logo

Як використовувати функцію lm() у R для підгонки лінійних моделей?

У цій статті ми дізнаємося, як використовувати функцію lm() для підгонки лінійних моделей у мові програмування R.

Лінійна модель використовується для прогнозування значення невідомої змінної на основі незалежних змінних. Здебільшого використовується для з’ясування зв’язку між змінними та прогнозуванням. Функція lm() використовується для підгонки лінійних моделей до кадрів даних у мові R. Його можна використовувати для виконання регресії, дисперсійного аналізу однієї страти та коваріаційного аналізу для прогнозування значення, що відповідає даним, яких немає у кадрі даних. Вони дуже корисні для прогнозування цін на нерухомість, прогнозування погоди тощо.



Щоб підігнати лінійну модель у мові R за допомогою lm() Спочатку ми використовуємо функцію data.frame(), щоб створити зразок фрейму даних, який містить значення, які потрібно підібрати до лінійної моделі за допомогою функції регресії. Потім ми використовуємо функцію lm(), щоб підібрати певну функцію до заданого кадру даних.

Синтаксис:

lm( формула_підгонки, фрейм даних)



Параметр:

    fitting_formula: визначає формулу для лінійної моделі. кадр даних: визначає назву кадру даних, який містить дані.

Потім ми можемо використовувати функцію summary(), щоб переглянути підсумок лінійної моделі. Функція summary() інтерпретує найважливіші статистичні значення для аналізу лінійної моделі.

linux м'ята кориця проти мате

Синтаксис:



резюме (лінійна_модель)

Резюме містить наступну ключову інформацію:

    Залишкова стандартна помилка: визначає стандартне відхилення помилки, де квадратний корінь із дисперсії віднімає n мінус 1 + # залучених змінних замість ділення на n-1. Multiple R-Squared: визначає, наскільки ваша модель відповідає даним. Скоригований R-квадрат: нормалізує множинні R-квадрати, враховуючи, скільки у вас зразків і скільки змінних ви використовуєте. F-статистика: це глобальний тест, який перевіряє, чи принаймні один із ваших коефіцієнтів відмінний від нуля.

приклад: Приклад, щоб показати використання функції lm().

Р




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)>

>

>

Вихід:

Телефонуйте:

lm(формула = y ~ x^2, дані = df)

Залишки:

1 2 3 4 5

2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00

Коефіцієнти:

Оцінка Std. Значення помилки t Pr(>|t|)

(Перетин) -7,0000 3,0876 -2,267 0,10821

x 6,0000 0,9309 6,445 0,00757 **

Signif. коди: 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ 0,1 ‘ ’ 1

Залишкова стандартна помилка: 2,944 на 3 ступенях свободи

Кілька R-квадрат: 0,9326, скоригований R-квадрат: 0,9102

F-статистика: 41,54 на 1 і 3 DF, p-значення: 0,007575

Діагностичні сюжети

Діагностичні графіки допомагають нам побачити зв’язок між різними статистичними значеннями моделі. Це допомагає нам аналізувати ступінь викидів і ефективність підігнаної моделі. Щоб переглянути діагностичні графіки лінійної моделі, ми використовуємо функцію plot() у мові R.

Синтаксис:

plot( linear_model )

приклад: Діагностичні графіки для наведеної вище підігнаної лінійної моделі.

Р




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)>

>

>

Вихід:

Побудова лінійної моделі

Ми можемо побудувати наведену вище підігнану лінійну модель, щоб добре її візуалізувати, використовуючи метод abline(). Спочатку ми будуємо діаграму розсіювання точок даних, а потім накладаємо її на графік лінійної моделі за допомогою функції abline().

Синтаксис:

plot(df$x, df$y)

python rstrip

abline(лінійна_модель)

приклад: Побудова лінійної моделі

Р




рядок до внутр
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)>

>

>

Вихід:

Прогнозуйте значення для невідомих точок даних за допомогою підігнаної моделі

Щоб передбачити значення для нових вхідних даних за допомогою наведеної вище лінійної моделі, ми використовуємо функцію predict(). Функція predict() бере модель і кадр даних із невідомими точками даних і прогнозує значення для кожної точки даних відповідно до підігнаної моделі.

Синтаксис:

прогнозувати (модель, дані)

Параметр:

    модель: визначає лінійну модель. дані: визначає кадр даних із невідомими точками даних.

приклад: Прогнозування нових вхідних даних

Р




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )>

>

>

Вихід:

1 2 3 83 89 95>