Lksdfjdk jdkfk lkfkfdkdf

  • 21 дек. 2011 г.
  • 1432 Слова
Регрессионный анализ

6 этапов регрессионного исследования - Регрессия – статистический метод, который используется для описания характера связи между переменными (положительная или отрицательная, линейная или нелинейная зависимость).
Шаг 1. Графически изобразить пары значений (x, y).
Шаг 2. Если визуально просматривается связь, найти коэффициент корреляции.
Шаг 3. Оценить значимостькоэффициента корреляции.
Шаг 4. Если коэффициент значим, то найти уравнение регрессии.
Шаг 5. Построить разумные прогнозы: для значения независимой
переменной х предсказать значение зависимой переменной у.
Шаг 6. Оценить надежность прогноза: найти коэффициент детерминации, стандартную ошибку оценки и интервал предсказания.

График рассеяния - графическое отображение взаимосвязи, на которую указываеткорреляция. Как показано на рис. 9.2, в случае полной положительной (9.2, а) или полной отрицательной (9.2, б) корреляции точки образуют прямую линию, а нулевая корреляция дает график рассеяния (9.2, в), точки которого распределены случайным образом. По сравнению с относительно слабой корреляцией (9.2, г и д) точки сравнительно сильной расположены ближе друг к другу (9.2, ж и з). В целом, по мереослабления корреляции точки на графике рассеяния все больше удаляются от диагонали, связывающей точки при полной корреляции, равной +1,00 или -1,00.

Уравнение линейной регрессии

значимость коэффициентов линейной регрессии

Коэффициент детерминации -это мера вариации зависимой
переменной, которая определяется линией регрессии и
независимой переменной. Коэффициент обозначается r2.Коэффициент детерминациивычисляется как отношение
объяснимой вариации к общей вариации. Остаточная дисперсия и коэффициент детерминации R-квадрат. Чем меньше разброс значений остатков около линии регрессии по отношению к общему разбросу значений, тем, очевидно, лучше прогноз. Например, если связь между переменными X и Y отсутствует, то отношение остаточной изменчивости переменной Y к исходной дисперсии равно 1.0. ЕслиX и Y жестко связаны, то остаточная изменчивость отсутствует, и отношение дисперсий будет равно 0.0. В большинстве случаев отношение будет лежать где-то между этими экстремальными значениями, т.е. между 0.0 и 1.0. 1.0 минус это отношение называется R-квадратом или коэффициентом детерминации. Это значение непосредственно интерпретируется следующим образом. Если имеется R-квадрат равный 0.4, тоизменчивость значений переменной Y около линии регрессии составляет 1-0.4 от исходной дисперсии; другими словами, 40% от исходной изменчивости могут быть объяснены, а 60% остаточной изменчивости остаются необъясненными. В идеале желательно иметь объяснение если не для всей, то хотя бы для большей части исходной изменчивости. Значение R-квадрата является индикатором степени подгонки модели к данным(значение R-квадрата близкое к 1.0 показывает, что модель объясняет почти всю изменчивость соответствующих переменных).
Интерпретация коэффициента множественной корреляции R.
Обычно, степень зависимости двух или более предикторов (независимых переменных или переменных X) с зависимой переменной (Y) выражается с помощью коэффициента множественной корреляции R. По определению он равен корню квадратному изкоэффициента детерминации. Это неотрицательная величина, принимающая значения между 0 и 1. Для интерпретации направления связи между переменными смотрят на знаки (плюс или минус) регрессионных коэффициентов или B-коэффициентов. Если B-коэффициент положителен, то связь этой переменной с зависимой переменной положительна (например, чем больше IQ, тем выше средний показатель успеваемости оценки); если B-коэффициентотрицателен, то и связь носит отрицательный характер (например, чем меньше число учащихся в классе, тем выше средние оценки по тестам). Конечно, если B-коэффициент равен 0, связь между переменными отсутствует

Представление о нелинейной и множественной линейной регрессии -

МНК -задача заключается в нахождении коэффициентов линейной зависимости, при...
tracking img