Подпишись и читай
самые интересные
статьи первым!

Построим матрицу коэффициентов парной корреляции. Определение множественного коэффициента корреляции в MS Excel

Анализ матрицы парных коэффициентов корреляции показывает, что результативный показатель наиболее тесно связан с показателем x (4) - количество удобрений, расходуемых на 1 га ().

В то же время связь между признаками-аргументами достаточно тесная. Так, существует практически функциональная связь между числом колесных тракторов (x (1)) и числом орудий поверхностной обработки почвы
.

О наличии мультиколлинеарности свидетельствуют также коэффициенты корреляции
и
. Учитывая тесную взаимосвязь показателейx (1) , x (2) и x (3) , в регрессионную модель урожайности может войти лишь один из них.

Чтобы продемонстрировать отрицательное влияние мультиколлинеарности, рассмотрим регрессионную модель урожайности, включив в нее все исходные показатели:


F набл = 121.

В скобках указаны значения исправленных оценок среднеквадратических отклонений оценок коэффициентов уравнения
.

Под уравнением регрессии представлены следующие его параметры адекватности: множественный коэффициент детерминации
; исправленная оценка остаточной дисперсии
, средняя относительная ошибка аппроксимациии расчетное значение-критерия F набл = 121.

Уравнение регрессии значимо, т.к. F набл = 121 > F kp = 2,85 найденного по таблицеF -распределения при=0,05; 1 =6 и 2 =14.

Из этого следует, что 0, т.е. и хотя бы один из коэффициентов уравнения j (j = 0, 1, 2, ..., 5) не равен нулю.

Для проверки гипотезы о значимости отдельных коэффициентов регрессии H0:  j =0, гдеj =1,2,3,4,5, сравнивают критическое значениеt kp = 2,14, найденное по таблицеt -распределения при уровне значимости=2Q =0,05 и числе степеней свободы=14, с расчетным значением. Из уравнения следует, что статистически значимым является коэффициент регрессии только при x (4) , так какt 4 =2,90 >t kp =2,14.

Не поддаются экономической интерпретации отрицательные знаки коэффициентов регрессии при x (1) и x (5) . Из отрицательных значений коэффициентов следует, что повышение насыщенности сельского хозяйства колесными тракторами (x (1)) и средствами оздоровления растений (x (5)) отрицательно сказывается на урожайности. Таким образом, полученное уравнение регрессии неприемлемо.

Для получения уравнения регрессии со значимыми коэффициентами используем пошаговый алгоритм регрессионного анализа. Первоначально используем пошаговый алгоритм с исключением переменных.

Исключим из модели переменную x (1) , которой соответствует минимальное по абсолютной величине значениеt 1 =0,01. Для оставшихся переменных вновь построим уравнение регрессии:

Полученное уравнение значимо, т.к. F набл = 155 > F kp = 2,90, найденного при уровне значимости=0,05 и числах степеней свободы 1 =5 и 2 =15 по таблицеF -распределения, т.е. вектор0. Однако в уравнении значим только коэффициент регрессии приx (4) . Расчетные значенияt j для остальных коэффициентов меньшеt кр = 2,131, найденного по таблицеt -распределения при=2Q =0,05 и=15.

Исключив из модели переменную x (3) , которой соответствует минимальное значениеt 3 =0,35 и получим уравнение регрессии:

(2.9)

В полученном уравнении статистически не значим и экономически не интерпретируем коэффициент при x (5) . Исключивx (5) получим уравнение регрессии:

(2.10)

Мы получили значимое уравнение регрессии со значимыми и интерпретируемыми коэффициентами.

Однако полученное уравнение является не единственно “хорошей” и не “самой лучшей” моделью урожайности в нашем примере.

Покажем, что в условии мультиколлинеарности пошаговый алгоритм с включением переменных является более эффективным. На первом шаге в модель урожайностиy входит переменная x (4) , имеющая самый высокий коэффициент корреляции сy , объясняемой переменнойr (y , x (4))=0,58. На втором шаге, включая уравнение наряду сx (4) переменныеx (1) илиx (3) , мы получим модели, которые по экономическим соображениям и статистическим характеристикам превосходят (2.10):

(2.11)

(2.12)

Включение в уравнение любой из трех оставшихся переменных ухудшает его свойства. Смотри, например, уравнение (2.9).

Таким образом, мы имеем три “хороших” модели урожайности, из которых нужно выбрать по экономическим и статистическим соображениям одну.

По статистическим критериям наиболее адекватна модель (2.11). Ей соответствуют минимальные значения остаточной дисперсии =2,26 и средней относительной ошибки аппроксимациии наибольшие значения
и F набл = 273.

Несколько худшие показатели адекватности имеет модель (2.12), а затем - модель (2.10).

Будем теперь выбирать наилучшую из моделей (2.11) и (2.12). Эти модели отличаются друг от друга переменными x (1) иx (3) . Однако в моделях урожайностей переменнаяx (1) (число колесных тракторов на 100 га) более предпочтительна, чем переменнаяx (3) (число орудий поверхностной обработки почвы на 100 га), которая является в некоторой степени вторичной (или производной от x (1)).

В этой связи из экономических соображений предпочтение следует отдать модели (2.12). Таким образом, после реализации алгоритма пошагового регрессионного анализа с включением переменных и учета того, что в уравнение должна войти только одна из трех связанных переменных (x (1) ,x (2) илиx (3)) выбираем окончательное уравнение регрессии:

Уравнение значимо при =0,05, т.к. F набл = 266 > F kp = 3,20, найденного по таблицеF -распределения при=Q =0,05; 1 =3 и 2 =17. Значимы и все коэффициенты регрессииив уравненииt j >t kp (=2Q =0,05;=17)=2,11. Коэффициент регрессии 1 следует признать значимым ( 1 0) из экономических соображений, при этомt 1 =2,09 лишь незначительно меньшеt kp = 2,11.

Из уравнения регрессии следует, что увеличение на единицу числа тракторов на 100 га пашни (при фиксированном значении x (4)) приводит к росту урожайности зерновых в среднем на 0,345 ц/га.

Приближенный расчет коэффициентов эластичности э 1 0,068 и э 2 0,161 показывает, что при увеличении показателейx (1) иx (4) на 1% урожайность зерновых повышается в среднем соответственно на 0,068% и 0,161%.

Множественный коэффициент детерминации
свидетельствует о том, что только 46,9% вариации урожайности объясняется вошедшими в модель показателями (x (1) иx (4)), то есть насыщенностью растениеводства тракторами и удобрениями. Остальная часть вариации обусловлена действием неучтенных факторов (x (2) ,x (3) ,x (5) , погодные условия и др.). Средняя относительная ошибка аппроксимациихарактеризует адекватность модели, так же как и величина остаточной дисперсии
. При интерпретации уравнения регрессии интерес представляют значения относительных ошибок аппроксимации
. Напомним, что- модельное значение результативного показателя, характеризует среднее для совокупности рассматриваемых районов значение урожайности при условии, что значения объясняющих переменныхx (1) иx (4) зафиксированы на одном и том же уровне, а именноx (1) =x i (1) иx (4) = x i (4) . Тогда по значениям i можно сопоставлять районы по урожайности. Районы, которым соответствуют значения i >0, имеют урожайность выше среднего, а i <0 - ниже среднего.

В нашем примере, по урожайности наиболее эффективно растениеводство ведется в районе, которому соответствует  7 =28%, где урожайность на 28% выше средней по региону, и наименее эффективно - в районе с 20 =27,3%.

Коллинеарными являются факторы …

Решение:

Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если . В нашей модели только коэффициент парной линейной регрессии между факторами и больше 0,7. , значит, факторы и коллинеарны.

4. В модели множественной регрессии определитель матрицы парных коэффициентов корреляции между факторами , и близок к нулю. Это означает, что факторы , и …

мультиколлинеарны

независимы

количественно измеримы

Решение:

Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами. Если факторы не коррелированы между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной. Поскольку все недиагональные элементы были бы равны нулю.
, поскольку = = и = = =0.
Если между факторами существует полная линейная зависимость и все коэффициенты парной корреляции равны единице, то определитель такой матрицы равен нулю.


Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.

5. Для эконометрической модели линейного уравнения множественной регрессии вида построена матрица парных коэффициентов линейной корреляции (y – зависимая переменная; х (1) , х (2) , х (3) , x (4) – независимые переменные):


Коллинеарными (тесно связанными) независимыми (объясняющими) переменными не являются

x (2) и x (3)

x (1) и x (3)

x (1) и x (4)

x (2) и x (4)

Решение:

При построении модели множественной регрессии необходимо исключить возможность существования тесной линейной зависимости между независимыми (объясняющими) переменными, которая ведет к проблеме мультиколлинеарности. При этом осуществляют проверку коэффициентов линейной корреляции для каждой пары независимых (объясняющих) переменных. Эти значения отражены в матрице парных коэффициентов линейной корреляции. Считается, что наличие значений коэффициентов парной корреляции между объясняющими переменными, превышающих по абсолютной величине 0,7, отражает тесную связь между этими переменными (теснота связи с переменной y в данном случае не рассматривается). Такие независимые переменные называются коллинеарными. Если значение коэффициента парной корреляции между объясняющими переменными не превышает по абсолютной величине 0,7, то такие объясняющие переменные не являются коллинеарными. Рассмотрим значения парных коэффициентов межфакторной корреляции: между x (1) и x (2) значение равно 0,45; между x (1) и x (3) – равно 0,82; между x (1) и x (4) – равно 0,94; между x (2) и x (3) – равно 0,3; между x (2) и x (4) – равно 0,7; между x (3) и x (4) – равно 0,12. Таким образом, не превышают 0,7 значения , , . Следовательно, коллинеарными не являются факторы x (1) и x (2) , x (2) и x (3) , x (3) и x (4) . Из последних перечисленных пар в вариантах ответов присутствует пара x (2) и x (3) – это верный вариант ответа. Для остальных пар: x (1 и x (3) , x (1) и x (4) , x (2) и x (4) – значения парных коэффициентов межфакторной корреляции превышают 0,7, и эти факторы являются коллинеарными.

Тема 3: Фиктивные переменные

1. Дана таблица исходных данных для построения эконометрической регрессионной модели:

Фиктивными переменными не являются

стаж работы

производительность труда

уровень образования

уровень квалификации работника

Решение:

При построении регрессионной модели может возникнуть ситуация, когда необходимо включить в уравнение помимо количественных переменных переменные, отражающие некоторые атрибутивные признаки (пол, образование, регион и т.п.). Такого рода качественные переменные называются «фиктивными» (dummy) переменными. Для построения указанной в постановке задания модели используются фиктивные переменные: уровень образования и уровень квалификации работника. Остальные переменные не являются фиктивными, из предложенных вариантов это стаж работы и производительность труда.

2. При исследовании зависимости потребления мяса от уровня дохода и пола потребителя можно рекомендовать …

использовать фиктивную переменную – пол потребителя

разделить совокупность на две: для потребителей женского пола и для потребителей мужского пола

использовать фиктивную переменную – уровень дохода

исключить из рассмотрения пол потребителя, так как данный фактор нельзя измерить количественным образом

Решение:

При построении регрессионной модели может возникнуть ситуация, когда необходимо включить в уравнение помимо количественных переменных переменные, отражающие некоторые атрибутивные признаки (пол, образование, регион и т.п.). Такого рода качественные переменные называются «фиктивными» (dummy) переменными. Они отражают неоднородность исследуемой статистической совокупности и используются для более качественного моделирования зависимостей в таких неоднородных объектах наблюдения. При моделировании отдельных зависимостей по неоднородным данным можно также воспользоваться способом разделения всей совокупности неоднородных данных на несколько отдельных совокупностей, количество которых равно количеству состояний dummy-переменной. Таким образом правильными вариантами ответов являются: «использовать фиктивную переменную – пол потребителя» и «разделить совокупность на две: для потребителей женского пола и для потребителей мужского пола».

3. Изучается зависимость цены квартиры (у ) от ее жилой площади (х ) и типа дома. В модель включены фиктивные переменные, отражающие рассматриваемые типы домов: монолитный, панельный, кирпичный. Получено уравнение регрессии: ,
где ,
Частными уравнениями регрессии для кирпичного и монолитного являются …

для типа дома кирпичный

для типа дома монолитный

для типа дома кирпичный

для типа дома монолитный

Решение:

Требуется узнать частное уравнение регрессии для кирпичного и монолитного домов. Для кирпичного дома значения фиктивных переменных следующие , . Уравнение примет вид: или для типа дома кирпичный.
Для монолитного дома значения фиктивных переменных следующие , . Уравнение примет вид
или для типа дома монолитный.

Коллинеарными являются факторы …

Решение:

Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если . В нашей модели только коэффициент парной линейной регрессии между факторами и больше 0,7. , значит, факторы и коллинеарны.

4. В модели множественной регрессии определитель матрицы парных коэффициентов корреляции между факторами , и близок к нулю. Это означает, что факторы , и …

мультиколлинеарны

независимы

количественно измеримы

Решение:

Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами. Если факторы не коррелированы между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной. Поскольку все недиагональные элементы были бы равны нулю.
, поскольку = = и = = =0.
Если между факторами существует полная линейная зависимость и все коэффициенты парной корреляции равны единице, то определитель такой матрицы равен нулю.


Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.

5. Для эконометрической модели линейного уравнения множественной регрессии вида построена матрица парных коэффициентов линейной корреляции (y – зависимая переменная; х (1) , х (2) , х (3) , x (4) – независимые переменные):


Коллинеарными (тесно связанными) независимыми (объясняющими) переменными не являются

x (2) и x (3)

x (1) и x (3)

x (1) и x (4)

x (2) и x (4)

Решение:

При построении модели множественной регрессии необходимо исключить возможность существования тесной линейной зависимости между независимыми (объясняющими) переменными, которая ведет к проблеме мультиколлинеарности. При этом осуществляют проверку коэффициентов линейной корреляции для каждой пары независимых (объясняющих) переменных. Эти значения отражены в матрице парных коэффициентов линейной корреляции. Считается, что наличие значений коэффициентов парной корреляции между объясняющими переменными, превышающих по абсолютной величине 0,7, отражает тесную связь между этими переменными (теснота связи с переменной y в данном случае не рассматривается). Такие независимые переменные называются коллинеарными. Если значение коэффициента парной корреляции между объясняющими переменными не превышает по абсолютной величине 0,7, то такие объясняющие переменные не являются коллинеарными. Рассмотрим значения парных коэффициентов межфакторной корреляции: между x (1) и x (2) значение равно 0,45; между x (1) и x (3) – равно 0,82; между x (1) и x (4) – равно 0,94; между x (2) и x (3) – равно 0,3; между x (2) и x (4) – равно 0,7; между x (3) и x (4) – равно 0,12. Таким образом, не превышают 0,7 значения , , . Следовательно, коллинеарными не являются факторы x (1) и x (2) , x (2) и x (3) , x (3) и x (4) . Из последних перечисленных пар в вариантах ответов присутствует пара x (2) и x (3) – это верный вариант ответа. Для остальных пар: x (1 и x (3) , x (1) и x (4) , x (2) и x (4) – значения парных коэффициентов межфакторной корреляции превышают 0,7, и эти факторы являются коллинеарными.

Тема 3: Фиктивные переменные

1. Дана таблица исходных данных для построения эконометрической регрессионной модели:

Фиктивными переменными не являются

стаж работы

производительность труда

уровень образования

уровень квалификации работника

Решение:

При построении регрессионной модели может возникнуть ситуация, когда необходимо включить в уравнение помимо количественных переменных переменные, отражающие некоторые атрибутивные признаки (пол, образование, регион и т.п.). Такого рода качественные переменные называются «фиктивными» (dummy) переменными. Для построения указанной в постановке задания модели используются фиктивные переменные: уровень образования и уровень квалификации работника. Остальные переменные не являются фиктивными, из предложенных вариантов это стаж работы и производительность труда.

2. При исследовании зависимости потребления мяса от уровня дохода и пола потребителя можно рекомендовать …

использовать фиктивную переменную – пол потребителя

разделить совокупность на две: для потребителей женского пола и для потребителей мужского пола

использовать фиктивную переменную – уровень дохода

исключить из рассмотрения пол потребителя, так как данный фактор нельзя измерить количественным образом

Решение:

При построении регрессионной модели может возникнуть ситуация, когда необходимо включить в уравнение помимо количественных переменных переменные, отражающие некоторые атрибутивные признаки (пол, образование, регион и т.п.). Такого рода качественные переменные называются «фиктивными» (dummy) переменными. Они отражают неоднородность исследуемой статистической совокупности и используются для более качественного моделирования зависимостей в таких неоднородных объектах наблюдения. При моделировании отдельных зависимостей по неоднородным данным можно также воспользоваться способом разделения всей совокупности неоднородных данных на несколько отдельных совокупностей, количество которых равно количеству состояний dummy-переменной. Таким образом правильными вариантами ответов являются: «использовать фиктивную переменную – пол потребителя» и «разделить совокупность на две: для потребителей женского пола и для потребителей мужского пола».

3. Изучается зависимость цены квартиры (у ) от ее жилой площади (х ) и типа дома. В модель включены фиктивные переменные, отражающие рассматриваемые типы домов: монолитный, панельный, кирпичный. Получено уравнение регрессии: ,
где ,
Частными уравнениями регрессии для кирпичного и монолитного являются …

для типа дома кирпичный

для типа дома монолитный

для типа дома кирпичный

для типа дома монолитный

Решение:

Требуется узнать частное уравнение регрессии для кирпичного и монолитного домов. Для кирпичного дома значения фиктивных переменных следующие , . Уравнение примет вид: или для типа дома кирпичный.
Для монолитного дома значения фиктивных переменных следующие , . Уравнение примет вид
или для типа дома монолитный.

Множественная регрессия не является результатом преобразования уравнения:

-
;

-
.

Линеаризация подразумевает процедуру …

- приведения уравнения множественной регрессии к парной;

+ приведения нелинейного уравнения к линейному виду;

- приведения линейного уравнения к нелинейному виду;

- приведения нелинейного уравнения относительно параметров к уравнению, линейному относительно результата.

Остатки не изменяются;

Уменьшается количество наблюдений

В стандартизованном уравнении множественной регрессии переменными являются:

Исходные переменные;

Стандартизованные параметры;

Средние значения исходных переменных;

Стандартизованные переменные.

Одним из методов присвоения числовых значений фиктивным переменным является. . .

+– ранжирование;

Выравнивание числовых значений по возрастанию;

Выравнивание числовых значений по убыванию;

Нахождение среднего значения.

В матрице парных коэффициентов корреляции отображены значения парных коэффициентов линейной корреляции между. . . .

Переменными;

Параметрами;

Параметрами и переменными;

Переменными и случайными факторами.

Метод оценки параметров моделей с гетероскедастичными остатками называется ____________ методом наименьших квадратов:

Обычным;

Косвенным;

Обобщенным;

Минимальным.

Дано уравнение регрессии . Определите спецификацию модели.

Полиномиальное уравнение парной регрессии;

Линейное уравнение простой регрессии;

Полиномиальное уравнение множественной регрессии;

Линейное уравнение множественной регрессии.

В стандартизованном уравнении свободный член ….

Равен 1;

Равен коэффициенту множественной детерминации;

Равен коэффициенту множественной корреляции;

Отсутствует.

В качестве фиктивных переменных в модель множественной регрессии включаются факторы,

Имеющие вероятностные значения;

Имеющие количественные значения;

Не имеющие качественных значений;

Не имеющие количественных значений.

Факторы эконометрической модели являются коллинеарными, если коэффициент …

Корреляции между ними по модулю больше 0,7;

Детерминации между ними по модулю больше 0,7;

Детерминации между ними по модулю меньше 0,7;

Обобщенный метод наименьших квадратов отличается от обычного МНК тем, что при применении ОМНК …

Преобразуются исходные уровни переменных;

Остатки не изменяются;

Остатки приравниваются к нулю;

Уменьшается количество наблюдений.

Объем выборки определяется …

Числовыми значением переменных, отбираемых в выборку;

Объемом генеральной совокупности;

Числом параметров при независимых переменных;

Числом результативных переменных.

11. Множественная регрессия не является результатом преобразования уравнения:

+-
;

-
;

-
.

Исходные значения фиктивных переменных предполагают значения …

Качественные;

Количественно измеримые;

Одинаковые;

Значения.

Обобщенный метод наименьших квадратов подразумевает …

Преобразование переменных;

Переход от множественной регрессии к парной;

Линеаризацию уравнения регрессии;

Двухэтапное применение метода наименьших квадратов.

Линейное уравнение множественной регрессии имеет вид . Определите какой из факторовили:

+- , так как 3,7>2,5;

Оказывают одинаковое влияние;

- , так как 2,5>-3,7;

По этому уравнению нельзя ответить на поставленный вопрос, так как коэффициенты регрессии несравнимы между собой.

Включение фактора в модель целесообразно, если коэффициент регрессии при этом факторе является …

Нулевым;

Незначимым;

Существенным;

Несущественным.

Что преобразуется при применении обобщенного метода наименьших квадратов?

Стандартизованные коэффициенты регрессии;

Дисперсия результативного признака;

Исходные уровни переменных;

Дисперсия факторного признака.

Проводится исследование зависимости выработки работника предприятия от ряда факторов. Примером фиктивной переменной в данной модели будет являться ______ работника.

Возраст;

Уровень образования;

Заработная плата.

Переход от точечного оценивания к интервальному возможен, если оценки являются:

Эффективными и несостоятельными;

Неэффективными и состоятельными;

Эффективными и несмещенными;

Состоятельными и смещенными.

Матрица парных коэффициентов корреляции строится для выявления коллинеарных и мультиколлинеарных …

Параметров;

Случайных факторов;

Существенных факторов;

Результатов.

На основании преобразования переменных при помощи обобщенного метода наименьших квадратов получаем новое уравнение регрессии, которое представляет собой:

Взвешенную регрессию, в которой переменные взяты с весами
;

;

Нелинейную регрессию, в которой переменные взяты с весами
;

Взвешенную регрессию, в которой переменные взяты с весами .

Если расчетное значение критерия Фишера меньше табличного значения, то гипотеза о статистической незначимости уравнения …

Отвергается;

Незначима;

Принимается;

Несущественна.

Если факторы входят в модель как произведение, то модель называется:

Суммарной;

Производной;

Аддитивной;

Мультипликативной.

Уравнение регрессии, которое связывает результирующий признак с одним из факторов при зафиксированных на среднем уровне значении других переменных, называется:

Множественным;

Существенным;

Частным;

Несущественным.

Относительно количества факторов, включенных в уравнение регрессии, различают …

Линейную и нелинейную регрессии;

Непосредственную и косвенную регрессии;

Простую и множественную регрессию;

Множественную и многофакторную регрессию.

Требованием к уравнениям регрессии, параметры которых можно найти при помощи МНК является:

Равенство нулю значений факторного признака4

Нелинейность параметров;

Равенство нулю средних значений результативной переменной;

Линейность параметров.

Метод наименьших квадратов не применим для …

Линейных уравнений парной регрессии;

Полиномиальных уравнений множественной регрессии;

Уравнений, нелинейных по оцениваемым параметрам;

Линейных уравнений множественной регрессии.

При включении фиктивных переменных в модель им присваиваются …

Нулевые значения;

Числовые метки;

Одинаковые значения;

Качественные метки.

Если между экономическими показателями существует нелинейная связь, то …

Нецелесообразно использовать спецификацию нелинейного уравнения регрессии;

Целесообразно использовать спецификацию нелинейного уравнения регрессии;

Целесообразно использовать спецификацию линейного уравнение парной регрессии;

Необходимо включить в модель другие факторы и использовать линейное уравнение множественной регрессии.

Результатом линеаризации полиномиальных уравнений является …

Нелинейные уравнения парной регрессии;

Линейные уравнения парной регрессии;

Нелинейные уравнения множественной регрессии;

Линейные уравнения множественной регрессии.

В стандартизованном уравнении множественной регрессии
0,3;
-2,1. Определите, какой из факторовилиоказывает более сильное влияние на:

+- , так как 2,1>0,3;

По этому уравнению нельзя ответить на поставленный вопрос, так как неизвестны значения «чистых» коэффициентов регрессии;

- , так как 0,3>-2,1;

По этому уравнению нельзя ответить на поставленный вопрос, так как стандартизированные коэффициенты несравнимы между собой.

Факторные переменные уравнения множественной регрессии, преобразованные из качественных в количественные называются …

Аномальными;

Множественными;

Парными;

Фиктивными.

Оценки параметров линейного уравнения множественной регрессии можно найти при помощи метода:

Средних квадратов;

Наибольших квадратов;

Нормальных квадратов;

Наименьших квадратов.

Основным требованием к факторам, включаемым в модель множественной регрессии, является:

Отсутствие взаимосвязи между результатом и фактором;

Отсутствие взаимосвязи между факторами;

Отсутствие линейной взаимосвязи между факторами;

Наличие тесной взаимосвязи между факторами.

Фиктивные переменные включаются в уравнение множественной регрессии для учета действия на результат признаков …

Качественного характера;

Количественного характера;

Несущественного характера;

Случайного характера.

Из пары коллинеарных факторов в эконометрическую модель включается тот фактор,

Который при достаточно тесной связи с результатом имеет наибольшую связь с другими факторами;

Который при отсутствии связи с результатом имеет максимальную связь с другими факторами;

Который при отсутствии связи с результатом имеет наименьшую связь с другими факторами;

Который при достаточно тесной связи с результатом имеет меньшую связь с другими факторами.

Гетероскедастичность подразумевает …

Постоянство дисперсии остатков независимо от значения фактора;

Зависимость математического ожидания остатков от значения фактора;

Зависимость дисперсии остатков от значения фактора;

Независимость математического ожидания остатков от значения фактора.

Величина остаточной дисперсии при включении существенного фактора в модель:

Не изменится;

Будет увеличиваться;

Будет равно нулю;

Будет уменьшаться.

Если спецификация модели отображает нелинейную форму зависимости между экономическими показателями, то нелинейно уравнение …

Регрессии;

Детерминации;

Корреляции;

Аппроксимации.

Исследуется зависимость, которая характеризуется линейным уравнением множественной регрессии. Для уравнения рассчитано значение тесноты связи результативной переменной с набором факторов. В качестве этого показателя был использован множественный коэффициент …

Корреляции;

Эластичности;

Регрессии;

Детерминации.

Строится модель зависимости спроса от ряда факторов. Фиктивной переменной в данном уравнении множественной регрессии не является _________потребителя.

Семейное положение;

Уровень образования;

Для существенного параметра расчетное значение критерия Стьюдента …

Больше табличного значения критерия;

Равно нулю;

Не больше табличного значения критерия Стьюдента;

Меньше табличного значения критерия.

Систему МНК, построенную для оценки параметров линейного уравнения множественной регрессии можно решить …

Методом скользящего среднего;

Методом определителей;

Методом первых разностей;

Симплекс-методом.

Показатель, характеризующий на сколько сигм изменится в среднем результат при изменении соответствующего фактора на одну сигму, при неизменном уровне других факторов, называется ____________коэффициентом регрессии

Стандартизованным;

Нормализованным;

Выровненным;

Центрированным.

Мультиколлинеарность факторов эконометрической модели подразумевает …

Наличие нелинейной зависимости между двумя факторами;

Наличие линейной зависимости между более чем двумя факторами;

Отсутствие зависимости между факторами;

Наличие линейной зависимости между двумя факторами.

Обобщенный метод наименьших квадратов не используется для моделей с _______ остатками.

Автокоррелированными и гетероскедастичными;

Гомоскедастичными;

Гетероскедастичными;

Автокоррелированными.

Методом присвоения числовых значений фиктивным переменным не является:

Ранжирование;

Присвоение цифровых меток;

Нахождения среднего значения;

Присвоение количественных значений.

Нормально распределенных остатков;

Гомоскедастичных остатков;

Автокорреляции остатков;

Автокорреляции результативного признака.

Отбор факторов в модель множественной регрессии при помощи метода включения основан на сравнении значений …

Общей дисперсии до и после включения фактора в модель;

Остаточной дисперсии до и после включения случайных факторов в модель;

Дисперсии до и после включения результата в модель;

Остаточной дисперсии до и после включения фактора модель.

Обобщенный метод наименьших квадратов используется для корректировки …

Параметров нелинейного уравнения регрессии;

Точности определения коэффициента множественной корреляции;

Автокорреляции между независимыми переменными;

Гетероскедастичности остатков в уравнении регрессии.

После применения обобщенного метода наименьших квадратов удается избежать_________ остатков

Гетероскедастичности;

Нормального распределения;

Равенства нулю суммы;

Случайного характера.

Фиктивные переменные включаются в уравнения ____________регрессии

Случайной;

Парной;

Косвенной;

Множественной.

Взаимодействие факторов эконометрической модели означает, что …

Влияние факторов на результирующий признак зависит от значений другого неколлинеарного им фактора;

Влияние факторов на результирующий признак усиливается, начиная с определенного уровня значений факторов;

Факторы дублируют влияние друг друга на результат;

Влияние одного из факторов на результирующий признак не зависит от значений другого фактора.

Тема Множественная регрессия (Задачи)

Уравнение регрессии, построенное по 15 наблюдениям, имеет вид:

Пропущенные значения, а также доверительный интервал для

с вероятностью 0,99 равны:

Уравнение регрессии, построенное по 20 наблюдениям, имеет вид:

с вероятностью 0,9 равны:

Уравнение регрессии, построенное по 16 наблюдениям, имеет вид:

Пропущенные значения, а также доверительный интервал для с вероятностью 0,99 равны:

Уравнение регрессии в стандартизированном виде имеет вид:

Частные коэффициенты эластичности равны:

Стандартизованное уравнение регрессии имеет вид:

Частные коэффициенты эластичности равны:

Стандартизованное уравнение регрессии имеет вид:

Частные коэффициенты эластичности равны:

Стандартизованное уравнение регрессии имеет вид:

Частные коэффициенты эластичности равны:

Стандартизованное уравнение регрессии имеет вид:

Частные коэффициенты эластичности равны:

По 18 наблюдениям получены следующие данные:

;
;
;
;

равны:

По 17 наблюдениям получены следующие данные:

;
;
;
;

Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:

По 22 наблюдениям получены следующие данные:

;
;
;
;

Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:

По 25 наблюдениям получены следующие данные:

;
;
;
;

Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:

По 24 наблюдениям получены следующие данные:

;
;
;
;

Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:

По 28 наблюдениям получены следующие данные:

;
;
;
;

Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:

По 26 наблюдениям получены следующие данные:

;
;
;
;

Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:

В уравнении регрессии:

Восстановить пропущенные характеристики; построить доверительный интервал для с вероятностью 0,95, еслиn=12

Первоначально в модель у включают все главные компоненты (в скобках указаны расчетные значения t -критерия):

Качество модели характеризуют: множественный коэффициент детерминации r = 0,517, средняя относительная ошибка аппроксимации = 10,4%, остаточная дисперсия s 2 = 1,79 и F набл = 121. Ввиду того что F набл > F кр =2,85 при α = 0,05, v 1 = 6, v 2 = 14, уравнение регрессии значимо и хотя бы один из коэффициентов регрессии - β 1 , β 2 , β 3 , β 4 - не равен нулю.

Если значимость уравнения регрессии (гипотеза Н 0: β 1 = β 2 = β 3 = β 4 = 0проверялась при α = 0,05, то значимость коэффициентов регрессии, т.е. гипотезы H 0: β j = 0 (j = 1, 2, 3, 4), следует проверять при уровне значимости, большем, чем 0,05, например при α = 0,1. Тогда при α = 0,1, v = 14 величина t кр = 1,76, и значимыми, как следует из уравнения (53.41), являются коэффициенты регрессии β 1 , β 2 , β 3 .

Учитывая, что главные компоненты не коррелированы между собой, можно сразу исключить из уравнения все незначимые коэффициенты, и уравнение примет вид

(53.42)

Сравнив уравнения (53.41) и (53.42), видим, что исключение незначимых главных компонент f 4 и f 5 , не отразилось на значениях коэффициентов уравнения b 0 = 9,52, b 1 = 0,93, b 2 = 0,66 и соответствующих t j (j = 0, 1, 2, 3).

Это обусловлено некоррелированностью главных компонент. Здесь интересна параллель уравнений регрессии по исходным показателям (53.22), (53.23) и главным компонентам (53.41), (53.42).

Уравнение (53.42) значимо, поскольку F набл = 194 > F кр = 3,01, найденного при α = 0,05, v 1 = 4, v 2 = 16. Значимы и коэффициенты уравнения, так как t j > t кр . = 1,746, соответствующего α = 0,01, v = 16 для j = 0, 1, 2, 3. Коэффициент детерминации r = 0,486 свидетельствует о том, что 48,6% вариации у обусловлено влияниемтрех первых главных компонент.

Уравнение (53.42) характеризуется средней относительной ошибкой аппроксимации = 9,99% и остаточной дисперсией s 2 = 1,91.

Уравнение регрессии на главных компонентах (53.42) обладает несколько лучшими аппроксимирующими свойствами по сравнению с регрессионной моделью (53.23) по исходным показателям: r = 0,486 > r = 0,469; = 9,99% < (х ) = 10,5% и s 2 (f) = 1,91 < s 2 (x) = 1,97. Кроме того, в уравнении (53.42) главные компоненты являются линейными функциями всех исходных показателей, в то время как в уравнение (53.23) входят только две переменные (x 1 и х 4 ). В ряде случаев приходится учитывать, что модель (53.42) трудноинтерпретируема, так как в нее входит третья главная компонента f 3 , которая нами не интерпретирована и вклад которой в суммарную дисперсию исходных показателей (x 1 , ..., х 5) составляет всего 8,6%. Однако исключение f 3 из уравнения (53.42) значительно ухудшает аппроксимирующие свойства модели: r = 0,349; = 12,4% и s 2 (f ) = 2,41. Тогда в качестве регрессионной модели урожайности целесообразно выбрать уравнение (53.23).

Кластерный анализ

В статистических исследованиях группировка первичных данных является основным приемом решения задачи классификации, а поэтому и основой всей дальнейшей работы с собранной информацией.

Традиционно эта задача решается следующим образом. Из множества признаков, описывающих объект, отбирается один, наиболее информативный, с точки зрения исследователя, и производится группировка данных в соответствии со значениями этого признака. Если требуется провести классификацию по нескольким признакам, ранжированным между собой по степени важности, то сначала осуществляется классификация по первому признаку, затем каждый из полученных классов разбивается на подклассы по второму признаку и т.д. Подобным образом строится большинство комбинационных статистических группировок.

В тех случаях, когда не представляется возможным упорядочить классификационные признаки, применяется наиболее простой метод многомерной группировки - создание интегрального показателя (индекса), функционально зависящего от исходных признаков, с последующей классификацией по этому показателю.

Развитием этого подхода является вариант классификации по нескольким обобщающим показателям (главным компонентам), полученным с помощью методов факторного или компонентного анализа.

При наличии нескольких признаков (исходных или обобщенных) задача классификации может быть решена методами кластерного анализа, которые отличаются от других методов многомерной классификации отсутствием обучающих выборок, т.е. априорной информации о распределении генеральной совокупности.

Различия между схемами решения задачи по классификации во многом определяются тем, что понимают под понятиями «сходство» и «степень сходства».

После того как сформулирована цель работы, естественно попытаться определить критерии качества, целевую функцию, значения которой позволят сопоставить различные схемы классификации.

В экономических исследованиях целевая функция, как правило, должна минимизировать некоторый параметр, определенный на множестве объектов (например, целью классификации оборудования может явиться группировка, минимизирующая совокупность затрат времени и средств на ремонтные работы).

В случаях когда формализовать цель задачи не удается, критерием качества классификации может служить возможность содержательной интерпретации найденных групп.

Рассмотрим следующую задачу. Пусть исследуется совокупность п объектов, каждый из которых характеризуется k измеренными признаками. Требуется разбить эту совокупность на однородные в некотором смысле группы (классы). При этом практически отсутствует априорная информация о характере распределения k -мерного вектора Х внутри классов.

Полученные в результате разбиения группы обычно называются кластерами* (таксонами**, образами), методы их нахождения - кластер-анализом (соответственно численной таксономией или распознаванием образов с самообучением).

* Clаster (англ.) - группа элементов, характеризуемых каким-либо общимсвойством.

**Тахоп (англ.) - систематизированная группа любой категории.

Необходимо с самого начала четко представлять, какая из двух задач классификации подлежит решению. Если решается обычная задача типизации, то совокупность наблюдений разбивают на сравнительно небольшое число областей группирования (например, интервальный вариационный ряд в случае одномерных наблюдений) так, чтобы элементы одной такой области находились друг от друга по возможности на небольшом расстоянии.

Решение другой задачи заключается в определении естественного расслоения результатов наблюдений на четко выраженные кластеры, лежащие друг от друга на некотором расстоянии.

Если первая задача типизации всегда имеет решение, то во втором случае может оказаться, что множество наблюдений не обнаруживает естественного расслоения на кластеры, т.е. образует один кластер.

Хотя многие методы кластерного анализа довольно элементарны, основная часть работ, в которых они были предложены, относится к последнему десятилетию. Это объясняется тем, что эффективное решение задач поиска кластеров, требующее выполнения большого числа арифметических и логических операций, стало возможным только с возникновением и развитием вычислительной техники.

Обычной формой представления исходных данных в задачах кластерного анализа служит матрица

каждая строка которой представляет результаты измерений k рассматриваемых признаков у одного из обследованных объектов. В конкретных ситуациях может представлять интерес как группировка объектов, так и группировка признаков. В тех случаях, когда разница между двумя этими задачами не существенна, например при описании некоторых алгоритмов, мы будем пользоваться только термином «объект», включая в это понятие и термин «признак».

Матрица Х не является единственным способом представления данных в задачах кластерного анализа. Иногда исходная информация задана в виде квадратной матрицы

элемент r ij которой определяет степень близости i -го объекта к j -му.

Большинство алгоритмов кластерного анализа полностью исходит из матрицы расстояний (или близостей) либо требует вычисления отдельных ее элементов, поэтому если данные представлены в форме X, то первым этапом решения задачи поиска кластеров будет выбор способа вычисления расстояний, или близости, между объектами или признаками.

Несколько проще решается вопрос об определении близости между признаками. Как правило, кластерный анализ признаков преследует те же цели, что и факторный анализ: выделение групп связанных между собой признаков, отражающих определенную сторону изучаемых объектов. Мерой близости в этом случае служат различные статистические коэффициенты связи.


Похожая информация.


Включайся в дискуссию
Читайте также
Салат с кукурузой и мясом: рецепт
Римские акведуки - водное начало цивилизации С какой целью строили акведуки
Мыс крестовый лиинахамари