Стандартизованные коэффициенты.

⁰

Оценка параметров уравнения регресии в стандартизованном масштабе

Параметры уравнения множественной регрессии в задачах по эконометрике оценивают аналогично парной регрессии, методом наименьших квадратов (МНК). При применении этого метода строится система нормальных уравнений, решение которой и позволяет получать оценки параметров регрессии.

При определении параметров уравнения множественной регрессии на основе матрицы парных коэффициентов корреляции строим уравнение регрессии в стандартизованном масштабе:

в уравнении стандартизированные переменные

Применяя метод МНК к моделям множественной регрессии в стандартизованном масштабе, после опрделенных преобразований получим систему нормальных уравнений вида

Решая системы методом определителей, находим параметры - стандартизованные коэффициенты регрессии (бета - коэффициенты). Сравнивая коэффициенты друг с другом, можно ранжировать факторы по силе их воздействия на результат. В этом заключается основное достоинство стандартизованных коэффициентов в отличие от обычных коэффициентов регрессии, которые несравнимы между собой.

В парной зависимости стандартизованный коэффициент регрессии связан с соответствующим коэфициентом уравнения зависимостью

Это позволяет от уравнения в стандартизованном масштабе переходить к регрессионному уравнению в натуральном масштабе переменных:

Параметр а определяется из следующего уравнения

Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результат, если соответствующий фактор xj изменится на одну сигму при неизменном среднем уровне других факторов. В силу того, что все перемеyные заданы как центрированные и нормированные, стандартизованные коэффициенты регрессии сравнимы между собой.

Рассмотренный смысл стандартизованных коэффициентов позволяет использовать их при отсеве факторов, исключая из модели факторы с наименьшим значением.

Компьютерные программы построения уравнения множественной регрессии позволяют получать либо только уравнение регрессии для исходных данных и уравнение регрессии в стандартизованном масштабе.

19. Характеристика эластичности по модели множественной регрессии. СТР 132-136

http://math.semestr.ru/regress/mregres.php

20. Взаимосвязь стандартизированных коэффициентов регрессии и коэффициентов эластичности. СТР 120-124

21. Показатели множественной и частной корреляции. Их роль при построении эконометрических моделей

Корреляция -это статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Математической мерой Корреляции двух случайных величин служит коэффициент Корреляции. Понятие корреляции появилось в середине XIX века в работах английских статистиков Ф. Гальтона и К. Пирсона.

Коэффициент множественной корреляции (R) характеризует тесноту связи между результативным показателем и набором факторных показателей:

где σ 2 - общая дисперсия эмпирического ряда, характеризующая общую вариацию результативного показателя (у) за счет факторов;

σ ост 2 - остаточная дисперсия в ряду у, отражающая влияния всех факторов, кроме х;

у - среднее значение результативного показателя, вычисленное по исходным наблюдениям;

s - среднее значение результативного показателя, вычисленное по уравнению регрессии.

Коэффициент множественной корреляции принимает только положительные значения в пределах от 0 до 1. Чем ближе значение коэффициента к 1, тем больше теснота связи. И, наоборот, чем ближе к 0, тем зависимость меньше. При значении R < 0,3 говорят о малой зависимости между величинами. При значении 0,3 < R < 0,6 говорят о средней тесноте связи. При R > 0,6 говорят о наличии существенной связи.

Квадрат коэффициента множественной корреляции называется коэффициентом детерминации (D): D = R 2 . Коэффициент детерминации показывает, какая доля вариации результативного показателя связана с вариацией факторных показателей. В основе расчета коэффициента детерминации и коэффициента множественной корреляции лежит правило сложения дисперсий, согласно которому общая дисперсия (σ 2) равна сумме межгрупповой дисперсии (δ 2) и средней из групповых дисперсий σ i 2):

σ 2 = δ 2 + σ i 2 .

Межгрупповая дисперсия характеризует колеблемость результативного показателя за счет изучаемого фактора, а средняя из групповых дисперсий отражает колеблемость результативного показателя за счет всех прочих факторов, кроме изучаемого.

Показатели частной корреляции. Основаны на соотношении сокращения остаточной вариации за счет дополнительно включенного в модель фактора к остаточной вариации до включения в модель соответствующего фактора

Рассмотренные показатели можно также использовать для сравнения факторов, т.е. Можно ранжировать факторы(т.е.2ой фактор более тесно связан).

Частные коэффициенты могут быть использованы в процедуре отсева факторов при построении модели.

Рассмотренные выше показатели являются коэф-ми корреляции первого порядка,т.е.они характризуют связь между двумя факторами при закреплении одного фактора (yx1. x2). Однако можно построить коэф-ты 2го и более порядка (yx1. x2x3, yx1. x2x3x4).

22. Оценка надежности результатов множественной регрессии.

Коэфициенты структурной модели могут быть оценены разными способами в зависимости от вида одновренных уравнений.
Методы оценивания коэф-тов структурной модели:
1) Косвенный МНК(КМНК)

2)Двухшаговый МНК(ДМНК)

3)Трехшаговый МНК(ТМНК)

4)МНП с полной информацией

5)МНП при огранич. информации

Применение КМНК:

КМНК применяется в случаеточнойидентификацииструктурноймодели.

Процедуры примения КМНК:
1. Структурн. модель преобраз. в привед. форму модели.

2. Для каждого уравнения привед.форма модели обычным МНК оцениваются привед. коэф

3. Коэфициенты приведенной формы модели трансформируются в параметры структурной модели.

Еслиси стема сверхидентифицируема, то КМНК не исп, так как не дает однозначных оценок для параметров структурной модели. В этом случае могут исп. разные методы оценивания, среди которых наиболее распространен ДМНК.
Основная идея ДМНК на основе приведенной модели получить для сверхидентиф. уравнения теор. значения эндогенных переменных, содерж. в правой части ур-ния. Далее подставив в найденные значения вместо факт.значений применяется обычный МНК и структурн. форма сверхидент. ур-ния.
1 шаг: при опред.привед. формы модели и нахождении на ее основе оценок теор. значений эндогенной переменой

2 шаг: Применительно к структурному сверхидентифицируемому уравнению при определении структурных коэфициентов модели по данным теоритических значений эндогенных переменных.

23. Дисперсионный анализ результатов множественной регрессии.

Задача дисперсионного анализа в проверке гипот Н0 о статист незачимости уравн регрессии в целом и показат тесн связи. Выполняется на основе сравнения факт и табличн значений F-крит кот определяются из соотн факторной и остаточной дисперсий, рассчитан на одну степень свободы

таблица дисперсионного анализа
Вару	df	СКО,S	Дисп на одну df,S 2	Fфакт
общ	n-1	d y 2 * n	-	-
факт	m	d y 2 * n*R 2 yx1x2
Ост	n-m-1	d y 2 * n*(1-R 2 yx 1 x 2) =Sобщ-Sфакт		-

Также можно построить таблицу частного дисперсионного анализа , и найти частный F крит который оценивает целесообразность включения фактора в модель после включения др переменной

24. Частный F-критерий Фишера, t- критерий Стьюдента. Их роль в построении регрессионных моделей.

F-критерия Фишера.

Для оценки статистич целесообразности добавления нов факторов в регрессион модель исп-ся частн критерий Фишера, т.к на рез-ты регрессион анализа влияет не только состав факторов, но и последовательность включения фактора в модель. Это обьясняется наличием связи между факторами.

F xj =((R 2 по yx1x2...xm – R 2 по yx1x2…xj-1,хj+1…xm)/(1- R 2 по yx1x2...xm))*((n-m-1)/1)

F табл (альфа,1, n-m-1) F xj больше F табл – фактор x j целесообразно лючать в модель после др.факторов.

Если рассматривается уравнение y=a+b1x1+b2+b3x3+e, то определяются последовательно F-критерий для уравнения с одним фактором х1, далее F- критерий для дополнительного включения в модель фактора х2, т. е. для перехода от однофакторного уравнения регрессии к двухфакторному, и, наконец, F-критерий для дополнительного включения в модель фактора х3, т.е. дается оценка значимости фактора х3 после включения в модель факторов x1 их2. В этом случае F-критерий для дополнительного включения фактора х2 после х1 является последовательным в отличие от F-критерия для дополнительного включения в модель фактора х3, который является частным F- критерием, ибо оценивает значимость фактора в предположении, что он включен в модель последним. С t-критерием Стьюдента связан именно частный F- критерий. Последовательный F-критерий может интересовать исследователя настадии формирования модели. Для уравнения y=a+b1x1+b2+b3x3+e оценка значимости коэффициентов регрессии Ь1,Ь2,b3 предполагает расчет трех межфакторных коэффициентов детерминации.

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей.

Сравнивая фактическое и критическое (табличное) значения t-статистики и tтабл. - принимаем или отвергаем гипотезу H0 . Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством

Если t табл.< tфакт ., то H0 отклоняется, т.е. a, b и r ху не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х.

Если, t табл.> tфакт. то гипотеза H0 не отклоняется и признается случайная природа формирования a, b или r ху.

25. Оценка качества регрессионных моделей. Стандартная ошибка линии регрессии.

Оценка качества линейной регрессии: коэффициент детерминации R 2

Из-за линейного соотношения и мы ожидаем, что изменяется, по мере того как изменяется , и называем это вариацией, которая обусловлена или объясняется регрессией. Остаточная вариация должна быть как можно меньше.

Если это так, то большая часть вариации будет объясняться регрессией, а точки будут лежать близко к линии регрессии, т.е. линия хорошо соответствует данным.

Долю общей дисперсии , которая объясняется регрессией называют коэффициентом детерминации , обычно выражают через процентное соотношение и обозначают R 2 (в парной линейной регрессии это величина r 2 , квадрат коэффициента корреляции), позволяет субъективно оценить качество уравнения регрессии.

Разность представляет собой процент дисперсии который нельзя объяснить регрессией.

Нет формального теста для оценки мы вынуждены положиться на субъективное суждение, чтобы определить качество подгонки линии регрессии.

Применение линии регрессии для прогноза

Применение линии регрессии для прогноза

Можно применять регрессионную линию для прогнозирования значения по значению в пределе наблюдаемого диапазона (никогда не экстраполируйте вне этих пределов).

Мы предсказываем среднюю величину для наблюдаемых, которые имеют определенное значение путем подстановки этого значения в уравнение линии регрессии.

Итак, если прогнозируем как Используем эту предсказанную величину и ее стандартную ошибку, чтобы оценить доверительный интервал для истинной средней величины в популяции.

Повторение этой процедуры для различных величин позволяет построить доверительные границы для этой линии. Это полоса или область, которая содержит истинную линию, например, с 95% доверительной вероятностью.

26. Взаимосвязь частного F-критерия, t- критерия Стьюдента и частного коэффициента корреляции.

Ввиду корреляции м/у факторами значимость одного и того же фактора м/б различной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частый F-критерий, т.е. F xi . В общем виде для фактора x i частый F-критерий определяется как:

Если рассматривается уравнение y=a+b 1 x 1 +b 2 +b 3 x 3 +e , то определяются последовательно F-критерий для уравнения с одним фактором х 1 , далее F-критерий для дополнительного включения в модель фактора х 2 , т. е. для перехода от однофакторного уравнения регрессии к двухфакторному, и, наконец, F-критерий для дополнительного включения в модель фактора х 3 , т. е. дается оценка значимости фактора х 3 после включения в модель факторов x 1 их 2 . В этом случае F-критерий для дополнительного включения фактора х 2 после х 1 является последовательным в отличие от F-критерия для дополнительного включения в модель фактора х 3 , который является частным F-критерием, ибо оценивает значимость фактора в предположении, что он включен в модель последним. С t-критерием Стьюдента связан именно частный F-критерий. Последовательный F-критерий может интересовать исследователя на стадии формирования модели. Для уравнения y=a+b 1 x 1 +b 2 +b 3 x 3 +e оценка значимости коэффициентов регрессии Ь 1 ,Ь 2,b 3 предполагает расчет трех межфакторных коэффициентов детерминации, а именно: , , и можно убедиться, что существует связьмежду собой t- критерия Стьюдента для оценки значимости b i и частным F-критерием:

На основе соотношения b i и получим:

27. Варианты построения регрессионной модели. Их краткая характеристика.

28. Интерпретация параметров линейной и нелинейной регрессии.

		b	a
парная	линейная	Коэффициент регрессии b показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. Связь между у и х определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе – обратная	не интерпретируется, только знак >0 – рез-т изменяется медленнее фактора, <0 рез-т изм быстрее фактора
нелинейная	в степенной – коэфф эластичноести, т.е. на ск % изм рез-т в среднем при изменении фактора на 1% обратная ф-я – также как и в линейной,	не интерпретируется
множ	линейная	В линейной множественной регрессии коэффициенты при хi характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизменных значениях других факторов, закреплённых на среднем уровне	не интерпретируется

29. Матрица парных и частных коэффициентов корреляции при построении регрессионных моделей.

30. Предпосылки метода наименьших квадратов.

Предпосылки метода наименьших квадратов (условия Гаусса-Маркова)

1. Математическое ожидание случайного отклонения равно нулю для всех наблюдений. Данное условие означает, что случайное отклонение в среднем не оказывает влияния на зависимую переменную. В каждом конкретном наблюдении случайный член может быть либо положительным, либо отрицательным, но он не должен иметь систематического смещения.

2. Дисперсия случайных отклонений постоянна для любых наблюдений . Это условие подразумевает, что несмотря на то, что при каждом конкретном наблюдении случайное отклонение может быть либо большим, либо меньшим, не должно быть некой априорной причины, вызывающей большую ошибку (отклонение).

Выполнимость данной предпосылки называется гомоскедастичностью (постоянством дисперсии отклонений). Невыполнимость данной предпосылки называется гетероскедастичностью (непостоянством дисперсии отклонений).

3. Случайные отклонения u i и u j являются независимыми друг от друга для i¹j. Выполнимость данной предпосылки предполагает, что отсутствует систематическая связь между любыми случайными отклонениями. Другими словами, величина и определенный знак любого случайного отклонения не должны быть причинами величины и знака любого другого отклонения. Выполнимость данной предпосылки влечет следующее соотношение:

Поэтому, если данное условие выполняется, то говорят об отсутствии автокорреляции.

4. Случайное отклонение должно быть независимо от объясняющих переменных.

Обычно это условие выполняется автоматически, если объясняющие переменные не являются случайными в данной модели. Данное условие предполагает выполнимость следующего соотношения:

5. Модель является линейной относительно параметров.

Теорема Гаусса-Маркова. Если предпосылки 1-5 выполнены, то оценки, полученные по МНК, обладают следующими свойствами:

Оценки являются несмещенными, то есть М(b 0) = b 0 , М(b 1) = b 1 , где b 0 , b 1) – коэффициенты эмпирического уравнения регрессии, а b 0 , b 1 – их теоретические прототипы. Это вытекает из первой предпосылки и говорит об отсутствии систематической ошибки в определении положения линии регрессии.
Оценки состоятельны, так как дисперсия оценок параметров при возрастании числа n наблюдений стремится к нулю. Другими словами, при увеличении объема выборки надежность оценок увеличивается (коэффициенты теоретического и эмпирического уравнений регрессии практически совпадают).
Оценки эффективны, то есть они имеют наименьшую дисперсию по сравнению с любыми оценками данных параметров, линейными относительно величин y i .

Если предпосылки 2 и 3 нарушены, то есть дисперсия отклонений непостоянна и (или) значения случайных отклонений связаны друг с другом, то свойства несмещенности и состоятельности сохраняются, но свойство эффективности – нет.

Наряду с выполнимостью указанных предпосылок при построении классических линейных регрессионных моделей делаются еще некоторые предположения. Например:

объясняющие переменные не являются СВ;
случайные отклонения имеют нормальное распределение;
число наблюдений существенно больше числа объясняющих переменных.

ДРУГОЙ ВАРИАНТ БИЛЕТА 30.

Метод наименьших квадратов - один из методов регрессионного анализа для оценки неизвестных величин по результатам измерений, содержащих случайные ошибки.

МНК применяется также для приближённого представления заданной функции другими (более простыми) функциями и часто оказывается полезным при обработке наблюдений.

Когда искомая величина может быть измерена непосредственно, как, например, длина отрезка или угол, то, для увеличения точности, измерение производится много раз, и за окончательный результат берут арифметическое среднее из всех отдельных измерений. Это правило арифметической середины основывается на соображениях теории вероятностей; легко показать, что сумма квадратов уклонений отдельных измерений от арифметической середины будет меньше, чем сумма квадратов уклонений отдельных измерений от какой бы то ни было другой величины. Само правило арифметической середины представляет, следовательно, простейший случай метода наименьших квадратов.

МНК позволяет получить такие оценки параметров, при кот. сумма квадратов отклон-й фактич.значений результат. признака от теоретич. минимальна.

Модель д.б. линейной по параметрам

Х - случайная переменная

Значение ошибки – случайны, их изменения не образуют опред.модели (модели остатков)

Число налюденийд.б. больше чисоаоценив.парметров (в 5-6р)

Значения переменной х не д.б. одинаковыми

Совокупность должна быть однородной

Отсутствие взаимосвязи м/у ф-ром х и остатком

Модель регрессии д.б. корректно специфифированна

В модели не д.б. тесной взаимосвязи м/у фак-ми (ля множ.регрессии)

Основные предпосылки МНК:

 случайный характер остатков

 нулевая средняя остатков, не зависящая от фактора x

 гомоскедастичность (дисперсия каждого отклонения одинакова для всех значений x)

 отсутствие автокорреляции остатков

 остатки должны подчиняться нормальному распределению

 Если регрессионная модель у = a + bх + E удовлетворяет условием Гаусса-Маркова, то оценки а и b, полученные на основе МНК имеют наилучшую дисперсию в классе всех линейных, несмещенных оценок.

31. Исследование остатков уравнения множественной регрессии.

Исследования остатков предполагают проверку наличия следующих пяти предпосылок МНК:

1) случайный характер остатков;

2) нулевая средняя величина остатков, не зависящая от ;

3) гомоскедастичность – дисперсия каждого отклонения , одинакова для всех значений ;

4) отсутствие автокорреляции остатков – значения остатков распределены независимо друг от друга;

5) остатки подчиняются нормальному распределению.

Если распределение случайных остатков не соответствует некоторым предпосылкам МНК, то следует корректировать модель.

Прежде всего, проверяется случайный характер остатков – первая предпосылка МНК. С этой целью стоится график зависимости остатков от теоретических значений результативного признака (рис. 2.1). Если на графике получена горизонтальная полоса, то остатки представляют собой случайные величины и МНК оправдан, теоретические значения хорошо аппроксимируют фактические значения .

32. Гетероскедастичность и ее учет при построении модели множественной регрессии. Качественная оценка гретероскедастичности.

Гетероскедастичность проявляется, если совокупность исходных данных включает качественно разнородные области. Гетероскедастичность означает неравную дисперсию остатков для разных значений x. Если имеет место гетероскедастичность, то:

Оценки МНК будут неэффективными .
Могут быть смещены оценки коэфф регрессии и они будут неэффективными .
Сложно исп формулу станд ошибок, т.к она предполаг единую дисперсию остатков.

Меры по устранению гетероскедастичности

p Увеличениечисланаблюдений

p Изменениефункциональнойформымодели

p Разделениеисходнойсовокупностинакачественно-однородныегруппы и проведениеанализа в каждойгруппе

p Использованиефиктивныхпеременных, учитывающихнеоднородность

p Исключениеизсовокупностиединиц, дающихнеоднородность

Тесты, используемыедлявыявлениягетероскедастичности

p Гольдфельда-Квандта

p Глейзера

p РанговойкорреляцииСпирмена

33. Автокорреляция остатков и ее роль при построении регрессионной модели.

Зависимость между последовательными уровнями врем. ряда называют автокорреляцией уровня ряда. В эконометрич. исследованиях часто возникают и такие ситуации, когда дисперсия остатков постоянная, но наблюдается их ковариация. Это явление называют автокорреляцией остатков.

Один из наиболее распространенных методов определения автокорреляции в остатках – критерий Дарбина-Уотсона:

d = ;

d – отношение суммы квадратов разностей последовательных значений к остаточной сумме квадратов по модели регрессии.

Сущ-ет след. соотношение между критерием Д-У «d» и коэф-ом автокорреляции остатков 1ого порядка r 1:

d = 2 * (1-r 1) .

Если в остатках сущ-ет полная положит. автокорреляция и r 1 = 1, то d = 0.

Если в остатках полная отриц. автокорреляция, то r 1 = -1 и d = 4.

Если автокорреляция отсутствует, то r 1 = 0 и d = 2.

Т.е. 0≤d≤4.

Рассмотрим алгоритм выявления автокорреляции остатков на основе критерия Д-У.

Выдвигается гипотеза H 0 об отсутствии автокорреляции остатков . Альтернативные гипотезы H 1 и H 1 * предполагают наличие положительной или отрицательной автокорреляции в остатках. Затем по спец. таблицам определяютсякритические значения критерия Дарбина - Уотсона d L и d u для заданного числа наблюдений n, числа независимых переменных модели k при уровня значимости ɑ (обычно 0,95). По этим значениям промежуток разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью (1-ɑ) представлено на след: рисунке:

+ есть	?	НЕТ	?	- есть
	d L	d u		4- d u	4- d L

Если фактич. значение критерия Дарбина - Уотсона попадает в зону неопределенности , то на практике предполагают существование автокорреляции остатков и гипотезу Н 0 отклоняют.

34. Выбор наилучшего варианта модели регрессии.

35. Нелинейные модели множественной регрессии, их общая характеристика.

Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций: например, равносторонней гиперболы , параболы второй степени и д.р.

Различают два класса нелинейных регрессий:

регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам;

Регрессии, нелинейные по оцениваемым параметрам.
Примером нелинейной регрессии по включаемым в нее объясняющим переменным могут служить следующие функции:

полиномы разных степеней
равносторонняя гипербола

К нелинейным регрессиям по оцениваемым параметрам относятся функции:

степенная
показательная
экспоненциальная

36. Модели гиперболического типа. Кривые Энгеля, кривая Филипса, и другие примеры использования моделей данного типа.

Кривые Энгеля (Engel curve ) иллюстрируют зависимость между объемом потребления благ (C ) и доходом потребителя (I ) при неизменных ценах и предпочтениях. Названа в честь немецкого статистика Эрнста Энгеля, занимавшегося анализом влияния изменения дохода на структуру потребительских расходов.

На оси абсцисс откладывается уровень дохода потребителя, а на оси ординат - расходы на потребление данного блага.

На графике показан примерный вид кривых Энгеля:

E 1 - кривая для нормальных товаров;
E 2 - кривая для предметов роскоши;
E 3 - кривая для низкокачественных товаров.

Кривая филипса отражает взаимосвязь между темпами инфляции ибезработицы.

Кейнсианская модель экономики показывает, что в экономике может возникнуть либо безработица (вызванная спадом производства, следовательно уменьшением спроса на рабочую силу), либо инфляция (если экономика функционирует в состоянии полной занятости).

Одновременно высокая инфляция и высокая безработица существовать не могут.

Кривая Филипса была построена А.У. Филлипсом на основе данных заработной платы и безработицы в Великобритании за 1861-1957 годы.

Следуя кривой Филлипса государство может выстроить свою экономическую политику. Государство с помощью стимулирования совокупного спроса может увеличить инфляцию и снизить безработицу и наоборот.

Кривая Филипса была полностью верна до середины 70х годов. В этот период случилась стагнация (одновременный рост инфляции и безработицы), которую кривая филипса не смогла объяснить.

Применение Кривой Филипса

©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-02-16

Общие интенсивные коэффициенты (рождаемости, смертности, детской смертности, заболеваемости и т.д.) правильно отражают частоту явлений при их сопоставлении лишь в том случае, если состав сравниваемых совокупностей однороден. Если же они имеют неоднородный возрастно-половой или профессиональный состав, различие по тяжести болезни, по нозологическим формам иди по другим признакам, то ориентируясь на общие показатели, сравнивая их, можно сделать неправильный вывод о тенденциях изучаемых явлений и истинных причинах разницы общих показателей сравниваемых совокупностей.

Например, больничная летальность на терапевтическом отделении № 1 в отчетном году составила 3%, а на терапевтическом отделении №2 в том же году - 6%. Если оценивать деятельность этих отделений по общим показателям, то можно сделать вывод о неблагополучии на 2 терапевтическом отделении. А если предположить, что состав лечившихся на этих отделениях разнится по нозологическим формам или по тяжести заболеваний госпитализированных, то наиболее правильным способом анализа является сопоставление специальных коэффициентов, рассчитанных отдельно.для каждой группы больных с одинаковыми нозологическими формами или тяжестью заболеваний, так называемых «повозрастных коэффициентов».

Зачастую, однако, в сравниваемых совокупностях наблюдаются противоречивые данные. Кроме того, даже при наличии одинаковой тенденции во всех сравниваемых группах не всегда удобно пользоваться набором показателей, а предпочтительнее получить единую суммарную оценку. Во всех подобных случаях прибегают к методу стандартизации, то есть к устранению (элиминации) влияния состава (структуры) совокупностей на общий, итоговый показатель.

Следовательно, метод стандартизации применяется тогда, когда имеющиеся различия в составе сравниваемых совокупностей могут повлиять на размеры общих коэффициентов.

Для того, чтобы устранить влияние неоднородности составов сравниваемых совокупностей на величину получаемых коэффициентов, их приводят к единому стандарту, то есть условно допускается, что состав сравниваемых совокупностей одинаков. В качестве стандарта можно принять состав какой-либо близкой по существу третьей совокупности, средний состав двух сравниваемых групп или, проще всего, состав одной из сравниваемых групп.

Стандартизованные коэффициенты показывают, каковы были бы общие интенсивные показатели (рождаемости, заболеваемости, смертности, летальности и т.д.), если бы на их величину не оказывала влияние неоднородность в составах сравниваемых групп. Стандартизованные коэффициенты являются условными величинами и применяются исключительно для анализа в целях сравнения.

Существуют три метода стандартизации: прямой, косвенный и обратный (Керриджа).

Рассмотрим применение этих трех методов стандартизации на примерах, взятых из статистики злокачественных новообразований. Как известно, с возрастом значительно повышаются, коэффициенты смертности от злокачественных новообразований. Отсюда следует, что если в каком-либо городе будет относительно высока доля людей пожилых возрастов, а в другом - преобладать население среднего возраста, то даже при полном равенстве санитарных условий жизни и медицинской помощи в обоих сравниваемых городах неизбежно общий коэффициент смертности населения от злокачественных новообразований в первом городе будет выше, чем тот же коэффициент во втором городе.

Для того, чтобы нивелировать влияние возраста на общий показатель смертности населения от злокачественных новообразований, необходимо применить стандартизацию. Только после этого можно будет сравнивать полученные коэффициенты и сделать обоснованный вывод о большем или меньшем уровне смертности от злокачественных новообразований в целом в сравниваемых городах.

Прямой метод стандартизации. В нашем примере его можно применять в том случае, когда известен возрастной состав населения и есть информация для расчета повозрастных коэффициентов смертности населения от злокачественных новообразований (числа умерших от злокачественных новообразований в каждой возрастной группе).

Методика вычисления стандартизованных коэффициентов прямым методом слагается из четырех последовательных этапов (табл. 5.1).

Первый этап. Вычисление «повозрастных» коэффициентов смертности от злокачественных новообразований (отдельно для каждой возрастной группы).

Второй этап. Выбор стандарта осуществляется произвольно. В нашем примере за стандарт взят возрастной состав населения в городе «А».

Таблица 5.1

Стандартизация коэффициентов смертности от злокачественных новообразований в городах «А» и «Б» (прямой метод)

Третий этап. Расчет «ожидаемых» чисел. Мы определяем, сколько бы человек умерло от злокачественных новообразований в каждой возрастной группе населения города «Б» при имеющихся повозрастных показателях смертности от злокачественных новообразований в этом городе, но при возрастном составе города «А» (стандарт).

Например, в возрастной группе «до 30 лет»:

или в возрастной группе «40-49 лет»:

Четвертый этап. Расчет стандартизованных коэффициентов. Сумму «ожидаемых» чисел (1069,0) мы предлагаем получить из общей численности населения города «А» (700000). А сколько же умерших от злокачественных новообразований приходится на 100000 населения?

Из наших результатов можно сделать следующий вывод: если бы возрастной состав населения «Б» был бы такой же, как в городе «А» (стандарт), то смертность населения от злокачественных новообразований в городе «Б» была бы существенно выше (152,7%ооо против 120,2%ооо).

Косвенный метод стандартизации. Применяется, если специальные коэффициенты в сравниваемых группах неизвестны или известны, но мало достоверны. Это наблюдается, например, когда числа заболевших очень малы и, следовательно, вычисляемые коэффициенты будут существенно меняться в зависимости от прибавления одного или нескольких случаев заболеваний.

Вычисление стандартизованных коэффициентов косвенным способом можно разбить на три этапа (см. табл. 5.2).

Первый этап. Состоит в выборе стандарта. Так как нам обычно неизвестны специальные коэффициенты сравниваемых групп (коллективов), то за стандарт берутся специальные коэффициенты какого-то хорошо изученного коллектива. В рассматриваемом примере таковыми могут служить повозрастные показатели смертности от злокачественных новообразований в городе «С».

Второй этап включает вычисление «ожидаемых» чисел умерших от злокачественных новообразований. Допуская, что повозрастные коэффициенты смертности в обоих сравниваемых городах равны стандартным, определяем сколько бы умерло людей от злокачественных новообразований в каждой возрастной группе.

На третьем этапе вычисляются стандартизованные коэффициенты смертности населения от злокачественных новообразований. Для этого действительное число умерших относят к суммарному «ожидаемому» числу, и результат умножают на общий коэффициент смертности стандарта.

Действительное число умерших Общий коэф. смертности стандарта

«Ожидаемое» число умерших

Бета-коэффициент равный 0,074 (табл. 3.2.1) показывает, что если реальная заработная плата изменится на величину своего среднеквадратического отклонения (σх1), то коэффициент естественного прироста населения изменится в среднем на 0,074 σу. Бета-коэффициент равный 0,02 показывает, что если общий коэффициент брачности изменится на величину своего среднеквадратического отклонения (на σх2), то коэффициент естественного прироста населения изменится в среднем на 0,02 σу. Аналогично, изменение количества преступлений на 1000 человек на величину своего среднеквадратического отклонения (на σх3) приведет к изменению результативного признака в среднем на 0,366 σу, а изменение в вводе кв.м жилых помещений на человека в год на величину своего среднеквадратического отклонения (на σх4) ведет к изменению результативного признака в среднем на 1,32σу.

Коэффициент эластичности показывает, на сколько процентов в среднем изменяется y с изменением признака-фактора на 1%. Из анализа рядов динамики известно, что значение 1% прироста результативного признака отрицательно, так как во всех единицах совокупности наблюдается естественная убыль населения. Поэтому прирост фактически означает сокращение убыли. А значит, отрицательные коэффициенты эластичности в данном случае отражают то, что с увеличением каждого из факторных признаков на 1%, коэффициент естественной убыли сократится на соответствующее число процентов. При увеличении реальной заработной платы на 1%, коэффициент естественной убыли сократится на 0,219%, при увеличении общего коэффициента брачности на 1% - сократится на 0,156%. Увеличение количества преступлений на 1000 человек населения на 1% характеризуется сокращением естественной убыли населения на 0,564. Конечно, это не означает, что увеличивая преступность, можно поправить демографическую ситуацию. Полученные результаты говорят о том, что чем больше людей сохраняется на 1000 населения, тем соответственно больше преступлений приходится на эту тысячу. Увеличение ввода кв.м. жилья на человека в год на 1% ведет к сокращению естественной убыли на 0,482%

Анализ коэффициентов эластичности и бета–коэффициентов показывает, что наибольшее влияние на коэффициент естественного прироста населения оказывает фактор ввода кв.м жилья на душу населения, так как ему соответствует наибольшее значение бета – коэффициента (1,32). Однако, это не означает, что наибольшие возможности в изменении коэффициента естественного прироста населения связаны с изменением данного из рассмотренных факторов. Полученный результат отражает то, что спрос на рынке жилья соответствует предложению, то есть чем больше естественный прирост населения, тем больше потребность этого населения в жилье и тем больше его строят.

Второй по величине бета–коэффициент (0,366) соответствует показателю количества преступлений на 1000 человек. Конечно, это не означает, что, увеличивая преступность, можно поправить демографическую ситуацию. Полученные результаты говорят о том, что чем больше людей сохраняется на 1000 населения, тем соответственно больше преступлений приходится на эту тысячу.

Больший из оставшихся признаков бета–коэффициент (0,074) соответствует показателю реальной заработной платы. Наибольшие возможности в изменении коэффициента естественного прироста населения связаны с изменением данного из рассмотренных факторов. Показатель общего коэффициента брачности уступает в этом отношении реальной заработной плате в связи с тем, что естественная убыль населения в России обусловлена, прежде всего, высокой смертностью население, сократить темпы роста которой возможно скорее материальным обеспечением, чем увеличением фактов вступления в брак.

3.3 Комбинированная группировка областей по величине реальной заработной платы и общему коэффициенту брачности

Комбинированная или многомерная группировка – это группировка по двум или нескольким признакам. Ценность этой группировки заключается в том, что она показывает не только влияние каждого из факторов на результат, но и влияние их сочетания.

Определим влияние величины реальной заработной платы и общего коэффициента брачности на коэффициент рождаемости на 1000 чел населения.

Выделим типические группы по намеченным признакам. Для этого построим и проанализируем ранжированный и интервальный ряды по факторному признаку (величина заработной платы), определим число групп и величину интервала; затем внутри каждой группы построим ранжированный и интервальный ряды по второму признаку (брачности) и также установим число групп и интервал. Порядок проведения этой работы представлен в главе 2, поэтому, опуская расчеты, приведем результаты. Для величины реальной заработной платы выделено 3 типические группы, для общего коэффициента брачности – 2 группы.

Составим макет комбинационной таблицы, в которой предусмотрим подразделение совокупности на группы и подгруппы, а также графы для записи числа областей и коэффициента рождаемости на 1000 чел населения. По выделенным группам и подгруппам подсчитаем коэффициенты рождаемости (табл.3.3.1)

Таблица 3.3.1

Влияние величины реальной заработной платы и общего коэффициента брачности на коэффициент рождаемости.

Проанализируем полученные данные зависимости коэффициента рождаемости от реальной заработной платы и коэффициента брачности. Так как изучается один признак – коэффициент рождаемости, то данные о нем запишем в шахматную комбинационную таблицу следующей формы (табл. 3.3.2)

Комбинированная группировка позволяет оценить степень влияния на коэффициент рождаемости каждого фактора в отдельности и их взаимодействие.

Таблица 3.3.2

Зависимость коэффициента рождаемости от реальной заработной платы и коэффициента брачности

Изучим вначале влияние на коэффициент рождаемости величины реальной заработной платы при фиксированном значении другого группировочного признака – коэффициента брачности. Так, при коэффициенте брачности от 13,2 до 25,625 средний коэффициент рождаемости повышается по мере увеличения заработной платы с 9,04 в 1-ой группе до 9,16 во 2-ой группе и 9,56 в 3-й группе; прибавка коэффициента рождаемости от заработной платы в 3-й группе по сравнению с 1-й составляет: 9,56-9,04=0,52 чел на 1000 населения. При коэффициенте брачности 25,625-38,05 прибавка от той же величины заработной платы равна: 10,27-9,49=0,78 чел на 1000 населения. Прибавка от взаимодействия факторов равна: 0,78-0,52=0,26 чел на 1000 населения. Из этого следует вполне естественный вывод: увеличение благосостояния мотивирует, а вернее позволяет с уверенностью в завтрашнем дне реализовать желание человека вступить в брак и создать семью с детьми. В этом проявляется взаимодействие факторов.

Таким же образом оценим влияние на коэффициент рождаемости коэффициента брачности при фиксированном уровне заработной платы. Для этого сравним коэффициент рождаемости по группам «а» и «б» в пределах каждой группы по величине реальной заработной платы. Увеличение коэффициента рождаемости с ростом коэффициента брачности до 25,625-38,05 на 1000 населения по сравнению с группой «а» составляет: в 1-й группе при величине заработной платы 5707,9 – 6808,7 руб. в месяц – 9,49-9,04=0,45 чел на 1000 населения, во 2-й группе – 10,01-9,16=0,85 чел на 1000 населения и в 3-й - 10,27-9,56=0,71 чел на 1000 населения. Как видно, решение о рождение ребенка зависит от семейного положения, т.е. имеет место взаимодействие факторов, дающее прибавку 0,26 чел на 1000 населения.

При совместном увеличении обоих факторов коэффициент рождаемости увеличивается с 9,04 в подгруппе 1«а» до 10,27 чел на 1000 населения в подгруппе 3 «б».

Представители Европейской экономической комиссии ООН недавно заявили, что возраст вступления в первый брак в европейских странах увеличился на пять лет. Парни и девушки предпочитают жениться и выходить замуж после 30. Россияне же не решаются связать себя узами брака раньше 24-26 лет. Также общей для Европы и России стала тенденция к сокращению количества брачных союзов. Молодые люди все чаще предпочитают карьеру и личную свободу. Отечественные эксперты усматривают в этих процессах признаки глубокого кризиса традиционной семьи. По их мнению, она доживает буквально последние дни. Социологи утверждают, что частная жизнь сейчас переживает период перестройки. Семья в привычном понимании этого слова, живущая по схеме "мама-папа-дети", постепенно уходит в прошлое. В частной жизни россияне все чаще экспериментируют, изобретая все новые и новые формы семьи, которые бы отвечали запросам времени. "Сейчас человек чаще меняет работу, профессию, интересы, место жительства, - рассказал "Новым известиям" директор Центра демографии и экологии человека Анатолий Вишневский. - Также часто он меняет и супругов, что еще 20 лет назад считалось неприемлемым".

Социологи отмечают, что одна из причин роста разводов в России – низкий уровень жизни населения. «По статистике, в России примерно на 10–15 % больше разводов, чем в Европе, – сообщил «НИ» г-н Гонтмахер (научный руководитель центра социальных исследований и инноваций). – Но причины разводов у нас и у них разные. Наше первенство продиктовано в основном тем, что на жизни россиян все ощутимее сказываются экономические проблемы. Супруги чаще ссорятся, если у них стесненные жилищные условия. Молодым людям не всегда удается жить самостоятельно. Кроме того, в регионах многие мужчины пьют, не работают и не могут обеспечить семью. Это тоже служит причиной развода».

Заключение

В данной работе произведен статистико-экономический анализ влияния уровня жизни населения на процессы естественного прироста.

Анализ рядов динамики показал, что за последние 10 лет наблюдается рост реальной заработной платы и величины прожиточного минимума. В целом за эти 10 лет результативный признак – коэффициент естественного прироста - является стационарным. Стабильность наметившихся процессов изменения отобранных признаков такова, что построение прогноза возможно лишь для величины реальной заработной платы и коэффициента смертности. Согласно выстроенному тренду по параболе к 2010 году прогнозная величина средней реальной заработной платы составить 17473,5 руб., а коэффициент смертности снизится до 12,75 человек на 1000.

Аналитическая группировка показала прямую зависимость между показателями: с ростом величины заработной платы улучшается показатели естественного прироста.

Однако семья из двух работников со среднестатистической заработной платой может обеспечить минимальный уровень потребления 2 детям – в низшей типической группе, 3 детям – в средней и высшей типических группах. Учитывая, что двое детей «подменяют» в будущем жизни своих родителей, незначительный прирост населения возможен только в средней и высшей типических группах и то при условии низкого по сравнению с рождаемостью уровня смертности. Потенциал рождаемости, который несет в себе заработная плата в России, низок для улучшения демографической ситуации в стране. Это как раз и выявляет необходимость введенного демографического нацпроекта в России. Увеличение заработной платы более благоприятно влияет на показатель смертности, чем на рождаемость.

Построение корреляционно-регрессионной модели выявило, что одновременное влияние факторных признаков (заработной платы, коэффициента брачности, уровня преступности и ввода жилья) на результативный (естественный прирост), наблюдается со средней силой связи. Вариация коэффициента естественного прироста населения на 44,9% характеризуется влиянием отобранных факторов, а 55,1% – другими неучтёнными и случайными причинами. Наибольшие возможности в изменении коэффициента естественного прироста населения связаны с изменением величины реальной заработной платы.

Комбинированная группировка подтвердила то, что увеличение благосостояния мотивирует, а вернее позволяет с уверенностью в завтрашнем дне реализовать желание человека вступить в брак и создать семью с детьми.

И наконец, надо дать оценку эффективности решения проблемы демографии в нашей стране. В целом, положительное и эффективное влияние материальных стимулов на процесс естественного движения населения доказано. Другое дело, что есть комплекс социально-психологических проблем (алкоголизм, насилие, самоубийства), которые неумолимо сокращают численность нашего населения. Их основная причина – отношение человека к самому себе и окружающим. Но эти проблемы не под силу решить государству в одиночку, на помощь самому себе в проблеме вымирания должно прийти гражданское общество, формируя нравственные ценности, ориентированные на создание благополучной семьи.

А государство может и должно делать все, чтобы повысить уровень и качество жизни в стране. Нельзя сказать, что наше государство пренебрегает этими обязанностями. Оно делает все возможное, отыскивая и пробуя различные пути выхода из демографического кризиса.

Список использованной литературы

1)Борисов Е.Ф. Экономическая теория: учеб.-2-е изд., перераб. и доп. – М.: ТК Велби, Изд-во Проспект, 2005. – 544с.

2)Белоусова С. анализ уровня бедности.// Экономист.-2006, №10.-с.67

3)Давыдова Л. А. Теория статистики. Учебное пособие. Москва. Проспект. 2005. 155 стр.;

4)Демография: Учебник/ Под общ. ред. Н.А. Волгина. М.: Изд-во РАГС, 2003 – 384 с.

5)Ефимова Е. П. Социальная статистика. Москва. Финансы и статистика. 2003. 559стр.;

6)Ефимова Е. П., Рябцев В.М. Общая теория статистики. Учебное издание. Москва. Финансы и статистика. 1991. 304 стр.;

7)Зинченко А.П. Практикум по общей теории статистики и с/х статистике. Москва. Финансы и статистика. 1988. 328 стр.;

8)Кадомцева С. Социальная политика и население.// Экономист.-2006, №7.-с.49

9)Козырев В.М. Основы современной экономики: Учебник. -2-е изд., перераб. и доп. –М.: Финансы и статистика, 2001.-432с.

10)Коныгина Н. Бринцева Г. Демограф Анатолий Вишневский о том, что заставляет россиянина выбирать между детьми и комфортом.// Российская газета.-2006, 7ноября - № 249 -с. 7

11)Назарова Н.Г. Курс социальной статистики. Москва. Финстатинформ. 2000. 770 стр.;

13)Основы демографии: Учебное пособие/ Н.В. Зверева, И.Н. Веселкова, В.В. Елизаров.-М.: Высш. Шк., 2004.-374 с.: ил.

14)Послание Президента Российской Федерации Федеральному Собранию Российской Федерации от 26 апреля 2007 года.

15)Райсберг Б.А., Лозовский Л.Ш., Стародубцева Е.Б. Современный экономический словарь. –4-е изд., перераб. и доп. -М.:ИНФРА-М, 2005.-480с.

16)Рудакова Р.П, Букин Л.Л., Гаврилов В.И. Практикум по статистике. -СПб.: Питер, 2007.-288стр.

17)Сайт федеральной службы статистики www.gks.ru

18)Шайкин Д.Н. Перспективная оценка численности населения России в среднесрочном периоде.// Вопросы статистики.-2007, №4 –с.47

СИСТЕМА ПОКАЗАТЕЛЕЙ (КЛЮЧ К ФИШКАМ)

1-среднемесячная номинальная заработная плата в 2006 году (в рублях)

2-индексы потребительских цен на все виды товаров и платные услуги в 2006 году в процентах к декабрю прошлого года

3- среднемесячная реальная заработная плата в 2006 году(в рублях)

4 – численность населения на начало 2006 года

5 – численность населения на конец 2006 года

6 – среднегодовая численность населения в 2006 году

7 – количество родившихся за 2006 год, человек

8 – количество умерших за 2006 год, человек

9 – коэффициент рождаемости в 2006 году на 1000 человек населения

10 –коэффициент смертности в 2006 году на 1000 человек населения

11 – коэффициент естественного прироста в 2006 году на 1000 человек населения

12 – величина прожиточного минимума за 2006 год (в рублях)

13 – количество преступлений, совершенных на 1000 челок населения

14 – ввод кв.м жилья на человека за год

15 – общий коэффициент брачности на 1000 человек населения

Приложение 1

Таблица

Реальная заработная плата, руб.

Приложение 2

Величина прожиточного минимума, руб.

Приложение 3

Г. Этот показатель представляет собой стандартизованный коэффициент регрессии, т. е. коэффициент, выраженный не в абсолютных единицах измерения признаков, а в долях среднего квадратического отклонения результативного признака

Коэффициенты условно-чистой регрессии bf являются Именованными числами, выраженными в разных единицах измерения , и поэтому несравнимы друг с другом. Для преобразования их в сравнимые относительные показатели применяется то же преобразование, что и для получения коэффициента парной корреляции. Полученную величину называют стандартизованным коэффициентом регрессии или -коэффициентом.

На практике часто бывает необходимо сравнение влияния на зависимую переменную различных объясняющих переменных, когда последние выражаются разными единицами измерения . В этом случае используют стандартизованные коэффициенты регрессии b j и коэффициенты эластичности Ej Q = 1,2,..., р)

Стандартизованный коэффициент регрессии b j показывает, на сколько величин sy изменится в среднем зависимая переменная Y при увеличении только j-й объясняющей переменной на sx, a

Решение. Для сравнения влияния каждой из объясняющих переменных по формуле (4.10) вычислим стандартизованные коэффициенты регрессии

Определите стандартизованные коэффициенты регрессии.

В парной зависимости стандартизованный коэффициент регрессии есть не что иное, как линейный коэффициент корреляции fa Подобно тому, как в парной зависимости коэффициенты регрессии и корреляции связаны между собой, так и во множественной регрессии коэффициенты чистой регрессии й, связаны со стандартизованными коэффициентами регрессии / ,-, а именно

Рассмотренный смысл стандартизованных коэффициентов регрессии позволяет их использовать при отсеве факторов - из модели исключаются факторы с наименьшим значением jQy.

Как было показано выше, ранжирование факторов, участвующих в множественной линейной регрессии , может быть проведено через стандартизованные коэффициенты регрессии (/ -коэффициенты). Эта же цель может быть достигнута с помощью частных коэффициентов корреляции - для линейных связей. При нелинейной взаимосвязи исследуемых признаков эту функцию выполняют частные индексы детерминации. Кроме того, частные показатели корреляции широко используются при решении проблемы отбора факторов целесообразность включения того или иного фактора в модель доказывается величиной показателя частной корреляции.

Иными словами, в двухфакторном анализе частные коэффициенты корреляции - это стандартизованные коэффициенты регрессии, умноженные на корень квадратный цз соотношения долей остаточных дисперсий фиксируемого фактора на фактор и на результат.

В процессе разработки нормативов численности собираются исходные данные о списочной численности управленческого персонала и значениях факторов по отобранным базовым предприятиям. Далее отбираются существенные факторы для каждой функции на основе корреляционного анализа , исходя из значения коэффициентов корреляции . Выбираются факторы с наибольшим значением парного коэффициента корреляции с функцией и стандартизованного коэффициента регрессии.

Стандартизованные коэффициенты регрессии (р) рассчитываются для каждой функции по совокупности всех аргументов согласно формуле

Тем не менее, в статистике даются полезные рекомендации, позволяющие получить хотя бы оценочные представления по этому поводу. В качестве примера познакомимся с одним из таких методов - сравнение стандартизованных коэффициентов регрессии.

Стандартизованный коэффициент регрессии вычисляется путем умножения коэффициента регрессии bi на стандартное отклонение Sn (для наших -переменных обозначим его как Sxk) и деления полученного произведения на Sy. Это означает, что каждый стандартизованный коэффициент регрессии измеряется как величина b Sxk / .Применительно к нашему примеру получим следующие результаты (табл.10).

Стандартизованные коэффициенты регрессии

Таким образом, приведенное сравнение абсолютных величин стандартизованных коэффициентов регрессии позволяет получить пусть и довольно грубое, но достаточно наглядное представление о важности рассматриваемых факторов. Еще раз напомним, что эти результаты не являются идеальными, поскольку не в полной мере отражают реальное влияние исследуемых переменных (мы оставляем без внимания факт возможного взаимодействия этих факторов, что может исказить первоначальную картину).

Коэффициенты этого уравнения (blf 62, Ь3) определяются решением стандартизованного уравнения регрессии

Оператор 5. Вычисление -коэффициентов - коэффициентов регрессии в стандартизованном масштабе.

Нетрудно видеть, что путем замены на 2 и дальнейших простых преобразований можно прийти к системе нормальных уравнений в стандартизованном масштабе. Подобное преобразование мы будем применять в дальнейшем, поскольку нормирование, с одной стороны, позволяет нам избежать слишком больших чисел и, с другой стороны, сама вычислительная схема при определении коэффициентов регрессии становится стандартной.

Вид графа непосредственных связей говорит о том, что при построении уравнения регрессии только по двум факторам - количеству тралений и времени чистого траления- остаточная дисперсия ст.з4 не отличалась бы от остаточной дисперсии а.23456. полученной из уравнения регрессии , построенного по всем факторам. Чтобы оценить различие, мы обратимся в данном случае к выборочной оценке . 1.23456 = 0,907, а 1.34 = 0,877. Но если скорректировать коэффициенты по формуле (38), то 1.23456=0,867, a / i.34= = 0,864. Различие вряд ли можно считать существенным. Более того, г14 = 0,870. Это наводит на мысль, что количество тралений почти не оказывает непосредственного влияния на размер улова. Действительно, в стандартизованном масштабе 1.34 = 0,891 4 - 0,032 3- Нетрудно убедиться, что коэффициент регрессии при t3 недостоверен даже при очень низком доверительном интервале.

Рх/. - соответствующий коэффициент

Задание.

Для заданного набора данных постройте линейную модель множественной регрессии. Оцените точность и адекватность построенного уравнения регрессии.
Дайте экономическую интерпретацию параметров модели.
Рассчитайте стандартизованные коэффициенты модели и запишите уравнение регрессии в стандартизованном виде. Верно ли утверждение, что цена блага оказывает большее влияние на объем предложения блага, чем заработная плата сотрудников?
Для полученной модели (в естественной форме) проверьте выполнение условия гомоскедастичности остатков, применив тест Голдфельда-Квандта .
Проверьте полученную модель на наличие автокорреляции остатков с помощью теста Дарбина-Уотсона .
Проверьте, адекватно ли предположение об однородности исходных данных в регрессионном смысле. Можно ли объединить две выборки (по первым 8 и остальным 8 наблюдениям) в одну и рассматривать единую модель регрессии Y по X ?

1. Оценка уравнения регрессии. Определим вектор оценок коэффициентов регрессии с помощью сервиса Уравнение множественной регрессии . Согласно методу наименьших квадратов, вектор s получается из выражения: s = (X T X) -1 X T Y
Матрица X

1	182.94	1018
1	193.45	920
1	160.09	686
1	157.99	405
1	123.83	683
1	152.02	530
1	130.53	525
1	137.38	418
1	137.58	425
1	118.78	161
1	142.9	242
1	99.49	226
1	116.17	162
1	185.66	70

Матрица Y

4.07
4
2.98
2.2
2.83
3
2.35
2.04
1.97
1.02
1.44
1.22
1.11
0.82

Матрица X T

1	1	1	1	1	1	1	1	1	1	1	1	1	1
182.94	193.45	160.09	157.99	123.83	152.02	130.53	137.38	137.58	118.78	142.9	99.49	116.17	185.66
1018	920	686	405	683	530	525	418	425	161	242	226	162	70

Умножаем матрицы, (X T X)
Находим обратную матрицу (X T X) -1

2.25	-0.0161	0.00037
-0.0161	0.000132	-7.0E-6
0.00037	-7.0E-6	1.0E-6

Вектор оценок коэффициентов регрессии равен

Y(X) =

2,25	-0,0161	0,00037
-0,0161	0,000132	-7,0E-6
0,00037	-7,0E-6	1,0E-6

31,05

4737,044

18230,79

0,18

0,00297

0,00347

Уравнение регрессии (оценка уравнения регрессии)
Y = 0.18 + 0.00297X 1 + 0.00347X 2

2. Матрица парных коэффициентов корреляции R. Число наблюдений n = 14. Число независимых переменных в модели равно 2, а число регрессоров с учетом единичного вектора равно числу неизвестных коэффициентов. С учетом признака Y, размерность матрицы становится равным 4. Матрица, независимых переменных Х имеет размерность (14 х 4).
Матрица, составленная из Y и X

1	4.07	182.94	1018
1	4	193.45	920
1	2.98	160.09	686
1	2.2	157.99	405
1	2.83	123.83	683
1	3	152.02	530
1	2.35	130.53	525
1	2.04	137.38	418
1	1.97	137.58	425
1	1.02	118.78	161
1	1.44	142.9	242
1	1.22	99.49	226
1	1.11	116.17	162
1	0.82	185.66	70

Транспонированная матрица.

1	1	1	1	1	1	1	1	1	1	1	1	1	1
4.07	4	2.98	2.2	2.83	3	2.35	2.04	1.97	1.02	1.44	1.22	1.11	0.82
182.94	193.45	160.09	157.99	123.83	152.02	130.53	137.38	137.58	118.78	142.9	99.49	116.17	185.66
1018	920	686	405	683	530	525	418	425	161	242	226	162	70

Матрица A T A.

14	31.05	2038.81	6471
31.05	83.37	4737.04	18230.79
2038.81	4737.04	307155.61	995591.55
6471	18230.79	995591.55	4062413

Полученная матрица имеет следующее соответствие:

∑n	∑y	∑x 1	∑x 2
∑y	∑y 2	∑x 1 y	∑x 2 y
∑x 1	∑yx 1	∑x 1 2	∑x 2 x 1
∑x 2	∑yx 2	∑x 1 x 2	∑x 2 2

Найдем парные коэффициенты корреляции.

Признаки x и y	∑{x i }		∑{y i }		∑{x i y i }
Для y и x 1	2038.81	145.629	31.05	2.218	4737.044	338.36
Для y и x 2	6471	462.214	31.05	2.218	18230.79	1302.199
Для x 1 и x 2	6471	462.214	2038.81	145.629	995591.55	71113.682

Признаки x и y
Для y и x 1	731.797	1.036	27.052	1.018
Для y и x 2	76530.311	1.036	276.641	1.018
Для x 1 и x 2	76530.311	731.797	276.641	27.052

Матрица парных коэффициентов корреляции R:

-	y	x 1	x 2
y	1	0.558	0.984
x 1	0.558	1	0.508
x 2	0.984	0.508	1

Для отбора наиболее значимых факторов x i учитываются следующие условия:
- связь между результативным признаком и факторным должна быть выше межфакторной связи;
- связь между факторами должна быть не более 0.7. Если в матрице есть межфакторный коэффициент корреляции r xjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность.;
- при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними.
В нашем случае все парные коэффициенты корреляции |r| Модель регрессии в стандартном масштабе Модель регрессии в стандартном масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты (стандартизованные значения) по формулам:

где х ji - значение переменной х ji в i-ом наблюдении.

Таким образом, начало отсчета каждой стандартизованной переменной совмещается с ее средним значением, а в качестве единицы изменения принимается ее среднее квадратическое отклонение S .
Если связь между переменными в естественном масштабе линейная, то изменение начала отсчета и единицы измерения этого свойства не нарушат, так что и стандартизованные переменные будут связаны линейным соотношением:
t y = ∑β j t xj
Для оценки β-коэффициентов применим МНК. При этом система нормальных уравнений будет иметь вид:
r x1y =β 1 +r x1x2 β 2 + ... + r x1xm β m
r x2y =r x2x1 β 1 + β 2 + ... + r x2xm β m
...
r xmy =r xmx1 β 1 + r xmx2 β 2 + ... + β m
Для наших данных (берем из матрицы парных коэффициентов корреляции):
0.558 = β 1 + 0.508β 2
0.984 = 0.508β 1 + β 2
Данную систему линейных уравнений решаем методом Гаусса : β 1 = 0.0789; β 2 = 0.944;
Стандартизированная форма уравнения регрессии имеет вид:
y 0 = 0.0789x 1 + 0.944x 2
Найденные из данной системы β–коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам:

Стандартизированные частные коэффициенты регрессии . Стандартизированные частные коэффициенты регрессии - β-коэффициенты (β j) показывают, на какую часть своего среднего квадратического отклонения S(у) изменится признак-результат y с изменением соответствующего фактора х j на величину своего среднего квадратического отклонения (S хj) при неизменном влиянии прочих факторов (входящих в уравнение).
По максимальному β j можно судить, какой фактор сильнее влияет на результат Y.
По коэффициентам эластичности и β-коэффициентам могут быть сделаны противоположные выводы. Причины этого: а) вариация одного фактора очень велика; б) разнонаправленное воздействие факторов на результат.
Коэффициент β j может также интерпретироваться как показатель прямого (непосредственного) влияния j -ого фактора (x j) на результат (y). Во множественной регрессии j -ый фактор оказывает не только прямое, но и косвенное (опосредованное) влияние на результат (т.е. влияние через другие факторы модели).
Косвенное влияние измеряется величиной: ∑β i r xj,xi , где m - число факторов в модели. Полное влияние j-ого фактора на результат равное сумме прямого и косвенного влияний измеряет коэффициент линейной парной корреляции данного фактора и результата - r xj,y .
Так для нашего примера непосредственное влияние фактора x 1 на результат Y в уравнении регрессии измеряется β j и составляет 0.0789; косвенное (опосредованное) влияние данного фактора на результат определяется как:
r x1x2 β 2 = 0.508 * 0.944 = 0.4796