Статистика. Шпаргалка — страница 8 из 24

Важное место в статистическом изучении взаимосвязей занимают следующие методы:

1) метод приведения параллельных данных;

2) графический метод;

3) корреляционно-регрессионный метод.

Сущность метода приведения параллельных данных заключается в следующем: исходные данные по признаку X располагаются в порядке возрастания или убывания, а по признаку У записываются соответствующие им показатели, после сопоставления значений X и У делается вывод о наличии и направлении зависимости.

Графический метод предполагает построение поля корреляции. Для этого значение факторного признака X располагается по оси абсцисс, а значение результативного признака У— по оси ординат. По совместному расположению точек на графике делают вывод о направлении и наличии зависимости. Если точки на графике расположены беспорядочно, то зависимость между изучаемыми признаками отсутствует. Если точки на графике концентрируются вокруг воображаемой кривой (прямой), то между признаками существует некоторая зависимость. Графический метод используют также для проверки гипотез о форме связи с помощью эмпирической линии регрессии. Эмпирическая линия регрессии — ломаная линия, изображающая изменение групповых средних результативного признака в зависимости от изменения группировочного признака-фактора.

Сущность корреляционно-регрессионного анализа заключается в: 

1) измерении тесноты связи между варьирующими признаками;

2) определении неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак;

3) установлении формы зависимости;

4) определении функции регрессии;

5) использовании уравнения для оценки неизвестных значений зависимой переменной. Выделяются следующие этапы корреляционно-регрессионного анализа:

1) предварительный анализ изучаемой совокупности;

2) сбор информации и ее первичная обработка с помощью метода группировки, графического метода;

3) оценка параметров распределения;

4) построение модели зависимости — уравнения регрессии;

5) оценка и анализ надежности модели.

При оценке модели рассчитывают показатели силы и тесноты связи. Для этого используют следующие показатели вариации результативного признака:

1) факторная дисперсия, характеризующаяся вариацию результативного признака, объясняемую только признаком-фактором;

2) остаточная дисперсия, объясняющаяся влиянием прочих факторов на результативный признак;

3) общая дисперсия, складывающаяся за счет влияния всех факторов;

4) коэффициент детерминации — отношение факторной дисперсии к общей, показывающий, какая часть общей вариации результативного признака объясняется признаком-фактором.

28. Построение уравнения регрессии

Целью регрессионного анализа является установление формы зависимости между результативным и одним или несколькими факторными признаками. Для решения этой задачи определяется функция (уравнение) регрессии. В статистике под регрессией понимают величину, которая выражает зависимость среднего значения случайной величины у (результативного признака) от значений случайной величины х (факторного признака). Уравнение регрессии выражает среднюю величину одного признака как функцию другого.

Функция регрессии — это модель (уравнение) вида yx = f(x), выражающая зависимость переменной у от определяющего ее независимого фактора х.

При построении уравнения регрессии выбирают тип аналитической функции, характеризующей механизм взаимосвязи между результативным признаком и одним или несколькими признаками-факторами. В статистике применяют следующие типы аналитических функций:

1) у = а + bх — линейная;

2)  гиперболическая;

3) у = а + bх+ сх2 — параболическая.

Множественная регрессия — регрессия между зависимой переменной у и независимыми переменными x1, x2, …, xn, т.е. это модель вида: у = f( x1, x2, …, xn ). Парная регрессия — регрессия между зависимой переменной у и независимой переменной х, т.е. это модель вида: у = f(x).

Уравнения регрессии подбирают на основании эмпирической линии связи. Выбрав форму связи, находят числовые значения параметров уравнения регрессии. В случае парной линейной зависимости строится регрессионная модель по уравнению линейной регрессии: у = а + bх.

Параметры этого уравнения находят методом наименьших квадратов.

Метод наименьших квадратов (МНК) — метод оценки параметров линейной регрессии, минимизирующий сумму квадратов отклонений наблюдений зависимой переменной от искомой линейной функции:

где уi — статические значения зависимой переменной;

f — теоретические значения зависимой переменной, рассчитанные с помощью уравнения регрессии.

Для нахождения минимума данной функции приравнивают к нулю ее частные производные и получают систему двух линейных уравнений:

Это система нормальных уравнений для линейной функции у = а+bх. Решение этой системы в общем виде дает параметры уравнения линейной регрессии:

29. Показатели тесноты связи. Линейный коэффициент корреляции

Линейный коэффициент корреляции —  количественная оценка и мера тесноты связи двух переменных, исчисляется он по следующей формуле:

Коэффициент корреляции принимает значения в интервале -1 ≤г ≤ 1. Считают, что если этот коэффициент |r|≤ 0,3, то связь слабая; если он находится в интервале 0,3 ≤ |г| ≤ 0,7, то связь средняя; если |г|≥ 0,7, то связь сильная, или тесная. Когда коэффициент |r| = 1, то связь является функциональной, если он равен 0, то говорят об отсутствии линейной связи между признаками. Значение данного коэффициента оказывает большое влияние на исследования социально-экономических явлений. При малом числе наблюдений для практических вычислений линейный коэффициент корреляции удобно вычислять по формуле:

где n — число наблюдений.

Линейным коэффициентом детерминации называется квадрат линейного коэффициента корреляции r 2.

Его значение всегда заключено в пределах от 0 до 1. Линейный коэффициент детерминации является более универсальным показателем связи по сравнению с линейным коэффициентом корреляции.

При парной связи теснота связи измеряется корреляционным отношением (η). Коэффициент детерминации (квадрат корреляционного отношения) — это отношение межгрупповой дисперсии результативного признака, которая выражает влияние различий группировочного факторного признака на среднюю величину результативного признака, к общей дисперсии результативного признака, выражающей влияние на него всех причин и условий:

где

 — общее среднее значение;

fj — частота в j -й группе;

уi — значение результативного признака для i-й единицы;

 — среднее значение у в j -й группе.

Корреляционное отношение применяется для измерения тесноты связи при линейной и криволинейной зависимостях между результативным и факторным признаками.

30. Понятие и классификация ряда динамики. Задачи изучения социально-экономических явлений во времени

Ряд динамики представляет собой числовые значения статистического показателя, расположенные в хронологическом порядке. Ряд динамики состоит из двух элементов:

1) числовых значений показателя, называемых уровнями ряда;

2) моментов (дат) или периодов, к которым относятся уровни.

Различают следующие виды рядов динамики: моментные; интервальные (периодические).

В моментных рядах уровни ряда выражают величину явления на определенную дату. Особенностью моментного ряда динамики является то, что в его уровни могут входить одни и те же единицы изучаемой совокупности. В интервальных рядах уровни характеризуют величину явления за определенный период времени. Особенностью интервального ряда динамики является то, что каждый его уровень складывается изданных за более короткие интервалы времени.

Ряды динамики могут быть полными и неполными. Полный ряд — ряд динамики, в котором одноименные моменты времени или периоды времени строго следуют один за другим в календарном порядке или равноотстоят друг от друга. Неполный ряд динамики — ряд, в котором уровни зафиксированы в неравноотстоящие моменты или периоды времени.

В зависимости от формы представленных показателей динамические ряды подразделяются на ряды абсолютных, относительных и средних величин.

Посредством анализа рядов динамики решаются следующие задачи:

1) характеристика изменения явления от даты к дате, от периода к периоду;

2) характеристика среднего уровня и средней интенсивности изменения явления за анализируемый период в целом;

3) выявление основных закономерностей, тенденций динамики;

4) прогноз дальнейшего развития явлений;

5) характеристика сезонности в изменении явлений.

При построении и перед анализом ряда динамики нужно прежде всего обратить внимание на сопоставимость уровней ряда между собой, так как только в этом случае динамический ряд будет правильно отражать процесс развития явления. Сопоставимость уровней ряда динамики — важнейшее условие обоснованности и правильности выводов, полученных в результате анализа этого ряда. При построении динамического ряда надо иметь в виду, что ряд может охватывать большой период времени, в течение которого могли произойти следующие изменения, нарушающие сопоставимость:

1) территориальные изменения объекта исследования, к которому относится изучаемый показатель;

2) изменение интервалов времени, к которым относится показатель;

3) изменение даты учета;

4) изменение цен;

5) изменение единиц измерения;

6) изменения круга охвата объектов;

7) изменения методологии расчетов и т.д.

31. Статистические показатели динамики