Формула для определения необходимой численности выборки выводится из формулы предельной ошибки выборки:
Следовательно,
Из последней формулы видно, что необходимая численность выборки зависит от трех параметров: коэффициента доверия t , предельной ошибки А, дисперсии σ2. Величина допустимой ошибки выборки и уровень вероятности, а следовательно, и значение коэффициента t задаются самим исследователем. При этом не следует гнаться за чрезмерно большими значениями t и чрезмерно малыми значениями σ2, так как это ведет к увеличению объема выборочного наблюдения n , а следовательно, к увеличению затрат средств, труда и времени, не вызванных необходимостью. Значение коэффициента доверия t находят по специальной таблице, где каждому значению коэффициента ставится в соответствие значение уровня вероятности.
Сложнее определить дисперсию, которая неизвестна. В связи с этим используют следующие способы приближенной оценки дисперсии:
1) проводят пробное обследование небольшой части совокупности. На его основе определяется величина дисперсии, используемая в качестве оценки генеральной дисперсии если структура совокупности и условия ее развития достаточно стабильны, оценкой генеральной дисперсии может служить выборочная дисперсия, полученная по результатам предшествующего выборке наблюдения;
3) находят дисперсию из соотношения если известна примерная величина средней;
4) определяют среднее квадратическое отклонение в соответствии с правилом «трех сигм»: , если известны максимальное и минимальное значения изучаемого признака в совокупности (хmax и хmin), Правило показывает, что при нормальном распределении размах вариации не превышает 6σ (±3σ);
5) устанавливают для относительной величины максимальную величину дисперсии равной σ2 max = 0,5 х 0,5 = 0,25 ;
6) принимают при выборочном наблюдении альтернативного признака долю, равную w = 0,5, а дисперсия — σ2 = 0,25. Необходимая численность выборки при изучении альтернативного признака определяется формулой:24. Статистическая оценка параметров распределения
Для статистической оценки параметров распределения используют средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели называют центральными моментами распределения порядка, соответствующего степени, в которую возводятся отклонения:
1) центральный момент первого порядка равен нулю;
2) центральный момент второго порядка, представляет собой дисперсию;
3) величина третьего порядка момента m 3:
а) — для несгруппированных данных;
б) — для сгруппированных данных.
В эмпирических распределениях центральный момент нечетного порядка отличается от нуля в отрицательную или положительную стороны в зависимости от характера асимметрии:
1) при левосторонней асимметрии центральный момент нечетного порядка меньше нуля;
2) при правосторонней асимметрии центральный момент нечетного порядка больше нуля. В анализе параметров распределения применяются специальные показатели, характеризующие расхождения между эмпирическим и нормальным распределениями. Чаще всего фактические распределения, построенные по эмпирическим данным, асимметричны, т.е. смещены по отношению коси симметрии нормального распределения.
Для определения направления и величины этого смещения применяют коэффициент асимметрии: . Другой показатель асимметрии вычисляют по формуле:
1) при левосторонней асимметрии КА <0;
2) при правосторонней — КА > 0.
Эксцесс распределения — показатель, который используется для характеристики островершинности фактического распределения по отношению к нормальному распределению. Для оценки эксцесса распределения используется четвертый центральный момент для двух типов данных:
1) — для несгруппированных данных;
2) — для сгруппированных данных.
Коэффициент эксцесса для эмпирического распределения вычисляют по формуле: . Его используют для оценки характера
фактического распределения по отношению к нормальному:
1) при островершинности изучаемого распределения E > 0;
2) при плосковершинности изучаемого распределения E < 0.25. Абсолютные величины
Абсолютные статистические величины показывают объем, размеры, уровни различных социально-экономических явлений и процессов. Абсолютные величины отражают наличие тех или иных ресурсов и являются основой материального учета. Они отражают уровни в физических мерах объема, веса и т.п. В общем абсолютные статистические величины — это именованные числа. Они всегда имеют определенную размерность и единицы измерения.
Единицы измерения определяют сущность абсолютной величины. Для измерения абсолютных показателей применяют следующие группы единиц измерения:
1) натуральные — это такие единицы измерения, которые отражают величину предметов, вещей в физических мерах (вес, объем, площадь и т.д.);
2) денежные (стоимостные) единицы измерения используются для характеристики многих экономических показателей в стоимостном выражении;
3) трудовые единицы измерения используются для определения затрат труда (человеко-час, человеко-день);
4) условно-натуральные — это единицы измерения, которые используются для сведения воедино нескольких разновидностей потребительских стоимостей.
Различают следующие виды абсолютных величин:
1) индивидуальные показатели. Отражают размеры количественных признаков у отдельных единиц изучаемой совокупности. Их получают в процессе статистического наблюдения как результат оценки, подсчета, замера фиксированного количественного признака;
2) общие (сводные) показатели. Выражают размер признака у отдельных групп или у всех единиц совокупности вместе взятых. Они получаются путем суммирования индивидуальных абсолютных величин в результате сводки и группировки значений индивидуальных абсолютных показателей.
Абсолютные показатели могут быть рассчитаны во времени и пространстве. При учете абсолютных показателей во времени (в динамике) их регистрация может быть осуществлена на определенную дату, т.е. на какой-либо момент времени или за какой-либо период времени. В первом случае показатели являются моментальными, во втором — интервальными.
Сточки зрения пространственной определенности абсолютные показатели делят следующим образом:
1) общие территориальные показатели, которые характеризуют страну в целом;
2) региональные показатели, которые характеризуют конкретный регион;
3) локальные показатели, которые характеризуют отдельный город, населенный пункт и т.д. Абсолютные показатели не дают ответа на вопрос, какую долю имеет та или иная часть в общей совокупности, не могут охарактеризовать уровни планового задания, степень выполнения плана, интенсивность того или иного явления, так как они не всегда пригодны для сравнения и часто используются лишь для расчета относительных величин.26. Относительные величины
Относительные статистические величины выражают количественные соотношения между явлениями общественной жизни, они получаются в результате деления одной абсолютной величины на другую.
Основание (база сравнения) — знаменатель дроби, величина, с которой производится сравнение.
Сравниваемая (отчетная, текущая) величина — числитель дроби, величина, которая сравнивается.
Относительная величина показывает, во сколько раз сравниваемая величина больше или меньше базисной или какую долю первая составляет по отношению ко второй. В ряде случаев относительная величина показывает, сколько единиц одной величины приходится на единицу другой.
Важное свойство относительных величин заключается в следующем: относительная величина абстрагирует различия абсолютных величин и позволяет сравнивать такие явления, абсолютные размеры которых непосредственно несопоставимы.
В результате сопоставления одноименных абсолютных величин получают неименованные относительные величины. Они могут иметь следующие формы выражения:
1) если сравниваются величины значительно больше основания, то для выражения относительной величины применяются коэффициенты;
2) если сравниваемые величины чуть больше или чуть меньше основания, то для выражения относительной величины применяются проценты;
3) если сравниваемые величины значительно меньше основания, то относительную величину выражают в промилле.
Результатом сопоставления разноименных величин являются именованные относительные величины.
Различают следующие виды относительных величин:
1) относительная величина динамики представляет собой отношение уровня показателя за данное время к его уровню за предыдущее время;
2) относительная величина планового задания представляет собой отношение плановой величины показателя к его фактическому уровню в предшествующем периоде;
3) относительная величина выполнения плана представляет собой отношение фактического уровня показателя к его плановому уровню в одном и том же периоде времени;
4) относительная величина структуры характеризует доли отдельных частей в общем объеме совокупности. Они получаются путем деления значения каждой части совокупности на общей объем признаков во всей совокупности;
5) относительная величина координации характеризует отношение частей совокупности между собой. При их исчислении одну из частей принимают за базу сравнения и находят отношения к ней всех других частей;
6) относительная величина интенсивности характеризует распределение явления в определенной среде. Она всегда является соотношением разноименных величин;
7) относительная величина сравнения представляет собой отношение одноименных величин, относящихся к различным объектам.