Основы статистики с элeмeнтами тeории вeроятностeй для экономистов 7

Найдем предельную ошибку выборки:     Ответ. С вероятностью 0,98 можно ожидать, что доля дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц, находится в интервале от 0,4297 до 0,7703.   Пример 5.

 

Изменим условие примера 3.   С помощью собственно-случайного бесповторного отбора определяется среднее число автомобилей, оставляемых на ночь на охрану. Предполагается, что оно подчиняется нормальному закону. Каким должен быть объем выборки, чтобы с вероятностью 0,95 можно было утверждать, что когда принимается полученное среднее число автомобилей по выборке за истинное, совершается погрешность, не превышающая 3 автомобилей, если среднее квадратическое отклонение ?

 

равно 10 автомобилям?   Решение. Дано: ?= 3; ? = 10; ?= 0,95; N=365. Воспользуемся формулой расчета необходимой численности выборки для средней при собственно-случайном бесповторном отборе;    Найдем t из соотношения 2Ф0(t) = ?. 2Ф0(t) = 0,95; Ф0(t) = 0,95/2 = 0,475.   По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,475. Ф0(1,96) = 0,475.   Следовательно, t = 1,96.

 

Рассчитаем объем выборки:     Так как п – целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.

 

Следовательно, необходимо провести не менее 39 проверок.

 

Ответ. Для определения среднего числа автомобилей, оставляемых на ночь на охрану с вероятностью 0,95 и ? = 3, необходимо провести не менее 39 проверок.   Пример 6. Изменим условие примера 4.   Каким должен быть объем собственно-случайной бесповторной выборки, чтобы с вероятностью 0,90 можно было утверждать, что максимальное отклонение выборочной доли дней от доли дней в течение года (когда среднее число оставляемых на охрану автомобилей не превышало 400 единиц) не превышало 0,10, если по данным прошлых проверок выборочная доля таких дней составляла 0,60?

 

Решение. Дано: ? = 0,10; ? = 0,60; ?= 0,90; N=365.

 

Воспользуемся формулой расчета необходимой численности выборки для доли при собственно-случайном бесповторном отборе    Найдем t из соотношения 2Ф0(t) = у. 2Ф0(t) = 0,90; Ф0(t) = 0,90/2 = 0,45.

 

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,45. Ф0(1,64) = 0,45.   Следовательно, t = 1,64.   Рассчитаем необходимую численность выборки:     Так как п – целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.   Следовательно, n ? 55.   Ответ. Для того чтобы с вероятностью 0,90 и предельной ошибкой 0,10 с помощью собственно-случайного бесповторного отбора определить искомую долю дней в течение года, необходимо провести не менее 55 проверок.   Пример 7. Служба контроля энергосбыта провела выборочную проверку расхода электроэнергии жителями одного из многоквартирных домов. С помощью собственно-случайного отбора выбрано 10 квартир и определен расход электроэнергии в течение одного из летних месяцев (кВт · ч): 125; 78; 102;  140; 90; 45; 50;125; 115;112.

 

С вероятностью 0,95 определите доверительный интервал для оценки среднего расхода электроэнергии на 1 квартиру во всем доме при условии, что в доме 70 квартир, а отбор был: а) повторным; б) бесповторным.

 

Решение. По условию задачи выборочное обследование проведено с помощью собственно-случайного отбора. Объем выборки n = 10 единиц, т. е. выборка малая.   а) Считая отбор повторным, найдем доверительный интервал для оценки среднего расхода электроэнергии на 1 квартиру во всем доме, т. е. границы доверительного интервала для оценки генеральной средней.   Для этого используем формулы:     Для определения границ доверительного интервала необходимо рассчитать выборочные среднюю и среднее квадратическое (стандартное) отклонение.   Рассчитаем выборочную среднюю арифметическую:    Найдем исправленную выборочную дисперсию:     Найдем исправленное выборочное среднее квадратическое отклонение    Итак, дано: Х? = 98,2; ?= 32,1448; п = 10; у= 0,95. По таблице Стьюдента (приложение 5) найдем t по уровню значимости ? и числу степеней свободы k.  ? = 1 – ?= 1 – 0,95 = 0,05;  k=n-1=10-1=9;  ta=0,05;k=9=2,26  Найдем предельную ошибку выборки       Ответ. При условии, что отбор квартир был повторным, с вероятностью 0,95 можно ожидать, что средний расход электроэнергии на 1 квартиру во всем доме находится в интервале от 75,2269 до  121,1731 кВт.ч.   б) Найдем границы доверительного интервала для оценки среднего расхода электроэнергии на 1 квартиру во всем доме, считая отбор бесповторным.   Для этого используем формулы:    По условию Х? = 98,2; s = 32,1448;п = 10; ?= 0,95;ta=0,05;k=9= 2,26; N = 70.  Найдем предельную ошибку выборки:    76,9311   Ответ. При условии, что отбор квартир был бесповторным, с вероятностью 0,95 можно ожидать, что средний расход электроэнергии на 1 квартиру во всем доме находится в интервале от 76,9311 до 119,4689 кВт ч.     Задачи к теме 7   1. С целью изучения размеров дневной выручки в сфере мелкого частного бизнеса была произведена 10%-я случайная бесповторная выборка из 1 000 торговых киосков города. В результате были получены данные о средней дневной выручке, которая составила 500 у.е.

 

В каких пределах с доверительной вероятностью 0,95 может находиться средняя дневная выручка всех торговых точек изучаемой совокупности, если среднее квадратическое отклонение составило 150 у. е.?

 

2. Фирма, торгующая автомобилями в небольшом городе, собирает информацию о состоянии местного автомобильного рынка в текущем году. С этой целью из 8 746 лиц в возрасте 18 лет и старше, проживающих в этом городе, отобрано 500 человек. Среди них оказалось 29 человек, планирующих приобрести новый автомобиль в текущем году. Оцените долю лиц в генеральной совокупности в возрасте 18 лет и старше, планирующих приобрести новый автомобиль в текущем году, если ? = 0,05.   3. Для оценки числа безработных среди рабочих одного из районов города в порядке случайной повторной выборки отобраны 400 человек рабочих специальностей. 25 из них оказались безработными.

 

Используя 95%-й доверительный интервал, оцените истинные размеры безработицы среди рабочих этого района.

 

4. Туристическое бюро, рекламируя отдых на одном из морских курортов, утверждает, что для этого курорта характерна идеальная погода со среднегодовой температурой +20° С. Пусть случайно отобраны 35 дней в году.

 

Какова в этом случае вероятность того, что отклонение средней температуры за отобранные дни от среднегодовой температуры не превысит по абсолютной величине 2° С, если температура воздуха распределена по нормальному закону, а стандартное отклонение дневной температуры составляет 4° С ?   5. Выборочные обследования малых предприятий города показали, что 95% малых предприятий в выборке относятся к негосударственной форме собственности. Приняв доверительную вероятность равной 0,954, определите, в каких границах находится доля негосударственных малых предприятий в генеральной совокупности, если в выборку попало 100 предприятий?   6. В целях изучения среднедушевого дохода семей города в 1995 г. была произведена 1% -я повторная выборка из 30 тыс.

 

семей. По результатам обследования среднедушевой доход семьи в месяц составил 200 тыс. руб. со средним квадратическим отклонением, равным 150 тыс. руб. С вероятностью 0,95 найдите доверительный интервал, в котором находится величина среднедушевого дохода всех семей города, считая среднедушевой доход случайной величиной, распределенной по нормальному закону.   7. Для изучения различных демографических характеристик населения выборочно обследовано 300 семей города.

 

Оказалось, что среди обследованных семей 15% состоят из 2 человек. В каких пределах находится в генеральной совокупности доля семей, состоящих из 2 человек, если принять доверительную вероятность равной 0,95?

 

8. По данным выборочных обследований в 1995 г. прожиточный минимум населения Северо-Кавказского района составил в среднем на душу населения 87 тыс. руб. в месяц. Каким должен был быть минимально необходимый объем выборки, чтобы с вероятностью 0,997 можно было утверждать, что этот показатель уровня жизни населения в выборке отличается от своего значения в генеральной совокупности не более чем на 10 тыс.

 

руб., если среднее квадратическое отклонение принять равным 30 тыс. руб.?   9.

 

В 1995 г. выборочное обследование распределения населения города по среднедушевому денежному доходу показало, что 40% обследованных в выборке имеют среднедушевой денежный доход не более 200 тыс. руб. В каких пределах находится доля населения, имеющего такой среднедушевой доход, во всей генеральной совокупности, если объем генеральной совокупности составляет 1 000 000 единиц, выборка не превышает 10% объема генеральной совокупности и осуществляется по методу собственно-случайного бесповторного отбора, а доверительная вероятность принимается равной 0,954?   10. Аудиторская фирма хочет проконтролировать состояние счетов одного из коммерческих банков. Для этого случайно отбираются 50 счетов. По 20 счетам из 50. отобранных имело место движение денежных средств в течение месяца. Постройте 99%-й доверительный интервал, оценивающий долю счетов в генеральной совокупности, по которым имело место движение денежных средств в течение месяца.

 

11. Строительная компания хочет оценить возможности успешного бизнеса на рынке ремонтностроительных работ. Эта оценка базируется на случайной бесповторной выборке, в соответствии с которой из 1 000 домовладельцев, собирающихся ремонтировать или перестраивать свои дома, отобраны 600 человек. По этой выборке определено, что средняя стоимость строительных работ, которую предполагает оплатить отдельный домовладелец, составляет 5 000 у. е. С какой вероятностью можно гарантировать, что эта стоимость будет отличаться от средней стоимости строительных работ в генеральной совокупности по абсолютной величине не более, чем на 100 у. е., если стандартное отклонение стоимости строительных работ в выборке составило 500 у. е.?   12. Менеджер компании, занимающейся прокатом автомобилей, хочет оценить среднюю величину пробега одного автомобиля в течение месяца. Из 280 автомобилей, принадлежащих компании, методом случайной бесповторной выборки отобрано 30. По данным этой выборки установлено, что средний пробег автомобиля в течение месяца составляет 1 342 км со стандартным отклонением 227 км. Считая пробег автомобиля случайной величиной, распределенной по нормальному закону, найдите 95%-й доверительный интервал, оценивающий средний пробег автомобилей всего парка в течение месяца.

 

13. Среднемесячный бюджет студентов в колледжах одного из штатов США оценивается по случайной выборке. С вероятностью 0,954 найдите наименьший объем выборки, необходимый для такой оценки, если среднее квадратическое отклонение предполагается равным 100 у. е., а предельная ошибка средней не должна превышать 20 у. е.   14. Коммерческий банк, изучая возможности предоставления долгосрочных кредитов населению, опрашивает своих клиентов для определения среднего размера такого кредита. Из 9 706 клиентов банка опрошено 1 000 человек. Среднее значение необходимого кредита в выборке составило 6 750 у. е. со стандартным отклонением 1 460 у. е. Найдите границы 95%-го доверительного интервала для оценки неизвестного среднего значения кредита в генеральной совокупности.   15. Выборочные обследования показали, что доля покупателей, предпочитающих новую модификацию товара А, составляет 60% от общего числа покупателей данного товара. Каким должен быть объем выборки, чтобы можно было получить оценку генеральной доли с точностью не менее 0,05 при доверительной вероятности 0,90?   16. С помощью случайной выборки оценивается среднее время ежедневного просмотра телепередач абонентами кабельного телевидения в период с 18 до 22 ч. Каким должен быть объем выборки в этом случае, если в предыдущих выборочных обследованиях стандартное отклонение времени просмотра передач составило 40 мин, а отклонение выборочной средней от генеральной средней по абсолютной величине не должно превышать 5 мин с вероятностью 0,99?   17.

 

При выборочном опросе 1200 телезрителей оказалось, что 456 из них регулярно смотрят программы телеканала НТВ.

 

Постройте 99%-й доверительный интервал, оценивающий долю всех телезрителей, предпочитающих программы телеканала НТВ.   18. Для оценки остаточных знаний по общеэкономическим предметам были протестированы 25 студентов 2-го курса факультета. Получены следующие результаты в баллах: 107, 90, 114, 88, 117, 110, 103, 120, 96, 122, 93, 100, 121, 110, 135, 85, 120, 89, 100, 126, 90, 94, 99, 116, 111.

 

По этим данным найдите 95%-й доверительный интервал для оценки среднего балла тестирования всех студентов 2-го курса факультета.   19. Для изучения размера среднемесячной заработной платы занятого населения региона производится случайная повторная выборка. Каким должен быть объем этой выборки, чтобы с доверительной вероятностью 0,997 можно было утверждать, что среднемесячная заработная плата в выборке отличается от среднемесячной заработной платы работников во всем регионе по абсолютной величине не более чем на 25%, если среднемесячная заработная плата в выборке составила 220 у. е. со средним квадратическим отклонением 120 у. е.?   20. Выборочное исследование деятельности коммерческих банков региона показало, что в среднем каждый банк имеет 10 филиалов в регионе (со стандартным отклонением, равным 5). Найдите объем выборки, позволивший сделать такую оценку, если предельная ошибка выборочной средней находится в пределах 20% от ее фактического значения, а доверительная вероятность составляет 0,95.    8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ   В процессе статистического анализа иногда бывает необходимо сформулировать и проверить предположения (гипотезы) относительно величины независимых параметров или закона распределения изучаемой генеральной совокупности (совокупностей). Например, исследователь выдвигает гипотезу о том, что “выборка извлечена из нормальной генеральной совокупности” или “генеральные средние двух анализируемых совокупностей равны”. Такие предположения называются статистическими гипотезами.   Сопоставление высказанной гипотезы относительно генеральной совокупности с имеющимися выборочными данными, сопровождаемое количественной оценкой степени достоверности получаемого вывода и осуществляемое с помощью того или иного статистического критерия, называется проверкой статистических гипотез.   Выдвинутая гипотеза называется нулевой (основной). Ее принято обозначать Н0.   По отношению к высказанной (основной) гипотезе всегда можно сформулировать альтернативную (конкурирующую), противоречащую ей. Альтернативную (конкурирующую) гипотезу принято обозначать Н1 .

 

Цель статистической проверки гипотез состоит в том, чтобы на основании выборочных данных принять решение о справедливости основной гипотезы Н0   Если выдвигаемая гипотеза сводится к утверждению о том, что значение некоторого неизвестного параметра генеральной совокупности в точности равно заданной величине, то эта гипотеза называется простой, например: “Среднедушевой совокупный доход населения России составляет 650 руб.

 

в месяц”; “Уровень безработицы (доля безработных в численности экономически активного населения) в России равен 9%”. В других случаях гипотеза называется сложной.   В качестве нулевой гипотезы Н0 принято выдвигать простую гипотезу, так как обычно бывает удобнее проверять более строгое утверждение.   По своему содержанию статистические гипотезы можно подразделить на несколько основных типов*:   – гипотезы о виде закона распределения исследуемой случайной величины;   – гипотезы о числовых значениях параметров исследуемой генеральной совокупности**;   – гипотезы об однородности двух или нескольких выборок или некоторых характеристик анализируемых совокупностей;  – гипотезы об общем виде модели, описывающей статистическую зависимость между признаками; и др.   * В этой работе рассматриваются первые два типа гипотез.   ** Эти гипотезы часто называют параметрическими, тогда как все остальные – непараметрическими.     Так как проверка статистических гипотез осуществляется на основании выборочных данных, т. е. ограниченного ряда наблюдений, решения относительно нулевой гипотезы Н0 имеют вероятностный характер. Другими словами, такое решение неизбежно сопровождается некоторой, хотя возможно и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону.

 

Так, в какой-то небольшой доле случаев ? нулевая гипотеза Н0 может оказаться отвергнутой, в то время как в действительности в генеральной совокупности она является справедливой. Такую ошибку называют ошибкой 1-го рода, а ее вероятность – 1 уровнем значимости и обозначают ?.   Наоборот, в какой-то небольшой доле случаев ??нулевая гипотеза Н0 принимается, в то время как на самом деле в генеральной совокупности она ошибочна, а справедлива альтернативная гипотеза Н1. Такую ошибку называют ошибкой 2-го рода. Вероятность ошибки 2-го рода обозначается как ?. Вероятность 1 – ? называют мощностью критерия.   При фиксированном объеме выборки можно выбрать по своему усмотрению величину вероятности только одной из ошибок ? или ?. Увеличение вероятности одной из них приводит к снижению другой. Принято задавать вероятность ошибки 1-го рода ? – уровень значимости. Как правило, пользуются некоторыми стандартными значениями уровня значимости ?: 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Тогда, очевидно, из двух критериев, характеризующихся одной и той же вероятностью ? (отклонить правильную в действительности гипотезу Н0), следует принять тот, которому соответствует меньшая ошибка 2-го рода ?, т.е. большая мощность.

 

Снижения вероятностей обеих ошибок ?

 

и ? можно добиться путем увеличения объема выборки.   Правильное решение относительно нулевой гипотезы Н0 также может быть двух видов:   – будет принята нулевая гипотеза Н0, когда в генеральной совокупности верна нулевая гипотеза Н0 ; вероятность такого решения 1 – ?;   – нулевая гипотеза Н0 будет отклонена в пользу альтернативной Н1, когда в генеральной совокупности нулевая гипотеза Н0 отклоняется в пользу альтернативной Н1, вероятность такого решения 1 – ? – мощность критерия.   Результаты решения относительно нулевой гипотезы можно проиллюстрировать с помощью табл. 8.1.  Таблица 8.1  Нулевая гипотеза Н0   Результаты решения относительно нулевой гипотезы Н0   Отклонена   Принята   Верна Ошибка 1-го рода, ее вероятность  Р(Н1/Н0) = ? Правильное решение, его вероятность Р(Н0/Н0) = 1 – ? Неверна Правильное решение, его вероятность Р(Н1/Н1) = 1 – ? Ошибка 2-го рода, ее вероятность  Р(Н0/Н0) = ?   Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К), являющего функцией от результатов наблюдения.   Статистический критерий – это правило (формула), по которому определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой Н0.

 

Статистический критерий, как и всякая функция от результатов наблюдения, является случайной величиной и в предположении справедливости нулевой гипотезы Н0 подчинен некоторому хорошо изученному (и затабулированному) теоретическому закону распределения с плотностью распределения  f(k).   Выбор критерия для проверки статистических гипотез может быть осуществлен на основании различных принципов. Чаще всего для этого пользуются принципом отношения правдоподобия, который позволяет построить критерий, наиболее мощный среди всех возможных критериев. Суть его сводится к выбору такого критерия К с известной функцией плотности f(k) при условии справедливости гипотезы Н0, чтобы при заданном уровне значимости ? можно было бы найти критическую точку К распределения f(k), которая разделила бы область значений критерия на две части: область допустимых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую область, в которой результаты выборочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы Н0.

 

Если такой критерий К выбран, и известна плотность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости ? рассчитать по выборочным данным наблюдаемое значение критерия Kнабл определить, является ли оно наиболее или наименее правдоподобным в отношении нулевой гипотезы Н0.   Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае.

 

Например, проверка гипотезы о виде закона распределения случайной величины может быть осуществлена с помощью критерия согласия Пирсона x2; проверка гипотезы о равенстве неизвестных значений дисперсий двух генеральных совокупностей – с помощью критерия Фишера F; ряд гипотез о неизвестных значениях параметров генеральных совокупностей проверяется с помощью критерия Z – нормальной распределенной случайной величины и критерия t-Стьюдента и т. д.   Значение критерия, рассчитываемое по специальным правилам на основании выборочных данных, называется наблюдаемым значением критерия(Kнабл).   Значения критерия, разделяющие совокупность значений критерия на область допустимых значений (наиболее правдоподобных в отношении нулевой гипотезы Н0) и критическую область (область значений, менее правдоподобных в отношении нулевой гипотезы Н0), определяемые на заданном уровне значимости ?

 

по таблицам распределения случайной величины К, выбранной в качестве критерия, называются критическими точками (Ккр ).   Областью допустимых значений (областью принятия нулевой гипотезы Н0) называют совокупность значений критерия К, при которых нулевая гипотеза Н0 не отклоняется.   Критической областью называют совокупность значений критерия К, при которых нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1.   Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.   Если конкурирующая гипотеза – правосторонняя, например, Н1: а > a0, то и критическая область – правосторонняя (рис.

 

8.1). При правосторонней конкурирующей гипотезе критическая точка (Ккр.п) принимает положительные значения.     Если конкурирующая гипотеза – левосторонняя, например, Н1 : а < а0, то и критическая область – левосторонняя (рис. 8.2). При левосторонней конкурирующей гипотезе критическая точка принимает отрицательные значения (Ккр.л).     Если конкурирующая гипотеза – двусторонняя, например.

 

Н1: а ? а0 , то и критическая область – двусторонняя (рис. 8.3).

 

При двусторонней конкурирующей гипотезе определяются 2 критические точки (Ккр.л и K кр..п)     Основной принцип проверки статистических гипотез состоит в следующем:   – если наблюдаемое значение критерия (Кнабл) принадлежит критической области, то нулевая гипотеза Н0 отклоняется в пользу конкурирующей H1;   – если наблюдаемое значение критерия (Кнабл) принадлежит области допустимых значений, то нулевую гипотезу Н0 нельзя отклонить.   Можно принять решение относительно нулевой гипотезы Н0 путем сравнения наблюдаемого (Кнабл) и критического значений критерия (Ккр. ).  При правосторонней конкурирующей гипотезе:   – если Кнабл?Ккр.

 

, то нулевую гипотезу Н0нельзя отклонить;   – если Кнабл > Kкр , то нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1.  При левосторонней конкурирующей гипотезе:   – если Кнабл?-Ккр, то нулевую гипотезу Н0 нельзя отклонить;   – если Кнабл < -Ккр , то нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1.  При двусторонней конкурирующей гипотезе:  – если -Ккр ? Кнабл? Ккр, то нулевую гипотезу Н0 нельзя отклонить;  – если Кнабл > Ккр или Кнабл < -Ккр, то нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1.     Алгоритм проверки статистических гипотез сводится к следующему:   1) сформулировать нулевую Н0 и альтернативную Н1 гипотезы;   2) выбрать уровень значимости ?;   3) в соответствии с видом выдвигаемой нулевой гипотезы Н0 выбрать статистический критерий для ее проверки, т.е.

 

– специально подобранную случайную величину К, точное или приближенное распределение которой заранее известно;   4) по таблицам распределения случайной величины К, выбранной в качестве статистического критерия, найти критическое значение Ккр (критическую точку или точки);   5) на основании выборочных данных по специальному алгоритму вычислить наблюдаемое значение критерия Кнабл;   6) по виду конкурирующей гипотезы Н1 определить тип критической области;   7) определить, в какую область (допустимых значений или критическую) попадает наблюдаемое значение критерия Кнабл , и в зависимости от этого – принять решение относительно нулевой гипотезы  Н0   Следует заметить, что даже в том случае, если нулевую гипотезу Н0 , нельзя отклонить, это не означает, что высказанное предположение о генеральной совокупности является единственно подходящим: просто ему не противоречат имеющиеся выборочные данные, однако таким же свойством наряду с высказанной могут обладать и другие гипотезы.   Можно интерпретировать результаты проверки нулевой гипотезы следующим образом:   – если в результате проверки нулевую гипотезу Н0 нельзя отклонить, то это означает, что имеющиеся выборочные данные не позволяют с достаточной уверенностью отклонить нулевую гипотезу Н0, вероятность нулевой гипотезы Н0 больше ?, а конкурирующей Н1 – меньше 1 – ?;   – если в результате проверки нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1, то имеющиеся выборочные данные не позволяют с достаточной уверенностью принять нулевую гипотезу Н0, вероятность нулевой гипотезы Н0 меньше ?, а конкурирующей Н1 – больше 1 – ?.   Пример 1. В 7 случаях из 10 фирма-конкурент компании “А” действовала на рынке так, как будто ей заранее были известны решения, принимаемые фирмой “А”.

 

На уровне значимости 0,05 определите, случайно ли это, или в фирме “А” работает осведомитель фирмы-конкурента?   Решение. Для того чтобы ответить на поставленный вопрос, необходимо проверить статистическую гипотезу о том, совпадает ли данное эмпирическое распределение числа действий фирмы-конкурента с равномерным теоретическим распределением?   Если ходы, предпринимаемые конкурентом, выбираются случайно, т. е. в фирме “А” – нет осведомителя (инсайдера), то число “правильных” и “неправильных” ее действий должно распределиться поровну, т. е.

 

по 5 (10/2), а это и есть отличительная особенность равномерного распределения.   Этот вид статистических гипотез относится к гипотезам о виде закона распределения генеральной совокупности.   Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.   Н0 : Х ~ R(a; b) – случайная величина Х подчиняется равномерному распределению с параметрами (a; b) (в контексте задачи – “В фирме “А” – нет осведомителя (инсайдера)”; “Распределение числа удачных ходов фирмы-конкурента – случайно”);   Н1 : случайная величина Х не подчиняется равномерному распределению (в контексте задачи – “В фирме “А” – есть осведомитель (инсайдер)”;  “Распределение числа удачных ходов фирмы-конкурента – неслучайно”).   В качестве критерия для проверки статистических гипотез о неизвестном законе распределения генеральной совокупности используется случайная величина ?2 . Этот критерий называют критерием Пирсона.

 

Его наблюдаемое значение (?2набл) рассчитывается по формуле    где m(эмп)i – эмпирическая частота i-й группы выборки; т(теор)i, – теоретическая частота i-й группы выборки.

 

Составим таблицу распределения эмпирических и теоретических частот (табл.

 

8.2).

 

Таблица 8.2  m(эмп)i   7   3   т(тeop)i   5   5    Найдем наблюдаемое значение ?2набл     Критическое значение (?2кр.) следует определять с помощью таблиц распределения ?2 (приложение 4) по уровню значимости ?

 

и числу степеней свободы k.   По условию ?

 

= 0,05, а число степеней свободы рассчитывается по формуле  k = п – l – 1,  где k – число степеней свободы; п – число групп выборки; l – число неизвестных параметров предполагаемой модели, оцениваемых по данным выборки (если все параметры предполагаемого закона известны точно, то l = 0).   По условию задачи, число групп выборки (п) равно 2, так как могут быть только 2 варианта действий фирмы-конкурента: “удачные” и “неудачные”, а число неизвестных параметров равномерного распределения (l) равно 0.  Отсюда k=2-0-l=l.   Найдем ?2кр. по уровню значимости ? = 0,05 и числу степеней свободы k = 1:  ?2кр(? =0,05 ;k=1). =3.8   ?2набл.

 

< ?2кр.следовательно, на данном уровне значимости нулевую гипотезу нельзя отклонить, расхождения эмпирических и теоретических частот – незначимые. Данные наблюдений согласуются с гипотезой о равномерном распределении генеральной совокупности.   Это означает, что для утверждения о том, что действия фирмы-конкурента на рынке неслучайны, нет оснований и на уровне значимости ? = 0,05 можно утверждать, что в фирме “А” нет платного осведомителя фирмы-конкурента.

 

Ответ. На уровне значимости ? = 0,05 можно утверждать, что в фирме “А” нет платного осведомителя фирмы-конкурента.   Пример 2.

 

На уровне значимости ? = 0,025 проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты (табл. 8.3):  Таблица 8.3  m(эмп)i   5   10   20   25   14   3   т(теор)i   6   14   28   18   8   3     Решение. Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.   Н?: Х ~ N(a; ?2) – случайная величина Х подчиняется нормальному закону распределения с параметрами а и ?2.   Н1.

 

случайная величина Х не подчиняется нормальному закону распределения с параметрами а и ?2.   В качестве критерия для проверки нулевой гипотезы используем критерий Пирсона ?2 .   Найдем наблюдаемое значение (?2 набл):     Найдем критическое значение критерия (?2кр ) по таблице распределения ?2 (приложение 4) по уровню значимости ? и числу степеней свободы k.   По условию ? = 0,025; число степеней свободы найдем по формуле  k = п – I – 1,   где k – число степеней свободы;   п – число групп выборки;   I – число неизвестных параметров предполагаемой модели, оцениваемых по данным выборки.   По условию задачи число групп выборки (п) равно 6, а число параметров нормального неизвестных распределения (I) равно 2.   Отсюда k=6-2-1=3.   Найдем ?2кр по уровню значимости ? = 0,025 и числу степеней свободы k = 3:  ?2кр(?=0,025;k=3) =9,4    ?2набл > ?2кр следовательно, на данном уровне значимости нулевая гипотеза отклоняется в пользу конкурирующей, расхождения эмпирических и теоретических частот – значимые. Данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.   Ответ. На уровне значимости ? = 0,025 данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.   Пример 3. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологической операции на конвейере по производству часов.

 

От работающих на этой операции поступили жалобы, что они в действительности затрачивают на нее больше времени. Для проверки данной жалобы произведены хронометрические измерения времени выполнения этой технологической операции у 16 работниц, занятых на ней, и получено среднее время выполнения операции ?X = 42 с. Можно ли по имеющимся хронометрическим данным на уровне значимости ? = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, если: а) исправленное выборочное среднее квадратическое отклонение s -3,5 с; б) выборочное среднее квадратическое отклонение ?- 3,5 с?   Решение. а) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна (выборка мала, так как n = 16 меньше 30).

 

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

 

H0: а = a0 = 40 – неизвестное математическое ожидание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) равно гипотетически предполагаемому числовому значению a0 (применительно к условию данной задачи – время выполнения технологической операции соответствует норме).   H1: а > 40 – неизвестное математическое ожидание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) больше числового значения a0 (применительно к условию данной задачи – время выполнения технологической операции больше установленной нормы).   Так как конкурирующая гипотеза – правосторонняя, то и критическая область – правосторонняя.

 

В качестве критерия для сравнения неизвестного математического ожидания а (нормально распределенной генеральной совокупности с неизвестной дисперсией) с гипотетическим числовым значением a0 используется случайная величина t-критерий Стьюдента.   Его наблюдаемое значение (tнабл) рассчитывается по формуле    где X? – выборочная средняя; a0 – числовое значение генеральной средней; s – исправленное среднее квадратическое отклонение; п – объем выборки. Найдем наблюдаемое значение tнабл     Критическое значение (tкр) следует находить с помощью таблиц распределения Стьюдента (приложение 5) по уровню значимости ? и числу степеней свободы k.   По условию ? = 0,01; число степеней свободы найдем по формуле k = п – 1,  где k – число степеней свободы; п – объем выборки.

 

k = 16 – 1 = 15.   Найдем tкр по уровню значимости ? = 0,01 (для односторонней критической области) и числу степеней свободы k = 15:   tкр(?=0,01;k=1)=2,6   Заметим, что при левосторонней конкурирующей гипотезе Н1 : а < 40 tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уровню значимости ? (для односторонней критической области) и числу степеней свободы k = п – 1 и присваивать ему знак “минус”.   При двусторонней конкурирующей гипотезе Н1 : а ? 40 tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уровню значимости ? (для двусторонней критической области) и числу степеней свободы k = п – 1.   tнабл < tкр , следовательно, на данном уровне значимости нет оснований отклонить нулевую гипотезу.   Ответ. По имеющимся хронометрическим данным на уровне значимости ? = 0,01 нельзя отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме. Следовательно, жалобы работниц – необоснованны.   Наблюдаемое значение критерия попадает в область допустимых значений (рис. 8.4), следовательно, нет оснований отклонить нулевую гипотезу.     б) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна.   Алгоритм решения задачи будет тот же, что и в первом случае. Однако наблюдаемое значение tнабл рассчитывается по формуле    где X?- выборочная средняя; а0 – числовое значение генеральной средней; ?ВЫБ? – выборочное среднее квадратическое отклонение; л – объем выборки.

 

Найдем наблюдаемое значение (tнабл)     Критическое значение (tкр) следует находить по таблице распределения Стьюдента (приложение 5) по уровню значимости ? и числу степеней свободы k.   tнабл < tкр , следовательно, на данном уровне значимости нет оснований отвергнуть нулевую гипотезу, жалобы работниц – необоснованны.   Ответ. По имеющимся хронометрическим данным на уровне значимости ? = 0,01 нельзя отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, жалобы работниц – необоснованны.   Пример 4.

 

Изменим условие предыдущей задачи.

 

Техническая норма предусматривает в среднем 40 с на выполнение определенной технологической операции на конвейере по производству часов. От работающих поступили жалобы, что они в действительности затрачивают на эту операцию больше времени. Для проверки данной жалобы произведены хронометрические измерения времени ее выполнения у 36 работниц, занятых на этой операции, и получено среднее время выполнения операции X? = 42 с.

 

Можно ли (предполагая время выполнения технологической операции случайной величиной, подчиняющейся нормальному закону) по имеющимся хронометрическим данным на уровне значимости ?

 

= 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, если известно, что среднее квадратическое отклонение генеральной совокупности ??составляет 3,5 с?

 

Решение. Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна числовому значению, когда дисперсия генеральной совокупности известна (большая выборка, так как п = 36 больше 30).

 

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.   Н0 : а = a0 = 40 – неизвестная генеральная средняя нормально распределенной совокупности с известной дисперсией равна числовому значению (применительно к условию данной задачи – время выполнения технологической операции соответствует норме).   Н1: а > 40 – неизвестная генеральная средняя нормально распределенной совокупности с известной дисперсией больше числового значения (применительно к условию данной задачи – время выполнения технологической операции больше установленной нормы).   Так как конкурирующая гипотеза – правосторонняя, то и критическая область – правосторонняя.   В качестве критерия для сравнения выборочной бедней с гипотетической генеральной средней нормальной совокупности, когда дисперсия генеральной совокупности известна, используется случайная величина U.   Его наблюдаемое значение (uнабл) рассчитывается по формуле    где X?- выборочная средняя; а0 – числовое значение генеральной средней; ?ген – выборочное среднее квадратическое отклонение; п – объем выборки. Найдем наблюдаемое значение (инабл):     Так как конкурирующая гипотеза – правосторонняя, критическое значение и следует находить по таблице функции Лапласа (приложение 2) из равенства  Ф0(икр) = (1 – 2?)/2.  По условию ? = 0,01.  Отсюда  Ф0(икр) = (1 – 2·0,01)/2 = 0,49.

 

По таблице функции Лапласа (приложение 2) найдем, при каком икр Ф0(икр) = 0,49.  Ф0(2,33) = 0,49.

 

Следовательно, икр = 2,33.   Заметим, что при левосторонней конкурирующей гипотезе Н1 : а < 40 uкр следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0(uкр ) = (1 – 2?)/2 и присваивать ему знак “минус”.   При двусторонней конкурирующей гипотезе Н1 : а ? 40 икр следует находить по таблице функции Лапласа (приложение 2) из равенства     инабл >uкр , следовательно, на данном уровне значимости нулевая гипотеза отвергается в пользу конкурирующей. По имеющимся хронометрическим данным с более чем 99%-й надежностью можно утверждать, что среднее время выполнения этой операции превышает норму. Следовательно, жалобы работниц – обоснованны.   Наблюдаемое значение критерия попадает в критическую область (рис. 8.5), следовательно, нулевая гипотеза отвергается в пользу конкурирующей.     Ответ. По имеющимся хронометрическим данным на уровне значимости ?

 

= 0,01 можно утверждать, что среднее время выполнения этой операции превышает норму, жалобы работниц – обоснованны.   Пример 5. Экономический анализ производительности труда предприятий отрасли позволил выдвинуть гипотезу о наличии 2 типов предприятий с различной средней величиной показателя производительности труда. Выборочное обследование 42 предприятий 1-й группы дало следующие результаты: средняя производительность труда X?- 119 деталей. По данным выборочного обследования, на 35 предприятиях 2-й группы средняя производительность труда ? – 107 деталей.

 

Генеральные дисперсии известны: D(X) = 126,91 (дет.2); D(Y) = 136,1 (дет.2). Считая, что выборки извлечены из нормально распределенных генеральных совокупностей Х и Y, на уровне значимости 0,05, проверьте, случайно ли полученное различие средних показателей производительности труда в группах или же имеются 2 типа предприятий с различной средней величиной производительности труда.   Решение. Для решения данной задачи необходимо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых известны (большие независимые выборки). В данной задаче речь идет о больших выборках, так как пx = 42 и пy =35 больше 30.

 

Выборки – независимые, так как из контекста задачи видно, что они извлечены из непересекающихся генеральных совокупностей.   Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.   Н0: ?X = ?Y – генеральные средние 2 нормально распределенных совокупностей с известными дисперсиями равны (применительно к условию данной задачи – предприятия 2 групп относятся к одному типу предприятий: средняя производительность труда в 2 группах – одинакова).

 

Н1: ?X???Y – генеральные средние 2 нормально распределенных совокупностей с известными дисперсиями неравны (применительно к условию данной задачи – предприятия 2 групп относятся к разному типу предприятий: средняя производительность труда в 2 группах – неодинакова).   Выдвигаем двустороннюю конкурирующую гипотезу, так как из условия задачи не следует, что необходимо выяснить больше или меньше производительность труда в одной из групп предприятий по сравнению с другой.

 

Поскольку конкурирующая гипотеза – двусторонняя, то и критическая область – двусторонняя.   В качестве критерия для сравнения 2 средних генеральных совокупностей, дисперсии которых известны (большие независимые выборки), используется случайная величина Z.   Его наблюдаемое значение (zнабл) рассчитывается по формуле    где X?- выборочная средняя для X; ?- выборочная средняя для Y; D(X) – генеральная дисперсия для X; D(Y) – генеральная дисперсия для Y; пx – объем выборки для X; пy – объем выборки для Y. Найдем наблюдаемое значение (zнабл):     Так как конкурирующая гипотеза – двусторонняя, критическое значение (zкр ) следует находить по таблице функции Лапласа (приложение 2) из равенства   Ф0(zкр) = (1 – ?)/2.  По условию ?= 0,05.

Прокрутить вверх