Реферати українською » Экономико-математическое моделирование » Довірчий інтервал. Перевірка статистичних гіпотез


Реферат Довірчий інтервал. Перевірка статистичних гіпотез

Довірчий інтервал.

Перевірка статистичних гіпотез


1. Довірчий інтервал

 

>Точечние оцінки є наближеними, оскільки вони вказують точку на числової осі, у якій має бути значення невідомого параметра. Проте оцінка є наближеним значенням параметра генеральної сукупності, яка за різних вибірках однієї й тієї ж обсягу прийматиме різних значень, у ряді завдань потрібно знайти лише підходяще значення параметра а, а й визначити її точність і надійність.

І тому в математичної статистиці використовується два поняття – довірчий інтервал і довірча ймовірність. Нехай для параметра та якщо з досвідчених даних отримананесмещенная оцінка Потрібна визначити можливу у своїй величину помилки і можливість те, що оцінка не вискочить межі цієї помилки (надійність).

Поставмо деякою ймовірністю b (наприклад, b = 0,99) і знайдемо таке значення e > 0, котрій

Уявімо цей вислів як

Це означає, що з імовірністю b точне значення параметра а перебуває у інтервалі le

                                                                                le

 

                                                         

Тут параметр а – невипадкова величина, а інтервал le  є випадковим, оскільки - випадкова величина. Тому b краще тлумачити, як можливість, випадковий інтервал le накриє точку а. Інтервал le  називають довірчим інтервалом, а ймовірність b - довірчій ймовірністю (надійністю).

Приклад. Якщо за вимірі якийсь величини Х вказується абсолютна похибкаDх, це, сутнісно, означає, що похибка вимірювання, будучи випадкової величиною, рівномірно розподілено в інтервалі (->Dх,Dх) і Х* - вимірювана величина, а x – її точне значення. Тут b = 1, e =Dх і le = (x*-Dх, x* +Dх).

1.1  Довірчий інтервал для математичного очікування

Як чергового прикладу розглянемо завдання про довірчому інтервалі для математичного очікування. Нехай проведено n незалежних дослідів виміру випадкової величини Х з невідомим математичним очікуваннямmx ідисперсиейs2. З досвідчених даних Х1, Х2, ... , Хn побудуємо вибіркові оцінки

Потрібна побудувати (знайти) довірчий інтервал le, відповідний довірчій ймовірності b, для середнього генеральногоmx.

Оскільки середнє вибіркове представляє суму n незалежних однаково розподілених випадкових величин то, при досить великий обсяг вибірки відповідно до центральної граничною теореми її закон близький до нормальному. Існує емпіричне правило, яким при обсязі вибірки n 30 вибіркове розподіл можемо вважати нормальним.

Раніше засвідчили, що Знайдемо тепер таку величинуe(b) > 0, на яку виконується рівність

Вважаючи випадкову величину нормально розподіленої, маємо

Після заміни маємо

Потабличним значенням функціїЛапласаФ*(z) знаходимо аргумент, у якому вона дорівнює b. Якщо це аргумент позначити Zb, тоді

Середнє квадратичне значення наближено усунути

    де 

Отже, довірчий інтервал для середнього генерального дорівнює:


le =  

Якщо ним користуватисятабличними значеннями інтеграла ймовірностей

то довірчий інтервал набирає вигляду

le =

 

1.2  РозподілСтьюдента

При малому обсязі вибірки (n < 30) отриманий довірчий інтервал для середнього генерального, використовує нормальне розподіл випадкової величини , може дуже грубим.

Для точного отримання довірчого інтервалу треба зазначити закон розподілу випадкової величини при малому обсязі вибірки. І тому скористаємося наступним результатом. Нехай Х1, Х2, ... , Хn – вибірка нормально розподіленої випадкової величини Х, тоді, як доведено, випадкова величина

підпорядковується розподілуСтьюдента з n – 1 ступенем свободи, щільність розподілу якого має вигляд

де - гама функція. Ця щільність, з формули, залежить від числа дослідів n. Нижче подані графікиплотностей унормованого (>mx = 0,s = 1) нормально розподіленої і із розподіломСтьюдента (n = 4) випадкових величин.


нормальне розподіл

 
                                                        >f

                                                      

 розподілСтьдента

 
                                                        0,4

                                                        0,3

                                                        0,2

                                                        0,1

                     -4 -3 -2 -1 1 2 3 4t

З знайдених можна, користуючись розподіломСтьюдента, знайти довірчий інтервал дляmx , відповідний довірчій ймовірності b. Справді, оскільки то


Користуючись таблицею значень інтеграла

за значенням b знайдемо величину отже, і саме довірчий інтервал le =


2.  Перевірка статистичних гіпотез

 

Прийняття рішення про параметрах генеральної сукупності грає винятково важливу роль практично. Розглянемо питання ухваленні рішення з прикладу. Нехай фірма, яка випускає конденсатори, стверджує, що середнєпробивное напруга конденсаторів одно чи перевищує 300 У. Відчувши 100 конденсаторів, ми маємо, що середнє вибірковепробивное напруга одно 290 У, анесмещенное вибіркове середнє квадратичне відхиленняsn = 40 У. Чи можна з довірчій ймовірністю 0,99 стверджувати, що середнєпробивное напруга перевищує 300 У.

Тут нас цікавить одностороння оцінка – середнєпробивное напруга повинна перевищувати 300 У.

Висловимо статистичну гіпотезу – генеральне середнєmx = 300 У, та був перевіримо, чи вона результатам спостереження. Оскільки обсяг вибірки більше 30, то вибіркове середнє вважатимутьсягауссовской випадкової завбільшки з генеральноїдисперсиейs2 »sn2.Введем центровану і нормовану величину

Твердження у тому, що середнє вибіркове напруга еквівалентно утвердженню, що випадкова величина

Знайдемо можливість, щогауссовская випадкова величина Z зm>z = 0 іs>z = 1 приймає значення більшеz>o:

Ця величина має дорівнювати довірчій ймовірності 0,99. Тоді й за таблицями значень функції знаходимо аргументz>o = -2,33.Вичислим тепер бачимо значення випадкової величини Z:

Ми, що значенняz = - 2,5нe належить інтервалу [->2,33;), тому гіпотезу треба відкинути.

Наведемо приклад гіпотези з двосторонній оцінкою. Нехай фірма, яка випускаєстабилитрони певного типу, стверджує, що номінальне напруга стабілізаціїстабилитронов одно 10 У. Природно, що відхилення напруги стабілізації в меншу чи велику боку однаково небажано.Видвинем гіпотезу, що генеральне середнє напруга стабілізації одно 10 У, та був перевіримо цю статистичну гіпотезу за результатами спостереження.

Нехай під час випробування 100стабилитронов середнє вибіркове одно 10,3 У, анесмещенное вибіркове середнє квадратичне відхилення одно 1,2 У. Чи можна з довірчій ймовірністю 0,95 вважати висунуту гіпотезу справедливою? Оскільки обсяг вибірки більше 30, можна, як і попереднього прикладі, запровадитигауссовскую випадкову величину Z. Знайдемо

і прирівняємо праву частина отриманого співвідношення 0,95. Тоді йz>o =1,96. Це означає, що значенняz має належати інтервалу (-1,96; 1,96). Оскільки не потрапляє у зазначений інтервал, то гіпотеза відхиляється.

Якщо обсяг вибірки n < 30, то випадкова величинаcчитаетсястьюденской випадкової величиною T. Тому повторюючи окреслені вище викладки для перевірки статистичних гіпотез, значення аргументу шукаються задля розподіленняСтьюдента. У цьому, оскільки "хвости"стьюденского розподілу стосовногауссовским подовжуються, довірчі інтервали розширюються, а можливість прийняття гіпотез поліпшуються.


3.  Функція ризику

довірчий інтервал ймовірність статистична гіпотеза

Нехай є дві протилежні гіпотези Мпро і М1 і певне що з ними випадкова величина Y. І хоча у - значення випадкової величини Y, отриманий у результаті випробувань, що належить безлічі D - безліч всіх значень випадкової величини Y. Потрібна перевірити гіпотези Мпро щодо конкуруючої гіпотези М1 виходячи з результатів випробування.

>Разобьем безліч D на частини - Dпро і D1 з вимогою прийняття гіпотези Мпро потрапляючи отриманого значення у в Dпро і гіпотези М1 - потрапляючи у в D1.  Вибір вирішального правила, тобто розбивка безлічі D на частини Dпро і D1 у будь-якій завданню перевірки гіпотез може бути більше, ніж єдиним чином. Постає питання, який із цихразбиений у кожній конкретній завданню вважати найкращим? Аби розв'язати це завдання потрібно мати деякою додаткової інформацією. Такої інформації називається апріорній.

Вважатимемо відомими два умовних розподілу ймовірностей випадкової величини Y:

 - щільність розподілу випадковоївеличині Y за умови, що правильна гіпотеза Мпро;

 - щільність розподілу випадковоївеличині Y за умови, що правильна гіпотеза М1;

З іншого боку нам знадобиться завжди апріорна ймовірність р те, що гіпотеза Мпро має місце.

>Введем в розгляд події:

А – правильна гіпотеза Мпро, тоді р =р(А);

 – правильна конкуруюча гіпотеза М1, тоді р() = 1 - р;

У – внаслідок експерименту значення у потрапив у інтервал Dпро;

 – внаслідок експерименту значення у потрапив у інтервал D1.

Тоді за результатами експерименту можливі лише чотири події:

АВ – правильна гіпотеза Мпро  і прийняте рішення її істинності;

У – правильна гіпотеза М1, а прийняте рішення істинності гіпотези Мпро;

А – правильна гіпотеза Мпро, а прийняте рішення істинності гіпотези М1;

 – правильна гіпотеза М1 і прийняте рішення її істинності.

Зрозуміло, що події У й О визначають помилкові рішення.Собитию У відповідає так звана помилка першого роду, а події А - помилка другого роду.

Щоб відповісти питанням, який із вирішальних правил можна вважати найкращим, введемо поняття функції втрат перезимувало і функцію ризику.

Функція втрат – дискретна випадкова величина З, яка кожному з подій АВ, У, А, ставить за відповідність втрати , виражені у якихось одиницях.Правильному рішенню природно покласти нульові втрати, а помилок першого і другого низки покласти відповідно позитивні втрати (числа) З1 і З2, потрібно поставити.

Нехай рпро =р(АВ чи ), р1 =р(В), р2 =р(А). Визначення значень цих ймовірностей пройдуть нижче. Ряд розподілу для випадкової величини З має вигляд

З 0

з1

з2

р

рпро

р1

р2

Визначення. Математичне очікуванняМ(С) випадкової величини З називається функцією ризику і позначається буквоюr. 

Отже,r =М(С) = 0 рпро + з1 р1 + з2 р2 = з1 р1 + з2 р2.

Запровадження функції ризику призводить до природному вибору вирішального правила. Із двох правил найкращим вважається те, який призводить до меншому ризику. Для перебування мінімуму функції ризику знайдемо ймовірності р1 і р2:

Тоді      

А, щоб інтеграл був мінімальним, отже, і мінімальне значення приймала функція ризикуr, у склад Dпро включити ті у, у якихподиинтегральная функція 

З1 (>1-р)f1(y) –p З2f>o(y) < 0,

а склад D1- інші значення у.

Останнє нерівність можна записати як

Функціяf1(>y)/f>o(y) називається ставленням правдоподібності.

Отже, оптимальне вирішальне правило ось у чому: отриманий у результаті експерименту значення у підставляється стосовно правдоподібностіf1(>y)/f>o(y) і порівнюється зі числом

l =

якщо отриманий у результаті обчислення числоf1(>y)/f>o(y) менше l, приймається гіпотеза Мпро; інакше – гіпотеза М1.

Величина l називається порога, а оптимальне вирішальне правило називається порогового критерію оптимальності.


Схожі реферати:

Навігація