STATISTIKA 2 Statistika a statistické zpracování dat Blok 2-3 in Fišer 22. listopadu 2024 Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 1/19 Bodový a intervalový odhad - Úvodní příklad • Jste manažerem firmy vyrábějící žárovky a chcete odhadnout průměrnou životnost (střední hodnotu) žárovek bez testování každé z nich. • Vyberete náhodně 10 žárovek a změříte jejich životnost: x = (850,870,890,900,920,940,960,980,1000,1020). • Na základě těchto měření chcete odhadnout průměrnou životnost všech žárovek. Jiří Fišer (MVŠO) YSTA2-02-3 Bodový odhad střední hodnoty Toto je bodový odhad průměrné životnosti žárovek pomocí výběrového průměru: 1 " x = - > x, = 933 hodin. Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 3/19 Intervalový odhad střední hodnoty Pro určení přesnosti odhadu spočítáme směrodatnou odchylku s = i n n - 1 ^ /=1 55,08 hodin • Pro 95% interval spolehlivosti použijeme kritickou hodnotu t « 2,262 Studentova rozdělení (pro n - 1 = 9 stupňů volnosti) • Intervalový odhad průměru: x±ť = 933 ±39,39 hodin. n • Interval: (893,61; 972,39} hodin. Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 4/19 Statistické odhady • Odhadujeme neznámé parametry základního souboru na základě výběru. • Statistický odhad je funkce výběrových dat používaná k odhadu parametrů. • Odhady jsou náhodné veličiny a mohou se lišit při různých výběrech. Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 5/19 Bodový odhad • Bodový odhad parametru /i je statistika T (X), která aproximuje li. • Bodový odhad se může měnit s každým novým výběrem. • Metody pro volbu statistiky: metoda momentů, metoda maximální věrohodnosti. Jiří Fišer (MVŠO) YSTA2-02-3 Metoda momentů • Porovnává teoretické momenty rozdělení s výběrovými momenty (viz skripta). • Odhad parametru získáme řešením takové rovnice. • Nejčastěji se používají: a /=i /=i □ g - = Jiří Fišer (MVŠO) YSTA2-02-3 Příklad: Poissonovo rozdělení Pravděpodobnostní funkce: Xxe~x p(x;X) = ——, x = 0,1,2,... s\ ! Teoretický moment: M1 = E[X] = X Výběrový moment: 1 n mi = - V x-, n ^ /=1 Odhad parametru A: A « m-| < □ ► < g ► < ► < -ž ► š -O <\ O Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 8/19 Intervalový odhad parametrů • Interval spolehlivosti: interval, ve kterém se s pravděpodobností 1 - a nachází skutečná hodnota parametru. o Hladina významnosti a\ pravděpodobnost, že parametr neleží v intervalu. • Stupeň spolehlivosti 1 - a\ pravděpodobnost, že parametr leží v intervalu. Jiří Fišer (MVŠO) YSTA2-02-3 Intervalový odhad střední hodnoty Pro velké n {n > 30): — s — s X--— • L/i _ íi. X H--— • L/i _ íi 77 2 a/Ä7 2 Pro malé n (n < 30): X —^= • ŕ^aŕn- 1), X+ • f^aŕn- 1) 7? 2 a/Ä7 2 V 7 kde: • X je výběrový průměr, • s je výběrová směrodatná odchylka, • je kvantil normovaného normálního rozdělení. • f-i_«(/7- 1) je kvantil Studentova ř-rozdělení. Definice 6.16. Praktický vzorce pro výpočet intervalu spolehlivosti pro střední hodnotu náhodne veličiny X při velkém počtu pozorování (n > 30): kde: _ s _ s X--— • U\_ol. X H—-= ■ u\_<* y/n 2' y/n 2 X je výběrový průměr, s je výběrová směrodatná odchylka, n j c počet pozorování (velikost výběru), j c kvantil normovaného normálního rozdělení odpovídající zvolene hladine spolehlivosti 1 — Cť, q je hladina významnosti (obvykle q = 0,05, což odpovídá 95% intervalu spolehlivosti) . Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 11/19 Definice 6.17. Praktický vzorce pro výpočet intervalu s náhodné veličiny X při malém počtu pozorování (n < 30): dolehli vos t i pro střední hodnotu V - -4= -íi_«(n- + kde: X je výběrový průměr, s je výběrová směrodatná odchylka. • n je počet pozorování (velikost výběru), t-i-f {n—1) jc kvantil Studentova r-rozdělení s n —1 stupni volnosti odpovídající zvoleno hladině spolehlivosti 1 — a, a jc hladina významnosti (obvykle a = 0,05, což odpovídá 95% intervalu spolehlivosti). Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 12/19 Určení přesnosti odhadu Velikost intervalu spolehlivosti, označovaná jako A, nám říká, jak přesný je náš odhad střední hodnoty /i. Vyjadřuje sc následovne: s s A = —j= • ui-9l . nebo A = —^= • (n — 1). n 2' \/n 2 Tento interval můžeme zapsat jako /i £ <^X — A, X + A^>, což znamená, že skutečná hodnota ft sc nachází někde uvnitř tohoto intervalu (při zvolené hladině spolehlivosti 1 — a] Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 13/19 Příklad: Intervalový odhad \± Praktický příklad Příklad 6.18. Měřili jsme průměr vačkového hřídele na 250 součástkách. Předpokládáme, že data mají normální rozdělení. Z výsledků měření jsme určili výběrový průměr x = 995,6 a výběrový rozptyl s2 = 134,7. Určete interval spolehlivosti pro střední hodnotu základního souboru při hladině významnosti 5 %. Řešení: Úlohu vyřešíme pomocí Excelu, kde kritickou hodnotu normálního rozdělení získáme pomocí funkce NORM. S. INV: ui_« = V L— -NORM.S.INV(0,975) sa 1,441558. n 2 v/249 Intervalový odhad střední hodnoty je tedy x- A;x + A) = (994,1584; 997,0416 Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 14/19 Intervalový odhad rozptylu (n-1)s2 (n-1)s: X?-a(n-1)' xl("-1) kde: s2 je výběrový rozptyl, X2 jsou kvantily chĺ-kvadrát rozdělení s n - 1 stupni volnosti □ ůp - - Jiří Fišer (MVSO) YSTA2-02-3 22. listopadu 2024 Příklad: Intervalový odhad rozptylu Definice 6.19. Praktický vzorce pro výpočet intervalu spolehlivosti pro rozptyl a2: I (n-l)s2 (n-l).s2\ kde: s2 je výběrový rozptyl, n je počet pozorování (velikost výběru), X%(n — 1) a Xi_£i(n — 1) jsou kvantily chí-kvadrát rozdělení s n — 1 stupni volnosti odpovídající hladinám významnosti ^ a 1 — |, a jc hladina významnosti (obvykle a = 0,05, což odpovídá 95% intervalu spolehlivosti). Tento interval spolehlivosti pro rozptyl a2 vyjadřuje, že skutečná hodnota rozptylu se s pravděpodobností 1 — a nachází v daném intervalu. Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 16/19 Příklad: Intervalový odhad a2 Praktický příklad Příklad 6.20. Určete oboustranný interval spolehlivosti pro rozptyl normálně rozloženého základního souboru při hladinách spolehlivosti 0,90, 0,95 a 0,99. Měření byla provedena na vzorku s velikostí n = 12 a bylo zjištěno, že vzorkový rozptyl je s2 = 0,64. Posuďte získané výsledky. Řešení: Známe obecný tvar intervalu spolehlivosti pro rozptyl: / (n - l).s2 (n - l)s2 \ \tf_s(»-i)'4(»-i)/" Dosadíme konkrétní hodnoty: n = 12, s2 = 0,64 n-1 = 11. Řešení pro hladinu spolehlivosti 0,90: 11-0.64 9 11-0.64 Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 17/19 Příklad: Intervalový odhad a2 Použití Excelu: Pro výpočet kritických hodnot použijeme funkci CHISQ.INV. Tato funkce vrací kvant il rozdělení %2. Syntaxe j c CHISQ . INV (pravděpodobnost, stupně volnosti). Kritické hodnoty jsou: • Xo)95(H) = CHISQ. INV(0,95; 11) = CHISQ . INV. RT(0,05; 11) = 19,675, . Xo,(k(11) = CHISQ.INV(0,05; 11) = 4,575. Interval spolehlivosti pro rozptyl je tedy: 11-0.64 9 11-0.64 -— < a2 < -—. 19.675 ~ ~ 4.575 Výsledkem je interval: (0,358,1,539}. Stejný postup použijeme pro zbývající dva případy. □ Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 18/19 Shrnutí • Bodové odhady poskytují konkrétní hodnotu parametru, ale nemusí být přesné. • Intervalové odhady poskytují rozsah hodnot s určitou spolehlivostí. • Metoda momentů a metoda maximální věrohodnosti jsou základní techniky odhadu parametrů. Jiří Fišer (MVŠO) YSTA2-02-3 22. listopadu 2024 19/19