STATISTIKA 2 Statistika a statistické zpracování dat Blok 2-2 in Fišer 22. listopadu 2024 Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 1/47 Základní diskrétní rozdělení pravděpodobností o Alternativní rozdělení • Binomické rozdělení • Hypergeometrické rozdělení • Diskrétní rovnoměrné rozdělení • Poissonovo rozdělení Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 2/47 Binomické rozdělení X ~ Bi(n, p) Model: počet úspěchů, které nastanou při provedení n nezávislých dichotomických pokusů Příklady • počet děvčat v rodině s n dětmi • počet zmetků mezi n výrobky • počet úspěšných zkoušek přístroje z celkem n zkoušek Parametry rozdělení • n ... počet nezávislých dichotomických pokusů • p ... pravděpodobnost úspěchu v jednom pokusu Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 3/47 Binomické rozdělení X ~ Bi(n,p) Pravděpodobnostní funkce (Bernoulliho schéma) P(X = k) = ( l) p*(1-p)n~k, k = 0,...,n, n>1, pe(0,1) Distribuční funkce 0 F(x;p,n) = { 1 n x < 0 n n Excel: BINOM.DIST(k;n;p;logická proměnná) • logická proměnná = 0 pro výpočet P(X = • logická proměnná = 1 pro výpočet F(k) Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 4/47 Binomické rozdělení X ~ Bi(n,p) Číselné charakteristiky E(X) = np, D(X) = np(1-p), ax = y/npO - p) p = 1 /2 symetrické rozdělení, jinak asymetrické Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 5/47 Príklad (Barva kvetú hrachu) Je křížen bělokvětý hrách s fialovým, přičemž předpokládáme, že rostliny, na nichž je pokus prováděn, nebyly dosud kříženy Podle pravidel dědičnosti lze očekávat, že f nově vzniklých rostlin (potomků) pokvetou fialově a \ bíle. Zatím vzklíčilo 10 nových rostlin. Jaká je pravděpodobnost, že 9 pokvete fialově? Nějaký nápad? Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 6/47 Příklad (Barva květů hrachu) Je křížen bělokvětý hrách s fialovým, přičemž předpokládáme, že rostliny, na nichž je pokus prováděn, nebyly dosud kříženy Podle pravidel dědičnosti lze očekávat, že f nově vzniklých rostlin (potomků) pokvetou fialově a \ bíle. Zatím vzklíčilo 10 nových rostlin. Jaká je pravděpodobnost, že 9 pokvete fialově? Řešení X... počet fialově kvetoucích rostlin z 10 rostlin X~Bi(10;0,75) P(X = 9) = ( 1g° ) 0 J59 0,251 = 0,188 Excel: BINOM.DIST(9;10;3/4;0) Hypergeometrické rozdělení X ~ Hg(A/, M, rí) Model: počet úspěchů, které nastanou při provedení n závislých dichotomických pokusů (výběr bez vracení) Příklady • počet vybraných zmetků, vybíráme-li n výrobků z N výrobků, přičemž M z nich jsou zmetky • počet vybraných nenaučených otázek, losujeme-li n otázek z A/, přičemž na M z nich nejsme naučeni Parametry rozdělení • n ... počet vybraných jednotek (závislých dichotomických pokusů) • N ... počet všech jednotek m M ... počet jednotek, které mají sledovanou vlastnost Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 8/47 Hypergeometrické rozdělení X ~ Hg(A/, M, rí) Pravděpodobnostní funkce P(X = k)= (N~k , /c = 0, . . . , /7, A/>A7>1,0 n Hypergeometrické rozdělení X ~ Hg(A/, M, h) Excel: HYPGEOM.DIST(k;n;M;N;logická proměnná) • logická proměnná = 0 pro výpočet P(X = k) • logická proměnná = 1 pro výpočet F(k) □ g - = Jiří Fišer (MVSO) YSTA2-02-2 22. listopadu 2024 Příklad (Vadné výrobky) Mezi 100 výrobky je 20 zmetků. Vybereme 10 výrobků a sledujeme počet zmetků mezi vybranými výrobky Jaká je pravděpodobnost, že jsme vybrali právě 3 zmetky? Nejaký nápad? Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 11/47 Příklad (Vadné výrobky) Mezi 100 výrobky je 20 zmetků. Vybereme 10 výrobků a sledujeme počet zmetků mezi vybranými výrobky. Jaká je pravděpodobnost, že jsme vybrali právě 3 zmetky? Řešení X ... počet vybraných zmetků N= 100, M = 20, n= 10 X-Hg(100;20;10) p(* = 3) = ^jmír = °>209 110 ) Excel: HYPGEOM.DIST(3;10;20;100;0) Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 12/47 Poissonovo rozdělení X ~ Po(A) Model: počet událostí, které nastanou při provedení velkého počtu nezávislých dichotomických pokusů, přičemž pravděpodobnost vzniku události je velmi malá • výskyt jevu v daném časovém/prostorovém intervalu nezávisí co se stalo jindy/jinde • v daném okamžiku/bodě nemohou nastat 2 jevy současně • pro každý časový okamžik/bod je pravděpodobnost výskytu jevu v malém časovém/prostorovém intervalu stejná • A ... intenzitu výskytu události za jednotku času/délky/objemu Příklady • # částic emit. za jedn. času radioaktivní látkou dané hmotnosti • # signálů, které dojdou do telefonní ústředny za jednotku času • # jednob. organizmů na ploše velikosti t v zorném poli mikroskopu • # dopravních nehod za jednotku času • # typografických chyb na stránce • # volných dnů ve firmě během měsíce Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 13/47 Poissonovo rozdělení X ~ Po(A) Pravděpodobnostní funkce A* P(X = k) = ^-e"A, /f = 0,1,2,..., A>0 a ! Distribuční funkce F(x; A) = 0 x < 0 Číselné charakteristiky E(X) = A, D(X) = A, ax = V A Excel: POISSON.DIST(/c;A;logická proměnná) • logická proměnná = 0 pro výpočet P(X = k) • logická proměnná = 1 pro výpočet F(k) Příklad (Poruchy obráběcího stroje) Při práci obráběcího stroje dochází náhodně k výpadkům. Průměrně jsou 2 výpadky za 24 hodin. a) Jaká je pst, že za 24 hodin dojde alespoň k jednomu výpadku? b) Jaká je pst, že za týden nebudou více než 3 výpadky? Nějaký nápad? Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 15/47 Příklad (Poruchy obráběcího stroje) Při práci obráběcího stroje dochází náhodně k výpadkům. Průměrně jsou 2 výpadky za 24 hodin. a) Jaká je pst, že za 24 hodin dojde alespoň k jednomu výpadku? b) Jaká je pst, že za týden nebudou více než 3 výpadky? Řešení X... počet výpadků za 1 den průměrně 2 výpadky za 24 hodin =4> A = 2 X Po(2) P(X = k)='—e-x, /c = 0,1,2,... k\ P(X > 1) = 1 - P(X < 1) = 1 - P(X Excel: 1-POISSON.DIST(0;2;0) = 0) = 1 - e~2 = 0,865 Jiří Fišer (MVŠO) YSTA2-02-2 < S1 ► < .g ► < -š ► -E -O Q, O 22. listopadu 2024 16/47 Příklad (Poruchy obráběcího stroje) Při práci obráběcího stroje dochází náhodně k výpadkům. Průměrně jsou 2 výpadky za 24 hodin. a) Jaká je pst, že za 24 hodin dojde alespoň k jednomu výpadku? b) Jaká je pst, že za týden nebudou více než 3 výpadky? Řešení Y ... počet výpadků za 1 týden průměrně 2 výpadky/24 hodin průměrně 2-7 = 14 výpadků/týden V ~Po(14) 142 143 P(V<3) = e"14( 1 +14 + —+ ] =0,000474 2! 3! Excel: POISSON.DIST(3;14;1) □ i5P Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 17/47 2.5 Základní spojitá rozdělení pravděpodobností a Rovnoměrné rozdělení • Exponenciální rozdělení • Normální rozdělení o Studentovo rozdělení • F-rozdělení • Chi-kvadrát rozdělení Jiří Fišer (MVŠO) YSTA2-02-2 Rovnoměrné rozdělení X ~ R(a, b) Model X ~ R(0, d) • modelování doby čekání na událost, která nastává v pravidelných intervalech délky d • čekání na událost zahajujeme v okamžiku, který nikterak nesouvisí s minulým ani budoucím výskytem události Příklady • doba čekání na autobusové zastávce na autobus, který jezdí po d minutách R(0, d) 9 chyba při zaokrouhlení na 1 desetinné místo R(-0,05; 0,05) • chyba při stanovení času z digitálních hodin v minutách R(0; 60) sekund Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 19/47 Rovnoměrné rozdělení X ~ R(a, b) Hustota f(x) = ) 5=ä xe{a,b), -oo b Číselné charakteristiky E(X)=«±*. D(X) = Í^, «x=b-a 12 v/12 □ S> - = Jiří Fišer (MVSO) YSTA2-02-2 22. listopadu 2024 Rovnoměrné rozdělení X ~ R(—1,1) Hustota Distribuční funkce Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 21/47 Příklad (Dodávka zboží) Prodejna očekává dodávku nového zboží určitý den v době od 8 do 10 hodin. Podle sdělení dodavatele je uskutečnění dodávky stejně možné kdykoliv během tohoto časového intervalu. Jaká je pravděpodobnost, že zboží bude dodáno v době od půl deváté do tri čtvrtě na devět? Nejaký nápad? Jiří Fišer (MVŠO) YSTA2-02-2 Příklad (Dodávka zboží) Prodejna očekává dodávku nového zboží určitý den v době od 8 do 10 hodin. Podle sdělení dodavatele je uskutečnění dodávky stejně možné kdykoliv během tohoto časového intervalu. Jaká je pravděpodobnost, že zboží bude dodáno v době od půl deváté do tri čtvrtě na devět? Řešení X ... čas příjezdu v hodinách X Ro(8,10) x g (8,10) jinak x g (a, b) jinak □ g - = 22. listopadu 2024 23/47 Pravděpodobnost, že zboží bude dodáno v době od půl deváté do tři čtvrtě na devět '8,75 h h P(8,5 < X < 8,75) = / -dx = -[8,75 - 8,5] = 0,125 8,5 2 2 Jiří Fišer (MVŠO) YSTA2-02-2 Exponenciální rozdělení X ~ Ex(A) Model: modelování doby/vzdálenosti čekání na událost, která nemá paměť, tj. zbývající doba/vzdálenost čekání nezávisí na tom, jak dlouho už na událost čekáme Příklady • doba životnosti zařízení, u kterého dochází k poruše náhodně, nikoliv z důsledku opotřebení • délka telefonního hovoru • doba mezi 2 příchozími telefonáty Parametr rozdělení • A ... míra rizika výskytu sledované události za jednotku času/vzdálenosti • I ■ ■ ■ očekávaná doba/vzdálenost do výskytu sledované události Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 25/47 Exponenciální rozdělení X ~ Ex(A) Hustota tí . \\e~Xx x > 0, A > 0 fix) = < w ^0 jinak Distribuční funkce F(x) = 0 x < 0, 1 - e~Xx x>0 Číselné charakteristiky E(X) = 1 D(X) = -1, ax = l Exponenciální rozdělení X ~ Ex(A) Hustota tí . \\e~Xx x > 0, A > 0 fix) = < w ^0 jinak Distribuční funkce F(x) = 0 x < 0, 1 - e~Xx x>0 Číselné charakteristiky E(X) = 1 D(X) = ± 1 Ä Pozor! Někdy se používá jiná parametrizace X ~ Ex(0), 9 = 1 /A Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 26/47 Exponenciální rozdělení X ~ Ex(1) Hustota Distribuční funkce Exponenciální rozdělení X ~ Ex(A) Excel: EXPON.DIST(x;A;logická proměnná) • logická proměnná = 0 pro výpočet f(x) • logická proměnná = 1 pro výpočet F(x) Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 28/47 Příklad (Obsluha v restauraci) Doba čekání hosta na pivo v restauraci U Lva je průměrně 5 minut. Určete a) pravděpodobnost, že host bude na pivo čekat déle než 12 minut b) dobu čekání hosta na pivo, během níž bude obsloužen s pravděpodobností 0,9. Nějaký nápad? Jiří Fišer (MVŠO) YSTA2-02-2 Příklad (Obsluha v restauraci) Doba čekání hosta na pivo v restauraci U Lva je průměrně 5 minut. Určete a) pravděpodobnost, že host bude na pivo čekat déle než 12 minut b) dobu čekání hosta na pivo, během níž bude obsloužen s pravděpodobností 0,9. Řešení X... doba čekání na pivo (v minutách) průměrná doba čekání na pivo ... 5 minut X~Ex(A), A 5 □ g - = Jiří Fišer (MVŠO) YSTA2-02-2 Pravděpodobnost, že host bude na pivo čekat déle než 12 minut P(X > 12) = 1 - P(X < 12) = 1 - F(12) = 1 - (i - e-5'12) = e~T = 0,09 Excel: 1-EXPON.DIST(12;1/5;1) Jiří Fišer (MVŠO) YSTA2-02-2 Doba čekání hosta na pivo, během níž bude obsloužen s pravděpodobností 0,9 P(0 < X < t) = 0,9 F(t) - F(0) = 0,9 1 - e~t/5 - 0 = 0,9 e-f/5 = 0,1 ř = -5 ln(0,1 )=11,51 min=11 min 30 s Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 32/47 Normální rozdělení X ~ n(/i, a2) Hustota f(x) = —^e~^~, x e IR1, /ígI1, a > 0 v 27t(j Vlastnosti • X může nabývat jakýchkoli reálných hodnot • hustota je symetrická kolem ji • hustota nabývá maxima v bodě x = /i, = -^=;) • normální rozdělení s parametry /i = 0 a a2 = 1 nazýváme normované (standardizované) normální rozdělení. 9 n parametr polohy (střední hodnota) • a parametr měřítka (směrodatná odchylka) □ S" ► 4 .F ► 4 = Jiří Fišer (MVSO) YSTA2-02-2 22. listopadu 2024 Normální rozdělení X ~ n(/i, a2) Číselné charakteristiky E(X) = ii, x0.5 = ^ * = M> D(x) = °2 71 (X) = 0 (šikmost), 72(X) = 0 (špičatost) Excel: NORM.DIST(x;/i;cr;logická proměnná) • logická proměnná = 0 pro výpočet f(x) 9 logická proměnná = 1 pro výpočet F(x) NORM.S.DIST(x;logická proměnná) pro práci s N(0,1) NORM.INV(a;/i; O 4» crX + /i ~ N(/i, o-2) Jiří Fišer (MVŠO) YSTA2-02-2 □ g - = Pravidlo 3 sigma Pro X ~ N(n, a2) platí P[/i - a < X < /x + a] « 68,3% P[/j - 2a < X < \x + 2a] » 95,5% P[ju - 3a < X < ^ + 3 1) o Rozptyl: - - (pro v > 2) v — 2 • Asymptotické chování: Pro velké v se Studentovo rozdělení blíží normálnímu rozdělení. Jiří Fišer (MVŠO) YSTA2-02-2 Grafy hustot a distribuční funkce Grafy znázorňující hustotu a distribuční funkci Studentova rozdělení pro v = 2 a v = 5 stupňů volnosti: -5 0 5 -5 0 5 x x Obrázek: Grafy hustot a distribučních funkcí Studentova rozdělení pro 2 a 5 stupňů volnosti Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 44/47 Excelovské funkce Pro práci se Studentovým rozdělením lze v Excelu použít následující funkce: • Hustota pravděpodobnosti (PDF): t.dist (x; vr falše) • Distribuční funkce (CDF): t.dist (x; vr true) • Kvantilová funkce: Funkce t . inv (p; v) vrací kvant i I pro danou pravděpodobnost p a v stupni volnosti. Jiří Fišer (MVŠO) YSTA2-02-2 Procvičení Použijte vhodné excelovské funkce k procvičení práce s rozdělením: O Vypočítejte hodnoty hustoty pravděpodobnosti pro Studentovo rozdělení s v = 8 a následující hodnoty x = -2, -1,0,1,2. O Vypočítejte hodnoty distribuční funkce pro Studentovo rozdělení s v = 8 a stejné hodnoty x = -2, -1,0,1,2. O Pomocí funkce t . inv () najděte kvantily pro pravděpodobnosti p = 0,05; 0,5; 0,95 při v = 8. Co nám ty výsledky říkají? O Vytvořte přibližné grafy hustoty a distribuční funkce pro Studentovo rozdělení v Excelu pomocí výpočtu jejich hodnot v dostatečně husté síti bodů na ose x. Můžete opět použít v = 8 a x — 6, 5,5, 5,..., 5,5, 6. Alternativně použijte GeoGebru. Jiří Fišer (MVŠO) YSTA2-02-2 22. listopadu 2024 46/47 Podobně projděte a procvičte další dvě rozdělení ze skript: • F-rozdělení • Chi-kvadrát Jiří Fišer (MVŠO) YSTA2-02-2