STATISTIKA 2 Statistika a statistické zpracování dat Blok 2-1 in Fišer 22. listopadu 2024 Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 1 /34 Obsah O Náhodná veličina ► Diskrétni náhodná veličina ► Spojitá náhodná veličina O Číselné charakteristiky náhodné veličiny ► polohy ► variability Jiří Fišer (MVŠO) YSTA2-02-1 Náhodná veličina Definice (Náhodná veličina) Náhodná veličina X je reálná funkce X: Q -> R • X, Y, Z ... náhodná veličina • x, y, z ... hodnota náhodné veličiny = realizace náhodné veličiny Dělení náhodných veličin podle oboru hodnot McR: • diskrétní: M konečná nebo spočetná • spojitá: M interval Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 3/34 Diskrétní náhodná veličina Pravděpodobnostní funkce Distribuční funkce i - i - 1/4 >< CL 3/4 - 7/12 - 1/6 1/4 1/3 1/4 1/6 1/3 1/3 1 2 I 4 i 5 o -e- 1 2 I 3 I 4 I ô Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 4/34 Pravděpodobnostní funkce Distribuční funkce CL 1/3 — 1/4 — 1/6 — 3/4 - 7/12 1/3 - 1 2 i 3 i 4 i 5 1/4 -0 1/3 o 1 2 I 3 1/4 -0 1/'j I 4 I 5 Pravděpodobnost, že X nabývá hodnoty alespoň 3 P(X > 3) = P(X = 4) + P(X = 5) = 1 + 1 = A 7 P(X>3) = 1-P(X<3) = 1-P(X<2) = 1-F(2)=.1-- = 1^ Jiří Fišer (MVSO) YSTA2-02-1 22. listopadu 2024 5/ Pravděpodobnostní funkce Distribuční funkce CL 1/3 — 1/4 — 1/6 — 3/4 - 7/12 1/3 - 1 2 i 3 i 4 i 5 1/4 -0 1/3 o 1 2 I 3 1/4 -0 1/'j I 4 I 5 Pravděpodobnost, že X nabývá hodnoty nejvýše 4 P(X<4) = P(X=1) + P(X = 2) + P(X = 4) = 1 + 1 + 1 = | P(X < 4) = F(4) = ^ Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 6/34 Diskrétní vs. spojitá náhodná veličina Diskrétní náhodná veličina • značí „počet" • počet autohavárií v daném časovém intervalu (Poissonovo rozdělení) o počet 6, které padly v 10 hodech pravidelnou kostkou (Binomické rozdělení) P(X = x0) = p(x0) g (0,1) Vx0 g R Spojitá náhodná veličina • značí „měření" P(X = x0) = 0 Vx0 g R o jsme schopni najít pouze interval, kde se X realizuje P(a < X < b) g (0,1} Va < b, a, b g R Jiří Fišer (MVŠO) YSTA2-02-1 Spojitá náhodná veličina Definice Náhodná veličina X se nazývá (absolutně) spojitá, jestliže existuje nezáporná funkce f: R -> R taková, že F(x)= í f(t)dt, VxeM. J — oo Funkce f (x) se nazývá hustota (rozdělení pravděpodobností) náhodné veličiny X. Vlastnosti hustoty f (x) > 0 ŕOO / f(t)dt = ^ J —oo <□► < ŕ3? ► < -E ► < -ž ► -š -O Q, O Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 8/34 Vlastnosti hustoty a distribuční funkce spojité náhodné veličiny = F'(x) v každém bodě x, kde je F diferencovatelná P(a < X < b) = F{b) - F(a) = P(a < X < b) = P(a < X < b) = P(a < X < b) = P(a < X < b) p(x e e) = / f(t)dt Jb < □ ► < g ► < -E ► < -ž ► -š -O Q, O Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 9/34 Výpočet pravděpodobností pomocí F(x) a f(x) P(£<0) = F(0)= / f(ř)dř J — oo X 0 -4 -3 -2 -1 0 X / p(^<0) i i i 4-3-2-101234 X i i i ---- i i i i i i 4 -O Q, O Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 10/34 Výpočet pravděpodobností pomocí F(x) a f(x) P(-2 < C < 0) = F(0) - F(-2) = y f(ř) dř X o -4 -3 -2 -1 0 X I mm P(-2<£<0) i i i 4-3-2-101234 X - i i i i Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 11/34 Interaktivní práce s hustotou a distribuční funkcí (GeoGebra) Jak používat pravděpodobnostní kalkulačku Author: Nikola Brůžková, GeoGebra Team Topic: Distributions, Probability https://www.geogebra.org/m/zyd8gta9 Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 12/34 Spojitá náhodná veličina X má rozdělení dané hustotou f(x) = 0 x < 1 1 x > 1 O Určete její distribuční funkci. O Spočítejte pravděpodobnost P(1 < X < 5). o xc x < 1 x > 1 F(x) = f(t)dt —oo x x •oo X —oo Odt = 0 pro x < 1 /(ř)ctf= / 0dř+ r4fltf J—oo J1 * 1 ř 1 =---h 1 pro x > 1 Jiří Fišer (MVSO) YSTA2-02-1 22. listopadu 2024 14/34 Jiří Fišer (MVSO) YSTA2-02-1 22. listopadu 2024 15/34 2.3 Číselné charakteristiky Náhodnou veličinu X jednoznačne určují a plně popisují • X diskrétní ► pravděpodobnostní funkce ► distribuční funkce 9 X spojitá ► hustota ► distribuční funkce číselné charakteristiky = shrnutí informací o X do několika čísel, které ji dostatečně charakterizují Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 16/34 Typy číselných charakteristik Členění dle popisované vlastnosti • polohy: „střed", kolem kterého jsou koncentrovány hodnoty X ► střední hodnota ► modus kvantily • variability: rozptýlenost hodnot X kolem charakteristiky polohy ► rozptyl ► směrodatná odchylka • šikmost: tvar rozdělení pravděpodobností (symetrické nebo asymetrické) • špičatost: tvar rozdělení pravděpodobností (špičaté nebo zploštělé) Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 17/34 Charakteristiky polohy • „střed" skupiny údajů, kolem kterého všechny hodnoty kolísají • chceme-li charakterizovat sledovanou veličinu jediným číslem, pak to bude nějaká charakteristika polohy ► dospělá liška obecná je obvykle velká přibližně 70 cm ► studenti prvního ročníku VŠ mají kolem 20 let věku • jaké by měly mít vlastnosti ► př. mzda ve firmě * všichni zaměstnanci dostanou přidáno 1000 Kč „střed" se zvětší o 1000 Kč f(x^ +c, x2+c, • • •, Xn+Ó) = ř(xi, x2,..., x„)+c * přepočteme-li jejich mzdu na euro ^> „střed" v eurech bude „střed" v Kč krát 0,042 f(x^-b, x2-b,..., xn-b) = ř(xi, x2,..., xn)-b Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 18/34 Střední hodnota E(X) • základní charakteristika polohy • „střed" (těžiště), kolem kterého jsou koncentrovány hodnoty X X diskrétní s oborem hodnot M E(X) = £ */P(X = x/) Xi-eM X spojitá s hustotou f(x) /oo xf{x) dx -oo Jestliže řada nebo integrál absolutně nekonverguje, střední hodnota neexistuje. Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 19/34 Vlastnosti střední hodnoty • E(c) = cpro libovolnou konstantu cgr • zvětšíme-li všechny hodnoty o konstantu c, zvětší se střední hodnota též o c E(c + X) = c+E(X) 9 násobíme-li všechny hodnoty nějakou konstantou b, pak nová střední hodnota bude rovna původní střední hodnotě krát konstanta b E(bX) = bE(X) Jiří Fišer (MVŠO) YSTA2-02-1 Charakteristiky variability (-i • • 4 » * ** w * .-■ — • číslo udávající koncentraci (rozptýlení) hodnot okolo středu j: Jiří Fišer (MVŠO) YSTA2-02-1 Charakteristiky variability Vlastnosti: • po přičtení konstanty ke každé hodnotě se variabilita nezmění • při násobení číslem (v absolutní hodnotě) mezi 0 a 1 se variabilita zmenší • při násobení číslem (v absolutní hodnotě) větším než 1 se variabilita zvětší in - a=1 o 50 100 150 200 lo lo a=0.6 0 50 100 150 200 lo lo » * ■/« ^**» j ,a . • a=3- 50 100 150 200 Jiří Fišer (MVŠO) YSTA2-02-1 Rozptyl D(X) • základní charakteristika variability • charakterizuje merítko (šířku) rozdělení • popisuje rozptýlenost hodnot kolem střední hodnoty Rozptyl D(X) = E [X - E(X)]2, existuje-li E(X) Směrodatná odchylka Jiří Fišer (MVŠO) YSTA2-02-1 < □ ► < rn? ► < -E ► < -ž ► -š -O Q, O Vlastnosti rozptylu O D(X) > 0 O D(X) = E(X2) - [E(X)}2 ' x^p(x = *'') ~ [E(x)]2 x diskrétní D(X) = Xi€M / x2f{x) dx - [E(X)] X spojitá O D(a + cX) = c2D(X) pro libovolné konstanty a,cgr O D(X) = 0 ^ P(X = c) = 1 Jiří Fišer (MVŠO) YSTA2-02-1 Modus x • charakteristika polohy • X diskrétní: nepravděpodobnější hodnota • X spojitá: bod x, ve kterém hustota pravděpodobností f (x) nabývá lokálního maxima Jiří Fišer (MVŠO) YSTA2-02-1 Příklad: diskrétní náhodná veličina Diskrétní náhodná veličina X • nabývá hodnot M = {1,2,4,5} s pravděpodobnostmi p(k) = P[X = k], kde • p(1) = ^ p(2) = J, p(4) = 1, p(5) = J a p(x) = Oy/na/c. Spočtěte střední hodnotu, rozptyl, směrodatnou odchylku a modus náhodné veličiny X. Nějaký nápad? Jiří Fišer (MVŠO) YSTA2-02-1 Rozdělení pravděpodobností náhodné veličiny X k 1 2 4 5 P(X = k) i 3 1 4 1 a 1 4 Střední hodnota E(X) = xnp(xn) n • E(X)=1.l + 2.l+4.l+5.l = n=2,75 Rozptyl a směrodatná odchylka D(X) = E [X - E(X)]2 = E(X2) - [E(X)]2 E(X2) = ^xn2p(xf7) = 12.l + 22.l+42.l + 52.l = ^ = 10,25 /7 D(X) = E(X2) - [E(X)]2 = 41 11 43 = T6=2'69 • VĎ(X) = y^=1,64 Modus: nejpravděpodobnější hodnota: x = 1 Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 27/34 Příklad: spojitá náhodná veličina Hustota pravděpodobnosti náhodné veličiny X má tvar 6x(1 - x) 0 < x < 1 0 jinak Určete střední hodnotu, rozptyl a modus náhodné veličiny X. Nějaký nápad? Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 28/34 f{x) = 6x(1 - x) O < x < 1 O jinak Střední hodnota: 'OO /oo x • f(x)dx -oo /oo /»1 xf(x)dx = x- 6x(1 -x)dx = -oo ./O / (6x2 - 6x3)dx = Jo o A -1 12 ~ 2 6x3 6x 4.1 JO 6 6 3 ~ 4 24-18 12 Jiří Fišer (MVŠO) YSTA2-02-1 Rozptyl: 6x(1-x) 0- maximum ^> x = 0,5 Jiří Fišer (MVŠO) YSTA2-02-1 Kvantily spojité náhodné veličiny Definice Nechť a g (0,1). a-kvantilem spojité náhodné veličiny X rozumíme kterékoli reálné číslo xa, které splňuje P(X < Xo) = a. • X spojitá: o-kvantil určen jednoznačně vztahem F(xa) = a • X diskrétní: kvantily nejsou určeny jednoznačně, nebudeme uvažovat Jiří Fišer (MVŠO) YSTA2-02-1 Speciální názvy kvantilů • x0,5 - medián • *o,25 - dolní kvartil • *o,75 - horní kvartil • */c/io> k = 1,..., 9 - /c-tý decil • */c/ioo> /c = 1,..., 99 — /c-tý percentil Příklad výpočtu kvantilů Vypočtěte první decil a horní kvartil náhodné veličiny X určené hustotou _ A pro x e (0,2; f(x) = 0 jinak. F(x) = v ) ^1 < 0 €(0 ;2) l 1 1 V-/ /A > 2 'i 1 3 1 2X = U, 1 , x = 0, ) — 0^75, x — 0,75, x — 1,5, tedy Xoj$ — 1,5 Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 34/34 Příklad výpočtu kvantilů Příklad Vypočtěte první decil a horní kvartil náhodné veličiny X určené hustotou f(x) = _ . \ pro x e (0,2 0 jinak. (0 • F(x) = { \x 1 • F(x) = 0,1, F(x) = 0,75, pro x < 0 pro x e (0;2) pro x > 2 ^ = 0,1, x = 0,2, tedy x0,i = 0,2 ^x = 0,75, x =1,5, tedy x0 75 = 1,5 Jiří Fišer (MVŠO) YSTA2-02-1 22. listopadu 2024 34/34