Dvourozměrný statistický soubor Regresní analýza P1ZST-12-2026 • • • J. 'O ••••" Základy lineární regrese Od zdánlivého chaosu v datech k přesným byznysovým předpovědím. y • • • • • • • • • NotebookLM Problém: Surová data Řešení: Jasný signál • _• • • • • • • • •• ■ • • • • • • • v. . . 7.>ť • • • • • • • • •/ i »• . • ••• f • »• • • _• •• • • • • • • • • • Máme data, která se zdánlivě chaoticky mění. Nevíme, jak přesně jedna hodnota ovlivňuje druhou. > • __ • • • • • • • • ■ • • • • • >. 1\ •••••• • • • • • • • • • ...v • • w • •• • • • '- • • 1-1 • • i-1 • • -1 -1 -, 1- 1-1 Algoritmus nachází jedinou ideální přímku, která nejlépe popisuje vztah mezi tím, co známe (X), a tím, co chceme zjistit (Y). NotebookLM Korelace a regrese odpovídají na dvě odlišné otázky. KORELACE Korelace měří sílu a směr vztahu. Souvisí tyto dvě věci spolu? Nabývá hodnot od -1 do 1 0.8 0.4 -0.4 -0.8 REGRESE Regrese vytváří matematický model. Když změním X o jednotku, jak přesně se změní Y? Výstupem je rovnice přímky £\t NotebookLM Metoda nejmenších čtverců (MNČ) i i i Reziduálni složka (Chyba) - vzdálenost mezi skutečností a modelem. Počítač nezkouší polohu přímky náhodně. Hledá takový úhel a pozici, při které je celkový součet chyb (červených úseček) ze všech bodů absolutně nejmenší. Cíl = Minimalizovat rozdíl mezi skutečností a předpovědí. £ft NotebookLM Rovnice lineární regrese Závislá proměnná To, co se snažíme předpovědět (např. budoucí tržby). Y Absolutní člen (Průsečík) Výchozí stav. Hodnota Y, když je X = 0 (např. tržby bez jakékoliv reklamy). Směrnice přímky (Multiplikátor) Síla vlivu. O kolik přesně vzroste Y, když X zvýšíme o 1 jednotku. + PiX 1Ĺ. Nezávislá proměnná Náš vstup nebo faktor, který známe a řídíme (např. investice do reklamy). R2 = 0,86 (86 %) Koeficient determinace (R2) Ne každé přímce můžeme věřit. R2 je náš indikátor spolehlivosti. Co to znamená? Udává, kolik procent změn naší cílové proměnné (Y) dokážeme vysvětlit změnami vstupní proměnné (X). Příklad z praxe Pokud R2 = 0,86, náš model vysvětluje 86 % chování trhu. Zbylých 14 % tvoří neznámé vlivy a náhodný šum. Čím blíže k 1, tím spolehlivější model. £i\ NotebookLM Proč rovnici přímky potřebujeme v praxi? 1. Analýza citlivosti (PochopenQ Zjištění přesné síly vztahu. (Jak silně reaguje spotřeba domácností na zvýšení platů?) 2. Extrapolace (Predikce) Odhad vývoje mimo historická data. (Jaké budou naše tržby, pokud příští měsíc zdvojnásobíme rozpočet?) 3. Datové rozhodování (Optimalizace) Nahrazení dojmů a pocitů matematickým modelem pro přesnou alokaci zdrojů a plánování. rXi NotebookLM Případ 1: Keynesiánská spotřební funkce Spotřební výdaje a příjmy v tis. Kč Rok y X 2010 38,0 36,1 2011 43,7 49,2 2012 45,2 51,7 2013 46,0 53,9 2014 41,3 43,0 2015 48,1 59,0 2016 49,8 62,1 2017 51,8 67,0 I 363,9 421,9 Vypočtený model: Y = 21,951 + 0,446X -7*- Interpretace p0: Autonomní spotřeba. I při nulovém příjmu by spotřebitel utratil zhruba 22 000 Kč (např. z úspor či dluhu). Interpretace p1: Mezní sklon ke spotřebě. Z každé další 1 000 Kč navíc utratí spotřebitel v průměru 446 Kč. Zbytek uspoří. £\t NotebookLM Prec Prípad 2: hkce tržeb na zaklade reklamy Historie. z1l Dnr ■v i iesi r O cu PrpHikrp model: 600 • • • Y: Í8X + l 83, Y = 53 (0,5 500 ť = 5,58 5 m • » • > Otázka: Jaké budou tržby v 11 • 2 400 • w měsíci, pokud investujeme do i C/5 1 300 n N ŕ 200 » reklamy rekord nich 80 000 Kč ? j m 1 /i m ✓N. y 100 i = (5,588 • 80) + 83,5 = 530,54 X = 80 u ■— n i 10 lanr 60 a mn Rpk Kč) Äi\ Notetx >okLM Přesah: Co když jeden faktor nestačí? Jednoduchá regrese funguje pro dva rozměry. Skutečná ekonomika je ale složitější. Přidáním dalších proměnných vzniká Vícenásobná regrese - snižujeme nevysvětlený šum a zvyšujeme spolehlivost modelu (R2). [ Konstanta: -7645,47 | Vstup X,: HDP £\t NotebookLM Modelování v praxi: 3 kliknutí v Excelu 1. Vložení grafu Označte data (Sloupec X a Y) a vložte Bodový graf (Scatter plot). 80 «3-1 VLOŽENÍ • 9 ŕ l -l |*1 \A |* X Y _ 2. Nalezení trendu Klikněte pravým tlačítkem na body a zvolte Přidat spojnici trendu. T Prvky grafu Popisky dat ► Spojnice trendu ► Popisky ► Mřížka 3. Zobrazení rovnice V bočním panelu zaškrtněte zobrazení rovnice a hodnoty spolehlivosti R2. y « 0.0561« * 3.8089 R» » 0.663S mS • Formát spojnice trendu MOŽNOSTI SPOJNICE TRCNOU O O ili I_ E»poo«n6iW LopntmcU [._ Expowngdn 1/ Uneémi /■ logartndci taními Zobrazit rovnici v grafu Zobrazit hodnotu spolehlivosti R2 £ft NotebookLM Lineární regrese: Klíčové závěry Od šumu k signálu Lineární regrese protíná chaos. Hledá jedinou matematickou přímku, která minimalizuje chyby (MNČ) a nejlépe popisuje realitu. Důvěřuj, ale prověřuj Koeficient determinace (R2) je neúprosným měřítkem kvality. Nízké R2 znamená, že model nevysvětluje data a predikce bude nepřesná. Y = P„ + P1X Jedna rovnice vládne všem Model Y = p0 + ftX rozkládá složitou realitu na absolutní základní stav (po) a měřitelnou sílu vlivu (PJ. Od dat k byznysu Skutečná hodnota neleží v čisté matematice, ale v aplikaci: pochopení chování trhu a datově podložená predikce budoucnosti. £\1 NotebookLM