Regresný koeficient. Regresná rovnica. Rovnica viacnásobnej regresie. Využitie schopností tabuľkového procesora Excel

V dôsledku štúdia materiálu v kapitole 4 by mal študent:

vedieť

  • základné pojmy regresná analýza;
  • metódy odhadu a vlastnosti odhadov metód najmenšie štvorce;
  • základné pravidlá pre kontrolu významnosti a intervalového odhadu rovníc a regresných koeficientov;

byť schopný

  • nájsť odhady parametrov dvojrozmerných a viacnásobných modelov regresných rovníc na základe vzorových údajov, analyzovať ich vlastnosti;
  • skontrolovať význam rovnice a regresných koeficientov;
  • nájsť intervalové odhady významných parametrov;

vlastné

  • schopnosti štatistického odhadu parametrov dvojrozmerných a viacnásobných regresných rovníc; schopnosti kontrolovať primeranosť regresných modelov;
  • schopnosti získať regresnú rovnicu so všetkými významnými koeficientmi pomocou analytického softvéru.

Základné pojmy

Po korelačná analýza Keď sa odhalí prítomnosť štatisticky významných vzťahov medzi premennými a vyhodnotí sa stupeň ich podobnosti, zvyčajne pristúpi k matematickému popisu typu závislostí pomocou metód regresnej analýzy. Za týmto účelom je vybraná trieda funkcií, ktorá spája efektívny indikátor o a argumenty „vypočítajte odhady parametrov obmedzovacej rovnice a analyzujte presnosť výslednej rovnice.

Funkcia |, popisujúca závislosť podmienenej priemernej hodnoty efektívneho indikátora o z daných hodnôt argumentov sa volá regresná rovnica.

Termín „regresia“ (z lat. regresia -ústup, návrat k niečomu) predstavil anglický psychológ a antropológ F. Galton a je spojený s jedným z jeho prvých príkladov, v ktorom Galton, spracúvajúci štatistické údaje súvisiace s otázkou dedičnosti výšky, zistil, že ak je výška otcov sa odchyľuje od priemernej výšky, na ktorej sú všetci otcovia NS palcov, potom sa výška ich synov líši od priemernej výšky všetkých synov o menej ako X palcov. Identifikovaný trend bol pomenovaný regresia k priemeru.

Pojem „regresia“ je v štatistickej literatúre široko používaný, aj keď v mnohých prípadoch nie je presne charakterizovaná štatistická závislosť.

Pre presný popis regresné rovnice potrebujú poznať zákon podmieneného rozdelenia efektívneho indikátora o. V štatistickej praxi tieto informácie zvyčajne nie je možné získať, preto sa obmedzuje na hľadanie vhodných aproximácií funkcie. f (x u NS 2, .... l *), na základe predbežnej zmysluplnej analýzy javu alebo na základe počiatočných štatistických údajov.

V rámci určitých modelových predpokladov o type distribúcie vektora indikátorov<) может быть получен общий вид regresné rovnice, kde. Napríklad za predpokladu, že sa študovaný súbor indikátorov riadi () -dimenzionálnym normálnym distribučným zákonom s vektorom matematických očakávaní

Kde a kovariančná matica,

kde je rozptyl y,

Regresná rovnica (podmienené očakávanie) má tvar

Ak teda ide o viacrozmernú náhodnú premennú ()

riadi sa () dimenzionálnym normálnym distribučným zákonom, potom regresnou rovnicou efektívneho indikátora o vo vysvetľujúcich premenných je lineárny v NS vyhliadka.

V štatistickej praxi sa však zvyčajne musíte obmedziť na hľadanie vhodných aproximácií pre neznámu skutočnú regresnú funkciu f (x), pretože výskumník nemá presné znalosti o podmienenom zákone rozdelenia pravdepodobnosti analyzovaného efektívneho ukazovateľa o pre dané hodnoty argumentov NS.

Zvážte vzťah medzi skutočným, modelovým a regresným skóre. Nechajte efektívny indikátor o spojené s hádkou NS pomer

kde je náhodná premenná s normálnym rozdelením a. Skutočná regresná funkcia v tomto prípade je

Predpokladajme, že nepoznáme presnú formu skutočnej regresnej rovnice, ale máme deväť pozorovaní dvojrozmernej náhodnej premennej príbuznej pomeru a znázornenej na obr. 4.1.

Ryža. 4.1. Vzájomné usporiadanie pravdyf (x) a teoretickéWowregresné modely

Umiestnenie bodov na obr. 4.1 nám umožňuje obmedziť sa na triedu lineárnych závislostí formulára

Použitím metódy najmenších štvorcov nájdeme odhad regresnej rovnice.

Na porovnanie obr. 4.1 ukazuje grafy skutočnej regresnej funkcie a teoretickej aproximačnej regresnej funkcie. Odhad regresnej rovnice k nej pravdepodobne konverguje Wow s neobmedzeným nárastom veľkosti vzorky ().

Keďže sme omylom zvolili lineárnu regresnú funkciu namiesto skutočnej regresnej funkcie, ktorá je, bohužiaľ, v praxi štatistického výskumu celkom bežná, naše štatistické závery a odhady nebudú mať vlastnosť konzistencie, t.j. bez ohľadu na to, ako zvýšime objem pozorovaní, náš vzorový odhad nebude konvergovať k skutočnej regresnej funkcii

Ak sme správne zvolili triedu regresných funkcií, potom nepresnosť v popise pomocou Wow by sa dalo vysvetliť iba obmedzeným výberom, a preto by mohol byť taký malý, ako je požadované

Aby sa čo najlepšie obnovila podmienená hodnota efektívneho indikátora a neznáma regresná funkcia z počiatočných štatistických údajov, najčastejšie sa používajú nasledujúce kritériá primeranosti stratové funkcie.

1. Metóda najmenších štvorcov, podľa ktorého je druhá mocnina odchýlky pozorovaných hodnôt efektívneho indikátora ,,, od modelových hodnôt minimalizovaná, kde koeficienty regresnej rovnice; sú hodnoty vektora argumentov v "-M pozorovanie:

Problém nájdenia odhadu pre vektor je vyriešený. Výsledná regresia sa nazýva hlavné námestie.

2. Metóda najmenších modulov, podľa ktorého je súčet absolútnych odchýlok pozorovaných hodnôt efektívneho indikátora od modulárnych hodnôt minimalizovaný, t.j.

Výsledná regresia sa nazýva priemer absolútny(medián).

3. Minimax metóda sa zníži na minimalizáciu maximálneho modulu odchýlky pozorovanej hodnoty efektívneho indikátora y, z modelovej hodnoty, t.j.

Výsledná regresia sa nazýva minimax.

V praktických aplikáciách sa často stretávajú s problémami, pri ktorých sa študuje náhodná premenná y, v závislosti od nejakej sady premenných a neznámych parametrov. Považujeme () za (k + 1) -dimenzionálna všeobecná populácia, z ktorej náhodná vzorka objemu NS, kde () je výsledok i -tého pozorovania,. Je potrebné odhadnúť neznáme parametre na základe výsledkov pozorovaní. Vyššie popísaný problém súvisí s problémami regresnej analýzy.

Regresná analýza sa nazýva metóda štatistickej analýzy závislosti náhodnej veličiny o o premenných považovaných v regresnej analýze za náhodné hodnoty bez ohľadu na skutočný distribučný zákon

Regresný koncept... Vzťah medzi premennými X a r môžu byť popísané rôznymi spôsobmi. Najmä akúkoľvek formu spojenia je možné vyjadriť všeobecnou rovnicou, kde r považovaný za závislú premennú, príp funkcie z iného - nezávislá premenná x, tzv argument... Korešpondencia medzi argumentom a funkciou môže byť daná tabuľkou, vzorcom, grafom atď. Volá sa zmena funkcie v závislosti od zmeny jedného alebo viacerých argumentov regresia... Všetky prostriedky použité na opis korelácií sú obsahové regresná analýza.

Na vyjadrenie regresie sa používajú korelačné rovnice alebo regresné rovnice, empirické a teoreticky vypočítané regresné rady, ich grafy, nazývané regresné čiary, ako aj lineárne a nelineárne regresné koeficienty.

Regresné ukazovatele vyjadrujú korelačný vzťah obojsmerne, pričom sa zohľadňuje zmena priemerných hodnôt atribútu Y pri zmene hodnôt X i podpísať X, a naopak, ukazujú zmenu priemerných hodnôt charakteristiky X zmenenými hodnotami r i podpísať Y... Výnimkou sú časové rady alebo série dynamiky ukazujúce zmenu funkcií v priebehu času. Regresia takýchto sérií je jednostranná.

Existuje mnoho rôznych foriem a typov korelácií. Úloha sa scvrkáva na identifikáciu formy komunikácie v každom konkrétnom prípade a jej vyjadrenie pomocou zodpovedajúcej korelačnej rovnice, ktorá umožňuje predpovedať možné zmeny v jednej vlastnosti Y na základe známych zmien v inom X spojené s prvou koreláciou.

12.1 Lineárna regresia

Regresná rovnica. Výsledky pozorovaní vykonaných nad konkrétnym biologickým objektom na základe korelovaných charakteristík X a r, je možné nakresliť bodmi v rovine zostrojením obdĺžnikového súradnicového systému. Výsledkom je druh bodového diagramu, ktorý vám umožňuje posúdiť tvar a tesnosť vzťahu medzi rôznymi vlastnosťami. Pomerne často tento vzťah vyzerá ako rovná čiara alebo sa dá aproximovať priamkou.

Lineárny vzťah medzi premennými X a r je opísaná všeobecnou rovnicou, kde a B C d,... sú parametre rovnice, ktoré určujú vzťah medzi argumentmi X 1 , X 2 , X 3 , ..., X m a funkcie.

V praxi sa neberú do úvahy všetky možné argumenty, ale iba niektoré z argumentov, v najjednoduchšom prípade iba jeden:

V rovnici lineárnej regresie (1) a Je voľný výraz a parameter b definuje sklon regresnej čiary vzhľadom na obdĺžnikové osi. V analytickej geometrii sa tento parameter nazýva svahu a v biometrii - regresný koeficient... Vizuálna reprezentácia tohto parametra a poloha regresných čiar Y na X a X na Y v systéme obdĺžnikových súradníc je uvedený na obr.

Ryža. 1 Regresné priamky Y až X a X až Y v systéme

obdĺžnikové súradnice

Regresné čiary, ako je znázornené na obr. 1, sa pretínajú v bode O (,), čo zodpovedá aritmetickým priemerným hodnotám znakov navzájom korelovaných Y a X... Pri vykresľovaní regresných grafov sú hodnoty nezávislej premennej X vynesené pozdĺž osi x a hodnoty závislej premennej alebo funkcie Y sú vynesené pozdĺž osi osi A. Čiara AB prechádzajúca bodom O (,) zodpovedá úplnej (funkčnej) závislosti medzi premennými Y a X keď korelačný koeficient. Čím silnejšie je spojenie medzi nimi Y a X, čím sú regresné čiary bližšie k AB, a naopak, čím je vzťah medzi týmito hodnotami slabší, tým sú regresné čiary od AB vzdialenejšie. Pri absencii spojenia medzi znakmi sa regresné čiary javia byť navzájom v pravom uhle a.

Pretože regresné indikátory vyjadrujú korelačný vzťah obojsmerne, regresná rovnica (1) by mala byť napísaná takto:

Podľa prvého vzorca sú priemerné hodnoty určené pri zmene atribútu X za mernú jednotku, za druhé - priemerné hodnoty, keď sa miera atribútu zmení o jednotku Y.

Regresný koeficient. Regresný koeficient ukazuje, koľko v priemere predstavuje hodnota jedného prvku r zmeny so zmenou o jednu mieru druhej, v korelácii s Y podpísať X... Tento indikátor je určený vzorcom

Tu sú hodnoty s vynásobené veľkosťou triednych košov λ , ak boli nájdené pomocou variácií alebo korelačných tabuliek.

Regresný koeficient je možné vypočítať obídením výpočtu štandardných odchýlok. s r a s X podľa vzorca

Ak nie je korelačný koeficient známy, regresný koeficient sa určí takto:

Vzťah medzi koeficientmi regresie a koreláciou. Porovnaním vzorcov (11.1) (téma 11) a (12.5) vidíme, že ich čitateľ má rovnakú hodnotu, čo naznačuje prítomnosť prepojenia medzi týmito ukazovateľmi. Toto spojenie je vyjadrené rovnosťou

Korelačný koeficient sa teda rovná geometrickému priemeru koeficientov b yx a b xy... Vzorec (6) umožňuje, po prvé, na základe známych hodnôt regresných koeficientov b yx a b xy určiť regresný koeficient R. xy, a za druhé, skontrolovať správnosť výpočtu tohto korelačného ukazovateľa R. xy medzi rôznymi funkciami X a Y.

Rovnako ako korelačný koeficient, aj regresný koeficient charakterizuje iba lineárny vzťah a je sprevádzaný znamienkom plus pre pozitívny vzťah a znamienkom mínus pre negatívny vzťah.

Stanovenie parametrov lineárnej regresie. Je známe, že súčet druhých mocnín odchýlok je variant X i priemeru je najmenšia hodnota, tj. Táto veta tvorí základ metódy najmenších štvorcov. Pokiaľ ide o lineárnu regresiu [porov. vzorec (1)] požiadavku tejto vety spĺňa určitý systém rovníc tzv normálne:

Spoločné riešenie týchto rovníc s ohľadom na parametre a a b vedie k nasledujúcim výsledkom:

;

;

, odkiaľ a.

Vzhľadom na obojsmerný charakter vzťahu medzi premennými Y a X, vzorec na určenie parametra a treba to vyjadriť takto:

a. (7)

Parameter b alebo regresný koeficient je určený nasledujúcimi vzorcami:

Konštrukcia empirických regresných sérií. Za prítomnosti veľkého počtu pozorovaní regresná analýza začína konštrukciou empirických regresných sérií. Empirická regresná séria je tvorená výpočtom hodnôt jedného variabilného znaku X priemerné hodnoty iného, ​​v korelácii s X podpísať Y... Inými slovami, konštrukcia empirických regresných sérií sa redukuje na hľadanie skupinových priemerov a zo zodpovedajúcich hodnôt atribútov Y a X.

Empirická regresná séria je dvojitá séria čísel, ktoré môžu byť reprezentované bodmi v rovine, a potom spojením týchto bodov so segmentmi priamky získate empirickú regresnú čiaru. Empirické regresné rady, najmä ich grafy, tzv regresné čiary„poskytujú vizuálnu reprezentáciu formy a tesnosti korelácie medzi rôznymi vlastnosťami.

Vyrovnanie empirických regresných sérií. Grafy empirických regresných sérií spravidla nie sú plynulé, ale prerušované. Dôvodom je skutočnosť, že spolu s hlavnými dôvodmi, ktoré určujú všeobecný vzorec variability korelovaných znakov, je ich hodnota ovplyvnená vplyvom mnohých sekundárnych príčin, ktoré spôsobujú náhodné výkyvy regresných uzlových bodov. Na identifikáciu hlavnej tendencie (trendu) konjugovanej variácie korelovaných znakov je potrebné nahradiť prerušované čiary hladkými, hladko prebiehajúcimi regresnými čiarami. Nazýva sa proces nahradenia prerušovaných čiar hladkými zarovnanie empirických sérií a regresné čiary.

Grafické zarovnanie. Toto je najjednoduchšia metóda, ktorá nevyžaduje výpočtovú prácu. Jeho podstata sa scvrkáva na nasledujúce. Empirická regresná séria je vynesená do pravouhlého súradnicového systému. Potom sú vizuálne označené stredné body regresie, pozdĺž ktorých je pomocou pravítka alebo šablóny nakreslená plná čiara. Nevýhoda tejto metódy je zrejmá: nevylučuje vplyv jednotlivých vlastností bádateľa na výsledky vyrovnávania empirických regresných čiar. Preto v prípadoch, kde je pri výmene prerušovaných regresných čiar za hladké potrebné vyššej presnosti, sa používajú iné metódy zarovnávania empirických radov.

Metóda kĺzavého priemeru. Podstata tejto metódy sa redukuje na sekvenčný výpočet aritmetického priemeru dvoch alebo troch susedných členov empirického radu. Táto metóda je obzvlášť vhodná v prípadoch, keď je empirický rad reprezentovaný veľkým počtom pojmov, takže strata dvoch z nich - extrémnych, ktoré sú pri tomto spôsobe zarovnania nevyhnutné, výrazne neovplyvní jeho štruktúru.

Metóda najmenšieho štvorca. Túto metódu navrhol na začiatku 19. storočia A.M. Legenda a nezávisle od K. Gaussa. Umožňuje najpresnejšie zarovnanie empirických sérií. Táto metóda, ako je uvedené vyššie, je založená na predpoklade, že súčet druhých mocnín odchýlok je variant X i z ich priemeru existuje minimálna hodnota, to znamená. Preto je názov metódy, ktorá sa používa nielen v ekológii, ale aj v technológiách. Metóda najmenších štvorcov je objektívna a univerzálna; používa sa v rôznych prípadoch pri hľadaní empirických rovníc pre regresné rady a určovaní ich parametrov.

Požiadavka metódy najmenších štvorcov je, aby teoretické body regresnej priamky boli získané takým spôsobom, aby súčet druhých mocnín odchýlok od týchto bodov pre empirické pozorovania r i bola minimálna, t.j.

Vypočítaním minima tohto výrazu v súlade s princípmi matematickej analýzy a jeho určitým spôsobom transformácie je možné získať systém tzv. normálne rovnice, v ktorom sú neznáme hodnoty hľadanými parametrami regresnej rovnice a známe koeficienty sú určené empirickými hodnotami znakov, spravidla súčtom ich hodnôt a ich krížových súčinov.

Viacnásobná lineárna regresia. Vzťah medzi niekoľkými premennými je zvyčajne vyjadrený viacnásobnou regresnou rovnicou, ktorá môže byť lineárne a nelineárne... V najjednoduchšej forme je viacnásobná regresia vyjadrená rovnicou s dvoma nezávislými premennými ( X, z):

kde a- voľný termín rovnice; b a c- parametre rovnice. Na nájdenie parametrov rovnice (10) (metódou najmenších štvorcov) sa používa nasledujúci systém normálnych rovníc:

Riadky dynamiky. Zarovnanie riadkov. Zmeny v znameniach v priebehu času tvoria tzv časové rady alebo rady dynamiky... Charakteristickým znakom týchto sérií je, že časový faktor vždy funguje ako nezávislá premenná X a znak premennej ako závislá premenná Y. V závislosti od regresných radov je závislosť medzi premennými X a Y jednostranná, pretože časový faktor nezávisí od variability znakov. Napriek týmto vlastnostiam je možné sériu dynamiky prirovnať k sérii regresie a spracovať ju rovnakými metódami.

Rovnako ako regresné rady sú empirické série dynamiky ovplyvnené nielen hlavnými, ale aj mnohými sekundárnymi (náhodnými) faktormi, ktoré zakrývajú hlavný trend variability funkcií, ktorý sa v jazyku štatistiky nazýva trend.

Analýza série dynamiky začína identifikáciou tvaru trendu. Na tento účel je časový rad zobrazený ako čiarový graf v obdĺžnikovom súradnicovom systéme. Súčasne sú časové body (roky, mesiace a ďalšie časové jednotky) vykreslené pozdĺž osi x a hodnoty závislej premennej Y sú vynesené pozdĺž osi osi. Je regresná rovnica vo forme odchýlok členy radu závislých premenných Y z aritmetického priemeru radu nezávislých premenných X:

Tu je parameter lineárnej regresie.

Numerické charakteristiky série dynamiky. Medzi hlavné zovšeobecňujúce číselné charakteristiky série dynamiky patria geometrický priemer a aritmetický priemer je blízko nej. Charakterizujú priemernú rýchlosť, ktorou sa hodnota závislej premennej mení za určité časové obdobia:

Odhad variability členov radu dynamiky je štandardná odchýlka... Pri výbere regresných rovníc na opis radu dynamiky sa berie do úvahy forma trendu, ktorý môže byť lineárny (alebo redukovaný na lineárny) a nelineárny. Správnosť voľby regresnej rovnice sa spravidla posudzuje podľa podobnosti empiricky pozorovaných a vypočítaných hodnôt závislej premennej. Presnejšia pri riešení tohto problému je metóda analýzy regresnej odchýlky (téma 12, položka 4).

Korelácia sérií dynamiky.Často je potrebné porovnať dynamiku navzájom súbežných časových radov podľa niektorých všeobecných podmienok, napríklad zistiť vzťah medzi poľnohospodárskou výrobou a rastom hospodárskych zvierat za určité časové obdobie. V takýchto prípadoch je charakteristika vzťahu medzi premennými X a Y korelačný koeficient R xy (ak existuje lineárny trend).

Je známe, že trend radu dynamiky je spravidla zakrytý fluktuáciami členov radu závislej premennej Y. Preto vzniká úloha dvoch druhov: meranie závislosti medzi porovnávaným radom, nevynímajúc trend a meranie závislosti medzi susednými členmi rovnakého radu, bez trendu. V prvom prípade je indikátor tesnosti spojenia medzi porovnávanou sériou dynamiky korelačný koeficient(ak je spojenie lineárne), v druhom - autokorelačný koeficient... Tieto ukazovatele majú rôzny význam, aj keď sú vypočítané pomocou rovnakých vzorcov (pozri tému 11).

Je ľahké vidieť, že hodnota koeficientu autokorelácie je ovplyvnená variabilitou členov radu závislých premenných: čím menej sa členy radu odchyľujú od trendu, tým vyšší je koeficient autokorelácie a naopak.

Za prítomnosti korelácie medzi faktorovými a účinnými charakteristikami musia lekári často stanoviť, do akej miery sa môže hodnota jedného atribútu zmeniť, keď sa iný zmení na všeobecne akceptovanú mernú jednotku alebo mernú jednotku stanovenú samotným výskumníkom.

Ako sa napríklad zmení telesná hmotnosť školákov 1. stupňa (dievčat alebo chlapcov), ak sa ich výška zvýši o 1 cm Na tento účel sa používa metóda regresnej analýzy.

Metóda regresnej analýzy sa najčastejšie používa na vývoj normatívnych škál a štandardov fyzického vývoja.

  1. Definícia regresie... Regresia je funkcia, ktorá umožňuje na základe priemernej hodnoty jedného znaku určiť priemernú hodnotu iného znaku, ktorý je v korelácii s prvým.

    Na tento účel sa používa regresný koeficient a množstvo ďalších parametrov. Môžete napríklad vypočítať počet prechladnutí v priemere pri určitých hodnotách priemernej mesačnej teploty vzduchu v období jeseň-zima.

  2. Stanovenie regresného koeficientu... Regresný koeficient je absolútna hodnota, o ktorú sa hodnota jedného znaku v priemere zmení, keď sa iný príbuzný znak zmení o špecifikovanú mernú jednotku.
  3. Vzorec regresného koeficientu... R y / x = r x y x (σ y / σ x)
    kde R y / x je regresný koeficient;
    r xy je korelačný koeficient medzi znamienkami x a y;
    (σ y a σ x) sú štandardné odchýlky znakov x a y.

    V našom prípade;
    σ х = 4,6 (štandardná odchýlka teploty vzduchu v období jeseň-zima;
    σ y = 8,65 (štandardná odchýlka počtu infekčných prechladnutí).
    R y / x je teda regresný koeficient.
    R y / x = -0,96 x (4,6 / 8,65) = 1,8, t.j. s poklesom priemernej mesačnej teploty vzduchu (x) o 1 stupeň sa priemerný počet infekčných prechladnutí (y) v období jeseň-zima zmení o 1,8 prípadov.

  4. Regresná rovnica... y = M y + R y / x (x - M x)
    kde y je priemerná hodnota prvku, ktorá by sa mala určiť, keď sa priemerná hodnota iného znaku (x) zmení;
    x je známa priemerná hodnota iného znaku;
    R y / x - regresný koeficient;
    M x, M y sú známe priemerné hodnoty znakov x a y.

    Napríklad priemerný počet infekčných prechladnutí (y) možno určiť bez špeciálnych meraní pri akejkoľvek priemernej mesačnej priemernej teplote vzduchu (x). Ak teda x = -9 °, R y / x = 1,8 chorôb, M x = -7 °, M y = 20 chorôb, potom y = 20 + 1,8 x (9-7) = 20 + 3, 6 = 23,6 choroby.
    Táto rovnica sa používa v prípade priameho vzťahu medzi dvoma znakmi (x a y).

  5. Priradenie regresnej rovnice... Regresná rovnica sa používa na vykreslenie regresnej čiary. Ten umožňuje bez špeciálnych meraní určiť priemernú hodnotu (y) jedného znaku, ak sa zmení (x) iného znaku. Na základe týchto údajov je zostavený graf - regresná čiara, pomocou ktorého je možné určiť priemerný počet prechladnutí pri akejkoľvek hodnote priemernej mesačnej teploty v rozmedzí medzi vypočítanými hodnotami počtu prechladnutí.
  6. Sigma regresia (vzorec).
    kde σ Rу / х - sigma (štandardná odchýlka) regresie;
    σ y - štandardná odchýlka atribútu y;
    r xy je korelačný koeficient medzi znamienkami x a y.

    Ak je teda σ y štandardná odchýlka počtu prechladnutí = 8,65; r xy je korelačný koeficient medzi počtom prechladnutí (y) a priemernou mesačnou teplotou vzduchu v období jeseň -zima (x) - 0,96, potom

  7. Priradenie regresie Sigma... Udáva charakteristiku miery diverzity efektívnej vlastnosti (y).

    Charakterizuje napríklad rozmanitosť počtu prechladnutí pri určitej hodnote priemernej mesačnej teploty vzduchu v období jeseň-zima. Priemerný počet prechladnutí pri teplote vzduchu x 1 = -6 ° sa teda môže pohybovať od 15,78 chorôb do 20,62 chorôb.
    Pri x 2 = -9 ° sa priemerný počet prechladnutí môže pohybovať od 21,18 chorôb do 26,02 chorôb atď.

    Regresná sigma sa používa na zostrojenie regresnej stupnice, ktorá odráža odchýlku hodnôt efektívneho znaku od jeho priemernej hodnoty zakreslenej na regresnej čiare.

  8. Údaje potrebné na výpočet a vykreslenie regresnej stupnice
    • regresný koeficient - R y / x;
    • regresná rovnica - y = M y + R y / x (x -M x);
    • regresia sigma - σ Rx / y
  9. Postupnosť výpočtov a grafické znázornenie regresnej škály.
    • určte regresný koeficient podľa vzorca (pozri s. 3). Mali by ste napríklad určiť, koľko telesnej hmotnosti sa v priemere zmení (v určitom veku v závislosti od pohlavia), ak sa priemerná výška zmení o 1 cm.
    • podľa vzorca regresnej rovnice (pozri str. 4) určte, aký bude priemer, napríklad telesná hmotnosť (y, y 2, y 3 ...) * pre určitú hodnotu výšky (x, x 2, x 3 ...) ...
      ________________
      * Hodnota y by sa mala vypočítať pre najmenej tri známe hodnoty x.

      V tomto prípade sú známe priemerné hodnoty telesnej hmotnosti a výšky (M x a M y) pre určitý vek a pohlavie

    • vypočítajte regresnú sigma tak, že poznáte zodpovedajúce hodnoty σ y a r xy a ich hodnoty dosadíte do vzorca (pozri položku 6).
    • na základe známych hodnôt x 1, x 2, x 3 a zodpovedajúcich priemerných hodnôt y 1, y 2 y 3, ako aj najmenších (y - σ rу / x) a najväčších (y + σ rу / x) hodnoty (y) vytvárajú regresnú stupnicu.

      Pre grafické znázornenie regresnej stupnice na grafe sa najskôr označia hodnoty x, x 2, x 3 (os súradnice), t.j. je zostavená regresná čiara, napríklad závislosť telesnej hmotnosti (y) od výšky (x).

      Potom sa v zodpovedajúcich bodoch y 1, y 2, y 3 vyznačia číselné hodnoty regresnej sigmy, t.j. na grafe sú nájdené najmenšie a najväčšie hodnoty y 1, y 2, y 3.

  10. Praktické využitie regresnej stupnice... Normatívne škály a normy sa vyvíjajú, najmä pre fyzický vývoj. V štandardnom meradle môžete poskytnúť individuálne hodnotenie vývoja detí. V tomto prípade je telesný vývoj hodnotený ako harmonický, ak napríklad s určitou výškou je telesná hmotnosť dieťaťa v rámci jednej sigma regresie k priemernej vypočítanej jednotke telesnej hmotnosti - (y) pre danú výšku (x) ( y ± 1 σ Ry / x).

    Fyzický vývoj sa považuje za neharmonický v telesnej hmotnosti, ak je telesná hmotnosť dieťaťa pre určitú výšku v rámci druhej sigma regresie: (y ± 2 σ Ry / x)

    Fyzický vývoj bude prudko neharmonický v dôsledku nadváhy aj podváhy, ak je telesná hmotnosť pre určitú výšku v rámci regresie tretej sigma (y ± 3 σ Ry / x).

Podľa výsledkov štatistickej štúdie o fyzickom vývoji 5-ročných chlapcov je známe, že ich priemerná výška (x) je 109 cm a priemerná telesná hmotnosť (y) je 19 kg. Korelačný koeficient medzi výškou a telesnou hmotnosťou je +0,9, štandardné odchýlky sú uvedené v tabuľke.

Požadovaný:

  • vypočítajte regresný koeficient;
  • pomocou regresnej rovnice určte, aká bude očakávaná telesná hmotnosť 5-ročných chlapcov s výškou rovnajúcou sa x1 = 100 cm, x2 = 110 cm, x3 = 120 cm;
  • vypočítajte regresnú sigmu, zostavte regresnú stupnicu, graficky prezentujte výsledky jej riešenia;
  • vyvodiť príslušné závery.

Stav problému a výsledky jeho riešenia sú uvedené v súhrnnej tabuľke.

stôl 1

Podmienky problému Výsledky riešenia problému
regresná rovnica regresia sigma regresná škála (očakávaná telesná hmotnosť (v kg))
M σ r xy R y / x NS Mať σ R x / r y - σ Rу / х y + σ Rу / х
1 2 3 4 5 6 7 8 9 10
Výška (x) 109 cm ± 4,4 cm +0,9 0,16 100 cm 17,56 kg ± 0,35 kg 17,21 kg 17,91 kg
Telesná hmotnosť (y) 19 kg ± 0,8 kg 110 cm 19,16 kg 18,81 kg 19,51 kg
120 cm 20,76 kg 20,41 kg 21,11 kg

Riešenie.

Výkon. Miera regresie v rámci vypočítaných hodnôt telesnej hmotnosti teda umožňuje určiť ju na akejkoľvek inej hodnote výšky alebo posúdiť individuálny vývoj dieťaťa. Aby ste to urobili, mali by ste obnoviť kolmicu na regresnú čiaru.

  1. Vlasov V.V. Epidemiológia. - M.: GEOTAR-MED, 2004.- 464 s.
  2. Lisitsyn Yu.P. Verejné zdravie a zdravotníctvo. Učebnica pre univerzity. - M.: GEOTAR-MED, 2007.- 512 s.
  3. Medic V.A., Yuriev V.K. Kurz prednášok o verejnom zdraví a zdravotnej starostlivosti: 1. časť Verejné zdravie. - M.: Medicína, 2003.- 368 s.
  4. Minyaev V.A., Vishnyakov N.I. a iná organizácia sociálneho lekárstva a zdravotnej starostlivosti (Sprievodca v 2 zväzkoch). - SPb, 1998.-528 s.
  5. Kucherenko V.Z., Agarkov N.M. a kol. Sociálna hygiena a organizácia zdravotnej starostlivosti (učebnica) - Moskva, 2000. - 432 s.
  6. S. Glantz. Biomedicínska štatistika. Per z angličtiny. - M., Prax, 1998.- 459 s.

Regresná analýza- metóda modelovania nameraných údajov a skúmania ich vlastností. Údaje sa skladajú z dvojíc hodnôt závislá premenná(premenná reakcie) a nezávislá premenná(vysvetľujúca premenná). Regresný model je funkciou nezávislej premennej a parametrov s pridanou náhodnou premennou. Parametre modelu sú upravené tak, aby model najlepšie zodpovedal údajom. Kritériom kvality aproximácie (objektívna funkcia) je zvyčajne chyba odmocniny: súčet druhých mocnín rozdielu medzi hodnotami modelu a závislou premennou pre všetky hodnoty nezávislých premenná ako argument. Regresná analýza je odvetvím matematickej štatistiky a strojového učenia. Predpokladá sa, že závislá premenná je súčtom hodnôt určitého modelu a náhodnej premennej. Predpokladá sa povaha distribúcie tohto množstva, ktorá sa nazýva hypotéza generovania údajov. Na potvrdenie alebo vyvrátenie tejto hypotézy sa vykonávajú štatistické testy nazývané zvyšková analýza. To predpokladá, že nezávislá premenná je bez chýb. Regresná analýza sa používa na predpovedanie, analýzu časových radov, testovanie hypotéz a odhaľovanie skrytých vzťahov v dátach.

Definovanie regresnej analýzy

Odber vzoriek nemusí byť funkciou, ale vzťahom. Údaje na vytvorenie regresie môžu byť napríklad tieto :. V takejto vzorke jedna hodnota premennej zodpovedá viacerým hodnotám premenných.

Lineárna regresia

Lineárna regresia predpokladá, že funkcia závisí lineárne od parametrov. V tomto prípade je lineárna závislosť na voľnej premennej voliteľná,

V prípade, že má funkcia lineárnej regresie tvar

tu sú zložky vektora.

Hodnoty parametrov v prípade lineárnej regresie sa zisťujú metódou najmenších štvorcov. Použitie tejto metódy je založené na predpoklade gaussovského rozdelenia náhodnej premennej.

Nazývajú sa rozdiely medzi skutočnými hodnotami závislej premennej a rekonštruovanými hodnotami regresné zvyšky(zvyšky). V literatúre sa používajú aj synonymá: zvyšky a chyby... Jedným z dôležitých hodnotení kritéria kvality získanej závislosti je súčet druhých mocnín zvyškových látok:

Tu je súčet štvorcových chýb.

Rozptyl zvyškov sa vypočíta podľa vzorca

Tu - priemerná chyba štvorca, stredná chyba štvorca.

Grafy zobrazujú vzorky označené modrými bodkami a regresné vzťahy označené plnými čiarami. Voľná ​​premenná je vynesená na osi x a závislá premenná je nakreslená na súradnici. Všetky tri vzťahy sú vzhľadom na parametre lineárne.

Nelineárna regresia

Nelineárne regresné modely - Zobraziť modely

ktoré nemožno reprezentovať ako bodkový produkt

kde sú parametre regresného modelu, je voľná premenná z priestoru, je závislou premennou, je náhodnou premennou a je funkciou z danej množiny.

Hodnoty parametrov v prípade nelineárnej regresie sa zisťujú pomocou jednej z metód gradientového klesania, napríklad Levenberg-Marquardtovho algoritmu.

O podmienkach

Termín „regresia“ zaviedol Francis Galton na konci 19. storočia. Galton zistil, že deti vysokých alebo nízkych rodičov zvyčajne nededia vynikajúcu výšku a nazval tento jav „regresiou k priemernosti“. Tento termín bol spočiatku používaný výlučne v biologickom zmysle. Po práci Karla Pearsona sa tento termín začal používať v štatistikách.

V štatistickej literatúre sa regresia rozlišuje s účasťou jednej voľnej premennej a s niekoľkými voľnými premennými - jednorozmerné a viacrozmerné regresia. Predpokladá sa, že používame niekoľko voľných premenných, to znamená, že voľná premenná je vektor. V špeciálnych prípadoch, keď je bezplatná premenná skalár, bude označená. Rozlíšiť lineárne a nelineárne regresia. Ak regresný model nie je lineárnou kombináciou funkcií parametrov, hovoríme o nelineárnej regresii. V tomto prípade môže byť modelom ľubovoľná superpozícia funkcií z určitej množiny. Nelineárne modely sú exponenciálne, trigonometrické a ďalšie (napríklad radiálne bázové funkcie alebo Rosenblattov perceptron), ktoré predpokladajú, že závislosť medzi parametrami a závislou premennou je nelineárna.

Rozlíšiť parametrický a neparametrické regresia. Je ťažké vytvoriť striktnú hranicu medzi týmito dvoma druhmi regresií. Teraz neexistuje všeobecne akceptované kritérium na rozlíšenie jedného typu modelu od druhého. Napríklad sa predpokladá, že lineárne modely sú parametrické a modely, ktoré zahŕňajú priemerovanie závislej premennej v priestore voľnej premennej, sú neparametrické. Príklad parametrického regresného modelu: lineárny prediktor, viacvrstvový perceptrón. Príklady modelov so zmiešanou regresiou: Funkcie na radiálnej báze. Neparametrický model - priemerný pohyb v okne určitej šírky. Neparametrická regresia sa vo všeobecnosti líši od parametrickej regresie v tom, že závislá premenná nezávisí od jednej hodnoty voľnej premennej, ale od nejakého určeného susedstva tejto hodnoty.

Existuje rozdiel medzi pojmami „aproximácia funkcie“, „aproximácia“, „interpolácia“ a „regresia“. Je to nasledovné.

Aproximácia funkcií. Je daná funkcia diskrétneho alebo spojitého argumentu. Je potrebné nájsť funkciu z nejakej parametrickej rodiny, napríklad medzi algebraickými polynómami daného stupňa. Parametre funkcie by mali poskytovať minimum niektorých funkcií, napr.

Termín aproximácia- synonymum pre výraz „aproximácia funkcií“. Častejšie sa používa, pokiaľ ide o danú funkciu ako funkciu diskrétneho argumentu. Tu je tiež potrebné nájsť takú funkciu, ktorá prejde najbližšie ku všetkým bodom danej funkcie. V tomto prípade je koncept predstavený zvyšky- vzdialenosť medzi bodmi spojitej funkcie a zodpovedajúcimi bodmi funkcie diskrétneho argumentu.

Interpolácia funkcie - špeciálny prípad úlohy aproximácie, keď sa vyžaduje, aby v určitých bodoch, tzv interpolačné uzly hodnoty funkcie a funkcie, ktorá sa jej približuje, sa zhodujú. Vo všeobecnejšom prípade sú na hodnoty niektorých derivátov kladené obmedzenia. To znamená, že je daná funkcia diskrétneho argumentu. Je potrebné nájsť funkciu, ktorá prechádza všetkými bodmi. V tomto prípade sa metrika zvyčajne nepoužíva, ale často sa zavádza koncept „hladkosti“ hľadanej funkcie.

Hlavný účel regresnej analýzy spočíva v určení analytickej formy komunikácie, v ktorej je zmena efektívneho znaku spôsobená vplyvom jedného alebo viacerých faktoriálnych znakov, a mnohé zo všetkých ďalších faktorov, ktoré tiež ovplyvňujú účinný prvok, sa považujú za konštantné a priemerné hodnoty.
Úlohy regresnej analýzy:
a) Stanovenie formy závislosti. Pokiaľ ide o povahu a formu vzťahu medzi javmi, rozlišujte pozitívnu lineárnu a nelineárnu a negatívnu lineárnu a nelineárnu regresiu.
b) Stanovenie regresnej funkcie vo forme matematickej rovnice jedného alebo druhého typu a stanovenie vplyvu vysvetľujúcich premenných na závislú premennú.
c) Odhad neznámych hodnôt závislej premennej. Pomocou regresnej funkcie môžete reprodukovať hodnoty závislej premennej v intervale špecifikovaných hodnôt vysvetľujúcich premenných (tj. Vyriešiť problém s interpoláciou) alebo vyhodnotiť priebeh procesu mimo zadaného intervalu (tj. Vyriešiť problém extrapolácie). Výsledkom je odhad hodnoty závislej premennej.

Párová regresia je rovnicou vzťahu medzi dvoma premennými y a x: y = f (x), kde y je závislá premenná (výsledné znamienko); x je nezávislá vysvetľujúca premenná (znakový faktor).

Rozlišujte lineárne a nelineárne regresie.
Lineárna regresia: y = a + bx + ε
Nelineárne regresie sú rozdelené do dvoch tried: regresie, ktoré sú nelineárne vzhľadom na vysvetľujúce premenné zahrnuté v analýze, ale lineárne v odhadovaných parametroch, a regresie, ktoré sú nelineárne v odhadovaných parametroch.
Regresie nelineárne vo vysvetľujúcich premenných:

Regresie, ktoré sú nelineárne v odhadovaných parametroch:

  • mocninový zákon y = a x b ε
  • exponenciálne y = a b x ε
  • exponenciálne y = e a + b x ε
Konštrukcia regresnej rovnice sa redukuje na odhad jej parametrov. Na odhad parametrov regresií, ktoré sú v parametroch lineárne, použite metódu najmenších štvorcov (OLS). OLS umožňuje získať také odhady parametrov, pre ktoré je súčet druhých mocnín odchýlok skutočných hodnôt efektívneho atribútu y od teoretického y x minimálny, t.j.
.
Pre lineárne a nelineárne rovnice, ktoré je možné redukovať na lineárne, je s ohľadom na a a b vyriešený nasledujúci systém:

Môžete použiť hotové vzorce, ktoré vyplývajú z tohto systému:

Blízkosť spojenia študovaných javov je odhadovaná lineárnym koeficientom párovej korelácie r xy pre lineárnu regresiu (-1≤r xy ≤1):

a index korelácie p xy - pre nelineárnu regresiu (0≤p xy ≤1):

Posúdenie kvality zostrojeného modelu bude dané koeficientom (indexom) determinácie, ako aj priemernou chybou aproximácie.
Priemerná chyba aproximácie je priemerná odchýlka vypočítaných hodnôt od skutočných:
.
Prípustný limit pre hodnoty A nie je väčší ako 8-10%.
Priemerný koeficient pružnosti E ukazuje, koľko percent v priemere v populácii sa výsledok y zmení od jeho priemernej hodnoty, keď sa faktor x zmení o 1% od jeho priemernej hodnoty:
.

Úlohou analýzy rozptylu je analyzovať rozptyl závislej premennej:
∑ (y-y) ² = ∑ (y x -y) ² + ∑ (y-y x) ²
kde ∑ (y-y) ² je celkový súčet druhých mocnín odchýlok;
∑ (y x -y) ² - súčet druhých mocnín odchýlok spôsobených regresiou („vysvetlené“ alebo „faktoriál“);
∑ (y -y x) ² - zvyškový súčet druhých mocnín odchýlok.
Podiel rozptylu vysvetlený regresiou na celkovom rozptyle efektívneho atribútu y je charakterizovaný koeficientom (indexom) určenia R 2:

Koeficient determinácie - druhá mocnina koeficientu alebo korelačného indexu.

F -test - hodnotenie kvality regresnej rovnice - spočíva v testovaní hypotézy Ale o štatistickej bezvýznamnosti regresnej rovnice a ukazovateli tesnosti spojenia. Za týmto účelom sa vykoná porovnanie medzi skutočnou skutočnosťou F a kritickou (tabuľkovou) tabuľkou F hodnôt F-Fisherovho testu. Skutočnosť je určená z pomeru hodnôt faktoriálnej a zvyškovej odchýlky vypočítaných pre jeden stupeň voľnosti:
,
kde n je počet jednotiek v populácii; m je počet parametrov pre premenné x.
F tabuľka je maximálna možná hodnota kritéria pod vplyvom náhodných faktorov pre dané stupne voľnosti a úroveň významnosti a. Úroveň významnosti a je pravdepodobnosť odmietnutia správnej hypotézy za predpokladu, že je správna. Obvykle sa a rovná 0,05 alebo 0,01.
Ak F tab< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >Faktom je, že hypotéza H o sa neodmieta a uznáva sa štatistická nevýznamnosť, nespoľahlivosť regresnej rovnice.
Na posúdenie štatistickej významnosti regresných a korelačných koeficientov sa vypočíta Studentov t-test a intervaly spoľahlivosti pre každý z indikátorov. Je predložená hypotéza H o náhodnej povahe ukazovateľov, t.j. o ich nepodstatnom rozdiele od nuly. Posúdenie významnosti regresných a korelačných koeficientov pomocou Studentovho t-testu sa vykoná porovnaním ich hodnôt s veľkosťou náhodnej chyby:
; ; .
Náhodné chyby parametrov lineárnej regresie a korelačného koeficientu sú určené vzorcami:



Porovnávaním skutočných a kritických (tabuľkových) hodnôt t -štatistiky - t tabuľky a faktu - hypotézu akceptujeme alebo odmietneme H o.
Vzťah medzi Fisherovým F-testom a Studentovou t-štatistikou je vyjadrený rovnosťou

Ak t tab< t факт то H o отклоняется, т.е. a , b и r xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >Skutočnosť, že hypotéza H o sa neodmieta a rozpoznáva sa náhodná povaha tvorby a, b alebo r xy.
Na výpočet intervalu spoľahlivosti určíme hraničnú chybu D pre každý indikátor:
Δ a = t tabuľka m a, Δ b = t tabuľka m b.
Vzorce na výpočet intervalov spoľahlivosti sú nasledujúce:
ya = aΔa; y a = a-Δ a; γ a = a + Δ a
y b = bΔ b; y b = b-Δ b; γ b = b + Δ b
Ak nula spadá do intervalu spoľahlivosti, t.j. dolná hranica je záporná a horná hranica je kladná, potom sa odhadovaný parameter považuje za nulový, pretože nemôže súčasne nadobúdať kladné aj záporné hodnoty.
Predpovedaná hodnota y p je určená substitúciou zodpovedajúcej (predpovedanej) hodnoty x p do regresnej rovnice y x = a + b x. Priemerná štandardná chyba predpovede m y x sa vypočíta:
,
kde
a interval spoľahlivosti prognózy sa zostrojí:
γ y x = y p Δ y p; γ y x min = y p -A y p; γ y x max = y p + Δ y p
kde Δ y x = t tabuľka m y x.

Príklad riešenia

Problém číslo 1. Pre sedem území uralského regiónu V roku 199X sú známe hodnoty dvoch znakov.
Stôl 1.

Požadovaný: 1. Na charakterizáciu závislosti y na x vypočítajte parametre nasledujúcich funkcií:
a) lineárne;
b) mocninový zákon (musíte najskôr vykonať postup pre linearizáciu premenných pomocou logaritmu oboch častí);
c) orientačné;
d) rovnostranná hyperbola (musíte tiež zistiť, ako tento model vopred linearizovať).
2. Vyhodnoťte každý model pomocou strednej chyby aproximácie A a F-Fisherovho testu.

Riešenie (možnosť č. 1)

Na výpočet parametrov a a b lineárnej regresie y = a + b x (výpočet je možné vykonať pomocou kalkulačky).
riešime sústavu normálnych rovníc pre a a b:
Na základe počiatočných údajov vypočítame ∑y, ∑x, ∑y · x, ∑x², ∑y²:
r X yx x 2 y 2 y xy-y xA i
l68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
Celkom405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
Streda význam (Celkom / n)57,89
r
54,90
X
3166,05
x r
3048,34
3383,68
XX8,1
s 5,74 5,86 XXXXXX
s 232,92 34,34 XXXXXX


a = y -b x = 57,89 + 0,35 54,9 ≈ 76,88

Regresná rovnica: y = 76,88 - 0,35NS. S nárastom priemernej dennej mzdy o 1 rub. podiel výdavkov na nákup potravinárskych výrobkov klesá v priemere o 0,35% bodu.
Vypočítajme korelačný koeficient lineárnej dvojice:

Komunikácia je striedma, obrátená.
Definujme koeficient determinácie: r² xy = (- 0,35) = 0,127
Variácia 12,7% vo výsledku sa vysvetľuje variáciou vo faktore x. Nahradenie skutočných hodnôt do regresnej rovnice NS, určíme teoretické (vypočítané) hodnoty y x. Nájdeme hodnotu priemernej chyby aproximácie A:

V priemere sa vypočítané hodnoty od skutočných líšia o 8,1%.
Vypočítajme F-kritérium:

Výsledná hodnota naznačuje potrebu akceptovať hypotézu H 0 o náhodnej povahe odhalenej závislosti a štatistickej nevýznamnosti parametrov rovnice a indikátora tesnosti spojenia.
1b. Konštrukcii mocninového modelu y = a x b predchádza postup na linearizáciu premenných. V tomto prípade sa linearizácia vykoná logaritmom oboch strán rovnice:
lg y = lg a + b lg x
Y = C + b Y
kde Y = log (y), X = log (x), C = log (a).

Na výpočty používame údaje v tabuľke. 1.3.
Tabuľka 1.3

YX YX Y 2 X 2 y xy-y x(y-y x) ²A i
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
Celkom12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
Priemer1,7605 1,7370 3,0572 3,1011 3,0194 XX28,27 8,0
σ 0,0425 0,0484 XXXXXXX
σ 20,0018 0,0023 XXXXXXX

Vypočítajme C a b:

C = Y -b X = 1,7605 + 0,298 1,7370 = 2,278126
Dostaneme lineárnu rovnicu: Y = 2,278-0,298 X
Po vykonaní jeho potenciácie dostaneme: y = 10 2,278 x -0,298
Nahradením skutočných hodnôt do tejto rovnice NS, získame teoretické hodnoty výsledku. Na ich základe vypočítame ukazovatele: tesnosť spojenia - index korelácie p xy a priemernú chybu aproximácie A.

Charakteristiky mocninového zákona naznačujú, že popisuje vzťah o niečo lepšie ako lineárna funkcia.

1c... Konštrukcii rovnice exponenciálnej krivky y = a b x predchádza postup linearizácie premenných s logaritmom oboch strán rovnice:
lg y = lg a + x lg b
Y = C + B x
Na výpočty používame údaje v tabuľke.

YX Yx Y 2 x 2y xy-y x(y-y x) ²A i
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
Celkom12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
Streda zn.1,7605 54,9 96,5711 3,1011 3048,34 XX28,68 8,0
σ 0,0425 5,86 XXXXXXX
σ 20,0018 34,339 XXXXXXX

Hodnoty regresných parametrov A a V. vymyslené:

A = Y -B x = 1,7605 + 0,0023 54,9 = 1,887
Získa sa lineárna rovnica: Y = 1,887-0,0023x. Potencujme výslednú rovnicu a napíšme ju v obvyklej forme:
y x = 10 1,887 10 -0,0023x = 77,1 0,9947 x
Tesnosť spojenia odhadujeme pomocou korelačného indexu p xy:

3588,01 56,9 3,0 9,00 5,0 4 56,7 0,0162 0,9175 0,000262 3214,89 55,5 1,2 1,44 2,1 5 55 0,0170 0,9354 0,000289 3025,00 56,4 -1,4 1,96 2,5 6 54,3 0,0212 1,1504 0,000449 2948,49 60,8 -6,5 42,25 12,0 7 49,3 0,0181 0,8931 0,000328 2430,49 57,5 -8,2 67,24 16,6 Celkom405,2 0,1291 7,5064 0,002413 23685,76 405,2 0,0 194,90 56,5 Priemer57,9 0,0184 1,0723 0,000345 3383,68 XX27,84 8,1 σ 5,74 0,002145 XXXXXXX σ 232,9476 0,000005 XX