Definícia komunikácie medzi náhodnými hodnotami. Úvod do korelačnej analýzy. Základy regresnej analýzy komunikácie medzi náhodnými hodnotami

Komunikačné charakteristiky medzi náhodnými premennými

Spolu s regresnou funkciou, ekonmetria tiež používajú kvantitatívne charakteristiky vzťahu medzi dvoma náhodnými hodnotami. Patrí medzi ne kovariadznosť a korelačný koeficient.

Kovaristika Náhodné premennéh. ay sa nazýva matematické očakávanie prác odchýlok týchto hodnôt z jeho matematických očakávaní a vypočíta sa podľa pravidiel:

kde a - matematické očakávania respektíve premenných X. a y

Kovaristika je konštantná, ktorá odráža stupeň vzťahu medzi dvoma náhodnými hodnotami a označenou kakili

Pre nezávislé náhodné premenné, kovariancia je nula, ak existuje štatistické spojenie medzi premennými, zodpovedajúca kovariancia sa líši od nuly. Znamenie kovariance posudzuje charakter komunikácie: jednosmerné () alebo viacsmerné ().

Všimnite si, že v prípade, keď je premenné h. a w. Definícia (3.12) sa zhoduje, sa konvertuje na definíciu disperzie náhodnej premennej:

Veľkosť hodnoty kovariancie. Jeho rozmer je produktom variabilných rozmerov. Prítomnosť rozmeru v Covarii sťažuje ho na vyhodnotenie závislosti náhodných premenných.

Spolu s kovarianciou sa korelačný koeficient používa na posúdenie vzťahu medzi náhodnými hodnotami.

Korelačný koeficient dvoch náhodných premennýchpostoj ich kovariancie k produktu štandardných chýb týchto množstiev sa nazýva:

Korelačný koeficient je bezrozmerný, oblasť možných hodnôt, z ktorých existuje segment [+1; -ne]. Pre nezávislé náhodné premenné je korelačný koeficient nulový, ak to znamená prítomnosť lineárnej funkčnej závislosti medzi premennými.

Analogicky s náhodnými premennými, kvantitatívne charakteristiky sú tiež zavedené aj pre náhodný vektor. Dve charakteristiky:

1) Vektor očakávaných hodnôt komponent

tu je náhodný vektor; - matematické očakávania zložky náhodného vektora;

2) Kovaristika Matrica

(3.15)

Matica s kovarianciou súčasne obsahuje informácie o stupni neistoty zložky náhodného vektora a informácie o stupni vzťahu medzi každým párom vektorovej zložky.

V ekonomike, koncepcia náhodného vektora a jeho vlastností, najmä našiel aplikáciu pri analýze operácií na akciovom trhu. Slávny americký ekonóm Harry Markovitz ponúkol nasledujúci prístup. Nech N rizikové aktíva sa vzťahujú na akciový trh. Výťažok každého aktíva určitý čas je náhodná hodnota. Zavádza sa výťažok vektor a zodpovedajúci vektor očakávaných výnosov. Vektor očakávaných výnosov Markovovets navrhol byť považovaný za indikátor príťažlivosti majetku a prvky hlavného uhlopriečka kovariankovej matrice - ako hodnota rizika pre každé aktívum. Diagonálne prvky odrážajú spojovacie znaky zodpovedajúcich párov ziskovosti zahrnuté do vektora. Parametrický model akciového trhu Marcovyman dostal názor

Tento model je založený na teórii optimálneho portfólia cenných papierov.

Vlastnosti na výpočet kvantitatívnych charakteristík náhodných premenných

Zvážte hlavné vlastnosti výpočtu kvantitatívnych charakteristík náhodných premenných a náhodného vektora.

Operácie výpočtu matematických očakávaní:

1) Ak náhodná premenná x \u003d z,kde z- konštantná, potom

2) Ak X a y - Náhodné premenné, AI-ľubovoľné konštanty, potom

3) ak h. a w. nezávislé náhodné premenné, potom

Operácie výpočtu disperzie:

1) Ak náhodná premenná x \u003d s, kde C je ľubovoľná konštanta, potom

2) ak x.

3) ak h. náhodná premenná a C je ľubovoľná konštanta, potom

4) ak h. a y. - náhodné premenné, AI - ľubovoľné konštanty, potom

Účel korelačnej analýzy Identifikuje hodnotenie spojovacej sily medzi náhodnými hodnotami (funkcie), ktoré charakterizuje nejaký skutočný proces.
Úlohy korelačnej analýzy:
a) Meranie stupňa konektivity (tesnosť, sily, prísnosť, intenzita) dvoch alebo viacerých javov.
b) výber faktorov, ktoré majú najvýznamnejší vplyv na produktívny základ na základe merania stupňa pripojenia medzi javmi. Faktory sú v tomto aspekte nevyhnutné v regresnej analýze.
c) Detekcia neznámych kauzálnych pripojení.

Formy prejavu vzťahov sú veľmi rôznorodé. Ako najbežnejšie druhy, funkčné (kompletné) a korelácia (neúplná) komunikácia.
Korelácia Pre hromadné pozorovania sa prejavuje v priemere, keď určitý počet pravdepodobnostných hodnôt nezávislej premennej zodpovedá zadaným hodnotám závislej premennej. Komunikácia sa nazýva koreláciaAk každá hodnota faktorovej funkcie zodpovedá úplne určitej non-náhodnú hodnotu výsledného funkcie.
Korelačné pole slúži ako jasný obraz tabuľky zhody. Je to graf, v ktorom sú hodnoty X odložené na osi osi, pozdĺž osi Ordinácie a body sú zobrazené kombináciami X a Y. Na mieste bodov je možné posúdiť prítomnosť komunikácie.
Invidenčné indikátory Je možné charakterizovať závislosť odchýlky efektívneho prvku z variácie značkového faktora.
Dokonalejší ukazovateľ stupňa blízkosti korelačná väzba je lineárny korelačný koeficient. Pri výpočte tohto ukazovateľa sa berie do úvahy nielen odchýlky jednotlivých hodnôt funkcie z priemeru, ale aj veľkosť samotných odchýlok.

Kľúčovými problémami tejto témy sú regresné rovnice medzi účinným funkciou a vysvetľujú variabilnú metódu najmenšie štvorce Na vyhodnotenie parametrov regresného modelu, analýza kvality získanej regresnej rovnice, výstavby intervalov spoľahlivosti prognózy hodnôt efektívneho rysu podľa regresnej rovnice.

Príklad 2.


Systém bežných rovníc.
n + bσx \u003d σy
aσx + bσx 2 \u003d σy x
Pre naše údaje má systém rovníc formulár
30A + 5763 B \u003d 21460
5763 A + 1200261 B \u003d 3800360
Z prvej rovnice Express ale a nahradiť druhú rovnicu:
Dostaneme B \u003d -3,46, A \u003d 1379,33
Regresná rovnica:
y \u003d -3,46 x + 1379,33

2. Výpočet parametrov regresnej rovnice.
Selektívny priemer.



Selektívne disperzie:


Radiálna odchýlka


1.1. Korelačný koeficient
Kovariač.

Vypočítajte indikátor tesnosti komunikácie. Tento ukazovateľ je selektívny lineárny korelačný koeficient, ktorý je vypočítaný vzorcom:

Lineárny korelačný koeficient berie hodnoty od -1 do +1.
Komunikácia medzi funkciami môže byť slabá a silná (blízko). Ich kritériá sa odhadujú na stupnici vzorcu:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
V našom príklade je vzťah medzi znakom Y vysoký a reverzný faktor.
Okrem toho koeficient lineárnej korelácie môže byť určený prostredníctvom regresného koeficientov B:

1.2. Regresná rovnica (Hodnotenie regresnej rovnice).

Lineárna regresná rovnica má formu y \u003d -3,46 x + 1379,33

Koeficient B \u003d -3,46 ukazuje priemernú zmenu účinného indikátora (v jednotkách merania Y) so zvýšením alebo znížením hodnoty faktora x na jednotku jej merania. V tento príklad S nárastom 1 jednotiek y kvapiek v priemere na -3,46.
Koeficient A \u003d 1379,33 formálne zobrazuje premietanú úroveň Y, ale len ak X \u003d 0 je blízko k selektívnym hodnotám.
Ale ak X \u003d 0 je ďaleko od selektívnych hodnôt x, potom môže doslovná interpretácia viesť k nesprávnemu výsledku, a to aj v prípade, že regresná čiara je celkom presne popisuje hodnoty pozorovanej vzorky, neexistuje žiadna záruka, ktorá bude s extrapoláciou doľava alebo doprava.
Nahradenie zodpovedajúcich hodnôt X k regresnej rovnici, môžete definovať zarovnané (predpokladané) hodnoty účinného indikátora Y (x) pre každé pozorovanie.
Vzťah medzi Y a X určuje znamenie regresného koeficientu B (ak\u003e 0 je priame spojenie, inak - reverzný). V našom príklade je pripojenie opačne.
1.3. Koeficient elasticity.
Regresné koeficienty (v príklade b) nežiaduce použitie na priame posúdenie vplyvu faktorov na produktívnom základe v prípade, že existuje rozdiel v jednotkách merania účinného ukazovateľa a faktora X.
Na tieto účely sa vypočítajú koeficienty elasticity a beta - koeficienty.
Priemerná elasticita koeficient E ukazuje, koľko percent v priemere výsledok zmení výsledok w. z jeho priemernej hodnoty pri zmene faktora x. 1% jej priemeru.
Koeficient elasticity je podľa vzorca:


Koeficient elasticity je v dôsledku toho menší ako 1. Zmena zmenou X o 1%, Y sa zmení za menej ako 1%. Inými slovami - účinok x na y nie je nevyhnutný.
Beta - koeficient Ukazuje, ktorá časť hodnoty jeho priemernej kvadratickej odchýlky sa zmení v priemere hodnotu efektívneho funkcie, keď sa faktor označenia zmení hodnota jeho štandardnej odchýlky na pevnej úrovni v konštantnej hodnote zostávajúcich nezávislých premenných :

Tí. Zvýšenie X hodnota hodnoty RMS S X zníži priemernú hodnotu Y pri 0,74 RMS odchýlky s y.
1.4. Chyba aproximácie.
Odhadujeme kvalitu regresnej rovnice pomocou chyby absolútnej aproximácie. Priemerná chyba aproximácie je priemerná odchýlka odhadovaných hodnôt zo skutočného:


Keďže chyba je menšia ako 15%, potom sa táto rovnica môže použiť ako regresia.
Analýza disperzie.
Úlohou analýzy disperzie je analyzovať disperziu závislej premennej:
Σ (y i - y cp) 2 \u003d σ (y (x) - y cp) 2 + σ (y - y (x)) 2
kde
Σ (y i - y cp) 2 - celkové množstvo štvorcov odchýlok;
Σ (y (x) - y cp) 2 - súčet štvorcov odchýlok z dôvodu regresie ("vysvetlil" alebo "faktor");
Σ (y - y (x)) 2 - zvyškový súčet štvorcov odchýlok.
Teoretický vzťah korelácie Pre lineárne spojenie sa rovná korelačnému koeficientov R xy.
Pre akúkoľvek formu závislosti tónu spojenia je určená viacnásobný koeficient Korelácia:

Tento koeficient je univerzálny, pretože odráža tesnosť komunikácie a presnosti modelu a môže sa použiť aj s akoukoľvek formou komunikácie premenných. Pri konštrukcii jednofaktorového korelačného modelu je viacnásobný korelačný koeficient rovnaký koeficientom párovej korelácie R xy.
1.6. Koeficient stanovenia.
Kvadrantový (viacnásobný) korelačný koeficient sa nazýva koeficient stanovenia, ktorý ukazuje podiel variácie produktívneho prvku vysvetlené variáciou faktora znamenia.
Najčastejšie sa vydáva výklad koeficientu stanovenia, je vyjadrený ako percento.
R2 \u003d -0,74 2 \u003d 0,5413
tí. V 54,13% prípadov zmien vedie k zmene v Y. Inými slovami - presnosť výberu regresnej rovnice je priemer. Zostávajúce 45,87% Zmena y je vysvetlené faktormi, ktoré nie sú zodpovedné v modeli.

Bibliografia

  1. Ekonometria: Návody / ed. I.i. Eliseeva. - M.: Financie a štatistiky, 2001, s. 34..89.
  2. Magnus ya.r., Katyshev P.K., príjemcovia A.A. Ekonometria. Začiatočný kurz. Návod. - 2. ed., ACT. - m.: Prípad, 1998, str. 17..42.
  3. Workshop o Econometric: Štúdie. Manuálne / i.i. ELISEEVA, S.V. KURYSCHEVA, N.M. GORDENKO et al.; Ed. I.i. Eliseeva. - M.: Financie a štatistiky, 2001, s. 5..48.

Náhodná premenná sa nazýva hodnota, ktorá v dôsledku skúseností môže vopred prijať neznáme hodnoty.

Príklady zahŕňajú: straty a podkurzie vzduchu, stupeň absorpcie kyslíka, nepresnosť váženia zložiek zmesi, výkyvy v chemickom zložení surovín v dôsledku nedostatočného priemeru atď.

Vzťah, ktorý stanovuje vzťah medzi možnými hodnotami náhodnej premennej a zodpovedajúce pravdepodobnosti sa nazývajú distribučný zákon, ktorý je kvantitatívne vyjadrený v dvoch formách.

Obr. 5.1 Distribučná funkcia (A) a Distribučná hustota (B)

Pravdepodobnosť udalosti v závislosti od hodnoty sa nazýva náhodná funkcia premennej distribúcie:

. (5.1) Existuje nekriedkavá funkcia (Obr. 5.1, A). Jeho hodnoty pre limitné hodnoty argumentu sú: a.

Distribučná hustota

Častejšie používali inú formu distribúcia práva - hustota distribúcie náhodnej premennej, ktorá je odvodená distribučná funkcia:

. (5.2) Potom pravdepodobnosť nájdenia množstva v intervalizátore vyjadriť cez hustotu distribúcie:

. (5.3 ") Distribučná hustota je negatívna funkcia (obr. 21, b), plocha pod distribučnou krivkou sa rovná jednému:

. (5.4) Distribučná funkcia môže byť vyjadrená cez hustotu distribúcie:

. (5.5) Riešenie väčšiny praktických úloh distribučný zákon , t.j. úplná charakteristika náhodnej premennej je nepohodlná. Číslo často používajte číselné charakteristiky náhodnej premennej, ktorá určuje hlavné funkcie distribúcia práva . Najčastejšie z nich sú matematické očakávania a disperzia (alebo štandardná odchýlka).

Očakávaná hodnota

Matematické očakávania náhodnej premennej je definované nasledovne.

. (5.6) Kde

Matematické očakávania náhodnej premennej sa odhaduje podľa jeho priemernej aritmetiky, čo s nárastom počtu, experimentovania s matematickým očakávaním

. (5.7) Kde - pozorované hodnoty náhodnej premennej.

Je dôležité si uvedomiť, že ak sa hodnota neustále mení v čase (teplota oblúka, steny, chemické zloženie Výrobky spaľovania), je potrebné užívať hodnotu hodnoty hodnoty oddelenej takýmito intervalmi, aby sa mohli považovať za nezávislé experimenty. Takmer to prichádza na účtovnú zotrvačnosť na príslušných kanáloch. Metódy hodnotenia zotrvačnosti objektov budú diskutované nižšie.

Disperzia a odchýlka RMS

Disperzia určuje rozptyl náhodnej premennej v blízkosti matematických očakávaní

. (5.8) Vyhodnotenie disperzie sa uskutočňuje vzorcom

. (5.9) RMS odchýlku podľa vzorca

Korelačný koeficient

Korelačný koeficient charakterizuje stupeň lineárnej komunikácie medzi hodnotou, t.j. tu sa už zaoberá systémom náhodných premenných. Posúdenie sa vykonáva vzorcom

. (5.10)

Určenie chýb a intervalov spoľahlivosti pre náhodné premenné

Aby bolo možné zvážiť výzvy náhodných množstiev s určitou spoľahlivosťou, je potrebné vypočítať chyby alebo intervaly spoľahlivosti pre každého z nich, ktoré závisia od stupňa rozptylu, počtu experimentov a danej pravdepodobnosti dôvery. Chyba matematického očakávania je približne stanovená vzorcom

. (5.11) Kde - kritérium študenta; Vybrané podľa tabuliek v závislosti od špecifikovanej pravdepodobnosti dôvery počtu experimentov (napríklad reklamy,).

Touto cestou, skutočná hodnota Matematické očakávania s pravdepodobnosťou je v intervale spoľahlivosti

. (5.12) S danou presnosťou výpočtu spoľahlivosti sa tieto rovnaké vzorce môžu použiť na výpočet potrebného počtu nezávislých experimentov.

Podobne chybové hodnoty a

. (5.13) Predpokladá sa, že lineárna závislosť interktukuje existuje, ak

. alebo

. (5.14) Napríklad, že prehreba medzi hodnotou pod štúdiou sa skutočne uskutočňuje, ak

. (5.15) Inak existencia závislosti medzi hodnotami OMNOYE.

Náhodná hodnota

Definícia koncepcie náhodnej premennej

Forma komunikácie medzi náhodnými hodnotami je určená regresnou čiarou, ktorá ukazuje, ako sa hodnota zmení v priemere

so zmenou hodnoty, ktorá je charakterizovaná podmienenými matematickými očakávaniami, vypočítané hodnotou, ktorú hodnota dostane určitú hodnotu. Regresia krivky je teda závislosť podmienených matematických očakávaní zo známej hodnoty

. (5.16) Kde - parametre Rovnice (koeficienty).

Zmeny sú náhodne ocenené variabilitou stochasticky pridruženej non-náhodnej veľkosti, ako aj iných faktorov ovplyvňujúcich, ale nezávislých. Proces stanovenia regresnej rovnice je konzistentný z dvoch najdôležitejších krokov: výber typu rovnice, t.j. Nastavenie funkcie a výpočet parametrov regresnej rovnice.

Výber formulára regresnej rovnice

Tento typ vzhľadu je vybraný na základe funkcií náhodného rozptylu systému. Jedným z možných prístupov je experimentálny výber regresnej rovnice podľa typu získanej korelačnej oblasti medzi cieleným bromom štruktúr rovníc a hodnotením každého z nich, napríklad podľa kritéria primeranosti. V prípade, keď existuje určitá a priori (núdzové) informácie o zariadení, využívanie teoretických myšlienok o procesoch a typoch vzťahov na tento účel medzi študovanými parametrami je efektívnejšie. Tento prístup je obzvlášť dôležitý, keď je potrebný kvantitatívny opis a stanovenie kauzálnych vzťahov.

Napríklad, len s niektorými nápadmi o teórii procesov oceľového teórie, môže byť v rukáve o príčinných vzťahoch pre závislosť zmenšujúcej sa rýchlosti od spotreby kyslíka do kúpeľa meniča alebo desarming trosky z jeho bázy a oxidácie. Ale na základe reprezentácií o hyperbolickej povahe závislosti od obsahu kyslíka v kovu z obsahu uhlíka, môžete vopred predpokladať lineárna rovnica Závislosti rýchlosti rýchlosti z intenzity čistenia v obsahu s nízkym uhlím (menej ako 0,2%) budú nedostatočné, a preto sa vyhýbajú niekoľkým štádiám experimentálny Výber typu rovnice.

Po výbere typu regresnej rovnice sa vypočíta svojimi parametrami (koeficienty), ktoré sa najčastejšie používajú najmenšia metóda štvorcová ktoré budú diskutované nižšie.

Po stanovení rovnice teoretickej línie regresie je potrebné poskytnúť kvantitatívne hodnotenie tónu vzťahu medzi dvoma pozorovacími riadkami. Regresné čiary vykonávané na obr. 4.1, B, B, to isté, na obr. 4.1, bity sú výrazne bližšie (bližšie) sú umiestnené na regresnú čiaru ako na obr. 4.1, c.

Pri korelačnej analýze sa predpokladá, že faktory a odpovede sú náhodné a dodržiavajú normálne distribučné právo.

Tón komunikácie medzi náhodnými hodnotami je charakterizovaný korelačným pomerom P x. Zastavme viac fyzický zmysel Tento ukazovateľ. Aby sme to urobili, zavádzame nové koncepty.

Zvyšková disperzia 5 ^ OST charakterizuje rozptyl experimentálne

pozorované body vzhľadom na regresnú čiaru a je indikátorom predikčnej chyby parametra v regresnej rovnici (Obr. 4.6):



s2 \u003d F.{2 - 12}

a otázka dôvery v korelačný koeficient sa zníži na intervaly spoľahlivosti pre náhodné premenné W, ktoré sú určené štandardnými tabuľkami alebo vzorcami.

V niektoré prípady Systémová analýza musí byť riešená o vzťahoch viacerých (viac ako 2) náhodných premenných alebo otázku viacnásobná korelácia.

Byť X., Y. a Z. - náhodné premenné, pričom pozorovania, na ktorých sme nainštalovali svoj priemer M x., M y.,Mz. a odchýlky RMS S X., S y, s z.

Potom môžete nájsť spárovaný Koreiálne koeficienty R xy., R xz, r yzpodľa vyššie uvedeného vzorca. Ale to zjavne nestačí - koniec koncov, jednoducho sme zabudli na prítomnosť tretej náhodnej odrody na každom z troch etáp! Preto v prípadoch viacerých korelačných analýz je niekedy potrebné hľadať tak ďaleko. súkromné Korelačné koeficienty - Napríklad hodnotenie Z. na spojenie medzi X. a Y. sa vykonáva s použitím koeficientu

R xy.z \u003d {2 - 13}

A nakoniec môžete položiť otázku - aké je spojenie medzi týmto sv. A súborom druhých? Odpoveď na tieto otázky dávajú koeficienty násobný korelácia R x.yz, r y.zx, r z.xyy, Vzorce na výpočet, ktorého sú postavené podľa rovnakých zásad - účtovanie spojenia jedného z množstiev so všetkými ostatnými v agregácii.

Obtiažnosť výpočtov všetkých popísaných korelačných väzieb nemôže zaplatiť osobitnú pozornosť - programy pre ich výpočet sú pomerne jednoduché a sú k dispozícii v hotovej forme v mnohých PPP moderných počítačov.

Stačí pochopiť hlavnú vec - ak s formálnym opisom prvku komplexného systému, kombinácia takých prvkov vo forme subsystému, alebo konečne, systém ako celku, považujeme komunikácia Medzi jeho jednotlivými časťami, potom sa stupeň brúsenia tohto spojenia vo forme vplyvu jedného sv. Iných a mala byť hodnotená na úrovni korelácie.

Na záver sme si všimli ďalšiu - vo všetkých prípadoch systémovej analýzy na úrovni korelácie, obe náhodné premenné počas párovej korelácie alebo všetky viacnásobné sú považované za "rovnaké" - to znamená, že hovoríme o vzájomnom vplyve.

To sa deje nie vždy - veľmi často otázka odkazov Y. a X. Je umiestnený v inej rovine - jedna z hodnôt je závislá (funkcia) z iného (argumentu).