Flexibilný algoritmus riešenia najmenších štvorcov. Aproximácia experimentálnych údajov. Metóda najmenšieho štvorca. Lineárna aproximácia počiatočných údajov

Ktorý nachádza najširšie uplatnenie v rôznych oblastiach vedy a praktické činnosti... Môže to byť fyzika, chémia, biológia, ekonómia, sociológia, psychológia a tak ďalej a tak ďalej. Podľa vôle osudu sa často musím vysporiadať s hospodárstvom, a preto vám dnes vydám lístok do úžasnej krajiny s názvom Ekonometria=) ... Ako to nechcete?! Je tam veľmi dobre - stačí sa len rozhodnúť! ... Čo však určite chcete, je naučiť sa riešiť problémy metóda najmenšie štvorce ... A hlavne usilovní čitatelia sa naučia, ako ich riešiť nielen bezchybne, ale aj VEĽMI RÝCHLO ;-) Ale najskôr všeobecné nastavenieúlohy+ príbuzný príklad:

Nech sa v určitej oblasti skúmajú ukazovatele, ktoré majú kvantitatívne vyjadrenie. Zároveň existuje každý dôvod domnievať sa, že indikátor závisí od indikátora. Tento predpoklad môže byť vedeckou hypotézou a môže byť založený na elementárnom zdravom rozume. Ponecháme však vedu bokom a preskúmame ďalšie oblasti, ktoré zaliajú vodu - konkrétne obchody s potravinami. Označme:

- nákupná zóna obchodu s potravinami, m2,
- ročný obrat v obchode s potravinami, milióny rubľov.

Je úplne jasné, že čo väčšia plocha obchode, tým viac bude jeho obrat vo väčšine prípadov.

Predpokladajme, že po pozorovaní / experimentovaní / výpočte / tanci s tamburínou budeme mať k dispozícii číselné údaje:

Pri obchodoch s potravinami je myslím všetko jasné: - toto je oblasť 1. obchodu, - jeho ročný obrat, - plocha 2. obchodu, - jeho ročný obrat atď. Mimochodom, nie je vôbec potrebné mať prístup k utajovaným materiálom - pomerne presný odhad obratu je možné získať pomocou matematická štatistika... Nenechajme sa však rušiť, priebeh komerčnej špionáže - tá je už zaplatená =)

Tabuľkové údaje môžu byť tiež zapísané vo forme bodov a znázornené obvyklým spôsobom Karteziánsky systém .

Odpovieme na dôležitá otázka: koľko bodov potrebujete na kvalitatívnu štúdiu?

Čím väčšie, tým lepšie. Minimálna povolená sada pozostáva z 5-6 bodov. Okrem toho, s malým množstvom údajov, vzorka nemôže zahŕňať „anomálne“ výsledky. Napríklad malý elitný obchod môže pomáhať rádovo viac „svojim kolegom“, čím skresľuje všeobecný vzor, ktorý chcete nájsť!

Zjednodušene povedané - musíme zvoliť funkciu, harmonogram ktorý prechádza čo najbližšie k bodom ... Táto funkcia sa nazýva približujúce (aproximácia - aproximácia) alebo teoretická funkcia ... Spravidla sa tu okamžite objaví zjavný „kandidát“ - polynóm vysoký stupeň, ktorého graf prechádza VŠETKÝMI bodmi. Táto možnosť je však náročná a často iba nesprávna. (pretože graf sa bude neustále „krútiť“ a zle odrážať hlavný trend).

Hľadaná funkcia by teda mala byť dostatočne jednoduchá a zároveň adekvátne odrážať závislosť. Ako asi hádate, nazýva sa jedna z metód na nájdenie takýchto funkcií metóda najmenších štvorcov... Najprv sa pozrime na jeho podstatu vo všeobecných pojmoch. Nechajte niektoré funkcie aproximovať experimentálne údaje:


Ako vyhodnotiť presnosť tejto aproximácie? Vypočítajme rozdiely (odchýlky) medzi experimentálnymi a funkčnými hodnotami (štúdium kresby)... Prvá myšlienka, ktorá príde na myseľ, je odhadnúť, aký veľký je tento súčet, ale problém je v tom, že rozdiely môžu byť negatívne. (napríklad, ) a odchýlky v dôsledku takéhoto súčtu sa navzájom vyrušia. Preto ako odhad presnosti aproximácie vyžaduje prijatie súčtu moduly odchýlky:

alebo zrútené: (zrazu, kto nevie: - toto je ikona súčtu a - pomocná premenná - „počítadlo“, ktorá nadobúda hodnoty od 1 do).

Priblížením experimentálnych bodov s rôznymi funkciami získame rôzne významy, a je zrejmé, kde je tento súčet menší - táto funkcia je presnejšia.

Takáto metóda existuje a nazýva sa metóda s najmenším modulom... V praxi sa však stal oveľa rozšírenejším. metóda najmenších štvorcov v ktorom je to možné záporné hodnoty nie sú eliminované modulom, ale zarovnaním odchýlok:

Potom sa úsilie zameria na výber takej funkcie, aby bol súčet druhých mocnín odchýlok bol čo najmenší. V skutočnosti odtiaľ pochádza názov metódy.

A teraz sa vrátime k ďalšiemu dôležitému bodu: ako je uvedené vyššie, zvolená funkcia by mala byť celkom jednoduchá - ale existuje aj veľa takýchto funkcií: lineárne , hyperbolický, exponenciálne, logaritmický, kvadratický atď. A samozrejme, tu by som okamžite rád „znížil pole činnosti“. Akú triedu funkcií zvoliť pre výskum? Primitívny, ale účinný trik:

- Najľahší spôsob čerpania bodov na výkrese a analyzujte ich polohu. Ak majú tendenciu byť v priamke, mali by ste hľadať rovnica priamky s optimálnymi hodnotami a. Inými slovami, úlohou je nájsť TAKÉ koeficienty - aby bol súčet druhých mocnín odchýlok najmenší.

Ak sú body umiestnené napríklad pozdĺž hyperbola, potom je a priori jasné, že lineárna funkcia poskytne zlú aproximáciu. V tomto prípade hľadáme tie „najpriaznivejšie“ koeficienty pre rovnicu hyperboly - tí, ktorí dávajú minimálna čiastkaštvorce .

Teraz si všimnite, že v oboch prípadoch hovoríme o funkcie dvoch premenných ktorých argumenty sú parametre hľadaných závislostí:

A v podstate musíme vyriešiť štandardný problém - nájsť minimálna funkcia dvoch premenných.

Pripomeňme si náš príklad: Predpokladajme, že body „obchodu“ sú väčšinou umiestnené v priamke a existuje každý dôvod domnievať sa, že lineárny vzťah obrat z maloobchodných priestorov. Nájdeme TAKÉ koeficienty „a“ ​​a „bs“, aby súčet druhých mocnín odchýlok bol najmenší. Všetko je ako obvykle - prvé Parciálne deriváty 1. rádu... Podľa pravidlo linearity rozlíšiť môžete priamo pod ikonou sumy:

Ak chcete použiť táto informácia za esej alebo učebnicu - budem veľmi vďačný za odkaz v zozname zdrojov, také podrobné výpočty nájdete na niekoľkých miestach:

Zostavme štandardný systém:

Každú rovnicu zmenšíme o „dve“ a okrem toho „rozbijeme“ sumy:

Poznámka : Analyzujte sami, prečo je možné pre ikonu súčtu vybrať písmená „a“ a „bie“. Mimochodom, formálne sa to dá dosiahnuť sumou

Prepíšeme systém do „aplikovanej“ podoby:

potom sa začne kresliť algoritmus na riešenie nášho problému:

Poznáme súradnice bodov? Vieme. Čiastky môžeme nájsť? Ľahko. Skladanie najjednoduchších sústava dvoch lineárnych rovníc v dvoch neznámych(„A“ a „bh“). Systém riešime napr. Cramerova metóda, v dôsledku čoho získame stacionárny bod. Kontrolou dostatočná podmienka pre extrém, môžeme sa uistiť, že v tomto mieste funkcia dosahuje presne minimum... Overovanie je spojené s dodatočnými výpočtami a preto ho necháme v zákulisí. (v prípade potreby je možné zobraziť chýbajúci rámček)... Vyvodzujeme konečný záver:

Funkcia najlepšia cesta (prinajmenšom v porovnaní s akoukoľvek inou lineárnou funkciou) približuje experimentálne body ... Zhruba povedané, jeho graf sa k týmto bodom približuje čo najbližšie. V tradícii ekonometria nazýva sa aj výsledná aproximačná funkcia párová lineárna regresná rovnica .

Uvažovaný problém má veľký praktický význam... V situácii s naším príkladom rovnica umožňuje predpovedať, aký obrat ("Hra") bude v obchode s jednou alebo inou hodnotou maloobchodných priestorov (tá alebo ona hodnota „x“)... Áno, získaná predpoveď bude len predpoveďou, ale v mnohých prípadoch bude celkom presná.

Budem analyzovať iba jeden problém so „skutočnými“ číslami, pretože s ním nie sú žiadne ťažkosti - všetky výpočty sú na úrovni školské osnovy 7-8 ročníkov. V 95 percentách prípadov budete požiadaní o nájdenie iba lineárnej funkcie, ale na samom konci článku ukážem, že nájsť rovnice optimálnej hyperboly, exponentu a niektorých ďalších funkcií nie je vôbec ťažké.

V skutočnosti zostáva distribuovať sľúbené buchty - aby ste sa naučili, ako vyriešiť tieto príklady nielen presne, ale aj rýchlo. Starostlivo študujeme štandard:

Úloha

Výsledkom štúdia vzťahu medzi týmito dvoma ukazovateľmi boli tieto dvojice čísel:

Pomocou metódy najmenších štvorcov nájdite lineárnu funkciu, ktorá sa najlepšie približuje empirickému (skúsený)údaje. Vytvorte kresbu, na ktorú v karteziánskej obdĺžnikovej súradnicovej sústave nakreslite experimentálne body a graf aproximačnej funkcie. ... Nájdite súčet štvorcových odchýlok medzi empirickými a teoretickými hodnotami. Zistite, či by funkcia bola lepšia (z pohľadu metódy najmenších štvorcov) priblížte experimentálne body.

Všimnite si toho, že významy „x“ sú prirodzené a majú charakteristický významový význam, o ktorom budem hovoriť trochu neskôr; ale môžu byť, samozrejme, zlomkové. Navyše, v závislosti od obsahu konkrétneho problému, hodnoty „x“ aj „hra“ môžu byť úplne alebo čiastočne negatívne. Máme úlohu „bez tváre“ a začíname Riešenie:

Koeficienty optimálnej funkcie nachádzame ako riešenie systému:

V záujme kompaktnejšej notácie je možné premennú „počítadlo“ vynechať, pretože je už zrejmé, že súčet sa vykonáva od 1 do.

Je pohodlnejšie vypočítať požadované sumy v tabuľkovej forme:


Výpočty je možné vykonávať na mikrokalkulačke, ale je oveľa lepšie použiť Excel - rýchlejší a bez chýb; pozrite si krátke video:

Získame teda nasledujúce systém:

Tu môžete druhú rovnicu vynásobiť 3 a odpočítajte 2. od 1. rovnice termín po termíne... Ale toto je šťastie - v praxi systémy často nie sú darom a v takýchto prípadoch šetria Cramerova metóda:
, čo znamená, že systém má jedinečné riešenie.

Skontrolujme to. Chápem, že nechcem, ale prečo vynechávať chyby, kde sa im dá úplne vyhnúť? Nájdené riešenie nahradíme na ľavej strane každej rovnice systému:

Získajú sa pravé strany zodpovedajúcich rovníc, čo znamená, že systém je vyriešený správne.

Požadovaná aproximačná funkcia teda: - od zo všetkých lineárne funkcie je to ona, ktorá najlepšie približuje experimentálne údaje.

Na rozdiel od rovno závislosť obratu obchodu od jeho plochy, zistená závislosť je obrátiť (zásada „čím viac - tým menej“), a táto skutočnosť je okamžite odhalená negatívom svahu... Funkcia nám hovorí, že so zvýšením určitého indikátora o 1 jednotku hodnota závislého indikátora klesá priemer o 0,65 jednotky. Ako sa hovorí, čím vyššia je cena pohánky, tým menej sa predá.

Na vykreslenie grafu aproximačnej funkcie nájdeme jeho dve hodnoty:

a spustite kresbu:


Zostrojená čiara sa nazýva trendová čiara (konkrétne lineárna trendová čiara, t. j. vo všeobecnom prípade trend nie je nevyhnutne rovná čiara)... Každý pozná výraz „byť v trende“ a myslím si, že tento výraz nepotrebuje ďalšie komentáre.

Vypočítajme súčet druhých mocnín odchýlok medzi empirickými a teoretickými hodnotami. Geometricky je to súčet druhých mocnín dĺžok „karmínových“ segmentov (dva z nich sú také malé, že ich ani nemôžete vidieť).

Zhrňme výpočty v tabuľke:


Opäť sa dajú vykonať ručne, len ak uvediem príklad pre 1. bod:

ale je oveľa efektívnejšie už konať známym spôsobom:

Zopakujme si: aký je význam získaného výsledku? Od všetkých lineárnych funkcií funkciu indikátor je najmenší, to znamená, že v jeho rodine je to najlepšia aproximácia. A tu, mimochodom, to nie je náhodné posledná otázka problémy: čo keď navrhovaná exponenciálna funkcia bude lepšie aproximovať experimentálne body?

Nájdeme zodpovedajúci súčet druhých mocnín odchýlok - na rozlíšenie ich označím písmenom „epsilon“. Technika je úplne rovnaká:


A opäť, len pre každého hasiča, výpočty pre 1. bod:

V programe Excel používame štandardnú funkciu EXP (syntax nájdete v Pomocníkovi k Excelu).

Výkon:, čo znamená, že exponenciálna funkcia sa približuje k experimentálnym bodom horšie ako priamka .

Tu však treba poznamenať, že „horšie“ je ešte neznamená, čo je zle. Teraz som zostavil graf tejto exponenciálnej funkcie - a tiež sa blíži k bodom - natoľko, že bez analytického výskumu je ťažké povedať, ktorá funkcia je presnejšia.

Tým je riešenie hotové a vraciam sa k otázke prirodzených hodnôt argumentu. V rôznych štúdiách je spravidla ekonomický alebo sociologický prirodzený počet „x“ mesiacov, rokov alebo iných rovnakých časových intervalov. Zoberme si napríklad taký problém.

Úlohou je nájsť koeficienty lineárnej závislosti, pre ktoré funkciu dvoch premenných a a b berie najmenšia hodnota... Teda dané a a b súčet druhých mocnín odchýlok experimentálnych údajov od nájdenej priamky bude najmenší. Toto je celý bod metódy najmenších štvorcov.

Riešenie príkladu sa teda redukuje na nájdenie extrému funkcie dvoch premenných.

Odvodenie vzorcov na hľadanie koeficientov. Zostaví a vyrieši sa sústava dvoch rovníc s dvoma neznámymi. Nájdite parciálne deriváty funkcie podľa premenných a a b, tieto deriváty prirovnáme k nule.

Výsledný systém rovníc vyriešime ľubovoľnou metódou (napríklad substitučnou metódou alebo Cramerovou metódou) a získame vzorce na hľadanie koeficientov pomocou metódy najmenších štvorcov (OLS).

S údajmi a a b funkciu má najmenšiu hodnotu.

To je celá metóda najmenších štvorcov. Vzorec na nájdenie parametra a obsahuje súčty ,,, a parameter n- množstvo experimentálnych údajov. Odporúčame vypočítať hodnoty týchto súm oddelene. Koeficient b je po výpočte a.

Hlavnou oblasťou použitia takýchto polynómov je spracovanie experimentálnych údajov (konštrukcia empirických vzorcov). Ide o to, že interpolačný polynóm zostrojený z hodnôt funkcie získanej experimentom bude silne ovplyvnený „experimentálnym hlukom“; navyše počas interpolácie sa interpolačné uzly nemôžu opakovať; výsledky opakovaných experimentov nemožno použiť za rovnakých podmienok. Polynóm so stredným štvorcom vyhladzuje šum a umožňuje vám použiť výsledky viacerých experimentov.

Numerická integrácia a diferenciácia. Príklad.

Numerická integrácia- výpočet hodnoty určitého integrálu (spravidla približného). Numerická integrácia je chápaná ako súbor numerických metód na zisťovanie hodnoty určitého integrálu.

Numerická diferenciácia- súbor metód na výpočet hodnoty derivátu diskrétne danej funkcie.

Integrácia

Formulácia problému. Matematická formulácia problému: je potrebné nájsť hodnotu definitívny integrál

kde a, b sú konečné, f (x) je spojité na [a, b].

Pri riešení praktických problémov sa často stáva, že integrál je nepohodlný alebo nemožné ho analyzovať: nemusí byť vyjadrený v elementárne funkcie, integrand môže byť špecifikovaný vo forme tabuľky atď. V takýchto prípadoch sa používajú metódy numerickej integrácie. Numerické integračné metódy používajú nahradenie oblasti zakriveného lichobežníka konečným súčtom oblastí jednoduchších. geometrických tvarov to sa dá presne vypočítať. V tomto zmysle hovoria o použití kvadratúrnych vzorcov.

Väčšina metód používa reprezentáciu integrálu konečným súčtom (kvadratúrny vzorec):

Kvadratúrne vzorce sú založené na myšlienke nahradenia grafu integrandu na integračnom intervale funkciami jednoduchšej formy, ktoré je možné ľahko integrovať analyticky a je ich teda možné ľahko vypočítať. Najjednoduchšia úloha pri zostavovaní kvadratúrnych vzorcov je realizovaná pre polynómové matematické modely.

Rozlišujú sa tri skupiny metód:

1. Metóda s rozdelením segmentu integrácie na rovnaké intervaly. Rozdelenie na intervaly sa robí vopred, zvyčajne sa intervaly volia rovnaké (aby sa uľahčilo vypočítanie funkcie na koncoch intervalov). Vypočítajte plochy a spočítajte ich (obdĺžnik, lichobežník, Simpsonove metódy).

2. Metódy s rozdelením segmentu integrácie pomocou špeciálnych bodov (Gaussova metóda).

3. Výpočet integrálov pomocou náhodných čísel (metóda Monte Carlo).

Metóda obdĺžnikov. Nech je funkcia (obrázok) integrovaná numericky na segment. Rozdelte segment na N rovnakých intervalov. Plochu každého z N zakrivených lichobežníkov je možné nahradiť plochou obdĺžnika.

Šírka všetkých obdĺžnikov je rovnaká a rovná sa:

Ako výber výšky obdĺžnikov môžete vybrať hodnotu funkcie na ľavom okraji. V tomto prípade bude výška prvého obdĺžnika f (a), druhého-f (x 1), ..., N-f (N-1).

Ak vezmeme hodnotu funkcie na pravom okraji ako výber výšky obdĺžnika, potom v tomto prípade bude výška prvého obdĺžnika f (x 1), druhého - f (x 2), ... , N - f (x N).

Ako vidíte, v tomto prípade jeden zo vzorcov poskytuje aproximáciu integrálu s prebytkom a druhý s nedostatkom. Existuje ďalší spôsob - použiť na aproximáciu hodnotu funkcie v strede integračného intervalu:

Odhad absolútnej chyby metódy obdĺžnika (v strede)

Odhad absolútnej chyby metód ľavého a pravého obdĺžnika.

Príklad. Vypočítajte celý interval a rozdeľte ho na štyri časti

Riešenie. Analytický výpočet tohto integrálu dáva I = arstg (1) –agstg (0) = 0,7853981634. V našom prípade:

1) h = 1; xо = 0; x1 = 1;

2) h = 0,25 (1/4); x0 = 0; x1 = 0,25; x2 = 0,5; x3 = 0,75; x4 = 1;

Vypočítajme metódu ľavých obdĺžnikov:

Vypočítajme metódu pravých obdĺžnikov:

Vypočítajme metódu stredných obdĺžnikov:

Trapézová metóda. Použitie polynómu prvého stupňa na interpoláciu (rovná čiara vedená dvoma bodmi) má za následok lichobežníkový vzorec. Konce integračného segmentu sa berú ako interpolačné uzly. Zakrivený lichobežník je teda nahradený obyčajným lichobežníkom, ktorého plochu nájdeme ako súčin polovičného súčtu báz a výšky.

V prípade N integračných segmentov pre všetky uzly, s výnimkou extrémnych bodov segmentu, bude hodnota funkcie zahrnutá do celkového súčtu dvakrát (pretože susedné lichobežníky majú jednu spoločnú stránku)

Lichobežníkový vzorec je možné získať tak, že polovicu súčtu vzorcov obdĺžnika vezmeme pozdĺž pravého a ľavého okraja segmentu:

Kontrola stability roztoku. Spravidla platí, že čím kratšia je dĺžka každého intervalu, t.j. čím väčší je počet týchto intervalov, tým menší je rozdiel medzi približnými a presnými hodnotami integrálu. To platí pre väčšinu funkcií. V lichobežníkovej metóde je chyba pri výpočte integrálu approximately približne úmerná štvorcu integračného kroku (ϭ ~ h 2). Na výpočet integrálu niektorej funkcie v rozsahu a, b je teda potrebné rozdeľte segment na N 0 intervalov a nájdite súčet oblastí lichobežníka. Potom musíte zvýšiť počet intervalov N 1, znova vypočítať súčet lichobežníka a porovnať výslednú hodnotu s predchádzajúcim výsledkom. Toto by sa malo opakovať, kým (N i) nedosiahne špecifikovanú presnosť výsledku (kritérium konvergencie).

Pri metódach obdĺžnika a lichobežníka sa počet intervalov zvyčajne zdvojnásobí v každom kroku iterácie (N i +1 = 2N i).

Kritérium konvergencie:

Hlavnou výhodou pravidla lichobežníka je jeho jednoduchosť. Ak je však pri výpočte integrálu potrebná vysoká presnosť, táto metóda môže vyžadovať príliš veľa iterácií.

Absolútna chyba metódy lichobežníka hodnotené ako
.

Príklad. Vypočítajte približný integrál pomocou lichobežníkového vzorca.

a) Rozdelenie segmentu integrácie na 3 časti.
b) Rozdelenie segmentu integrácie na 5 častí.

Riešenie:
a) Podľa podmienky musí byť integračný segment rozdelený na 3 časti, tj.
Vypočítajme dĺžku každého segmentu oddielu: .

Preto všeobecný vzorec lichobežník je zmenšený na príjemnú veľkosť:

Nakoniec:

Pripomínam, že získaná hodnota je približnou hodnotou pre danú oblasť.

b) Rozdeľte segment integrácie na 5 rovnaké diely, to je. zvýšením počtu segmentov zvyšujeme presnosť výpočtov.

Ak, potom má lichobežníkový vzorec nasledujúcu formu:

Nájdite krok rozdelenia:
to znamená, že dĺžka každého medziľahlého úseku je 0,6.

Po dokončení úlohy sú všetky výpočty pohodlne vyhotovené pomocou výpočtovej tabuľky:

V prvom riadku napíšeme „počítadlo“

Ako výsledok:

No, skutočne existuje objasnenie a vážne!
Ak pre 3 segmenty oddielu, tak pre 5 segmentov. Ak vezmeme ešte viac so segmentom =>, bude to ešte presnejšie.

Simpsonov vzorec. Lichobežníkový vzorec dáva výsledok, ktorý silne závisí od veľkosti kroku h, ktorý ovplyvňuje presnosť výpočtu určitého integrálu, najmä v prípadoch, keď funkcia nie je monotónna. Je možné predpokladať zvýšenie presnosti výpočtov, ak namiesto úsečiek nahrádzajúcich krivočiare fragmenty grafu funkcie f (x) použijeme napríklad fragmenty paraboly zmenšené cez tri susediace body grafu. Táto geometrická interpretácia je jadrom Simpsonovej metódy na výpočet určitého integrálu. Celý interval integrácia a, b N segmentov je rozdelených, dĺžka segmentu bude tiež h = (b-a) / N.

Simpsonov vzorec je:

zvyšok

S nárastom dĺžky segmentov sa presnosť vzorca znižuje, preto sa na zvýšenie presnosti používa zložený Simpsonov vzorec. Celý integračný interval je rozdelený na párne číslo identické segmenty N, dĺžka segmentu sa bude rovnať aj h = (b-a) / N. Simpsonov zlúčený vzorec je:

Vo vzorci výrazy v zátvorkách predstavujú súčty hodnôt integrandu na koncoch nepárnych a párnych vnútorných segmentov.

Zostávajúca časť Simpsonovho vzorca je úmerná štvrtej mocnine kroku:

Príklad: Vypočítajte integrál pomocou Simpsonovho pravidla. (Presné riešenie je 0,2)

Gaussova metóda

Gaussov kvadratúrny vzorec... Základný princíp druhého druhu kvadratúrnych vzorcov je možné vidieť na obrázku 1.12: body je potrebné umiestniť týmto spôsobom NS 0 a NS 1 vo vnútri segmentu [ a;b] tak, aby sa celkové plochy „trojuholníkov“ rovnali ploche „segmentu“. Pri použití Gaussovho vzorca pôvodný segment [ a;b] sa zmenou premennej zníži na segment [-1; 1] NS na

0.5∙(ba)∙t+ 0.5∙(b + a).

Potom , kde .

Takáto výmena je možná, ak a a b sú konečné a funkcia f(X) je nepretržitý na [ a;b]. Gaussov vzorec pre n bodov x i, i=0,1,..,n-1 vo vnútri segmentu [ a;b]:

, (1.27)

kde t i a A i pre rôzne n sú uvedené v referenčných knihách. Napríklad pre n=2 A 0 =A 1 = 1; o n=3: t 0 = t 2 "0,775, t 1 =0, A 0 = A 2 "0,555, A 1 "0,889.

Gaussov kvadratúrny vzorec

získané s váhovou funkciou rovnou jednej p (x) = 1 a uzly x i ktoré sú koreňmi Legendrových polynómov

Kurzy A iľahko vypočítateľné podľa vzorcov

i=0,1,2,...n.

Hodnoty uzlov a koeficienty pre n = 2,3,4,5 sú uvedené v tabuľke

objednať Uzly Kurzy
n=2 x 1=0 x 0 =-x 2=0.7745966692 A 1=8/9 A 0 = A 2=5/9
n=3 x 2 =-x 1=0.3399810436 x 3 =-x 0=0.8611363116 A1 = A2=0.6521451549 A 0 = A 3=0.6521451549
n = 4 X 2 = 0 X 3 = -X 1 = 0.5384693101 X 4 =-X 0 =0.9061798459 A 0 =0.568888899 A 3 =A 1 =0.4786286705 A 0 =A 4 =0.2869268851
n=5 X 5 = -X 0 =0.9324695142 X 4 = -X 1 =0.6612093865 X 3 = -X 2 =0.2386191861 A 5 = A 0 =0.1713244924 A 4 = A 1 =0.3607615730 A 3 = A 2 =0.4679139346

Príklad. Vypočítajte hodnotu pomocou Gaussovho vzorca pre n=2:

Presná hodnota: .

Algoritmus na výpočet integrálu podľa Gaussovho vzorca nezabezpečuje zdvojnásobenie počtu mikrosekcií, ale zvýšenie počtu súradníc o 1 a porovnanie získaných hodnôt integrálu. Výhodou Gaussovho vzorca je vysoká presnosť s relatívne malým počtom súradníc. Nevýhody: nepohodlné pre manuálne výpočty; hodnoty je potrebné uchovávať v pamäti počítača t i, A i pre rôzne n.

Chyba Gaussovho kvadratúrneho vzorca na segmente bude v tomto prípade Pre zostávajúci vzorec bude navyše koeficient α N. s rastom rýchlo klesá N.... Tu

Gaussove vzorce poskytujú vysokú presnosť aj pri malom počte uzlov (od 4 do 10). V tomto prípade sa v praktických výpočtoch počet uzlov pohybuje od niekoľko stoviek do niekoľko tisíc. Váhy gaussovských kvadratúr sú vždy kladné, čo zaisťuje stabilitu algoritmu na výpočet súčtov

Metóda najmenších štvorcov (OLS) vám umožňuje odhadnúť rôzne veličiny pomocou výsledkov mnohých meraní, ktoré obsahujú náhodné chyby.

Charakteristika OLS

Hlavnou myšlienkou tejto metódy je, že súčet druhých mocnín chýb je považovaný za kritérium presnosti riešenia problému, ktoré sa snaží minimalizovať. Pri použití tejto metódy je možné použiť numerické aj analytické prístupy.

Najmä, ako numerická implementácia, metóda najmenších štvorcov znamená vykonať toľko meraní neznámeho náhodná premenná... Navyše, čím viac výpočtov, tým presnejšie bude riešenie. Na základe tejto sady výpočtov (počiatočné údaje) sa získa ďalší súbor navrhovaných riešení, z ktorého sa potom vyberie najlepšie. Ak je množina riešení parametrizovaná, metóda najmenších štvorcov sa zredukuje na nájdenie optimálnej hodnoty parametrov.

Ako analytický prístup k implementácii OLS na súbore počiatočných údajov (merania) a predpokladanom súbore riešení je určený určitý (funkčný), ktorý je možné vyjadriť vzorcom získaným ako nejaká hypotéza, ktorá vyžaduje potvrdenie. V tomto prípade sa metóda najmenších štvorcov redukuje na nájdenie minima tejto funkcie na množine druhých mocnín počiatočných chýb údajov.

Všimnite si, že nie samotné chyby, ale druhé mocniny chýb. Prečo? Faktom je, že odchýlky meraní od presnej hodnoty sú často pozitívne aj negatívne. Pri určovaní priemeru môže jednoduché sčítanie viesť k nesprávnemu záveru o kvalite odhadu, pretože vzájomné zrušenie kladných a záporných hodnôt zníži vzorkovaciu silu súboru dimenzií. A v dôsledku toho aj presnosť hodnotenia.

Aby sa tomu zabránilo, sú štvorce odchýlok zhrnuté. Ešte viac, aby sa zosúladil rozmer nameranej hodnoty a konečný odhad, extrahuje sa súčet druhých mocnín chýb

Niektoré aplikácie OLS

OLS je široko používaný v rôznych oblastiach. Napríklad v teórii pravdepodobnosti a matematickej štatistike sa metóda používa na určenie takej charakteristiky náhodnej premennej, ako je štandardná odchýlka, ktorá určuje šírku rozsahu hodnôt náhodnej premennej.

Príklad.

Experimentálne údaje o hodnotách premenných NS a o sú uvedené v tabuľke.

V dôsledku ich zarovnania funkcia

Použitím metóda najmenších štvorcov, aproximujte tieto údaje s lineárnou závislosťou y = os + b(nájsť parametre a a b). Zistite, ktorý z týchto dvoch riadkov je lepší (v zmysle metódy najmenších štvorcov) zarovnáva experimentálne údaje. Vytvorte kresbu.

Podstata metódy najmenších štvorcov (mns).

Úlohou je nájsť koeficienty lineárnej závislosti, pre ktoré funkciu dvoch premenných a a b má najmenšiu hodnotu. Teda dané a a b súčet druhých mocnín odchýlok experimentálnych údajov od nájdenej priamky bude najmenší. Toto je celý bod metódy najmenších štvorcov.

Riešenie príkladu sa teda redukuje na nájdenie extrému funkcie dvoch premenných.

Odvodenie vzorcov na hľadanie koeficientov.

Zostaví a vyrieši sa sústava dvoch rovníc s dvoma neznámymi. Nájdite parciálne deriváty funkcie podľa premenných a a b, tieto deriváty prirovnáme k nule.

Výsledný systém rovníc riešime ľubovoľnou metódou (napr substitučná metóda alebo Cramerova metóda) a pomocou metódy najmenších štvorcov (OLS) získajte vzorce na hľadanie koeficientov.

S údajmi a a b funkciu má najmenšiu hodnotu. Dôkaz o tejto skutočnosti je uvedený nižšie v texte na konci stránky.

To je celá metóda najmenších štvorcov. Vzorec na nájdenie parametra a obsahuje súčty ,,, a parameter n- množstvo experimentálnych údajov. Odporúčame vypočítať hodnoty týchto súm oddelene. Koeficient b je po výpočte a.

Je načase zapamätať si pôvodný príklad.

Riešenie.

V našom prípade n = 5... Tabuľku vyplňujeme pre pohodlie výpočtu súm, ktoré sú zahrnuté vo vzorcoch požadovaných koeficientov.

Hodnoty vo štvrtom riadku tabuľky sa získajú vynásobením hodnôt 2. riadka hodnotami 3. riadka pre každé číslo i.

Hodnoty v piatom riadku tabuľky sa získajú umocnením hodnôt 2. riadka pre každé číslo i.

Hodnoty v poslednom stĺpci tabuľky sú súčty hodnôt podľa riadkov.

Na nájdenie koeficientov používame vzorce metódy najmenších štvorcov a a b... Nahradíme v nich zodpovedajúce hodnoty z posledného stĺpca tabuľky:

Preto, y = 0,165x + 2,184 je požadovaná aproximačná priamka.

Zostáva zistiť, ktorý z riadkov y = 0,165x + 2,184 alebo lepšie aproximuje pôvodné údaje, to znamená, urobí odhad pomocou metódy najmenších štvorcov.

Odhad chyby metódy najmenších štvorcov.

Aby ste to urobili, musíte z týchto riadkov vypočítať súčet druhých mocnín odchýlok počiatočných údajov a , menšia hodnota zodpovedá riadku, ktorý lepšie aproximuje pôvodné údaje v zmysle metódy najmenších štvorcov.

Odvtedy rovno y = 0,165x + 2,184 lepšie približuje pôvodné údaje.

Grafické znázornenie metódy najmenších štvorcov (mns).

Na grafoch je všetko perfektne viditeľné. Červená čiara je nájdená rovná čiara y = 0,165x + 2,184, je modrá čiara , ružové bodky sú nespracované údaje.

V praxi sa pri modelovaní rôznych procesov - najmä ekonomických, fyzických, technických, sociálnych - jeden alebo druhý používa spôsob výpočtu približných hodnôt funkcií zo známych hodnôt v niektorých pevných bodoch.

Takéto problémy s aproximáciou funkcií často vznikajú:

    pri konštrukcii približných vzorcov na výpočet hodnôt charakteristických hodnôt študovaného procesu podľa tabuľkových údajov získaných ako výsledok experimentu;

    s numerickou integráciou, diferenciáciou, riešením diferenciálne rovnice atď.;

    keď je potrebné vypočítať hodnoty funkcií v medziľahlých bodoch uvažovaného intervalu;

    pri určovaní hodnôt charakteristických veličín procesu mimo uvažovaný interval, najmä pri predpovedaní.

Ak na modelovanie určitého procesu uvedeného v tabuľke zostrojíme funkciu, ktorá tento proces približne popisuje, na základe metódy najmenších štvorcov, bude sa to nazývať aproximačná funkcia (regresia) a problém konštrukcie samotnej aproximačnej funkcie je problém aproximácie .

Tento článok pojednáva o schopnostiach balíka MS Excel na riešenie takýchto problémov. Okrem toho sú uvedené metódy a techniky na vytváranie (vytváranie) regresií pre funkcie definované v tabuľke (ktoré sú základom regresnej analýzy).

Excel má dve možnosti vykresľovania regresií.

    Pridanie vybraných regresií (trendové čiary - trendové čiary) do diagramu, zostaveného na základe tabuľky údajov pre študovanú charakteristiku procesu (k dispozícii iba vtedy, ak existuje vytvorený diagram);

    Použitie vstavaných štatistických funkcií pracovného hárka programu Excel na získanie regresií (trendových čiar) priamo z tabuľky zdrojových údajov.

Pridanie trendových čiar do grafu

Pokiaľ ide o tabuľku údajov popisujúcich určitý proces a reprezentovanú diagramom, Excel má účinný nástroj regresnej analýzy, ktorý vám umožňuje:

    stavať na základe metódy najmenších štvorcov a pridať do diagramu päť typov regresií, ktoré modelujú študovaný proces s rôznym stupňom presnosti;

    pridajte do diagramu rovnicu zostrojenej regresie;

    určiť, do akej miery sa zvolená regresia zhoduje s údajmi zobrazenými v grafe.

Na základe údajov grafu programu Excel vám umožňuje získať lineárne, polynomické, logaritmické, výkonové a exponenciálne typy regresií, ktoré sú dané rovnicou:

y = y (x)

kde x je nezávislá premenná, ktorá často preberá hodnoty sekvencie prirodzených čísel (1; 2; 3; ...) a vytvára napríklad odpočítavanie doby trvania študovaného procesu ( charakteristiky).

1 ... Lineárna regresia je vhodná na modelovanie charakteristík, ktoré sa zvyšujú alebo znižujú konštantnou rýchlosťou. Toto je najjednoduchší model konštruovaného študovaného procesu. Je postavený podľa rovnice:

y = mx + b

kde m je dotyčnica sklonu lineárnej regresie k osi x; b - súradnica bodu priesečníku lineárnej regresie s osou osi.

2 ... Polynomická trendová čiara je užitočná na opis charakteristík, ktoré majú niekoľko odlišných extrémov (vysoké a nízke). Voľba stupňa polynómu je určená počtom extrémov študovanej charakteristiky. Polynom druhého stupňa teda môže dobre opísať proces, ktorý má iba jedno maximum alebo minimum; polynóm tretieho stupňa - nie viac ako dva extrémy; polynóm štvrtého stupňa - nie viac ako tri extrémy atď.

V tomto prípade je trendová čiara vykreslená podľa rovnice:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

kde koeficienty c0, c1, c2, ... c6 sú konštanty, ktorých hodnoty sú určené počas výstavby.

3 ... Logaritmická trendová čiara sa úspešne používa na simuláciu charakteristík, ktorých hodnoty sa najskôr rýchlo menia a potom sa postupne stabilizujú.

y = c ln (x) + b

4 ... Power-law trendová čiara poskytuje dobré výsledky, ak sú hodnoty študovanej závislosti charakterizované neustálou zmenou rýchlosti rastu. Príkladom takéhoto vzťahu je graf rovnomerne zrýchleného pohybu auta. Ak údaje obsahujú nulové alebo záporné hodnoty, nemôžete použiť trendovú čiaru.

Je postavený podľa rovnice:

y = c xb

kde koeficienty b, c sú konštanty.

5 ... Ak sa rýchlosť zmien údajov neustále zvyšuje, mala by sa použiť exponenciálna trendová čiara. Pre údaje obsahujúce nulové alebo záporné hodnoty tento druh aproximácie tiež neplatí.

Je postavený podľa rovnice:

y = c ebx

kde koeficienty b, c sú konštanty.

Pri výbere trendovej čiary Excel automaticky vypočíta hodnotu R2, ktorá charakterizuje presnosť aproximácie: čím bližšie je hodnota R2 k jednej, tým spoľahlivejšie sa trendová čiara približuje k skúmanému procesu. V prípade potreby je možné na grafe vždy zobraziť hodnotu R2.

Určené vzorcom:

Postup pridania trendovej čiary do série údajov:

    aktivujte graf na základe série údajov, to znamená kliknite v oblasti grafu. Položka Graf sa zobrazí v hlavnej ponuke;

    po kliknutí na túto položku sa na obrazovke zobrazí ponuka, v ktorej by ste mali vybrať príkaz Pridať trendovú čiaru.

Rovnaké akcie sa dajú ľahko vykonať umiestnením kurzora myši na graf zodpovedajúci jednému z radu údajov a kliknutím na pravé tlačidlo myši; v kontextovej ponuke, ktorá sa zobrazí, vyberte príkaz Pridať trendovú čiaru. Na obrazovke sa zobrazí dialógové okno Trendová čiara s rozbalenou kartou Typ (obr. 1).

Potom je potrebné:

Na karte Typ vyberte požadovaný typ trendovej čiary (v predvolenom nastavení je vybratý typ Lineárny). V prípade typu polynóm zadajte do poľa Stupeň stupeň vybratého polynómu.

1 ... Pole Plotted on Series zobrazuje všetky dátové rady príslušného grafu. Ak chcete do konkrétnej dátovej série pridať trendovú čiaru, vyberte jej názov v poli Plotted on Series.

Ak je to potrebné, na karte Parametre (obr. 2) môžete pre riadok trendu nastaviť nasledujúce parametre:

    zmeňte názov trendovej čiary v poli Názov aproximačnej (vyhladenej) krivky.

    v poli Prognóza nastavte počet období (dopredu alebo dozadu) pre predpoveď;

    v oblasti grafu zobrazte rovnicu trendovej čiary, pre ktorú by ste mali začiarknuť políčko Zobraziť rovnicu v grafe;

    v oblasti diagramu zobrazte hodnotu spoľahlivosti aproximácie R2, pre ktorú by ste mali zaškrtnutím políčka umiestniť hodnotu spoľahlivosti aproximácie do diagramu (R ^ 2);

    nastavte bod priesečníka trendovej čiary s osou Y, pre ktorý by ste mali začiarknuť políčko priesečníka krivky s osou Y;

    kliknutím na tlačidlo OK zatvoríte dialógové okno.

Ak chcete začať upravovať už vytvorenú trendovú čiaru, existujú tri spôsoby:

    použite príkaz Vybratá trendová čiara z ponuky Formát, pričom ste predtým vybrali trendovú čiaru;

    z kontextového menu zvoľte príkaz Formátovať trendovú čiaru, ktorý sa vyvolá pravým kliknutím na trendovú čiaru;

    dvojitým kliknutím na trendovú čiaru.

Na obrazovke sa zobrazí dialógové okno Formát trendu (obr. 3), ktoré obsahuje tri karty: Zobraziť, Typ, Parametre a obsah posledných dvoch sa úplne zhoduje s podobnými kartami v dialógovom okne Trendový riadok (obr. 1-2) . Na karte Zobraziť môžete nastaviť typ čiary, jej farbu a hrúbku.

Ak chcete odstrániť už vytvorenú trendovú čiaru, vyberte trendovú čiaru, ktorú chcete odstrániť, a stlačte kláves Delete.

Výhody uvažovaného nástroja pre regresnú analýzu sú:

    relatívna jednoduchosť vykresľovania trendovej čiary na grafoch bez toho, aby ste pre ňu vytvorili údajovú tabuľku;

    pomerne široký zoznam typov navrhovaných trendových línií a tento zoznam obsahuje najčastejšie používané typy regresie;

    schopnosť predvídať správanie študovaného procesu k ľubovoľnému (v rámci zdravý rozum) počet krokov vpred, ako aj späť;

    schopnosť získať rovnicu trendovej čiary v analytickej forme;

    v prípade potreby možnosť získať odhad spoľahlivosti vykonanej aproximácie.

Nevýhody zahŕňajú nasledujúce body:

    konštrukcia trendovej čiary sa vykonáva iba vtedy, ak existuje diagram postavený na množstve údajov;

    proces vytvárania dátových radov pre študovanú charakteristiku na základe pre ňu získaných rovníc trendových čiar je trochu preplnený: hľadané regresné rovnice sa aktualizujú pri každej zmene hodnôt pôvodného radu údajov, ale iba v oblasti diagramu, zatiaľ čo dátový rad vytvorený na základe trendu starých rovnicových rovníc zostáva nezmenený;

    Keď v prehľadoch kontingenčného grafu zmeníte zobrazenie grafu alebo prepojeného prehľadu kontingenčnej tabuľky, existujúce trendové čiary sa nezachovajú, to znamená, že pred nakreslením trendových čiar alebo iným formátovaním zostavy kontingenčného grafu musíte zaistiť, aby rozloženie zostavy zodpovedalo vašim požiadavkám.

Trendové čiary je možné použiť na doplnenie sérií údajov uvedených na grafoch, ako sú grafy, stĺpce, ploché nenormalizované plošné grafy, stĺpcové, bodové, bublinové a akciové grafy.

Trendové čiary nemôžete pridávať do radov údajov v trojrozmerných, normalizovaných, radarových, koláčových a prstencových grafoch.

Použitie vstavaných funkcií programu Excel

Excel tiež poskytuje nástroj na regresnú analýzu na vykreslenie trendových čiar mimo oblasť grafu. Na tento účel je možné použiť množstvo štatistických funkcií pracovného hárka, ale všetky umožňujú vytvárať iba lineárne alebo exponenciálne regresie.

Excel poskytuje niekoľko funkcií na konštrukciu lineárnej regresie, najmä:

    TREND;

  • INCLINE a INTERCEPT.

A tiež niekoľko funkcií na vytváranie exponenciálnej trendovej čiary, najmä:

    LGRFPRIBL.

Je potrebné poznamenať, že metódy konštrukcie regresií pomocou funkcií TREND a RAST sa prakticky zhodujú. To isté platí pre dvojicu funkcií LINEST a LGRFPRIBL. Pre tieto štyri funkcie sa funkcie programu Excel, ako sú vzorce matice, používajú na vytvorenie tabuľky hodnôt, vďaka čomu je regresný proces trochu preplnený. Všimnite si tiež, že stavbu lineárnej regresie je podľa nášho názoru najľahšie vykonať pomocou funkcií SLOPE a INTERCEPT, kde prvá z nich určuje sklon lineárnej regresie a druhá je segment prerušená regresiou na os osi.

Výhody integrovaného regresného analytického nástroja zahŕňajú:

    pomerne jednoduchý proces rovnakého typu tvorby dátových radov študovanej charakteristiky pre všetky vstavané štatistické funkcie, ktoré určujú trendové čiary;

    štandardná technika na vytváranie trendových línií na základe generovaných radov údajov;

    schopnosť predpovedať správanie študovaného procesu pre požadovaný počet krokov dopredu alebo dozadu.

Nevýhodou je, že Excel nemá vstavané funkcie na vytváranie ďalších (okrem lineárnych a exponenciálnych) typov trendových čiar. Táto okolnosť často neumožňuje vybrať dostatočne presný model skúmaného procesu, ako ani získať prognózy, ktoré sú blízke realite. Tiež pri použití funkcií TREND a RAST nie sú rovnice trendovej čiary známe.

Je potrebné poznamenať, že autori si nestanovili za cieľ článku predstaviť priebeh regresnej analýzy s rôznym stupňom úplnosti. Jeho hlavnou úlohou je pomocou konkrétnych príkladov ukázať schopnosti balíka Excel pri riešení aproximačných problémov; ukážte, aké účinné nástroje má Excel na vytváranie regresií a prognóz; ilustrujte, ako relatívne ľahko môžu byť tieto problémy vyriešené aj používateľom, ktorý nemá hlboké znalosti o regresnej analýze.

Príklady riešenia konkrétnych problémov

Uvažujme riešenie konkrétnych úloh pomocou uvedených nástrojov balíka Excel.

Problém 1

S tabuľkou údajov o zisku prepravnej spoločnosti za roky 1995-2002. musíte urobiť nasledujúce.

    Zostavte diagram.

    Pridajte do grafu lineárne a polynomické (kvadratické a kubické) trendové čiary.

    Pomocou rovníc trendovej čiary získajte tabuľkové údaje o ziskoch podnikov pre každú trendovú čiaru za roky 1995-2004.

    Vytvorte predpoveď zisku podniku na roky 2003 a 2004.

Riešenie problému

    Do rozsahu buniek A4: C11 pracovného hárka programu Excel zadajte pracovný hárok zobrazený na obr. 4.

    Po výbere rozsahu buniek B4: C11 zostavíme diagram.

    Aktivujeme zostrojený graf a podľa vyššie popísanej metódy po zvolení typu trendovej čiary v dialógovom okne Trendová čiara (pozri obr. 1) do grafu postupne pridáme lineárne, kvadratické a kubické trendové čiary. V tom istom dialógovom okne otvorte kartu Parametre (pozri obr. 2), do poľa Názov aproximačnej (vyhladenej) krivky zadajte názov pridaného trendu a v poli Predpoveď pre: obdobia nastavte hodnotu 2 plánuje sa prognóza zisku na dva roky dopredu. Ak chcete v oblasti diagramu zobraziť regresnú rovnicu a hodnotu spoľahlivosti aproximácie R2, začiarknutím políčok zobrazíte rovnicu na obrazovke a na diagram umiestnite hodnotu spoľahlivosti aproximácie (R ^ 2). Pre lepšie vizuálne vnímanie meníme typ, farbu a hrúbku skonštruovaných trendových čiar, na čo používame záložku Zobraziť v dialógovom okne Formát trendovej čiary (pozri obr. 3). Výsledný diagram s pridanými trendovými čiarami je znázornený na obr. 5.

    Získať tabuľkové údaje o zisku podniku pre každú trendovú čiaru za roky 1995-2004. Použime rovnice trendovej čiary znázornené na obr. 5. Za týmto účelom zadajte do buniek v rozsahu D3: F3 textové informácie o type vybranej trendovej čiary: Lineárny trend, Kvadratický trend, Kubický trend. Ďalej zadajte vzorec lineárnej regresie do bunky D4 a pomocou značky výplne skopírujte tento vzorec s relatívnymi odkazmi na rozsah buniek D5: D13. Je potrebné poznamenať, že každá bunka s lineárnym regresným vzorcom z rozsahu buniek D4: D13 berie ako argument zodpovedajúcu bunku z rozsahu A4: A13. Podobne pre kvadratickú regresiu je rozsah buniek E4: E13 vyplnený a pre kubickú regresiu je rozsah buniek F4: F13. Bola teda vypracovaná prognóza zisku podniku na roky 2003 a 2004. pomocou troch trendov. Výsledná tabuľka hodnôt je znázornená na obr. 6.

Úloha 2

    Zostavte diagram.

    Do grafu pridajte logaritmické, exponenciálne a exponenciálne trendové čiary.

    Odvodte rovnice získaných trendových čiar, ako aj hodnoty spoľahlivosti aproximácie R2 pre každú z nich.

    Pomocou rovníc trendovej čiary získajte tabuľkové údaje o ziskoch podnikov pre každú trendovú čiaru za roky 1995-2002.

    Pomocou týchto trendových línií predpovedajte zisk spoločnosti na roky 2003 a 2004.

Riešenie problému

Podľa metodiky uvedenej pri riešení úlohy 1 získame diagram s pridanými logaritmickými, silovými a exponenciálnymi trendovými čiarami (obr. 7). Ďalej pomocou získaných rovníc trendových čiar vyplníme tabuľku hodnôt zisku podniku vrátane predpokladaných hodnôt na roky 2003 a 2004. (obr. 8).

Na obr. 5 a obr. je vidieť, že model s logaritmickým trendom zodpovedá najmenšej hodnote presnosti aproximácie

R2 = 0,8659

Najväčšie hodnoty R2 zodpovedajú modelom s polynómovým trendom: kvadratické (R2 = 0,9263) a kubické (R2 = 0,933).

Problém 3

S tabuľkou údajov o zisku nákladnej prepravnej spoločnosti za roky 1995-2002 uvedenou v úlohe 1 musíte vykonať nasledujúce akcie.

    Získajte rad údajov pre lineárne a exponenciálne trendové čiary pomocou funkcií TREND a RAST.

    Pomocou funkcií TREND a RAST urobte prognózu zisku spoločnosti na roky 2003 a 2004.

    Zostavte diagram pre počiatočné údaje a výsledný rad údajov.

Riešenie problému

Použime pracovný list úlohy 1 (pozri obr. 4). Začnime s funkciou TREND:

    vyberte rozsah buniek D4: D11, ktoré by mali byť vyplnené hodnotami funkcie TREND, zodpovedajúcimi známym údajom o zisku podniku;

    zavolajte príkaz Funkcia z ponuky Vložiť. V zobrazenom dialógovom okne Sprievodca funkciami vyberte funkciu TREND z kategórie Štatistiky a potom kliknite na tlačidlo OK. Rovnakú operáciu je možné vykonať stlačením tlačidla (Vložiť funkciu) na štandardnom paneli s nástrojmi.

    V zobrazenom dialógovom okne Funkčné argumenty zadajte rozsah buniek C4: C11 do poľa Known_values_y; v poli Known_x - rozsah buniek B4: B11;

    aby sa zo zadaného vzorca stal vzorec poľa, použite kombináciu klávesov + +.

Vzorec, ktorý sme zadali do riadka vzorcov, bude vyzerať takto: = (TREND (C4: C11; B4: B11)).

Výsledkom je, že rozsah buniek D4: D11 je naplnený zodpovedajúcimi hodnotami funkcie TREND (obr. 9).

Predpovedať zisk spoločnosti za roky 2003 a 2004. nevyhnutné:

    vyberte rozsah buniek D12: D13, kde budú zadané hodnoty predpovedané funkciou TREND.

    zavolajte funkciu TREND a do zobrazeného dialógového okna Funkčné argumenty zadajte do poľa Known_values_y - rozsah buniek C4: C11; v poli Known_x - rozsah buniek B4: B11; a pole New_x_values ​​obsahuje rozsah buniek B12: B13.

    zmeňte tento vzorec na vzorec poľa pomocou klávesovej skratky Ctrl + Shift + Enter.

    Zadaný vzorec bude vyzerať takto: = (TREND (C4: C11; B4: B11; B12: B13)) a rozsah buniek D12: D13 bude vyplnený predpovedanými hodnotami funkcie TREND (pozri obr. 9).

Podobne je pomocou funkcie GROWTH vyplnená séria údajov, ktorá sa používa na analýzu nelineárnych závislostí a funguje úplne rovnako ako jeho lineárny analóg TREND.

Obrázok 10 zobrazuje tabuľku v režime zobrazenia vzorcov.

Pre počiatočné údaje a získané série údajov je diagram zobrazený na obr. jedenásť.

Problém 4

S tabuľkou údajov o prijímaní žiadostí o služby dispečerskou službou motorovej dopravnej spoločnosti za obdobie od 1. do 11. dňa aktuálneho mesiaca musíte vykonať nasledujúce akcie.

    Získajte rad údajov pre lineárnu regresiu: pomocou funkcií SLOPE a INTERCEPT; pomocou funkcie LINEST.

    Získajte rad údajov pre exponenciálnu regresiu pomocou funkcie LGRFPRIBL.

    Pomocou vyššie uvedených funkcií vytvorte prognózu príjmu aplikácií do dispečerskej služby na obdobie od 12. do 14. dňa aktuálneho mesiaca.

    Zostavte diagram pre pôvodný a prijatý rad údajov.

Riešenie problému

Všimnite si toho, že na rozdiel od funkcií TREND a RAST, žiadna z vyššie uvedených funkcií (SLOPE, INTERCEPT, LINEST, LGRFPRIB) nie je regresiou. Tieto funkcie zohrávajú iba pomocnú úlohu definujúcu potrebné parametre regresie.

Pri lineárnych a exponenciálnych regresiách vytvorených pomocou funkcií SLOPE, INTERCEPT, LINEST, LGRFPRIB je vzhľad ich rovníc vždy známy, na rozdiel od lineárnych a exponenciálnych regresií zodpovedajúcich funkciám TREND a GROWTH.

1 ... Vytvorme lineárnu regresiu pomocou rovnice:

y = mx + b

s funkciami SLOPE a INTERCEPT, kde sklon m je určený funkciou SLOPE a zachytenie b funkciou INTERCEPT.

Aby sme to urobili, vykonávame nasledujúce akcie:

    zadáme pôvodnú tabuľku do rozsahu buniek A4: B14;

    hodnota parametra m sa určí v bunke C19. Vyberte zo štatistickej kategórie Sklon; zadajte rozsah buniek B4: B14 do poľa known_y a rozsah buniek A4: A14 do poľa known_x. Vzorec sa zadá do bunky C19: = SLOPE (B4: B14; A4: A14);

    hodnota parametra b v bunke D19 sa stanoví podobným spôsobom. A jeho obsah bude vyzerať takto: = INTERCEPT (B4: B14; A4: A14). Hodnoty parametrov m a b nevyhnutné na konštrukciu lineárnej regresie budú teda uložené v bunkách C19, respektíve D19;

    potom do bunky C4 zadáme lineárny regresný vzorec v tvare: = $ C * A4 + $ D. V tomto vzorci sú bunky C19 a D19 zapísané s absolútnymi odkazmi (adresa bunky by sa nemala meniť, ak je možné kopírovanie). Znak absolútnej referencie $ je možné napísať buď z klávesnice, alebo pomocou klávesu F4, po umiestnení kurzora na adresu bunky. Pomocou rukoväte výplne skopírujte tento vzorec do rozsahu buniek C4: C17. Získame požadovaný rad údajov (obr. 12). Vzhľadom na to, že počet objednávok je celé číslo, mali by ste na karte Číslo v okne Formát buniek nastaviť formát čísla s 0 desatinnými miestami.

2 ... Teraz zostavme lineárnu regresiu danú rovnicou:

y = mx + b

pomocou funkcie LINEST.

Pre to:

    zadajte funkciu LINEST do rozsahu buniek C20: D20 ako vzorec poľa: = (LINEST (B4: B14; A4: A14)). Výsledkom je, že v bunke C20 dostaneme hodnotu parametra m a v bunke D20 - hodnotu parametra b;

    zadajte vzorec do bunky D4: = $ C * A4 + $ D;

    skopírujte tento vzorec pomocou popisovača plnenia do rozsahu buniek D4: D17 a získajte požadovaný rad údajov.

3 ... Vytvoríme exponenciálnu regresiu, ktorá má rovnicu:

pomocou funkcie LGRFPRIBL sa vykonáva rovnakým spôsobom:

    do rozsahu buniek C21: D21 zadáme funkciu LGRFPRIBL ako maticový vzorec: = (LGRFPRIBL (B4: B14; A4: A14)). V tomto prípade v bunke C21 bude určená hodnota parametra m a v bunke D21 - hodnota parametra b;

    vzorec sa zadá do bunky E4: = $ D * $ C ^ A4;

    pomocou značky výplne sa tento vzorec skopíruje do rozsahu buniek E4: E17, kde sa bude nachádzať rad údajov pre exponenciálnu regresiu (pozri obr. 12).

Na obr. 13 je tabuľka, kde môžete vidieť funkcie, ktoré používame s požadovanými rozsahmi buniek, ako aj vzorcami.

Množstvo R. 2 zavolal koeficient determinácie.

Úlohou zostrojenia regresnej závislosti je nájsť vektor koeficientov m modelu (1), v ktorom koeficient R nadobúda svoju maximálnu hodnotu.

Na posúdenie významnosti R sa používa Fisherov F-test vypočítaný podľa vzorca

kde n- veľkosť vzorky (počet experimentov);

k je počet koeficientov modelu.

Ak F prekročí kritickú hodnotu pre údaje n a k a akceptovanú úroveň spoľahlivosti, potom sa hodnota R považuje za významnú. Tabuľky kritických hodnôt F sú uvedené v príručkách k matematickej štatistike.

Význam R je teda určený nielen jeho hodnotou, ale aj pomerom medzi počtom experimentov a počtom koeficientov (parametrov) modelu. Korelačný pomer pre n = 2 pre jednoduchý lineárny model je skutočne 1 (cez 2 body v rovine môžete vždy nakresliť jednu priamku). Ak sú však experimentálne údaje náhodnými hodnotami, takej hodnote R by sa malo dôverovať veľmi opatrne. Na získanie významnej R a spoľahlivej regresie sa obvykle snaží zaistiť, aby počet experimentov výrazne prevyšoval počet modelových koeficientov (n> k).

Ak chcete vytvoriť lineárny regresný model, musíte:

1) pripravte zoznam n riadkov a m stĺpcov obsahujúcich experimentálne údaje (stĺpec obsahujúci výstupnú hodnotu Y musí byť buď prvý alebo posledný v zozname); napríklad vezmeme údaje z predchádzajúcej úlohy a pridáme stĺpček s názvom „Č. obdobia“, očíslujeme čísla období od 1 do 12. (to budú hodnoty NS)

2) prejdite do ponuky Údaje / Analýza údajov / Regresia

Ak položka „Analýza údajov“ v ponuke „Nástroje“ chýba, mali by ste prejsť na položku „Doplnky“ v tej istej ponuke a začiarknuť políčko „Balíček analýzy“.

3) v dialógovom okne „Regresia“ nastavte:

· Vstupný interval Y;

· Vstupný interval X;

· Interval výstupu - ľavá horná bunka intervalu, v ktorom budú umiestnené výsledky výpočtov (odporúča sa umiestniť ho na nový pracovný list);

4) kliknite na „Ok“ a analyzujte výsledky.

Ak nejaké fyzické množstvo závisí od inej veličiny, potom je možné túto závislosť skúmať meraním y pri rôznych hodnotách x. V dôsledku meraní sa získa niekoľko hodnôt:

x 1, x 2, ..., x i, ..., x n;

y 1, y 2, ..., y i, ..., y n.

Na základe údajov takéhoto experimentu je možné zostrojiť graf závislosti y = ƒ (x). Výsledná krivka umožňuje posúdiť formu funkcie ƒ (x). Konštantné koeficienty, ktoré sú súčasťou tejto funkcie, však zostávajú neznáme. Metóda najmenších štvorcov vám ich umožňuje určiť. Experimentálne body spravidla nezapadajú presne na krivku. Metóda najmenších štvorcov vyžaduje, aby súčet druhých mocnín odchýlok experimentálnych bodov od krivky, t.j. 2 bol najmenší.

V praxi sa táto metóda najčastejšie (a najjednoduchšie) používa v prípade lineárneho vzťahu, t.j. kedy

y = kx alebo y = a + bx.

Lineárna závislosť je vo fyzike veľmi rozšírená. A aj keď je závislosť nelineárna, zvyčajne sa pokúšajú vykresliť graf tak, aby získal rovnú čiaru. Ak sa napríklad predpokladá, že index lomu skla n súvisí s dĺžkou λ svetelnej vlny pomerom n = a + b / λ 2, potom je závislosť n na λ -2 vynesená do grafu. .

Zvážte závislosť y = kx(priamka prechádzajúca počiatkom). Zostavme hodnotu φ - súčet druhých mocnín odchýlok našich bodov od priamky

Hodnota φ je vždy kladná a ukazuje sa, že čím je menšia, tým bližšie sú naše body k priamke. Metóda najmenších štvorcov uvádza, že pre k by sme mali zvoliť takú hodnotu, pri ktorej φ má minimum


alebo
(19)

Výpočet ukazuje, že chyba stredného štvorca pri určovaní hodnoty k je rovnaká

, (20)
kde - n je počet meraní.

Uvažujme teraz o niečo ťažší prípad, keď body musia spĺňať vzorec y = a + bx(priama čiara neprechádzajúca pôvodom).

Úlohou je nájsť najlepšie hodnoty a a b z dostupnej množiny hodnôt x i, y i.

Poďme opäť skladať kvadratická forma φ , rovnajúci sa sume kvadratické odchýlky bodov x i, y i od priamky

a nájdite hodnoty a a b, pre ktoré má φ minimum

;

.

.

Spoločné riešenie týchto rovníc dáva

(21)

Chyby strednej odmocniny pri určovaní a a b sú rovnaké

(23)

... & nbsp (24)

Pri spracovaní výsledkov meraní touto metódou je vhodné zhrnúť všetky údaje do tabuľky, v ktorej sú predbežne vypočítané všetky sumy zahrnuté vo vzorcoch (19) - (24). Formy týchto tabuliek sú uvedené v príkladoch diskutovaných nižšie.

Príklad 1. Skúmala sa základná rovnica dynamiky rotačný pohybε = M / J (priamka prechádzajúca počiatkom). Pre rôzne hodnoty momentu M bolo zmerané uhlové zrýchlenie ε určitého telesa. Je potrebné určiť moment zotrvačnosti tohto telesa. Výsledky meraní momentu sily a uhlového zrýchlenia sa zadávajú do druhého a tretieho stĺpca. tabuľka 5.

Tabuľka 5
n M, Nm ε, s -1 M 2 M ε e - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Pomocou vzorca (19) určíme:

.

Na určenie strednej štvorcovej chyby použijeme vzorec (20)

0.005775Kg-1 · m -2 .

Podľa vzorca (18) máme

; .

S J = (2,996 0,005775) /0,3333 = 0,05185 kg m 2.

Vzhľadom na spoľahlivosť P = 0,95 podľa tabuľky Studentových koeficientov pre n = 5 zistíme t = 2,78 a určíme absolútnu chybu ΔJ = 2,78 0,05185 = 0,14441 ≈ 0,2 kg m 2.

Výsledky napíšeme vo forme:

J = (3,0 ± 0,2) kg m 2;


Príklad 2. Vypočítajme teplotný koeficient odporu kovu pomocou metódy najmenších štvorcov. Odpor je lineárny s teplotou

Rt = R ° (1 + a t °) = Ro + R0 a t °.

Voľný termín definuje odpor R 0 pri 0 ° C a sklon je súčinom teplotného koeficientu α a odporu R 0.

Výsledky meraní a výpočtov sú uvedené v tabuľke ( pozri tabuľku 6).

Tabuľka 6
n t °, s r, Ohm t-¯ t (t-¯t) 2 (t-¯ t) r r - bt - a (r - bt - a) 2, 10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑ / n 85.83333 1.4005 – – – – –

Pomocou vzorcov (21), (22) určíme

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ohm.

Nájdeme chybu v definícii α. Pretože potom podľa vzorca (18) máme:

.

Použitím vzorcov (23), (24) máme

;

0.014126 Ohm.

Vzhľadom na spoľahlivosť P = 0,95 podľa tabuľky Studentových koeficientov pre n = 6 zistíme t = 2,57 a určíme absolútnu chybu Δα = 2,57 0,000132 = 0,000338 stupeň -1.

a = (23 ± 4) · 10 -4 krupobitie-1 pri P = 0,95.


Príklad 3. Je potrebné určiť polomer zakrivenia šošovky pomocou Newtonových krúžkov. Zmerali sa polomery Newtonových prstencov r m a určili sa počty týchto prstencov m. Polomery Newtonových prstencov súvisia s polomerom zakrivenia šošovky R a počtom krúžku podľa rovnice

r 2 m = mλR - 2d 0 R,

kde d 0 je hrúbka medzery medzi šošovkou a rovinne rovnobežnou doskou (alebo deformácia šošovky),

λ je vlnová dĺžka dopadajúceho svetla.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

potom má rovnica tvar y = a + bx.

.

Výsledky meraní a výpočtov sú zaznamenané v Tabuľka 7.

Tabuľka 7
n x = m y = r 2, 10 -2 mm 2 m -m m (m -5 m) 2 (m -5 m) r y - bx - a, 10 -4 (y - bx - a) 2, 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑ / n 3.5 20.8548333 – – – – –