Esnek en küçük kareler çözüm algoritması. Deneysel verilere yaklaşım. En küçük kareler yöntemi. Kaynak verilerine doğrusal bağımlılıkla yaklaşım

Bilimin çeşitli alanlarında en geniş uygulamayı bulan ve pratik aktiviteler. Bu fizik, kimya, biyoloji, ekonomi, sosyoloji, psikoloji vb. olabilir. Kaderin iradesiyle sık sık ekonomiyle uğraşmak zorunda kalıyorum ve bu nedenle bugün sizin için muhteşem bir ülkeye bir gezi ayarlayacağım. Ekonometri=) ...Nasıl istemezsin?! Orası çok iyi; sadece karar vermeniz gerekiyor! ...Ama muhtemelen kesinlikle isteyeceğiniz şey sorunların nasıl çözüleceğini öğrenmektir yöntem en küçük kareler . Ve özellikle dikkatli okuyucular, bunları yalnızca doğru bir şekilde değil, aynı zamanda ÇOK HIZLI bir şekilde çözmeyi öğrenecekler ;-) Ama önce genel ayar görevler+ eşlik eden örnek:

Biraz içeri girsin konu alanı niceliksel ifadeye sahip göstergeler incelenir. Aynı zamanda göstergenin göstergeye bağlı olduğuna inanmak için her türlü neden vardır. Bu varsayım şöyle olabilir bilimsel hipotez ve temel sağduyuya dayanmalıdır. Ancak bilimi bir kenara bırakıp daha iştah açıcı alanları yani marketleri keşfedelim. Şununla belirtelim:

– bir bakkalın perakende alanı, m2,
– bir bakkalın yıllık cirosu, milyon ruble.

Ne olduğu tamamen açık daha büyük alanÇoğu durumda mağazanın cirosu o kadar büyük olur.

Tefle gözlemler/deneyler/hesaplamalar/danslar yaptıktan sonra elimizde sayısal verilere sahip olduğumuzu varsayalım:

Bakkallarda her şeyin açık olduğunu düşünüyorum: - bu 1. mağazanın alanı, - yıllık cirosu, - 2. mağazanın alanı, - yıllık cirosu vb. Bu arada, sınıflandırılmış materyallere erişime sahip olmak hiç de gerekli değil - ticaret cirosunun oldukça doğru bir değerlendirmesi şu şekilde elde edilebilir: matematiksel istatistik. Ancak dikkatimizi dağıtmayalım, ticari casusluk kursu zaten ücretli =)

Tablo verileri aynı zamanda noktalar biçiminde de yazılabilir ve bilinen biçimde gösterilebilir. Kartezyen sistem .

Cevap vereceğiz önemli soru: için kaç puan gerekli niteliksel araştırma?

Daha fazla, daha iyi. Kabul edilebilir minimum set 5-6 puandan oluşur. Ayrıca veri miktarı az olduğunda “anormal” sonuçlar örnekleme dahil edilememektedir. Dolayısıyla, örneğin küçük bir elit mağaza, "meslektaşlarından" daha fazla sipariş kazanabilir ve bu sayede satışları çarpıtabilir. genel desen, bulmanız gereken şey bu!

Çok basit bir şekilde ifade etmek gerekirse, bir fonksiyon seçmemiz gerekiyor, takvim noktalara mümkün olduğu kadar yakından geçen . Bu fonksiyon denir yaklaşık (yaklaşım - yaklaşım) veya teorik fonksiyon . Genel olarak konuşursak, burada hemen bariz bir "rakip" ortaya çıkıyor - polinom yüksek derece grafiği TÜM noktalardan geçen. Ancak bu seçenek karmaşıktır ve çoğunlukla yanlıştır. (grafik her zaman “döngüye gireceğinden” ve ana eğilimi zayıf şekilde yansıtacağından).

Bu nedenle aranan fonksiyonun oldukça basit olması ve aynı zamanda bağımlılığı yeterince yansıtması gerekir. Tahmin edebileceğiniz gibi, bu tür işlevleri bulma yöntemlerinden birine denir. en küçük kareler yöntemi. Öncelikle onun özüne bakalım. genel görünüm. Bazı fonksiyonların deneysel verilere yakın olmasına izin verin:


Bu yaklaşımın doğruluğu nasıl değerlendirilir? Deneysel ve fonksiyonel değerler arasındaki farkları (sapmaları) da hesaplayalım (çizi inceliyoruz). Akla gelen ilk düşünce toplamın ne kadar büyük olduğunu tahmin etmektir, ancak sorun şu ki farklar negatif olabilir (Örneğin, ) ve bu toplamanın sonucunda ortaya çıkan sapmalar birbirini iptal edecektir. Bu nedenle, yaklaşımın doğruluğunun bir tahmini olarak toplamın alınması gerekir. modüller sapmalar:

veya çöktü: (kimsenin bilmemesi durumunda: - bu toplam simgesidir ve - 1'den 1'e kadar değerleri alan yardımcı bir "sayaç" değişkenidir).

Deneysel noktaları çeşitli fonksiyonlara yaklaştırarak şunu elde ederiz: farklı anlamlar ve açıkçası bu miktarın daha küçük olduğu yerde bu işlev daha doğrudur.

Böyle bir yöntem var ve buna denir en az modül yöntemi. Ancak pratikte çok daha yaygın hale geldi. en küçük kareler yöntemi mümkün olan durumlarda negatif değerler modül tarafından değil, sapmaların karesi alınarak elimine edilir:

Bundan sonra çabalar, sapmaların karelerinin toplamı olacak şekilde bir fonksiyonun seçilmesini amaçlamaktadır. mümkün olduğu kadar küçüktü. Aslında yöntemin ismi de buradan geliyor.

Şimdi başka bir önemli noktaya dönüyoruz: Yukarıda belirtildiği gibi, seçilen işlev oldukça basit olmalıdır - ancak bu tür birçok işlev de vardır: doğrusal , hiperbolik, üstel, logaritmik, ikinci dereceden vesaire. Ve tabii ki burada hemen "faaliyet alanını daraltmak" istiyorum. Araştırma için hangi fonksiyon sınıfını seçmeliyim? İlkel ama etkili bir teknik:

– En kolay yol noktaları tasvir etmektir çizim üzerinde ve konumlarını analiz edin. Düz bir çizgide koşma eğilimindeyseler, bir çizginin denklemi optimal değerlerle ve . Başka bir deyişle görev, karesel sapmaların toplamı en küçük olacak şekilde BÖYLE katsayıları bulmaktır.

Noktalar örneğin birlikte bulunuyorsa abartı ise doğrusal fonksiyonun zayıf bir yaklaşım vereceği açıktır. Bu durumda hiperbol denklemi için en "uygun" katsayıları arıyoruz - verenler asgari miktar kareler .

Şimdi her iki durumda da bahsettiğimize dikkat edin. iki değişkenli fonksiyonlar, kimin argümanları aranan bağımlılık parametreleri:

Ve aslında standart bir problemi çözmemiz gerekiyor - bul iki değişkenli minimum fonksiyon.

Örneğimizi hatırlayalım: "depolama" noktalarının düz bir çizgide yer aldığını ve buna inanmak için her türlü nedenin bulunduğunu varsayalım. doğrusal bağımlılık perakende alanından elde edilen ciro. Sapmaların karesi toplamı olacak şekilde BÖYLE katsayıları “a” ve “be” bulalım. en küçüğüydü. Her şey her zamanki gibi - ilk önce 1. dereceden kısmi türevler. Buna göre doğrusallık kuralı Toplam simgesinin hemen altında ayırt edebilirsiniz:

Kullanmak istiyorsanız bu bilgi bir makale veya ders için - Kaynak listesindeki bağlantı için çok minnettar olacağım; bu tür ayrıntılı hesaplamaları birkaç yerde bulacaksınız:

Hadi oluşturalım standart sistem:

Her denklemi "iki" azaltıyoruz ve ayrıca toplamları "parçalıyoruz":

Not : “a” ve “be”nin neden toplam simgesinin ötesine çıkarılabileceğini bağımsız olarak analiz edin. Bu arada, resmi olarak bu toplamla yapılabilir

Sistemi “uygulamalı” biçimde yeniden yazalım:

bundan sonra sorunumuzu çözecek algoritma ortaya çıkmaya başlıyor:

Noktaların koordinatlarını biliyor muyuz? Biliyoruz. Tutarlar bulabilir miyiz? Kolayca. En basitini yapalım iki bilinmeyenli iki doğrusal denklem sistemi(“a” ve “olmak”). Sistemi çözüyoruz, örneğin, Cramer'in yöntemi bunun sonucunda durağan bir nokta elde ederiz. Kontrol ediliyor bir ekstremum için yeterli koşul, bu noktada işlevin olduğunu doğrulayabiliriz tam olarak ulaşıyor minimum. Kontrol ek hesaplamalar içeriyor ve bu nedenle bunu perde arkasında bırakacağız (Gerekirse eksik çerçeve görüntülenebilir). Nihai sonucu çıkarıyoruz:

İşlev mümkün olan en iyi şekilde (en azından diğer herhangi bir doğrusal fonksiyonla karşılaştırıldığında) deneysel noktaları yakınlaştırır . Kabaca söylemek gerekirse grafiği bu noktalara mümkün olduğu kadar yakından geçer. Gelenekte ekonometri sonuçta ortaya çıkan yaklaşım fonksiyonuna da denir çift ​​denklemi doğrusal regresyon .

Ele alınan sorunun büyük bir boyutu var pratik önemi. Örnek durumumuzda, Denk. hangi ticaret cirosunu tahmin etmenizi sağlar ("İgrek") mağaza satış alanının şu veya bu değerine sahip olacak (“x”in bir veya başka anlamı). Evet, ortaya çıkan tahmin yalnızca bir tahmin olacaktır, ancak çoğu durumda oldukça doğru olduğu ortaya çıkacaktır.

"Gerçek" sayılarla sadece bir sorunu analiz edeceğim çünkü bunda hiçbir zorluk yok - tüm hesaplamalar aynı seviyede okul müfredatı 7-8 sınıf. Vakaların yüzde 95'inde sizden yalnızca doğrusal bir fonksiyon bulmanız istenecektir, ancak makalenin en sonunda optimal hiperbol, üstel ve diğer bazı fonksiyonların denklemlerini bulmanın artık zor olmadığını göstereceğim.

Aslında geriye kalan tek şey vaat edilen güzellikleri dağıtmaktır - böylece bu tür örnekleri yalnızca doğru değil, aynı zamanda hızlı bir şekilde çözmeyi öğrenebilirsiniz. Standardı dikkatlice inceliyoruz:

Görev

İki gösterge arasındaki ilişkinin incelenmesi sonucunda aşağıdaki sayı çiftleri elde edildi:

En küçük kareler yöntemini kullanarak ampirik değere en iyi yaklaşan doğrusal fonksiyonu bulun. (deneyimli) veri. Kartezyen dikdörtgen koordinat sisteminde deneysel noktaların ve yaklaşık fonksiyonun grafiğinin oluşturulacağı bir çizim yapın . Ampirik ve teorik değerler arasındaki sapmaların karelerinin toplamını bulun. Özelliğin daha iyi olup olmayacağını öğrenin (en küçük kareler yöntemi açısından) Deneysel noktaları yaklaştırın.

Lütfen “x” anlamlarının doğal olduğunu ve bunun biraz sonra bahsedeceğim karakteristik anlamlı bir anlamı olduğunu unutmayın; ama elbette kesirli de olabilirler. Ayrıca belirli bir görevin içeriğine bağlı olarak hem “X” hem de “oyun” değerleri tamamen veya kısmen negatif olabilir. Bize "meçhul" bir görev verildi ve başlıyoruz çözüm:

Sistemin çözümü olarak optimal fonksiyonun katsayılarını buluyoruz:

Daha kompakt kayıt amacıyla, toplamanın 1'den .'ye kadar gerçekleştirildiği zaten açık olduğundan "sayaç" değişkeni çıkarılabilir.

Gerekli miktarları tablo halinde hesaplamak daha uygundur:


Hesaplamalar bir mikro hesap makinesinde yapılabilir, ancak Excel'i kullanmak çok daha iyidir - hem daha hızlı hem de hatasız; kısa bir video izleyin:

Böylece aşağıdakileri elde ederiz sistem:

Burada ikinci denklemi 3 ile çarpabilir ve 2.yi 1. denklemden terim bazında çıkar. Ancak bu şanstır; pratikte sistemler genellikle bir hediye değildir ve bu gibi durumlarda tasarruf sağlar Cramer'in yöntemi:
Bu, sistemin benzersiz bir çözümü olduğu anlamına gelir.

Kontrol edelim. İstemediğinizi anlıyorum, ama neden kesinlikle gözden kaçırılmayacak hataları atlayasınız ki? Bulunan çözümü sistemdeki her denklemin sol tarafına koyalım:

Karşılık gelen denklemlerin sağ tarafları elde edilir, bu da sistemin doğru çözüldüğü anlamına gelir.

Böylece istenen yaklaşım fonksiyonu: – itibaren herkes doğrusal fonksiyonlar Deneysel verilere en iyi yaklaşan kişi odur.

Farklı doğrudan mağazanın cirosunun kendi alanına bağımlılığı, bulunan bağımlılık tersi (ilke “ne kadar çoksa o kadar az”) ve bu gerçek olumsuzluklarla hemen ortaya çıkıyor eğim. İşlev belirli bir göstergenin 1 birim artmasıyla bağımlı göstergenin değerinin azaldığını söyler ortalama olarak 0,65 birim arttı. Dedikleri gibi karabuğdayın fiyatı ne kadar yüksek olursa o kadar az satılır.

Yaklaşım fonksiyonunun grafiğini çizmek için iki değerini buluyoruz:

ve çizimi yürütün:


Oluşturulan düz çizgiye denir eğilim çizgisi (yani doğrusal bir trend çizgisi, yani genel durumda bir trendin mutlaka düz bir çizgi olması gerekmez). Herkes “trendde olmak” tabirine aşinadır ve bu terimin ek yorumlara ihtiyacı olmadığını düşünüyorum.

Sapmaların karelerinin toplamını hesaplayalım Ampirik ve teorik değerler arasında. Geometrik olarak bu, "ahududu" bölümlerinin uzunluklarının karelerinin toplamıdır. (ikisi o kadar küçük ki görülemiyor bile).

Hesaplamaları bir tabloda özetleyelim:


Yine manuel olarak da yapılabilirler, her ihtimale karşı 1. nokta için bir örnek vereceğim:

ama bunu zaten yapmak çok daha etkili bilinen bir şekilde:

Bir kez daha tekrarlıyoruz: Elde edilen sonucun anlamı nedir?İtibaren tüm doğrusal fonksiyonlar y fonksiyonu gösterge en küçüğüdür, yani ailesindeki en iyi yaklaşımdır. Ve bu arada, bu bir tesadüf değil son soru görevler: ya önerilen üstel fonksiyon Deney noktalarını yakınlaştırmak daha iyi olur mu?

Karşılık gelen karesel sapmaların toplamını bulalım - ayırt etmek için bunları "epsilon" harfiyle göstereceğim. Teknik tamamen aynı:


Ve yine, her ihtimale karşı, 1. nokta için hesaplamalar:

Excel'de standart işlevi kullanıyoruz EXP (söz dizimi Excel Yardımında bulunabilir).

Çözüm: , bu, üstel fonksiyonun deneysel noktalara düz bir çizgiden daha kötü bir şekilde yaklaştığı anlamına gelir .

Ancak burada şunu da belirtmek gerekir ki “daha ​​kötüsü” henüz anlamına gelmiyor ki bu kötü. Şimdi bu üstel fonksiyonun bir grafiğini oluşturdum - ve aynı zamanda noktaların yakınından da geçiyor - öyle ki analitik araştırma olmadan hangi fonksiyonun daha doğru olduğunu söylemek zordur.

Bu, çözümü sonuçlandırıyor ve argümanın doğal değerleri sorusuna dönüyorum. Genellikle ekonomik veya sosyolojik olan çeşitli çalışmalarda ayları, yılları veya diğer eşit zaman aralıklarını numaralandırmak için doğal “X”ler kullanılır. Örneğin aşağıdaki problemi düşünün.

Görev, iki değişkenli fonksiyonun geçerli olduğu doğrusal bağımlılık katsayılarını bulmaktır. A Ve B kabul eder en küçük değer. Yani verilen A Ve B Deneysel verilerin bulunan düz çizgiden sapmalarının karelerinin toplamı en küçük olacaktır. En küçük kareler yönteminin asıl amacı budur.

Dolayısıyla örneği çözmek, iki değişkenli bir fonksiyonun ekstremumunu bulmaya indirgenir.

Katsayıları bulmak için formüllerin türetilmesi.İki bilinmeyenli iki denklemden oluşan bir sistem derlenip çözülür. Bir fonksiyonun kısmi türevlerini bulma değişkenlere göre A Ve B, bu türevleri sıfıra eşitliyoruz.

Ortaya çıkan denklem sistemini herhangi bir yöntemi (örneğin, ikame yöntemini veya Cramer yöntemini) kullanarak çözeriz ve en küçük kareler yöntemini (LSM) kullanarak katsayıları bulmak için formüller elde ederiz.

Verilen A Ve B işlev en küçük değeri alır.

En küçük kareler yönteminin tamamı budur. Parametreyi bulma formülü A toplamları , , ve parametrelerini içerir N- deneysel veri miktarı. Bu tutarların değerlerinin ayrı ayrı hesaplanmasını öneririz. Katsayı B Hesaplamadan sonra bulunan A.

Bu tür polinomların ana uygulama alanı deneysel verilerin işlenmesidir (ampirik formüllerin oluşturulması). Gerçek şu ki, deney yoluyla elde edilen fonksiyon değerlerinden oluşturulan bir enterpolasyon polinomu, "deneysel gürültüden" güçlü bir şekilde etkilenecektir; ayrıca, enterpolasyon sırasında enterpolasyon düğümleri tekrarlanamaz, yani. Aynı koşullar altında tekrarlanan deneylerin sonuçları kullanılamaz. Kök ortalama kare polinomu gürültüyü yumuşatır ve birden fazla deneyin sonuçlarını kullanmanıza olanak tanır.

Sayısal entegrasyon ve farklılaşma. Örnek.

Sayısal entegrasyon– belirli bir integralin değerinin hesaplanması (genellikle yaklaşık değer). Sayısal entegrasyon, belirli bir integralin değerini bulmak için bir dizi sayısal yöntem olarak anlaşılmaktadır.

Sayısal farklılaşma– ayrı olarak belirlenmiş bir fonksiyonun türevinin değerini hesaplamak için bir dizi yöntem.

Entegrasyon

Sorunun beyanı. Matematiksel problem ifadesi: değeri bulmanız gerekiyor belirli integral

a, b sonlu olmak üzere, f(x) [a, b] üzerinde süreklidir.

Karar verirken pratik problemlerÇoğu zaman integralin analitik olarak alınması elverişsiz veya imkansız olur: şeklinde ifade edilemeyebilir. temel işlevler, integrand tablo vb. şeklinde belirtilebilir. Bu gibi durumlarda sayısal entegrasyon yöntemleri kullanılır. Sayısal entegrasyon yöntemleri, eğrisel bir yamuğun alanını, daha basit alanların sonlu toplamı ile değiştirmeyi kullanır geometrik şekiller tam olarak hesaplanabilmektedir. Bu anlamda karesel formüllerin kullanılmasından bahsediyorlar.

Çoğu yöntem, integralin sonlu bir toplam olarak gösterimini kullanır (kareleme formülü):

Dördül formüller, integral segmentindeki integralin grafiğini daha fazla fonksiyonla değiştirme fikrine dayanır. basit tip Analitik olarak kolayca entegre edilebilen ve dolayısıyla kolayca hesaplanabilen. Karesel formüller oluşturma görevi en kolay şekilde polinom matematiksel modeller için uygulanır.

Üç grup yöntem ayırt edilebilir:

1. Entegrasyon segmentini eşit aralıklara bölme yöntemi. Aralıklara bölme işlemi önceden yapılır; genellikle aralıklar eşit seçilir (aralıkların sonundaki fonksiyonu hesaplamayı kolaylaştırmak için). Alanları hesaplayın ve toplayın (dikdörtgen, yamuk, Simpson yöntemleri).

2. Entegrasyon segmentinin özel noktalar kullanılarak bölümlenmesine yönelik yöntemler (Gauss yöntemi).

3. Rasgele sayılar kullanılarak integrallerin hesaplanması (Monte Carlo yöntemi).

Dikdörtgen yöntemi. Fonksiyonun (şekil) entegre edilmesi gereksin sayısal yöntem segmentte. Segmenti N eşit aralığa bölün. N kavisli yamuğun her birinin alanı bir dikdörtgenin alanı ile değiştirilebilir.

Tüm dikdörtgenlerin genişliği aynıdır ve eşittir:

Dikdörtgenlerin yüksekliğini seçmek için sol kenardaki fonksiyonun değerini seçebilirsiniz. Bu durumda, ilk dikdörtgenin yüksekliği f(a), ikincisi - f(x 1),..., N-f(N-1) olacaktır.

Dikdörtgenin yüksekliğini seçmek için sağ kenardaki fonksiyonun değerini alırsak, bu durumda ilk dikdörtgenin yüksekliği f(x 1), ikincisi - f(x 2), ... , N - f(x N).

Gördüğünüz gibi, bu durumda formüllerden biri integrale fazlalık, ikincisi ise eksiklik ile yaklaşık bir değer verir. Yaklaşım için entegrasyon bölümünün ortasındaki fonksiyonun değerini kullanmanın başka bir yolu daha var:

Dikdörtgen yönteminin mutlak hatasının tahmini (orta)

Sol ve sağ dikdörtgen yöntemlerinin mutlak hatasının tahmini.

Örnek. Tüm aralığı hesaplayın ve aralığı dört bölüme ayırın

Çözüm. Bu integralin analitik hesaplaması şunu verir: I=arctg(1)–arctg(0)=0,7853981634. Bizim durumumuzda:

1)h = 1; xo = 0; x1 = 1;

2) h = 0,25 (1/4); x0 = 0; x1 = 0,25; x2 = 0,5; x3 = 0,75; x4 = 1;

Sol dikdörtgen yöntemini kullanarak hesaplayalım:

Sağ dikdörtgen yöntemini kullanarak hesaplayalım:

Ortalama dikdörtgen yöntemini kullanarak hesaplayalım:

Yamuk yöntemi. Yamuk formülündeki sonuçları enterpolasyon yapmak için birinci dereceden bir polinomun (iki noktadan çizilen düz bir çizgi) kullanılması. Entegrasyon bölümünün uçları enterpolasyon düğümleri olarak alınır. Böylece, kavisli yamuk alanı tabanların ve yüksekliğin toplamının yarısı kadar bulunabilen normal bir yamuk ile değiştirilir

Tüm düğümler için N entegrasyon segmenti olması durumunda, segmentin uç noktaları hariç, fonksiyonun değeri buna dahil edilecektir. toplam tutar iki kez (bitişik yamukların bir ortak tarafı olduğundan)

Yamuk formülü, parçanın sağ ve sol kenarları boyunca dikdörtgen formüllerinin toplamının yarısı alınarak elde edilebilir:

Çözeltinin stabilitesinin kontrol edilmesi. Kural olarak, her aralığın uzunluğu ne kadar kısa olursa, yani Bu aralıkların sayısı ne kadar büyük olursa, integralin yaklaşık ve kesin değerleri arasındaki fark o kadar az olur. Bu çoğu fonksiyon için geçerlidir. Yamuk yönteminde, ϭ integralinin hesaplanmasındaki hata, entegrasyon adımının karesiyle (ϭ ~ h 2) yaklaşık olarak orantılıdır. Bu nedenle, belirli bir fonksiyonun integralini a, b cinsinden hesaplamak gerekir. parçayı N 0 aralıklara bölün ve yamuğun alanlarının toplamını bulun. Daha sonra N 1 aralık sayısını artırmanız, yamuğun toplamını tekrar hesaplamanız ve elde edilen değeri önceki sonuçla karşılaştırmanız gerekir. Bu, sonucun belirtilen doğruluğuna (yakınsama kriteri) ulaşılıncaya kadar (N i)'ye kadar tekrarlanmalıdır.

Dikdörtgen ve yamuk yöntemleri için genellikle her yineleme adımında aralık sayısı 2 kat artar (N i +1 = 2N i).

Yakınsama kriteri:

Trapez kuralının temel avantajı basitliğidir. Ancak integral hesaplanırken yüksek hassasiyet gerekiyorsa bu yöntem çok fazla yineleme gerektirebilir.

Yamuk yönteminin mutlak hatası olarak tahmin edilmektedir
.

Örnek. Yamuk formülünü kullanarak yaklaşık olarak belirli bir integrali hesaplayın.

a) Entegrasyon segmentinin 3 parçaya bölünmesi.
b) Entegrasyon segmentinin 5 parçaya bölünmesi.

Çözüm:
a) Koşula göre entegrasyon bölümünün 3 parçaya bölünmesi gerekir.
Her bölüm bölümünün uzunluğunu hesaplayalım: .

Böylece, genel formül yamuk hoş bir boyuta küçültülür:

Nihayet:

Ortaya çıkan değerin alanın yaklaşık bir değeri olduğunu hatırlatayım.

b) Entegrasyon segmentini 5'e bölün eşit parçalar yani. Segment sayısını artırarak hesaplamaların doğruluğunu arttırıyoruz.

Eğer ise yamuk formülü aşağıdaki formu alır:

Bölümleme adımını bulalım:
yani her bir ara parçanın uzunluğu 0,6'dır.

Görevi tamamlarken, tüm hesaplamaları bir hesaplama tablosu kullanarak resmileştirmek uygundur:

İlk satıra “counter” yazıyoruz

Sonuç olarak:

Gerçekten bir açıklama var ve ciddi bir açıklama!
3 bölüm bölümü içinse, o zaman 5 bölüm için. Daha da büyük bir segment alırsanız => daha da doğru olacaktır.

Simpson'un formülü. Yamuk formülü, özellikle fonksiyonun monoton olmadığı durumlarda, belirli bir integralin hesaplanmasının doğruluğunu etkileyen h adım büyüklüğüne güçlü bir şekilde bağlı olan bir sonuç verir. f(x) fonksiyonunun grafiğinin eğrisel parçalarını değiştiren düz parçalar yerine, örneğin grafiğin üç bitişik noktasından verilen parabol parçalarını kullanırsak, hesaplamaların doğruluğunun artacağı varsayılabilir. Bu geometrik yorum, Simpson'ın belirli integrali hesaplama yönteminin temelini oluşturur. Tüm aralık entegrasyon a,b N parça bölünürse parçanın uzunluğu da h=(b-a)/N'ye eşit olacaktır.

Simpson'ın formülü şöyle görünür:

kalan terim

Segmentlerin uzunluğu arttıkça formülün doğruluğu azalmakta, dolayısıyla doğruluğu arttırmak için Simpson bileşik formülü kullanılmaktadır. Entegrasyon aralığının tamamı şu şekilde bölünmüştür: çift ​​sayı Aynı segmentler N ise, segmentin uzunluğu da h=(b-a)/N'ye eşit olacaktır. Simpson'ın bileşik formülü şöyledir:

Formülde parantez içindeki ifadeler sırasıyla tek ve çift iç segmentlerin uçlarındaki integrand değerlerinin toplamını temsil eder.

Simpson formülünün geri kalanı adımın dördüncü kuvvetiyle orantılıdır:

Örnek: Simpson kuralını kullanarak integrali hesaplayın. (Kesin çözüm - 0,2)

Gauss yöntemi

Gauss kareleme formülü. İkinci tip kareleme formüllerinin temel prensibi Şekil 1.12'de görülebilir: noktaları bu şekilde yerleştirmek gerekir X 0 ve X 1 segmentin içinde [ A;B], böylece “üçgenlerin” toplam alanı “segmentin” alanına eşittir. Gauss formülünü kullanırken orijinal segment [ A;B], değişken değiştirilerek [-1;1] segmentine indirgenir X Açık

0.5∙(BA)∙T+ 0.5∙(B + A).

Daha sonra , Nerede .

Böyle bir değiştirme şu durumlarda mümkündür: A Ve B sonludur ve fonksiyon F(X) [ üzerinde süreklidir A;B] Gauss formülü N puan x ben, Ben=0,1,..,N-1 segmentin içinde [ A;B]:

, (1.27)

Nerede ben Ve bir bençeşitli için N Referans kitaplarında verilmektedir. Örneğin, ne zaman N=2 A 0 =A 1 =1; en N=3: T 0 =t 2 "0,775, T 1 =0, A 0 =A 2"0,555, A 1 "0,889.

Gauss kareleme formülü

birliğe eşit bir ağırlık fonksiyonuyla elde edilir p(x)= 1 ve düğümler x ben Legendre polinomlarının kökleri olan

Oranlar bir ben formülleri kullanarak hesaplamak kolay

Ben=0,1,2,...N.

n=2,3,4,5 için düğüm değerleri ve katsayılar tabloda verilmiştir.

Emir Düğümler Oranlar
N=2 x 1=0 x 0 =-x 2=0.7745966692 1=8/9 bir 0 = bir 2=5/9
N=3 x 2 =-x 1=0.3399810436 x 3 =-x 0=0.8611363116 bir 1 =A 2=0.6521451549 bir 0 = bir 3=0.6521451549
n=4 X 2 = 0 X 3 = -X 1 = 0.5384693101 X 4 =-X 0 =0.9061798459 A 0 =0.568888899 A 3 =A 1 =0.4786286705 A 0 =A 4 =0.2869268851
N=5 X 5 = -X 0 =0.9324695142 X 4 = -X 1 =0.6612093865 X 3 = -X 2 =0.2386191861 A 5 =A 0 =0.1713244924 A 4 =A 1 =0.3607615730 A 3 =A 2 =0.4679139346

Örnek. Gauss formülünü kullanarak değeri hesaplayın N=2:

Tam değer: .

Gauss formülünü kullanarak integrali hesaplamaya yönelik algoritma, mikro segment sayısını iki katına çıkarmayı değil, koordinat sayısını 1 artırmayı ve integralin elde edilen değerlerinin karşılaştırılmasını içerir. Gauss formülünün avantajı nispeten az sayıda koordinatla yüksek doğruluğudur. Dezavantajları: manuel hesaplamalar için uygun değildir; değerlerin bilgisayar hafızasında saklanması gerekir ben, bir bençeşitli için N.

Segment üzerindeki Gauss kareleme formülünün hatası şu şekilde olacaktır: Kalan terim formülü için ve katsayı α N büyümeyle birlikte hızla azalır N. Burada

Gauss formülleri az sayıda düğümle bile (4'ten 10'a kadar) yüksek doğruluk sağlar. Bu durumda, pratik hesaplamalarda düğüm sayısı birkaç yüz ila birkaç bin arasında değişir. Ayrıca Gauss karelemelerinin ağırlıklarının her zaman pozitif olduğuna dikkat edin; bu, toplamların hesaplanmasında algoritmanın kararlılığını sağlar

En küçük kareler yöntemi (OLS), rastgele hatalar içeren birçok ölçümün sonuçlarını kullanarak çeşitli miktarları tahmin etmenize olanak tanır.

Çokuluslu Şirketlerin Özellikleri

Bu yöntemin ana fikri, karesel hataların toplamının, en aza indirilmeye çalışılan problemin çözümünün doğruluğu için bir kriter olarak kabul edilmesidir. Bu yöntemi kullanırken hem sayısal hem de analitik yaklaşımlar kullanılabilir.

Özellikle sayısal bir uygulama olarak en küçük kareler yöntemi, bilinmeyenlerin mümkün olduğu kadar çok ölçümünün gerçekleştirilmesini ifade eder. rastgele değişken. Üstelik ne kadar çok hesaplama yapılırsa çözüm o kadar doğru olacaktır. Bu hesaplama setine (ilk verilere) dayanarak, en iyisinin seçildiği başka bir tahmini çözüm seti elde edilir. Çözüm kümesi parametrelendirilmişse, en küçük kareler yöntemi parametrelerin optimal değerini bulmaya indirgenecektir.

LSM'nin bir dizi başlangıç ​​verisi (ölçümler) ve beklenen bir çözüm kümesi üzerinde uygulanmasına analitik bir yaklaşım olarak, onay gerektiren belirli bir hipotez olarak elde edilen bir formülle ifade edilebilecek belirli bir (işlevsel) belirlenir. Bu durumda, en küçük kareler yöntemi, orijinal verinin hata kareleri kümesinde bu fonksiyonelin minimumunu bulmaya gelir.

Lütfen bunun hataların kendisi değil, hataların kareleri olduğunu unutmayın. Neden? Gerçek şu ki, ölçümlerin kesin değerden sapmaları çoğu zaman hem olumlu hem de olumsuzdur. Ortalamayı belirlerken pozitif ve negatif değerlerin iptali, birden fazla ölçümün örnekleme gücünü azaltacağından basit toplama, tahminin kalitesi hakkında yanlış bir sonuca yol açabilir. Ve sonuç olarak değerlendirmenin doğruluğu.

Bunun olmasını önlemek için sapmaların kareleri toplanır. Ayrıca, ölçülen değerin ve nihai tahminin boyutunu eşitlemek için hataların kareleri toplamı çıkarılır.

Bazı MNC uygulamaları

MNC çeşitli alanlarda yaygın olarak kullanılmaktadır. Örneğin, olasılık teorisinde ve matematiksel istatistiklerde, rastgele değişkenin değer aralığının genişliğini belirleyen standart sapma gibi rastgele bir değişkenin böyle bir özelliğini belirlemek için bir yöntem kullanılır.

Örnek.

Değişkenlerin değerlerine ilişkin deneysel veriler X Ve en tabloda verilmektedir.

Hizalamalarının bir sonucu olarak, fonksiyon elde edilir

Kullanma en küçük kareler yöntemi, bu verilere doğrusal bir bağımlılıkla yaklaşın y=ax+b(parametreleri bul A Ve B). İki çizgiden hangisinin (en küçük kareler yöntemi anlamında) deneysel verileri daha iyi hizaladığını bulun. Bir çizim yapın.

En küçük kareler yönteminin (LSM) özü.

Görev, iki değişkenli fonksiyonun geçerli olduğu doğrusal bağımlılık katsayılarını bulmaktır. A Ve B en küçük değeri alır. Yani verilen A Ve B Deneysel verilerin bulunan düz çizgiden sapmalarının karelerinin toplamı en küçük olacaktır. En küçük kareler yönteminin asıl amacı budur.

Dolayısıyla örneği çözmek, iki değişkenli bir fonksiyonun ekstremumunu bulmaya indirgenir.

Katsayıları bulmak için formüllerin türetilmesi.

İki bilinmeyenli iki denklemden oluşan bir sistem derlenip çözülür. Bir fonksiyonun kısmi türevlerini bulma değişkenlere göre A Ve B, bu türevleri sıfıra eşitliyoruz.

Ortaya çıkan denklem sistemini herhangi bir yöntemi kullanarak çözeriz (örneğin ikame yöntemiyle veya Cramer'in yöntemi) ve en küçük kareler yöntemini (LSM) kullanarak katsayıları bulmak için formüller elde edin.

Verilen A Ve B işlev en küçük değeri alır. Bu gerçeğin kanıtı veriliyor sayfanın sonundaki metinde aşağıda.

En küçük kareler yönteminin tamamı budur. Parametreyi bulma formülü A toplamları ve parametreyi içerir N- deneysel veri miktarı. Bu tutarların değerlerinin ayrı ayrı hesaplanmasını öneririz. Katsayı B Hesaplamadan sonra bulunan A.

Orijinal örneği hatırlamanın zamanı geldi.

Çözüm.

Örneğimizde n=5. Gerekli katsayıların formüllerinde yer alan tutarların hesaplanmasında kolaylık sağlamak için tabloyu dolduruyoruz.

Tablonun dördüncü satırındaki değerler, her sayı için 2. satırdaki değerlerin 3. satırdaki değerlerle çarpılmasıyla elde edilir. Ben.

Tablonun beşinci satırındaki değerler, her sayı için 2. satırdaki değerlerin karesi alınarak elde edilir. Ben.

Tablonun son sütunundaki değerler satırlar arasındaki değerlerin toplamıdır.

Katsayıları bulmak için en küçük kareler yönteminin formüllerini kullanıyoruz A Ve B. Tablonun son sütunundaki karşılık gelen değerleri bunların yerine koyarız:

Buradan, y = 0,165x+2,184- istenen yaklaşık düz çizgi.

Hangi satırların olduğunu bulmak için kalır y = 0,165x+2,184 veya orijinal verilere daha iyi yaklaşır, yani en küçük kareler yöntemini kullanarak bir tahmin yapar.

En küçük kareler yönteminde hata tahmini.

Bunu yapmak için orijinal verilerin bu çizgilerden sapmalarının karelerinin toplamını hesaplamanız gerekir. Ve , daha küçük bir değer, en küçük kareler yöntemi anlamında orijinal verilere daha iyi yaklaşan bir çizgiye karşılık gelir.

O zamandan beri düz y = 0,165x+2,184 orijinal verilere daha iyi yaklaşır.

En küçük kareler (LS) yönteminin grafiksel gösterimi.

Grafiklerde her şey açıkça görülüyor. Kırmızı çizgi bulunan düz çizgidir y = 0,165x+2,184, mavi çizgi , pembe noktalar orijinal verilerdir.

Uygulamada, çeşitli süreçleri (özellikle ekonomik, fiziksel, teknik, sosyal) modellerken, fonksiyonların yaklaşık değerlerini belirli sabit noktalarda bilinen değerlerinden hesaplamak için bir veya başka bir yöntem yaygın olarak kullanılır.

Bu tür fonksiyon yaklaşımı problemi sıklıkla ortaya çıkar:

    deney sonucunda elde edilen tablo verilerini kullanarak, incelenen sürecin karakteristik miktarlarının değerlerini hesaplamak için yaklaşık formüller oluştururken;

    sayısal entegrasyon, türev, çözüm diferansiyel denklemler vesaire.;

    fonksiyonların değerlerini dikkate alınan aralığın ara noktalarında hesaplamak gerekiyorsa;

    özellikle tahmin yaparken, dikkate alınan aralığın dışındaki bir sürecin karakteristik miktarlarının değerlerini belirlerken.

Bir tablo tarafından belirtilen belirli bir süreci modellemek için, en küçük kareler yöntemine dayalı olarak bu süreci yaklaşık olarak tanımlayan bir fonksiyon oluşturursak, buna yaklaşıklık fonksiyonu (regresyon) adı verilecek ve yaklaşıklık fonksiyonlarının oluşturulması probleminin kendisi çağrılacaktır. bir yakınsama problemi.

Bu makale, MS Excel paketinin bu tür sorunları çözme konusundaki yeteneklerini tartışmakta, ayrıca tablo halindeki regresyonları oluşturmak (oluşturmak) için yöntemler ve teknikler sağlamaktadır. belirtilen işlevler(Bu, regresyon analizinin temelidir).

Excel'in regresyon oluşturmak için iki seçeneği vardır.

    İncelenen süreç karakteristiği için bir veri tablosu temelinde oluşturulan bir diyagrama seçilen regresyonların (eğilim çizgileri) eklenmesi (yalnızca bir diyagram oluşturulmuşsa kullanılabilir);

    Excel çalışma sayfasının yerleşik istatistiksel işlevlerini kullanarak regresyonları (eğilim çizgileri) doğrudan kaynak veri tablosundan elde etmenize olanak tanır.

Grafiğe trend çizgileri ekleme

Bir süreci tanımlayan ve bir diyagramla temsil edilen bir veri tablosu için Excel'in aşağıdakileri yapmanıza olanak tanıyan etkili bir regresyon analiz aracı vardır:

    en küçük kareler yöntemini temel alarak inşa edin ve diyagrama, incelenen süreci değişen doğruluk dereceleriyle modelleyen beş tür regresyon ekleyin;

    oluşturulan regresyon denklemini diyagrama ekleyin;

    Seçilen regresyonun grafikte görüntülenen verilere uygunluk derecesini belirleyin.

Excel, grafik verilerine dayanarak, denklemle belirtilen doğrusal, polinom, logaritmik, güç, üstel regresyon türlerini elde etmenize olanak tanır:

y = y(x)

burada x, genellikle bir dizi doğal sayının (1; 2; 3; ...) değerlerini alan ve örneğin incelenen sürecin zamanının geri sayımını (özellikler) üreten bağımsız bir değişkendir.

1 . Doğrusal regresyon, değerleri sabit bir oranda artan veya azalan özellikleri modellemek için iyidir. Bu, incelenen süreç için oluşturulacak en basit modeldir. Aşağıdaki denkleme göre inşa edilir:

y = mx + b

burada m, doğrusal regresyon eğiminin x eksenine teğetidir; b - doğrusal regresyonun ordinat ekseni ile kesişme noktasının koordinatı.

2 . Bir polinom eğilim çizgisi, birkaç farklı uç noktaya (maksimum ve minimum) sahip özellikleri tanımlamak için kullanışlıdır. Polinom derecesinin seçimi, incelenen özelliğin ekstremum sayısına göre belirlenir. Dolayısıyla, ikinci dereceden bir polinom, yalnızca bir maksimumu veya minimumu olan bir süreci iyi tanımlayabilir; üçüncü dereceden polinom - en fazla iki ekstrema; dördüncü dereceden polinom - en fazla üç ekstrema vb.

Bu durumda trend çizgisi aşağıdaki denkleme göre oluşturulur:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

burada c0, c1, c2,... c6 katsayıları inşaat sırasında değerleri belirlenen sabitlerdir.

3 . Logaritmik eğilim çizgisi, değerleri başlangıçta hızla değişen ve daha sonra yavaş yavaş sabitlenen özelliklerin modellenmesinde başarıyla kullanılır.

y = c ln(x) + b

4 . Güç yasası eğilim çizgisi, incelenen ilişkinin değerleri büyüme oranındaki sürekli bir değişiklikle karakterize ediliyorsa iyi sonuçlar verir. Böyle bir bağımlılığın bir örneği, bir arabanın eşit şekilde hızlandırılmış hareketinin grafiğidir. Verilerde sıfır veya negatif değerler varsa güç trend çizgisi kullanamazsınız.

Denkleme göre oluşturulmuştur:

y = cxb

burada b, c katsayıları sabittir.

5 . Verilerdeki değişim hızı sürekli arttığında üstel eğilim çizgisi kullanılmalıdır. Sıfır veya negatif değer içeren veriler için bu tür bir yaklaşım da uygulanamaz.

Denkleme göre oluşturulmuştur:

y = c ebx

burada b, c katsayıları sabittir.

Bir eğilim çizgisi seçerken Excel, yaklaşımın güvenilirliğini karakterize eden R2 değerini otomatik olarak hesaplar: R2 değeri birliğe ne kadar yakınsa, eğilim çizgisi incelenen sürece o kadar güvenilir bir şekilde yaklaşır. Gerektiğinde R2 değeri her zaman grafikte görüntülenebilir.

Formülle belirlenir:

Bir veri serisine trend çizgisi eklemek için:

    bir dizi veriye dayalı olarak bir grafiği etkinleştirin, yani grafik alanının içine tıklayın. Diyagram öğesi ana menüde görünecektir;

    Bu öğeye tıkladıktan sonra ekranda Trend çizgisi ekle komutunu seçmeniz gereken bir menü görünecektir.

Aynı eylemler, fare imlecini veri serilerinden birine karşılık gelen grafiğin üzerine getirip sağ tıklatarak kolayca uygulanabilir; Görüntülenen içerik menüsünde Trend çizgisi ekle komutunu seçin. Tür sekmesi açıkken ekranda Trend çizgisi iletişim kutusu görünecektir (Şekil 1).

Bundan sonra ihtiyacınız var:

Tür sekmesinde gerekli eğilim çizgisi türünü seçin (Doğrusal tür varsayılan olarak seçilidir). Polinom türü için Derece alanında seçilen polinomun derecesini belirtin.

1 . Yerleşik seriler alanı, söz konusu grafikteki tüm veri serilerini listeler. Belirli bir veri serisine trend çizgisi eklemek için Dahili seri alanında adını seçin.

Gerekirse Parametreler sekmesine (Şekil 2) giderek trend çizgisi için aşağıdaki parametreleri ayarlayabilirsiniz:

    Yaklaşık (düzleştirilmiş) eğrinin adı alanında trend çizgisinin adını değiştirin.

    Tahmin alanında tahmin için dönem sayısını (ileri veya geri) ayarlayın;

    diyagram alanında denklemi göster onay kutusunu etkinleştirmeniz gereken trend çizgisinin denklemini görüntüleyin;

    yaklaşık güvenilirlik değeri R2'yi diyagram alanında görüntüleyin; bunun için Yaklaşım güvenilirlik değerini diyagrama yerleştir (R^2) onay kutusunu etkinleştirmeniz gerekir;

    trend çizgisinin Y ekseni ile kesişme noktasını ayarlayın; bunun için eğrinin Y ekseni ile bir noktada kesişmesi için onay kutusunu etkinleştirmeniz gerekir;

    İletişim kutusunu kapatmak için Tamam düğmesini tıklayın.

Zaten çizilmiş bir trend çizgisini düzenlemeye başlamanın üç yolu vardır:

    daha önce trend çizgisini seçtikten sonra Format menüsünden Seçilen trend çizgisi komutunu kullanın;

    trend çizgisine sağ tıklanarak çağrılan içerik menüsünden Trend çizgisini formatla komutunu seçin;

    trend çizgisine çift tıklayın.

Ekranda üç sekme içeren Trend Çizgisi Formatı iletişim kutusu görünecektir (Şekil 3): Görünüm, Tür, Parametreler ve son ikisinin içeriği, Trend Çizgisi iletişim kutusunun benzer sekmeleriyle tamamen örtüşmektedir (Şekil 1). -2). Görünüm sekmesinde çizgi türünü, rengini ve kalınlığını ayarlayabilirsiniz.

Daha önce çizilmiş bir trend çizgisini silmek için silinecek trend çizgisini seçin ve Sil tuşuna basın.

Dikkate alınan regresyon analiz aracının avantajları şunlardır:

    bir veri tablosu oluşturmadan grafikler üzerinde bir trend çizgisi oluşturmanın göreceli kolaylığı;

    önerilen trend çizgisi türlerinin oldukça geniş bir listesi ve bu liste en sık kullanılan regresyon türlerini içerir;

    İncelenmekte olan sürecin davranışını herhangi bir düzeyde (içinde) tahmin etme yeteneği sağduyu) ileri ve geri adım sayısı;

    trend çizgisi denklemini analitik biçimde elde etme yeteneği;

    Gerekirse, yaklaşımın güvenilirliğine ilişkin bir değerlendirme elde etme olasılığı.

Dezavantajları aşağıdakileri içerir:

    bir trend çizgisinin oluşturulması yalnızca bir dizi veri üzerine kurulu bir diyagram varsa gerçekleştirilir;

    elde edilen eğilim çizgisi denklemlerine dayanarak incelenen karakteristik için veri serisi oluşturma süreci biraz karmaşıktır: gerekli regresyon denklemleri, orijinal veri serisinin değerlerindeki her değişiklikle birlikte, ancak yalnızca grafik alanı içinde güncellenir. eski çizgi denklemi temelinde oluşturulan veri serisi değişmeden kalırken;

    PivotChart raporlarında, bir grafiğin veya ilişkili PivotTable raporunun görünümünü değiştirmek mevcut eğilim çizgilerini korumaz; bu, eğilim çizgileri çizmeden veya PivotChart raporunu başka şekilde biçimlendirmeden önce rapor düzeninin gerekli gereksinimleri karşıladığından emin olmanız gerektiği anlamına gelir.

Eğilim çizgileri, grafik, histogram, düz standartlaştırılmamış alan grafikleri, çubuk grafikler, dağılım grafikleri, kabarcık grafikleri ve hisse senedi grafikleri gibi grafiklerde sunulan veri serilerini tamamlamak için kullanılabilir.

3B, normalleştirilmiş, radar, pasta ve halka grafiklerindeki veri serilerine trend çizgileri ekleyemezsiniz.

Excel'in yerleşik işlevlerini kullanma

Excel'de ayrıca grafik alanının dışındaki trend çizgilerini çizmek için bir regresyon analiz aracı da bulunur. Bu amaç için kullanılabilecek çok sayıda istatistiksel çalışma sayfası işlevi vardır, ancak bunların tümü yalnızca doğrusal veya üstel regresyonlara izin verir.

Excel'in doğrusal regresyon oluşturmak için çeşitli işlevleri vardır, özellikle:

    TREND;

  • EĞİM ve KESME.

Üstel bir trend çizgisi oluşturmak için çeşitli işlevlerin yanı sıra, özellikle:

    LGRFPRIBL.

TREND ve BÜYÜME işlevlerini kullanarak regresyon oluşturma tekniklerinin neredeyse aynı olduğunu belirtmek gerekir. Aynı şey LINEST ve LGRFPRIBL işlev çifti için de söylenebilir. Bu dört işlev için bir değer tablosu oluşturmak, regresyon oluşturma sürecini biraz karmaşıklaştıran dizi formülleri gibi Excel özelliklerini kullanır. Ayrıca, bizim görüşümüze göre doğrusal regresyon oluşturmanın en kolay şekilde SLOPE ve INTERCEPT işlevleri kullanılarak gerçekleştirildiğine dikkat edin; bunlardan birincisi doğrusal regresyonun eğimini belirler ve ikincisi, y üzerindeki regresyon tarafından kesilen parçayı belirler. -eksen.

Regresyon analizi için yerleşik işlevler aracının avantajları şunlardır:

    eğilim çizgilerini tanımlayan tüm yerleşik istatistiksel işlevler için incelenmekte olan karakteristiğe ait veri serilerinin oluşturulmasına yönelik oldukça basit, tek tip bir süreç;

    oluşturulan veri serilerine dayalı trend çizgileri oluşturmak için standart metodoloji;

    Üzerinde çalışılan sürecin davranışını tahmin etme yeteneği gerekli miktar ileri veya geri adım atar.

Dezavantajları arasında Excel'in diğer (doğrusal ve üstel hariç) eğilim çizgileri türlerini oluşturmak için yerleşik işlevlere sahip olmaması yer alır. Bu durum çoğu zaman incelenen sürecin yeterince doğru bir modelinin seçilmesine ve gerçeğe yakın tahminlerin elde edilmesine izin vermez. Ayrıca TREND ve BÜYÜME fonksiyonları kullanıldığında trend çizgilerinin denklemleri bilinmemektedir.

Yazarların, regresyon analizinin gidişatını herhangi bir bütünlük derecesiyle sunmaya çalışmadıklarına dikkat edilmelidir. Ana görevi, yaklaşım problemlerini çözerken Excel paketinin yeteneklerini belirli örnekler kullanarak göstermektir; Regresyonlar ve tahminler oluşturmak için Excel'in hangi etkili araçlara sahip olduğunu gösterin; regresyon analizi konusunda kapsamlı bilgiye sahip olmayan bir kullanıcı tarafından bile bu tür problemlerin nasıl nispeten kolay çözülebileceğini göstermektedir.

Belirli sorunları çözme örnekleri

Listelenen Excel araçlarını kullanarak belirli sorunları çözmeye bakalım.

Sorun 1

Bir motorlu taşımacılık işletmesinin 1995-2002 dönemine ilişkin kârına ilişkin bir veri tablosu ile. aşağıdakileri yapmanız gerekir:

    Bir diyagram oluşturun.

    Grafiğe doğrusal ve polinom (ikinci dereceden ve kübik) eğilim çizgileri ekleyin.

    Eğilim çizgilerinin denklemlerini kullanarak, 1995-2004 yılları için her bir eğilim çizgisi için işletme karlarına ilişkin tablo halinde veriler elde edin.

    İşletmenin 2003 ve 2004 yılı karı için bir tahmin yapın.

Sorun çözümü

    Excel çalışma sayfasının A4:C11 hücreleri aralığına, Şekil 2'de gösterilen çalışma sayfasını girin. 4.

    B4:C11 hücre aralığını seçtikten sonra bir diyagram oluşturuyoruz.

    Oluşturulan diyagramı etkinleştiriyoruz ve yukarıda açıklanan yönteme göre Trend Çizgisi iletişim kutusunda trend çizgisi türünü seçtikten sonra (bkz. Şekil 1), diyagrama dönüşümlü olarak doğrusal, karesel ve kübik trend çizgileri ekliyoruz. Aynı iletişim kutusunda, Parametreler sekmesini açın (bkz. Şekil 2), yaklaşık (düzleştirilmiş) eğrinin adı alanına, eklenen trendin adını girin ve İleriye yönelik tahmin: dönemler alanına, değeri 2, çünkü iki yıl sonrası için kar tahmini yapılması planlanıyor. Regresyon denklemini ve yaklaşım güvenilirlik değeri R2'yi diyagram alanında görüntülemek için denklemi ekranda göster onay kutularını etkinleştirin ve yaklaşım güvenilirlik değerini (R^2) diyagrama yerleştirin. Daha iyi görsel algı için, Trend Çizgisi Formatı iletişim kutusunun Görünüm sekmesini kullandığımız oluşturulan trend çizgilerinin türünü, rengini ve kalınlığını değiştiriyoruz (bkz. Şekil 3). Eklenen trend çizgileri ile ortaya çıkan diyagram, Şekil 1'de gösterilmektedir. 5.

    1995-2004 yılları için her bir trend çizgisi için işletme karlarına ilişkin tablo halinde veri elde etmek.

Şekil 2'de sunulan trend çizgisi denklemlerini kullanalım. 5. Bunu yapmak için D3:F3 aralığındaki hücrelere seçilen trend çizgisinin türü hakkında metin bilgilerini girin: Doğrusal trend, Karesel trend, Kübik trend. Daha sonra, D4 hücresine doğrusal regresyon formülünü girin ve doldurma işaretini kullanarak bu formülü göreli referanslarla D5:D13 hücre aralığına kopyalayın. D4:D13 hücre aralığından doğrusal regresyon formülüne sahip her hücrenin, A4:A13 aralığından karşılık gelen bir hücreye argüman olarak sahip olduğuna dikkat edilmelidir. Benzer şekilde, ikinci dereceden regresyon için E4:E13 hücre aralığını doldurun ve kübik regresyon için F4:F13 hücre aralığını doldurun. Böylece işletmenin 2003 ve 2004 yılı kârına ilişkin bir tahmin derlendi. üç trendi kullanıyor. Ortaya çıkan değer tablosu Şekil 2'de gösterilmektedir. 6.

    Bir diyagram oluşturun.

    Sorun 2

    Grafiğe logaritmik, güç ve üstel eğilim çizgileri ekleyin.

    Elde edilen trend çizgilerinin denklemlerini ve bunların her biri için R2 yaklaşımının güvenilirlik değerlerini türetin.

    Trend çizgisi denklemlerini kullanarak, 1995-2002 yılları için her bir trend çizgisi için işletmenin kârına ilişkin tablo halinde veriler elde edin.

Sorun çözümü

Problem 1'in çözümünde verilen metodolojiyi takip ederek, logaritmik, güç ve üstel eğilim çizgilerinin eklendiği bir diyagram elde ediyoruz (Şekil 7). Daha sonra, elde edilen trend çizgisi denklemlerini kullanarak, 2003 ve 2004 yılları için öngörülen değerleri de içeren, işletmenin karı için bir değerler tablosu dolduruyoruz. (Şekil 8).

Şek. 5 ve Şek. Logaritmik eğilime sahip modelin, yaklaşım güvenilirliğinin en düşük değerine karşılık geldiği görülebilir.

R2 = 0,8659

R2'nin en yüksek değerleri polinom eğilimi olan modellere karşılık gelir: ikinci dereceden (R2 = 0,9263) ve kübik (R2 = 0,933).

Sorun 3

Görev 1'de verilen, bir motorlu taşımacılık kuruluşunun 1995-2002 dönemine ilişkin kârına ilişkin veri tablosuyla aşağıdaki adımları uygulamanız gerekir.

    TREND ve BÜYÜME işlevlerini kullanarak doğrusal ve üstel eğilim çizgileri için veri serileri elde edin.

    TREND ve BÜYÜME işlevlerini kullanarak işletmenin 2003 ve 2004 yılı kârına ilişkin bir tahmin yapın.

    Orijinal veriler ve elde edilen veri serileri için bir diyagram oluşturun.

Sorun çözümü

Problem 1 için çalışma sayfasını kullanalım (bkz. Şekil 4). TREND işleviyle başlayalım:

    işletmenin kârına ilişkin bilinen verilere karşılık gelen TREND fonksiyonunun değerleriyle doldurulması gereken D4:D11 hücre aralığını seçin;

    Ekle menüsünden İşlev komutunu çağırın. Görüntülenen İşlev Sihirbazı iletişim kutusunda İstatistik kategorisinden TREND işlevini seçin ve ardından Tamam düğmesine tıklayın. Aynı işlem standart araç çubuğundaki (Fonksiyon Ekle) düğmesine tıklanarak da yapılabilir.

    Görüntülenen İşlev Bağımsız Değişkenleri iletişim kutusunda Bilinen_değerler_y alanına C4:C11 hücre aralığını girin; Bilinen_değerler_x alanında - B4:B11 hücre aralığı;

    Girilen formülün bir dizi formülü haline gelmesi için ++ tuş birleşimini kullanın.

Formül çubuğuna girdiğimiz formül şu şekilde görünecektir: =(TREND(C4:C11,B4:B11)).

Sonuç olarak, D4:D11 hücre aralığı TREND fonksiyonunun karşılık gelen değerleriyle doldurulur (Şekil 9).

İşletmenin 2003 ve 2004 yılı kârına ilişkin tahmin yapmak. gerekli:

    TREND fonksiyonu tarafından tahmin edilen değerlerin girileceği D12:D13 hücre aralığını seçin.

    TREND işlevini çağırın ve beliren İşlev Bağımsız Değişkenleri iletişim kutusunda Bilinen_değerler_y alanına - C4:C11 hücre aralığını girin; Bilinen_değerler_x alanında - B4:B11 hücre aralığı; ve New_values_x alanında - B12:B13 hücre aralığı.

    Ctrl + Shift + Enter tuş kombinasyonunu kullanarak bu formülü bir dizi formülüne dönüştürün.

    Girilen formül şu şekilde görünecektir: =(TREND(C4:C11;B4:B11;B12:B13)) ve D12:D13 hücre aralığı, TREND fonksiyonunun öngörülen değerleriyle doldurulacaktır (bkz. 9).

Veri serisi, doğrusal olmayan bağımlılıkların analizinde kullanılan ve doğrusal karşılığı TREND ile tamamen aynı şekilde çalışan BÜYÜME işlevi kullanılarak benzer şekilde doldurulur.

Şekil 10'da formül görüntüleme modundaki tablo gösterilmektedir.

İlk veriler ve elde edilen veri serileri için, Şekil 1'de gösterilen diyagram. 11.

Sorun 4

Bir motorlu taşıt işletmesinin sevkıyat servisi tarafından cari ayın 1'inden 11'ine kadar olan süre için hizmet başvurularının alınmasına ilişkin veri tablosu ile aşağıdaki işlemleri gerçekleştirmelisiniz.

    Doğrusal regresyon için veri serileri alma: EĞİM ve KESME NOKTASI işlevlerini kullanma; DOT işlevini kullanarak.

    LGRFPRIBL işlevini kullanarak üstel regresyon için bir dizi veri elde edin.

    Yukarıdaki işlevleri kullanarak, içinde bulunulan ayın 12'sinden 14'üne kadar olan dönem için sevk hizmetine başvuruların alınmasına ilişkin bir tahmin yapın.

    Orijinal ve alınan veri serileri için bir diyagram oluşturun.

Sorun çözümü

TREND ve BÜYÜME işlevlerinden farklı olarak, yukarıda listelenen işlevlerin (EĞİM, KESME NOKTASI, DİZGİ, LGRFPRIB) hiçbirinin regresyon olmadığını unutmayın. Bu işlevler yalnızca gerekli regresyon parametrelerini belirleyen destekleyici bir rol oynar.

EĞİLİM, KESME NOKTASI, DİZGİ, LGRFPRIB fonksiyonları kullanılarak oluşturulan doğrusal ve üstel regresyonlar için, TREND ve BÜYÜME fonksiyonlarına karşılık gelen doğrusal ve üstel regresyonların aksine, denklemlerinin görünümü her zaman bilinir.

1 . Denklemi kullanarak doğrusal bir regresyon oluşturalım:

y = mx+b

regresyon eğimi m, SLOPE işlevi tarafından belirlenir ve serbest terim b, KESMENOKTASI işlevi tarafından belirlenir.

Bunu yapmak için aşağıdaki eylemleri gerçekleştiriyoruz:

    orijinal tabloyu A4:B14 hücre aralığına girin;

    m parametresinin değeri C19 hücresinde belirlenecektir. İstatistik kategorisinden Eğim işlevini seçin; bilinen_değerler_y alanına B4:B14 hücre aralığını ve bilinen_değerler_x alanına A4:A14 hücre aralığını girin.

    Formül C19 hücresine girilecektir: =EĞİM(B4:B14,A4:A14);

    Daha sonra, C4 hücresine doğrusal regresyon formülünü şu biçimde girin: =$C*A4+$D. Bu formülde C19 ve D19 hücreleri mutlak referanslarla yazılmıştır (olası kopyalama sırasında hücre adresi değişmemelidir). Mutlak referans işareti $, klavyeden veya imleci hücre adresinin üzerine getirdikten sonra F4 tuşunu kullanarak yazılabilir.

2 Doldurma tutamacını kullanarak bu formülü C4:C17 hücre aralığına kopyalayın. Gerekli veri serisini elde ediyoruz (Şekil 12). Uygulama sayısının tam sayı olması nedeniyle Hücre Formatı penceresinin Sayı sekmesinde ondalık basamak sayısını içeren sayı biçimini 0 olarak ayarlamanız gerekmektedir.

y = mx+b

. Şimdi denklem tarafından verilen doğrusal bir regresyon oluşturalım:

DOT işlevini kullanarak.

    Bunu yapmak için:

    DOT işlevini C20:D20 hücre aralığına dizi formülü olarak girin: =(LINEST(B4:B14,A4:A14)). Sonuç olarak, C20 hücresinde m parametresinin değerini ve D20 hücresinde b parametresinin değerini elde ederiz;

    formülü D4 hücresine girin: =$C*A4+$D;

3 doldurma işaretini kullanarak bu formülü D4:D17 hücre aralığına kopyalayın ve istenen veri serisini elde edin.

. Aşağıdaki denklemle üstel bir regresyon oluşturuyoruz:

    LGRFPRIBL işlevi kullanılarak benzer şekilde gerçekleştirilir:

    C21:D21 hücre aralığında LGRFPRIBL fonksiyonunu bir dizi formülü olarak giriyoruz: =( LGRFPRIBL (B4:B14,A4:A14)). Bu durumda m parametresinin değeri C21 hücresinde, b parametresinin değeri D21 hücresinde belirlenecek;

    formül E4 hücresine girilir: =$D*$C^A4;

doldurma işaretçisi kullanılarak bu formül, üstel regresyona yönelik veri serilerinin yerleştirileceği E4:E17 hücre aralığına kopyalanır (bkz. Şekil 12).

Şek. Şekil 13'te gerekli hücre aralıklarıyla kullandığımız fonksiyonları ve formülleri görebileceğiniz bir tablo gösterilmektedir. Büyüklük 2 R isminde.

belirleme katsayısı

Bir regresyon bağımlılığı oluşturma görevi, R katsayısının maksimum değeri aldığı model (1)'in m katsayılarının vektörünü bulmaktır.

Nerede N R'nin önemini değerlendirmek için aşağıdaki formül kullanılarak hesaplanan Fisher F testi kullanılır:

- numune büyüklüğü (deney sayısı);

k, model katsayılarının sayısıdır. N Ve Eğer F veri için bazı kritik değerleri aşarsa k

Böylece, R'nin önemi yalnızca değeriyle değil aynı zamanda deney sayısı ile modelin katsayıları (parametreleri) sayısı arasındaki ilişkiyle de belirlenir. Aslında, basit bir doğrusal model için n=2 korelasyon oranı 1'e eşittir (bir düzlemde her zaman 2 noktadan geçen tek bir düz çizgi çizebilirsiniz). Bununla birlikte, eğer deneysel veriler rastgele değişkenlerse, böyle bir R değerine büyük bir dikkatle güvenilmelidir. Genellikle anlamlı R ve güvenilir regresyon elde etmek için deney sayısının model katsayılarının sayısını (n>k) önemli ölçüde aşmasını sağlamaya çalışırlar.

Doğrusal bir regresyon modeli oluşturmak için ihtiyacınız olan:

1) deneysel verileri içeren n satır ve m sütundan oluşan bir liste hazırlayın (çıkış değerini içeren sütun) e listede ilk veya son olmalıdır); Örneğin bir önceki görevin verilerini alalım, “Dönem No.” diye bir sütun ekleyelim, dönem sayılarını 1'den 12'ye kadar numaralandıralım. (bunlar değerler olacaktır) X)

2) Veri/Veri Analizi/Regresyon menüsüne gidin

"Araçlar" menüsünde "Veri Analizi" öğesi eksikse, aynı menüdeki "Eklentiler" öğesine gidip "Analiz paketi" onay kutusunu işaretlemelisiniz.

3) "Regresyon" iletişim kutusunda şunu ayarlayın:

· giriş aralığı Y;

· giriş aralığı X;

· çıktı aralığı - hesaplama sonuçlarının yerleştirileceği aralığın sol üst hücresi (bunların yeni bir çalışma sayfasına yerleştirilmesi önerilir);

4) "Tamam"a tıklayın ve sonuçları analiz edin.

Eğer bazıları fiziksel miktar başka bir niceliğe bağlıysa, bu bağımlılık y'nin farklı x değerlerinde ölçülmesiyle incelenebilir. Ölçümler sonucunda bir takım değerler elde edilir:

x 1, x 2, ..., xi, ..., xn;

y 1 , y 2 , ..., y ben , ... , y n .

Böyle bir deneyin verilerine dayanarak, y = ƒ(x) bağımlılığının bir grafiğini oluşturmak mümkündür. Ortaya çıkan eğri, ƒ(x) fonksiyonunun biçimini değerlendirmeyi mümkün kılar. Ancak bu fonksiyona giren sabit katsayılar bilinmemektedir. En küçük kareler yöntemi kullanılarak belirlenebilirler. Deneysel noktalar kural olarak tam olarak eğrinin üzerinde yer almaz. En küçük kareler yöntemi, deneysel noktaların eğriden sapmalarının karelerinin toplamının, yani;

2 en küçüğüydü.

Uygulamada, bu yöntem çoğunlukla (ve en basit şekilde) doğrusal bir ilişki durumunda kullanılır; Ne zaman y = kx veya

Doğrusal bağımlılık fizikte çok yaygındır. İlişki doğrusal olmadığında bile genellikle düz bir çizgi elde edecek şekilde bir grafik oluşturmaya çalışırlar. Örneğin, camın n kırılma indisinin ışık dalga boyu λ ile n = a + b/λ 2 ilişkisi ile ilişkili olduğu varsayılırsa, o zaman n'nin λ -2'ye bağımlılığı grafikte gösterilir.

Bağımlılığı göz önünde bulundurun Uygulamada, bu yöntem çoğunlukla (ve en basit şekilde) doğrusal bir ilişki durumunda kullanılır; Ne zaman(Orijinden geçen düz bir çizgi). Noktalarımızın düz çizgiden sapmalarının karelerinin toplamı φ değerini oluşturalım.

φ değeri her zaman pozitiftir ve noktalarımız düz çizgiye yaklaştıkça küçülür. En küçük kareler yöntemi, k değerinin, φ minimum değere sahip olacak şekilde seçilmesi gerektiğini belirtir.


veya
(19)

Hesaplama, k değerinin belirlenmesindeki ortalama karekök hatasının şuna eşit olduğunu göstermektedir:

, (20)
burada n, ölçümlerin sayısıdır.

Şimdi noktaların formülü karşılaması gereken biraz daha zor bir durumu ele alalım. y = a + bx(Orijinden geçmeyen düz bir çizgi).

Görev, verilen x i , y i değerlerini bulmaktır. en iyi değerler a ve b.

Tekrar telafi edelim ikinci dereceden form φ , miktara eşit x i, y i noktalarının düz çizgiden kare sapmaları

ve φ'nin minimum olduğu a ve b değerlerini bulun

;

.

.

Bu denklemlerin ortak çözümü şunu verir:

(21)

a ve b'nin belirlenmesindeki ortalama kare hataları eşittir

(23)

.  (24)

Bu yöntemi kullanarak ölçüm sonuçlarını işlerken, tüm verileri formül (19)(24)'te yer alan tüm miktarların ön olarak hesaplandığı bir tabloda özetlemek uygundur. Bu tabloların formları aşağıdaki örneklerde verilmiştir.

Örnek 1. Dinamiğin temel denklemi incelendi dönme hareketiε = M/J (başlangıç ​​noktasından geçen çizgi). M anının farklı değerlerinde, belirli bir cismin açısal ivmesi ε ölçüldü. Bu cismin eylemsizlik momentinin belirlenmesi gerekmektedir. Kuvvet momenti ve açısal ivme ölçümlerinin sonuçları ikinci ve üçüncü sütunlarda listelenmiştir. masa 5.

Tablo 5
N M, N m ε, s -1 M2 M ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Formül (19)'u kullanarak şunu belirleriz:

.

Kök ortalama kare hatasını belirlemek için formül (20) kullanıyoruz

0.005775kilogram-1 · M -2 .

Formül (18)'e göre elimizde

; .

SJ = (2,996 0,005775)/0,3337 = 0,05185 kg m2.

Güvenilirliği P = 0,95 olarak ayarladıktan sonra, n = 5 için Öğrenci katsayıları tablosunu kullanarak t = 2,78'i buluruz ve mutlak hatayı ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 belirleriz. kg m2.

Sonuçları forma yazalım:

J = (3,0 ± 0,2) kg m2;


Örnek 2. En küçük kareler yöntemini kullanarak metal direncinin sıcaklık katsayısını hesaplayalım. Direnç doğrusal olarak sıcaklığa bağlıdır

R t = R 0 (1 + α t°) = R 0 + R 0 α t°.

Serbest terim, 0 ° C sıcaklıkta R 0 direncini belirler ve eğim katsayısı, sıcaklık katsayısı α ile R 0 direncinin çarpımıdır.

Ölçüm ve hesaplamaların sonuçları tabloda verilmiştir ( Tablo 6'ya bakın).

Tablo 6
N t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2 ,10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

(21), (22) formüllerini kullanarak şunu belirleriz:

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ohm.

α'nın tanımındaki bir hatayı bulalım. O zamandan beri formül (18)'e göre elimizde:

.

(23), (24) formüllerini kullanarak şunu elde ederiz:

;

0.014126 Ohm.

Güvenilirliği P = 0,95 olarak ayarladıktan sonra, n = 6 için Öğrenci katsayıları tablosunu kullanarak, t = 2,57'yi buluruz ve mutlak hatayı Δα = 2,57 0,000132 = 0,000338 olarak belirleriz. derece -1.

α = (23 ± 4) 10 -4 dolu P = 0,95'te -1.


Örnek 3. Newton halkalarını kullanarak merceğin eğrilik yarıçapını belirlemek gerekir. Newton halkalarının r m yarıçapları ölçüldü ve bu m halkalarının sayıları belirlendi. Newton halkalarının yarıçapları, R merceğinin eğrilik yarıçapı ve halka sayısı ile aşağıdaki denklemle ilişkilidir:

r 2 m = mλR - 2d 0 R,

burada d 0 mercek ile paralel düzlem plaka arasındaki boşluğun kalınlığı (veya merceğin deformasyonu),

λ gelen ışığın dalga boyu.

λ = (600 ± 6) nm;
r2m = y;
m = x;
λR = b;
-2d 0 R = a,

o zaman denklem şu şekli alacaktır y = a + bx.

.

Ölçüm ve hesaplamaların sonuçları sisteme girilir. masa 7.

Tablo 7
N x = m y = r 2, 10 -2 mm2 m -¯ m (m -¯m) 2 (m -¯ m)y y - bx - a, 10 -4 (y - bx - a) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –