Що таке соціальне економічне явище? Соціально-економічні явища та методи дослідження зв'язків між ними. Обмеженість аналізованої методології

Нові соціально-економічні явища та тенденції

Реальна практика впровадження Інтернет технологій у різні соціально-економічні системи дає приклади та сюжети, які важливі для розуміння сучасного контексту формування мережевої економіки. Збір таких прикладів, їх систематизація і класифікація дуже важливі розуміння загальної структурисоціально-економічних змін та виявлення основних типів впливів Інтернет технологій на суспільство. Аналіз такого роду емпіричного матеріалу необхідний нам для розуміння того, що є проявами мережевої економіки, що є найбільш характерним об'єктом для її наукового дослідження, та які найбільш фундаментальні особливості відрізняють її від інших економічних укладів.

Приклади Інтернет інновацій та їх вплив на економіку

Спостереження за соціально-економічними додатками сучасних ІКТ показують, що найбільш помітними на даний моментявищами у віртуальному просторі мережі Інтернет є такі:

  • · "Робота" стає "телероботою", яку можна виконувати в режимі "телеприсутності";
  • · Торгівля перетворюється на "електронну комерцію", засіб платежу - "цифрову готівку", а бізнес - у "електронний бізнес";
  • · Підтримка контактів засноване на використанні електронної пошти, ICQі т.п., а обговорення набувають вигляду телеконференцій, веб-форумів, чатівта ін;
  • · "Робота в колективі" ґрунтується на "Комп'ютерних засобах колективної роботи", дух колективізму, комфортність та ефективність спільної роботивже залежить від groupware- Особливого класу комп'ютерних програм.

Дані явища нині більшою мірою пов'язані з розвитком бізнесу та відбивають поширене серед підприємців сучасне розуміння можливостей Інтернет технологій зниження витрат і підвищення ефективності бізнес діяльності.

За даними, опублікованими в журналі The Economist ще в 1999 р., близько 90% вищих менеджерів найбільших міжнародних компаній вважало, що Інтернет змінить або сильно вплине на глобальний ринок найближчі роки. Як приклад, віце-президент компанії Intel (світовий лідер з виробництва мікропроцесорів) стверджував, що через п'ять років усі компанії будуть Інтернет-компаніями, або вони будуть знищені конкурентами.

Зазначається, що внаслідок масового використання Інтернет технологій у діяльності компаній у загальноекономічному середовищі спостерігаються такі зміни: 1) формуються нові моделі ведення бізнесу (наприклад, інформаційне партнерство); 2)починають використовувати нові принципи управління бізнесом (приклад - менеджмент 5-го покоління); 3) з'являються нові правила успішної індивідуальної поведінки (наприклад, правила К. Келлі).

Перший пункт у цьому списку можна проілюструвати матеріалами, опублікованими в The Economist.

Використання компаніями Інтернету дозволяє їм створювати тристороннє "інформаційне партнерство" зі своїми постачальниками та замовниками. В умовах прямих та оперативних контактів через Інтернет ці зв'язки можуть перетворюватися на співпрацю, спрямовану на колективний пошук шляхів підвищення ефективності по всьому ланцюжку від попиту до споживання, а також спільного використання отриманих вигод. Прикладами є компанії Cisco System, General Electric, Dell, Ford, Visa та ін.

Ось, наприклад, короткий опис моделі бізнесу, яка використовується в компанії Dell (див. статтю):

Компанія щодня продає комп'ютери через свій веб-сайт на 15 млн. доларів. Однією з причин цього є "інформаційне партнерство" компанії з його постачальниками та замовниками. Постачальники компанії мають постійний онлайновий доступ до їх замовлень від компанії через її корпоративний екстранет (extranet). Вони можуть організувати своє виробництво та постачання так, щоб Dell постійно мав усе потрібне для належної організації виробничого процесу. Допускаючи постачальників у свою базу даних, Dell вважає, що вони будуть постійно знати про будь-які зміни в його попиті. З іншого боку, Dell через свій веб-сайт дає замовникам доступ до інформації про проходження замовлення через свій виробничий ланцюжок. Що дозволяє покупцям відстежувати зміни статусу у виконанні їх замовлення від моменту його початку на заводі до закінчення біля дверей покупця.

Як тільки фірми домагаються успіхів у зниженні їх витрат і підвищення ефективності за рахунок капіталовкладень у можливість вести свою діяльність через Інтернет, то у них з'являється зацікавленість, щоб їх постійні партнери зробили те саме. Дослідники відзначають, що це стимулює поширення використання Інтернет-технологій в економіці по всіх ланках виробничо-технологічних ланцюжків.

The Economist дає з цього приводу ще один приклад (див. ):

Британська фірма Safeway, яка є власником серії супермаркетів, сконструювала, засновану на Інтернеті, інтегровану систему (value chain), яка внесла революційні зміни до методів їхнього бізнесу. У розділі операцій із закупівлі вони відкрили доступ сотням постачальників до даних зміст їх складів. Це дозволило постачальникам отримувати інформацію в реальному часі про те, як продаються через кожний із торгових залів Safeway, що поставляються ними товари. У цих умовах постачальники можуть відстежувати зміну попиту та смаку покупців, а також стежити, щоб запас товарів на складах Safeway не зменшувався.

Супермаркет у свою чергу може тепер легко збільшувати кількість своїх постачальників, пропонуючи їм ширший вибір можливостей для співробітництва та кращі ціни, т.к. його витрати на створення таких можливостей стали значно меншими з використанням Інтернет технологій. Аналогічно витрати постачальників на контакти з супермаркетом також зменшилися.

У розділі операцій з продажу товарів використання Інтернет технологій дало можливість покупцям робити віддалені покупки (електронну комерцію) та отримати доступ до електронним каталогамсупермаркету. Сам супермаркет отримав від цього можливість збирати та аналізувати дані про переваги покупців, та використовувати їх для організації персоніфікованого просування (реклами) своїх товарів.

З використанням Інтернет технологій у процес функціонування підприємств вони отримують раніше не мислимі методи для інтеграції їхніх операцій із зовнішніми організаціями. При цьому основними напрямками розвитку компаній є: а) аутсорсинг (outsourcing); б) зменшення її розмірів; в) її реінженіринг; г) повну зміну змісту бізнесу. Вертикальна інтеграція підприємств, що була основним досягненням індустріальної епохи, у нових умовах то, можливо навіть небезпечна, т.к. малоймовірно, що окрема взята компанія буде однаково гарна у всіх ланках свого бізнес-процесу.

У цих умовах цілями великої компанії має стати її перетворення на своєрідний E-business комутатор, який, як це видно з попередніх прикладів, по-перше, дає дрібним фірмам стимул для використання Інтернет технологій, а також створює їм середовище для дешевшого моніторингу попиту та пропозиції. Метою невеликої фірми в цих умовах стає доказ своєї життєвої необхідностідля потенційних партнерів Компанії, які використовують дані інновації, повинні бути готові допустити своїх постачальників і замовників до внутрішніх процесів своєї роботи, а також отримати аналогічне розуміння бізнес-процесів своїх партнерів. Все це створює абсолютно нові стандарти на відкритість та прозорість компаній. У результаті можна говорити, що Інтернет посилює тенденцію до розукрупнення економічних структур.

А ось як описуються принципи менеджменту 5-го покоління, які, на думку їх автора, є ефективнішими за традиційні, якщо на підприємстві добре розвинені інформаційні технології (з огляду "Менеджмент п'ятого покоління: підприємство як мережа людей", див. [Чарльз Севедж]) :

  • · Зв'язування не начальника з підлеглим, а рівноправних людей (людям мають забезпечуватися прямі контакти один з одним);
  • · Кожен співробітник повинен мати доступ до будь-якої інформації про підприємство; має бути забезпечений доступ до знань будь-якого співробітника підприємства; роботою повинні займатися "команди", які працюють над певним проектом, або з певним замовником, або класом клієнтів; команди збираються із співробітників різних відділів, або, точніше, з людей, компетентних у різних галузях (у виробництві, конструюванні, фінансах, ринках тощо);
  • · Підтримка цілісності підприємства за рахунок створення мережі команд (ці команди, ці підрозділи можуть і навіть повинні бути в основному "потенційними", щоб підприємство завжди могло відреагувати на зовнішні умови, нові задуми або знання, що змінюються. "В організації повинна бути інституціалізована готовність до змін ");
  • · робота в режимі реального часу, яка включає в себе запаралелювання робіт та ітеративно-комунікаційну їх організацію (замість послідовної та кооперативної);
  • · Створення техніко-організаційних умов для формування "віртуальних" команд, члени яких можуть перебувати в різних географічних точках.

Відомі частково екстравагантні, але чудові правила успішної індивідуальної поведінки в мережевій економіці, сформульовані Кевіном Келлі. Ось деякі з них (див.):

  • · Все дешевшає в міру вдосконалення. Слід винаходити швидше, ніж новація стане звичною.
  • · Розвивайте не продукт, а мережу ділових зв'язків. Відданість стандартам, а чи не фірмі.
  • · Потрібно прагнути стати нехай менш досконалим, але більш гнучким та децентралізованим, щоб на піку успіху провести демонтаж старого та йти до нового.
  • · Нові види постійно замінюють старі. Балансування на межі хаосу та самооновлення.
  • · Не вирішуйте проблеми, шукайте нові можливості. Повтори, копіювання, автоматизація – знецінюються, а оригінальність, уява, творчість – зростають у ціні ( повний списокз 12 правил у перекладі російською мовою див. в [Парінов С., Яковлєва Т.]).

Ці правила поведінки були б повним абсурдом для традиційних соціально-економічних організацій 20-го століття, але в нових умовах вони дійсно не тільки практично здійсненні, а й повністю відповідають духу "інформаційного партнерства", "віртуальних команд" і т.п.

Переходячи до аналізу впливу мережевих інновацій лише на рівні компанії, можна тут помітити присутність знайомих ознак. Коли описані вище моделі ведення бізнесу, принципи менеджменту та індивідуальної поведінки глибоко проникають у внутрішньофірмове середовище, її організаційна форма набуває новий вигляд, Який отримав назву: "мережева форма організації".

Вважається, що головною відмінністю мережевих форм організації від ринкових та ієрархічних є: а) тривалість зв'язків між членами організації, які б) регламентуються тими самими особами без участі вищої влади. Д. Подольни і К. Пейдж описують мережеві зміни, що відбуваються в останні рокиу внутрішньому середовищі традиційних ієрархічних фірм та організацій, таким чином:

  • · Одна з основних відмінностей мережевої форми організації від традиційної полягає в етичних чи ціннісних орієнтаціях її учасників;
  • · центральним елементом є "дух доброї волі" (spirit of goodwill), який означає використання "голосу" замість "сили" для вирішення проблем, а також високий рівеньдовіри між учасниками (покупець намагається працювати з продавцем, беручи до уваги недоліки у його діяльності замість того, щоб змінити продавця);
  • · норми взаємності лежать в основі мережевої організації (у відносинах між учасниками переважають почуття взаємних зобов'язань та відповідальності, а не бажання отримати вигоду з довіри);
  • · Члени мережевої організації становлять "моральне співтовариство", в якому передбачається довірчу поведінку, розуміння нормативних стандартів, де опортунізм має мало шансів на існування.

Мережева форма діє додатково до ринкового та ієрархічного механізмів регулювання і тому конкурує з іншими двома за обслуговування взаємодій між людьми в економіці.

Переваги мережевих організацій описуються так:

  • 1. Освоєння нових навичок чи знань проходить краще, ніж у ієрархічної організації, т.к. мережна форма пропонує кращу різноманітність процедур пошуку, ніж ієрархія, та забезпечує учасників багатшою та комплекснішою інформацією, ніж ринок. Це досягається двома шляхами. Перший – стимулювання навчання за рахунок забезпечення швидкого поширення корисної інформації. Другий – стимулювання синтезу нових знань та інформації на основі вже існуючої у членів організації.
  • 2. Легітимність або статус мережевої організації, більшою мірою, ніж у традиційної організації, визначається статусом її членів і навпаки, статус мережевої організації легко поширюється на її членів. Ця легітимність чи статус можуть у свою чергу мати певні економічні переваги для учасників, пов'язані, наприклад, з її виживанням, зростанням та прибутковістю.
  • 3. Економічні переваги мережевої форми організації виявляються у певному зниженні транзакційних витрат проти традиційної командно-иерархической формою. Проте головною перевагою є вартісні, а якісні зміни. Наприклад, більше висока якістьпродукції як наслідок кращих комунікацій між покупцем та постачальником з питань, що мають відношення до якості. Інший приклад - підвищення адаптивності мережевої організації до непередбачуваних змін у навколишньому середовищі.
  • 4. Серед інших переваг наголошується на можливості мережевих організацій послаблювати зовнішні обмеження або невизначеність шляхом посилення своїх зв'язків з конкретними джерелами, від яких ці обмеження залежать. Мережева організація фактично є мережею малих фірм або виробників, що дає індивідам у порівнянні з великими бюрократичними формами організацій більшу автономність, меншу нерівність у розподілі багатства та посилює дух спільноти.

Коли мережеві організації починають домінувати у загальноекономічному середовищі, можна говорити, що на даному ринку чи в цій країні сформувалися необхідні умовивиникнення мережевої економіки. Зазначається, що мережева економіка матиме такі особливості (див. ):

  • 1. Купують лише ті продукти, які можна скуштувати (experience good). "Ви не можете показати людям наскільки цінний ваш продукт, поки ви не дасте їм його спробувати. Але як тільки вони зробили це, вони вже не мають причин, щоб його купувати. Чому вони повинні платити за те, що вони вже знають? Але якщо Продавець не дасть людям можливість ознайомитися з тим, що він продає, те, як вони дізнаються, яку вигоду вони отримають, купивши цей продукт?
  • 2. Структура витрат мережевої економіки (майже нульові граничні витрати на розширення випуску інформаційних продуктів) не дозволяє виживати багатьом конкурентам в одному сегменті ринку. Залишаться сильніші, т.к. витрати споживача на перемикання від одного постачальника до іншого дорівнюють нулю.
  • 3. Чим більше одиниць продукту продано, тим більша ймовірність, що користувач знайде додаткові продукти або послуги, які використовуватимуть або посилюватимуть цінність основного продукту (прикладом основного продукту може бути персональний комп'ютер IBM PC або операційна система Windows, для використання з якими було вироблено масу додаткових продуктів). У мережевій економіці високі обсяги виробництва як дешевше обходяться виробнику, а й є ціннішими споживачам. Отже, зростання стає стратегічним імперативом, т.к. Тільки великий обсяг виробництва може зробити товар цінним споживача.

Однак сучасні ІКТ підривають деякі властивості економіки, які роблять "невидиму руку" ринкової системи ефектним і ефективним засобомдля організації виробництва та розподілу продукції. При цьому ринок втрачає такі зі своїх фундаментальних засад (див. ):

  • 1. Винятковість. У мережевий економіці власник товару неспроможна простими і дешевими засобами виключити конкурентів зі свого сегмента. «За відсутності винятковості... потенційні учасники ринку втрачають ефективний спосібдати знати ринковій системі, наскільки сильний їхній попит і на що саме він спрямований»;
  • 2. Змагальність. Ослаблена в мережевій економіці, оскільки гранична вартість тиражування «цифрової» продукції (digital goods) стає близькою до нуля. У одвічній боротьбі за покупця (якщо це відбувається в мережевій економіці) зникають конкурентні відмінності між продавцями щодо їх витрат на обслуговування додаткових замовлень. Через це практично недосяжні такі характеристики «хорошого» ринку як «конкуренція з метою обмеження проявів приватної економічної могутності, віддача від інвестицій та трудових зусиль відповідно до доданої соціальної цінності, достатність стимулів для інновацій та розвитку нових продуктів»;
  • 3. Прозорість. Багато секторах економіки купівля товарів нині перестає бути «прозорою» т.к. відповідна їй транзакція, як правило, одразу не закінчується. Акт купівлі, все більше означає виникнення довгострокових відносин між продавцем і покупцем. Ця нова риса особливо добре помітна по ринку програмних продуктів: періодичне оновлення версій програмного забезпечення перетворює акт купівлі на процес довгострокового «співробітництва» між покупцем і продавцем.

МЕТОДИЧНІ ВКАЗІВКИ З ТИПОВИМИ ПРИКЛАДАМИ

Статистика у сучасному світіє системою збору, обробки та аналізу інформації. Вона покликана забезпечувати кількісні оцінки та прогноз основних макроекономічних показників, а також мікроекономічних, таких як обсяги продажів, ступінь ризику в банківській справі, страхуванні та провадженні, характеристики споживчої поведінки населення, демографічної та соціальної ситуаціїі т.п.

В умовах ринкової економіки суттєво змінилися вимоги керуючих структур до обсягу, складу, достовірності та оперативності інформації. Об'єктивні умови, коли основою економіки стають не держпідприємства, а мільйони агентів ринку, ведуть до переходу від суцільного обліку до вибіркового за багатьма системами показників. На основі вибіркових даних і здійснюються статистичні побудови, що дозволяють судити про процеси, що відбуваються в суспільстві.

У ринкових умовах, коли товаровиробник незалежний і звернення до підприємства, фірмі не має директивного характеру, необхідно максимально використовувати інформаційні можливості обмежених первинних даних для розробки вільної макроекономічної інформації. Активне інтегрування економіки Росії у світове співтовариство вимагало від неї переходу на прийняту повсюдно систему обліку та статистики, яка дозволяє адекватно оцінювати соціально-економічне становище країни, розмовляти з міжнародними партнерами однією статистичним мовою.

Динамізм сучасної економіки Росії та регіонів вимагає щоквартальної, щомісячної оцінки виробництва та використання валового внутрішнього продукту, тобто. аналізу підсумків діяльності як сфери матеріального виробництва, так і секторів економіки – комерційних банків, страхових компаній, бірж та інших елементів ринкової інфраструктури.

Важливого значення набувають зараз і технології збору, обробки та дослідження даних про соціально-економічні та демографічні процеси, що характеризують економічно активне населення, фактичну та приховане безробіття, рівень життя та купівельну спроможність різних верств населення.

Зміни, що відбуваються в суспільстві, призводять до того, що наші знання про економіку перехідного періоду завжди будуть відставати від потреб управління. У зв'язку з цим статистична діяльність має містити прогностичну складову, здатну заздалегідь сигналізувати про появу тих чи інших «особливих» (зокрема і кризових) ситуацій, якщо у системі управління не відбудуться зміни.

Значна потреба в економістах-статистиках сьогодні відзначається на мікроекономічному рівні у підприємств, установ та фірм різних формвласності. Слід очікувати, що у цій сфері працюватиме більша частина випускників вишів відповідної спеціальності.

Таким чином, у своїй діяльності економісту-статистику доводиться вирішувати питання, пов'язані тією чи іншою мірою з наступними розділами статистичної науки:

  • методологією соціально-економічних вимірювачів, яка визначає, що саме, які показники необхідно вимірювати для успішного вирішення основних завдань управління соціально-економічними процесами;
  • теорією та практикою вибіркових статистичних обстежень, що забезпечують необхідний інструментарій для правильної організаціївибірки та науково обґрунтованих методів її математичного аналізу;
  • методологією сучасного математико-статистичного аналізу та прогнозування соціально-економічних даних, що забезпечує найкращий вибір(залежно від поставленої мети) того чи іншого математико-статистичного методу, реалізованого у вигляді проблемно або методоорієнтованих статистичних програмних систем.

Все сказане вище дозволяє сформулювати вимоги до знань майбутніх фахівців. Економісти-статистики мають отримати хорошу гуманітарну, зокрема, економічну, мовну та правову підготовку, володіти міжнародною методологією статистики, добре орієнтуватися у методології економічних, соціально-економічних вимірів, бухгалтерському обліку, бути висококваліфікованими користувачами сучасних інформаційних технологій. Вони мають володіти методами комп'ютерних досліджень, математико-статистичним інструментарієм від елементарних до багатовимірних статистичних методів аналізу даних, методами економетрики та аналізу динаміки та прогнозування.

Сьогодні потрібні фахівці, які не лише володіють досвідом попередніх поколінь, а й готові до зустрічі з новими постановками завдань, зумовленими специфікою Росії та перехідного періоду.

Нині економісти-статистики мають більше уваги приділяти вдосконаленню та розширенню сфери застосування статистичних методів. Причому їх необхідно застосовувати в комплексі з методами математичної статистики, моделювання та прогнозування: це дозволяє робити глибший аналіз явищ та процесів, отримувати науково обґрунтовані висновки, точніше визначати об'єктивні тенденції та закономірності. Слід відрізняти статистику як суспільну науку від математичної статистики, прийоми якої застосовуються для обробки масових даних як суспільних, так і природних явищ. Ці науки мають багато спільного. У суспільних науках, як і в науках про природу, використання математико-статистичних методів передбачає наявність безлічі факторів або елементів, що зазнають швидких змін. Звідси випливає спільність прийомів обробки та оцінки даних. Відмінність між ними полягає в тому, що математична статистика як частина математики розглядає масові кількісні відносини в загальному вигляді, абстраюно, тоді як соціально-економічнастатистика вивчає їх у зв'язку з якістю, конкретними умовами та місцем.

У цій темі слід усвідомити такі найбільш використовувані в економічній практицістатистичні методи, як кореляційний та регресійний аналіз.

Значну увагу слід приділити логічного аналізу вихідної інформації та економічної інтерпретації одержуваних результатів, а також розгляд детально розроблених типових прикладів, взятих з економічної практики.

Приклади ілюструють необхідність комплексного використання багатовимірних статистичних методів. При цьому кореляційний аналізвикористовується, з одного боку, на етапі попереднього аналізу виявлення мультиколлинеарности, з другого боку - в оцінці адекватності регресійної моделі. На остаточному етапі вибору моделі рекомендується застосовувати як економічні, і статистичні критерії. Поряд із точковими оцінками розглядаються методи побудови інтервальних оцінок коефіцієнтів та рівнянь регресії.

Розрізняють два види залежності між економічними явищами: функціональну та статистичну. Залежність між двома величинами X таУ, що відображають два явища, називають функціональною, при цьому кожному значенню величини Xмає відповідати єдине значення величини Ута навпаки. Прикладом функціонального зв'язку в економіці може бути залежність продуктивності праці від обсягу виробленої продукції та витрат робочого часу. Слід зазначити, що якщо X- детермінована, не випадкова величина, те й функціонально залежить від неї величина Утакож є детермінованою. Якщо ж X- величина випадкова, те й Уматиме випадковий характер.

Однак набагато частіше в економіці має місце нефункціональна, а статистична залежність, коли кожному фіксованого значеннянезалежної змінної Xвідповідає не одне, а безліч значень залежної змінної У, причому заздалегідь не можна сказати, яке саме значення набуде У.Це з тим, що у, крім змінної X,впливають і численні випадкові неконтрольовані фактори. У цій ситуації У- Випадкова величина, а змінна Xможе бути як детермінованою, так і випадковою величиною. Приватним випадком статистичної залежності є кореляційна, при якій функціональною залежністю пов'язані фактор Xта середнє значення (математичне очікування) результативного показника У.

Статистична залежність може бути виявлена ​​лише за результатами досить великої кількості спостережень. Графічно статистична залежність двох ознак може бути представлена ​​за допомогою поля кореляції, при побудові якого на осі абсцис відкладається значення факторної ознаки X, а по осі ординат - результуючого У.

Як приклад на рис. 13.1 представлені дані, що ілюструють пряму та зворотну залежність між хі у.У разі (а) це пряма залежність між, наприклад, середньодушовим доходом (л;) та заощадженням (у) у сім'ї. У випадку (б) йдеться про зворотної залежності. Така, скажімо, залежність між продуктивністю праці (х) та собівартістю одиниці продукції (У).На цьому малюнку кожна точка характеризує об'єкт спостереження зі своїми значеннями Xі у.

Мал. 13.1. Поле кореляції: а - пряма залежність між хі уб - зворотна

На малюнку 13.1 також представлені прямі лінії, лінійні рівняннярегресії типу у= р 0 + Р г т, що характеризують функціональну залежність між незалежною змінною хта середнім значенням результативного показника у.Таким чином, за рівнянням регресії, знаючи х,можна відновити лише середнє значення у.

Ставлячи завдання статистичного дослідження залежностей, важливо добре представляти кінцеву прикладну мету побудови моделей статистичної залежності між результативним показником, з одного боку, і перемінними, що пояснюють. x v x 2 .... x h- з іншого (досі розглядалася лише одна пояснювальна змінна л*). Зазначимо дві основні цілі подібних досліджень.

Перша з них полягає у встановленні самого факту наявності (або відсутності) статистичної значущості зв'язку між Yі X.За такої постановки завдання статистичний висновок має альтернативну природу – «зв'язок є» чи «зв'язку немає». Він зазвичай супроводжується лише чисельною характеристикою – вимірником ступеня тісноти досліджуваної залежності. Завдання оцінки рівня тісноти зв'язку між показниками вирішується методами кореляційного аналізу. При цьому вибір форми зв'язку між результативним показником Y

та пояснювальними змінними х ідг 2,___» х доі навіть вибір складу останніх грає допоміжну роль, покликану максимізувати характеристику ступеня тісноти зв'язку.

Друга мета зводиться до прогнозу, відновлення невідомих індивідуальних чи середніх значень результативного показника Yза заданими значеннями пояснюють змінних методами регресійного аналізу. При цьому вибір форми та виду залежності Yвід пояснюючих змінних х і х 2,..., х доорієнтований на мінімілізацію сумарної помилки, тобто. відхилень значень, що спостерігаються Yвід значень, отриманих за регресійною моделлю.

Кореляційний аналіз - один із методів статистичного аналізу взаємозалежності кількох ознак.

Основне його завдання полягає в оцінці кореляційної матриці генеральної сукупностіза вибіркою, що визначається на основі цієї матриці приватних та множинних коефіцієнтів кореляції та детермінації.

Парний та приватний коефіцієнти кореляції характеризують тісноту лінійної залежностіміж двома змінними відповідно на фоні дії та при виключенні впливу всіх інших показників, що входять у модель. Вони змінюються в межах від -1 до +1, причому чим ближче коефіцієнт кореляції за модулем до 1, тим сильніша залежність між змінними. Якщо коефіцієнт кореляції більший за нуль, то зв'язок прямий, а якщо менше - зворотний.

Множинний коефіцієнтКореляція характеризує тісноту лінійного зв'язку між однією змінною (результативною), обумовленою впливом всіх інших змінних (аргументів), що входять у модель.

Вихідною для аналізу є матриця

Розмірності пх до у/-я рядок якої характеризує /-е спостереження (об'єкт) по всьому допоказниками (/" = 1,2,..., к).

У кореляційному аналізі матрицю Xрозглядають як вибірку обсягу пз А-вимірної генеральної сукупності, що підкоряється A-вимірному нормальному закону розподілу.

За вибіркою визначають оцінки параметрів генеральної сукупності, а саме: середній вектор х,вектор середніх квадратичних відхилень sта кореляційну матрицю Rпорядку А:

де х~- значення j-го показника для /-го спостереження;

r jf - вибірковий парний коефіцієнт кореляції, що характеризує

тісноту лінійного зв'язку між показниками. При цьому r jtє оцінкою генерального парного коефіцієнта кореляції p jt.

Матриця Rє симетричною (г і =г;/) та позитивно визначеної.

Крім того, знаходяться точкові оцінки приватних та множинних коефіцієнтів кореляції будь-якого порядку (порядок визначається числом фіксованих змінних). Наприклад, приватний коефіцієнт кореляції (до- 2)-го порядку між змінними х (і х 2дорівнює:

де Rj t- алгебраїчне доповнення елемента кореляційної матриці R.

При цьому Rji = (-1У + ",

де Mj.- Мінор, тобто. визначник матриці, що отримується з матриці Rшляхом викреслення у-го рядказ одного стовпця.

Множинний коефіцієнт кореляції (до - 1)-го порядку результативної ознаки л;, визначається за формулою

де Щ- Визначник матриці R.

Значимість приватних та парних коефіцієнтів кореляції, тобто. гіпотеза Н 0: р = 0, перевіряється за / - критерієм Стиодеїту. Значення критерію, що спостерігається, знаходиться за формулою

де г- Оцінка приватного або парного коефіцієнта кореляції р;

I- Порядок приватного коефіцієнта кореляції, тобто. число змінних, що фіксуються (для парного коефіцієнта кореляції / = 0).

Нагадаємо, що перевірений коефіцієнт кореляції вважається значним, тобто. гіпотеза Н(): р = 0 відкидається з імовірністю помилки а, якщо / набл по модулю буде більше, ніж значення / к0 , що визначається за таблицями /-розподілу для заданого аіу = і-/-2.

При визначенні з надійністю довірчого інтервалу для значущого парного або приватного коефіцієнта кореляції рвикористовують Z-перетворення Фішера і попередньо встановлюють інтервальну оцінку Z:

де t yобчислюють за таблицею значень інтегральної функції Лапласа за умови Ф(/,) = у,.Значення Z" визначають за таблицею Z-npe-освіти за знайденим значенням м.Функція Z "- непарна, тобто.

Зворотний перехід від Z до рздійснюється також за таблицею Z-перетворення, після використання якої отримують інтервальну оцінку для рз надійністю у.

Таким чином, з ймовірністю угарантується, що генеральний коефіцієнт кореляції рперебуватиме в інтервалі (r mjlI , г^).

Значимість множинного коефіцієнта кореляції (і його квадрата - коефіцієнта детермінації) перевіряється за критерієм.

Наприклад, для множинного коефіцієнта кореляції p v2 ..... *

перевірка значимості зводиться до перевірки гіпотези, що генеральний множинний коефіцієнт кореляції дорівнює нулю, тобто. Н 0 : p xil до= 0, а значення статистики, що спостерігається, знаходиться за формулою

Множинний коефіцієнт кореляції вважається значним, тобто. має місце лінійна статистична залежність між л*, та іншими змінними х 2 ,..., х до,якщо F Ha6jI > де F mвизначається за таблицею F-розподілу для заданих a, v = до- 1, v 2 = п - до.

Регресійний аналіз – це статистичний метод дослідження залежності результативної величини Yвід пояснюючих змінних (аргументів) х,-(/ = 1,2, ..., &), що розглядаються в регресійному аналізі як невипадкові величини незалежно від істинного закону розподілу x f.

Зазвичай передбачається, що випадкова величина Yмає нормальний закон розподілу з умовним математичним очікуванням у =Ф(лг„ ..., х до),що є функцією від аргументів..., х доз постійною, незалежною від аргументів дисперсією сг.

Для проведення регресійного аналізу з (до+ 1)-мірної генеральної сукупності (у, х ]ул: 2 x Jy ..., х до)береться вибірка обсягом і, і кожне /-е спостереження (об'єкт) характеризується значеннями змінних (y hх л, ДГ/2, x U y ..., x ik),де Хц - значення у-й змінної для y-го спостереження (/ = 1, 2 ...п),у, - значення результативної ознаки для у"-го спостереження.

Найчастіше використовувана множинна лінійна модель регресійного аналізу має вигляд

де р ? - Параметри регресійної моделі;

Г. - випадкові помилки спостереження, не залежні один від одного, мають нульову середню та дисперсію а2.

Зазначимо, що модель справедлива всім / = 1, 2,..., плінійна щодо невідомих параметрів Ро, Pi,..., Р„ Р* та аргументів.

Як випливає з моделі, коефіцієнт регресії р показує, на яку величину в середньому зміниться результативна ознака у, якщо змінну x hзбільшити на одиницю при постійних значеннях інших аргументів, тобто. є нормативним коефіцієнтом. У матричній формі регресійна модель має вигляд

де Y- випадковий вектор-стовпець розмірності (n х 1) значень результативної ознаки, що спостерігаються.

X- матриця розмірності пх (до+ 1) значень аргументів, що спостерігаються, елемент матриці х &сприймається як невипадкова величина (/= 1,2,..., = 0, 1..... k; x i0 = 1);

р - вектор-стовпець розмірності (А+1) х 1 невідомих, що підлягають оцінці параметрів моделі (коефіцієнтів регресії);

е - випадковий вектор-стовпець розмірності (пх 1) помилок спостережень (регресійних залишків), компоненти вектора е, незалежні один від одного, мають нормальний закон розподілу з нульовим математичним очікуванням (Л/е, = 0) та невідомою постійною дисперсією a 2 (De., = а 2) .

У матричному вигляді модель регресії

У першому стовпці матриці Xвказуються одиниці за наявності вільного члена моделі. Тут передбачається, що існує змінна лг 0 яка у всіх спостереженнях приймає значення, рівні 1.

Основне завдання регресійного аналізу полягає у знаходженні за вибіркою обсягом поцінки невідомих коефіцієнтів регресії ро, Pi, ..., Р у, ..., р * моделі, тобто. вектор р.

Бо в регресійному аналізі х,розглядається як невипадкові величини, а Me, = 0, то рівняння регресії має вигляд:

для всіх / = 1,2,я, або в матричній формі:

де Y-вектор-стовпець з елементами

Для оцінки вектора-стовпця р найчастіше використовують метод найменших квадратів, згідно з яким як оцінку приймають вектор-стовпець Ь,який мінімізує суму квадратів відхилень значень, що спостерігаються y hвід модельних значень у,-,тобто. квадратичну форму:

де символом Тпозначена транспонована матриця.

Спостережені та модельні значення результативної ознаки упоказано на рис. 13.2.


Мал. 13.2.

Диференціюючи квадратичну форму та прирівнюючи приватні похідні до нуля, отримаємо систему рівнянь:

вирішуючи яку отримаємо вектор-стовпець оцінок b, де b = (6 0 , 6„ Ь до) т.Згідно з методом найменших квадратів, вектор-стовпець оцінок коефіцієнтів регресії виходить за формулою

де X 1- транспонована матриця.V;

(Х Г Х) ~ 1- матриця, зворотна матриці Х Т Х.

Знаючи вектор-стовпець 6-оцінок коефіцієнтів регресії, знайдемо оцінку рівняння регресії:

або в матричному вигляді:

де - Вектор розрахункових значень результативного показника.

Оцінка коваріаційної матриці вектора коефіцієнтів регресії визначається виразом:

де s 2 - незміщена оцінка залишкової дисперсії про 2 рівна:

На головній діагоналі коварійної матриці знаходяться дисперсії коефіцієнтів регресії:

Значущість рівняння регресії, тобто. гіпотеза Я 0: р = О, або що (р 0 = Р! = ... = р * = 0), перевіряється за F-критерієм, значення якого визначається за формулою

де

За таблицею ^-розподілу для заданих а та vi = до+ 1, уг = л - - до-знаходять FKp.

Гіпотеза Я і відхиляється з імовірністю а, якщо Я набл > F Kp . На цьому випливає, що рівняння є значним, тобто. хоча один із коефіцієнтів регресії відмінний від нуля.

Для перевірки важливості окремих коефіцієнтів регресії, тобто. гіпотези Але: р, = 0, де j = 1,2,..., довикористовують /-критерій і обчислюють / на бл(А) = bj/Sfy.За таблицею /-розподілу для заданого ата v = п - до - 1 знаходять/кт.

Гіпотеза Я 0 відкидається з імовірністю а, якщо j/ Ha6 J > t Kр.З цього випливає, відповідний коефіцієнт регресії р/ значимий, тобто. Р/ Ф 0 та змінну х,-слід включити у модель. В іншому випадку коефіцієнт регресії незначний і відповідна змінна модель не включається. Після перевірки значущості коефіцієнтів регресії реалізується алгоритм покрокового регресійного аналізу, що полягає в тому, що виключається одна з незначних змінних, якій відповідає мінімальне по абсолютній величині значення /на6л. Після цього знову проводять регресійний аналіз з числом факторів, зменшеним на одиницю. Алгоритм закінчується отриманням рівняння регресії з усіма значимими за економічними та статистичними критеріями коефіцієнтами.

Існують інші алгоритми покрокового регресійного аналізу, наприклад з послідовним включенням чинників.

Поряд із точковими оцінками b hгенеральних коефіцієнтів регресії р, регресійний аналіз дозволяє отримувати й інтервальні оцінки останніх із довірчою ймовірністю у.

Інтервальна оцінка з довірчою ймовірністю для параметра (З у має вигляд:

де / а знаходять по таблиці / - розподілу при ймовірності а = 1 та числі ступенів свободи v = п-до - 1.

Інтервальна оцінка показує, на яку величину в кращому і гіршому випадку зміниться з вірогідністю увеличина у,якщо х,-збільшити на одиницю.

Інтервальна оцінка для рівняння регресії уу точці, що визначається вектором-стовпцем початкових умов

записується у вигляді

Інтервал передбачення у„., з довірчою ймовірністю у визначається як

де/а визначається за таблицею/-розподілу при v=l hv = п-к- 1.

У міру видалення вектора початкових умов х°від вектора середніх хширина довірчого інтервалу при заданому значенні у збільшуватиметься (рис. 13.3), де х = (1, ... 9 х к).

Мал. 13.3. Точкова;" та інтервальна [у-5

Однією з основних перешкод ефективного застосуваннямножинного регресійного аналізу є мул'тіколліієарність.Вона пов'язана з лінійною залежністю між аргументами х 2, .... х до.В результаті мультиколлінеарності матриця парних коефіцієнтів кореляції та матриця Х Г Хстають слабообумовленими, тобто. їх визначники близькі до нуля.

Це призводить до нестійкості оцінок коефіцієнтів регресії, завищення дисперсії. s 2 hоцінок коефіцієнтів b hтому що в них

вирази входить зворотна матриця (Х Р Х) Л,отримання якої пов'язане з розподілом на визначник матриці (Х * Х).Звідси випливають занижені значення Крім того, мультиколлінеарність призводить до завищення значення множинного коефіцієнта кореляції.

Насправді про наявність мультиколлинеарности зазвичай судять по матриці парних коефіцієнтів кореляції. Якщо один із елементів матриці Rбільше 0,8, тобто. f> 0,8, то вважають, що має місце мультиколлінеарність, і до рівняння регресії слід включати лише один із показників - x tабо д

Щоб позбутися цього негативного явища зазвичай використовують алгоритм покрокового регресійного аналізу або будують рівняння регресії на головних компонентах.

Приклад 1. Згідно з даними 20 сільськогосподарських районів (п = 20) потрібно побудувати регресійну модель врожайності на основі наступних показників:

у- урожайність зернових культур (ц/га); т, - число колісних тракторів (наведеної потужності) на 100 га; х 2- кількість зернозбиральних комбайнів на 100 га; х 3- Число знарядь поверхневої обробки ґрунту на 100 га; х 4- кількість добрив, які витрачаються на гектар; х 5- кількість хімічних засобів оздоровлення рослин, які витрачаються на гектар.

Вихідні дані для аналізу наведено у табл. 13.1.

Вихідні дані для аналізу

Таблиця 13.1

Рішення. З метою попереднього аналізу взаємозв'язку показників побудовано матрицю R.

Таблиця 13.2

Парні коефіцієнти кореляції

Аналіз матриці парних коефіцієнтів кореляції показує, що результативна ознака найбільш тісно пов'язана з показником дг 4 - кількістю добрив, що витрачаються на гектар.

У той самий час зв'язок між аргументами досить тісний. Так, існує практично функціональний зв'язок між числом колісних тракторів (л,) та числом знарядь поверхневого обробітку ґрунту.

Про наявність мультиколінеарності свідчать також коефіцієнти кореляції:

Щоб продемонструвати негативний впливмультиколлінеарності, розглянемо розраховане на ЕОМ регресійне рівняння врожайності, включивши до нього всі вихідні показники:

У дужках вказані / Н авя(Р/) = h- розрахункові значення /-критерію для перевірки гіпотези про значущість коефіцієнта регресії Я і: Р, = О, j = 1, 2, 3, 4, 5. Критичне значення /кп = 1,76 знайдено за таблицею /-розподілу при рівні значимості a = 0,1 та числі ступенів свободи v = 14.

З рівняння випливає, що статистично значущим є коефіцієнт регресії лише за лг 4 , оскільки

піддаються економічній інтерпретації негативні значеннякоефіцієнтів регресії при х хі х 5 ,які свідчать про те, що підвищення насиченості сільського господарстваколісними тракторами (*,) та хімічними засобами оздоровлення рослин (х 5) негативно позначається на врожайності. Таким чином, отримане рівняння регресії є неприйнятним.

Після реалізації алгоритму покрокового регресійного аналізу з винятком змінних та врахуванням того, що до рівняння має увійти лише одна з трьох тісно пов'язаних змінних (л*ь х 2або лг 3), отримуємо остаточне рівняння регресії:

Рівняння значимо при а = 0,05, оскільки F Ha6n = 266 > F KO = 3,20, знайденого за таблицею F-розподілу при а = 0,05, v = 3 і v = 17. Значні коефіцієнти регресії pi і Р4, оскільки |/ набл | > /„,= 2,1 (при а = 0,05, v = 17). Коефіцієнт регресії pi слід визнати значним (Pi ф 0) з економічних міркувань; при цьому /, = 2,09 лише трохи менше /„, = 2,11. Якщо а = 0,1, /„, = 1,74, і коефіцієнт регресії Pi статистично значимий.

З рівняння регресії випливає, що збільшення одиницю числа тракторів на 100 га ріллі призводить до зростання врожайності зернових загалом на 0,345 ц/га (/>, = 0,345).

Коефіцієнти еластичності Е| = 0,068 та Е 4 = 0,161

показують, що зі збільшенням показників х хі х 4

на 1% урожайність зернових підвищується відповідно на 0,068% та 0,161%.

Множинний коефіцієнт детермінації г 2 = 0,469 свідчить про те, що тільки 46,9% варіації врожайності пояснюється показниками, що увійшли в модель (*, і х 4), тобто. насиченістю рослинництва тракторами та добривами. Решта варіації обумовлена ​​дією неврахованих факторів (* 2, х 3 , х$,погодними умовами та ін.). Середня відносна помилка апроксимації 5 = 10,5% свідчить про адекватність моделі, як і величина залишкової дисперсії s 2 = 1,97.

Статистичні методи прогнозування

Трендові моделі прогнозування. Статистичні спостереженняу соціально-економічних дослідженнях зазвичай проводяться регулярно через рівні відрізки часу та подаються у вигляді часових рядів x t де t = 1, 2, ..., п.Як інструмент статистичного прогнозування часових рядів служать трендові регресійні моделі, параметри яких оцінюються за наявною статистичною базою, а потім основні тенденції (тренди) екстраполюються на заданий інтервал часу.

Методологія статистичного прогнозування передбачає побудову та випробування багатьох моделей кожному за часового ряду, порівняння їх з урахуванням статистичних критеріїв і відбір найкращих їх прогнозування.

При моделюванні сезонних явищ у статистичних дослідженнях розрізняють два типи коливань: мультиплікативні та адитивні. У мультиплікативному випадку розмах сезонних коливаньзмінюється в часі пропорційно до рівня тренду і відображається в статистичній моделі множником. При адитивної сезонності передбачається, що амплітуда сезонних відхилень постійна і залежить від рівня тренду, а самі коливання представлені у моделі доданком.

Основою більшості методів прогнозування є екстраполяція, пов'язана з поширенням закономірностей, зв'язків і співвідношень, що діють у періоді, що вивчається, за його межі або - в більш широкому значенніслова - це отримання поглядів на майбутнє з урахуванням інформації, що стосується минулого і сьогодення.

Найбільш відомі та широко застосовуються трендові та адаптивні методи прогнозування. Серед останніх можна виділити такі, як методи авторегресії та ковзного середнього (Бокса-Дженкінса та адаптивної фільтрації), методи експоненційного згладжування (моделі Хольта, Брауна та експоненційної середньої) та ін.

Для оцінки якості досліджуваної моделі прогнозу використовують кілька статистичних критеріїв.

Найбільш поширеними критеріями є такі:

Відносна помилка апроксимації:

де е, = х, -х,- Помилка прогнозу;

х,- Фактичне значення показника; х (- Прогнозоване значення.

Цей показник використовується у разі порівняння точності прогнозів за кількома моделями. При цьому вважають, що точність моделі є високою, коли 8

Середня квадратична помилка:

де до- Число оцінюваних коефіцієнтів рівняння.

Поруч із точковим у практиці прогнозування широко використовують інтервальний прогноз. При цьому довірчий інтервал найчастіше задається нерівностями.

де t u- Табличне значення, що визначається за /-розподілом Стьюдента при рівні значимості а та числі ступенів свободи п - до.

У літературі представлено велику кількість математико-статистичних моделей для адекватного опису різноманітних тенденцій часових рядів.

Найбільш поширеними видами трендових моделей кривих росту, що характеризують монотонне зростання або спадання досліджуваного явища, є:

Правильно обрана модель має відповідати характеру змін тенденції досліджуваного явища. При цьому величина е,повинна мати випадковий характер з нульовою середньою.

Крім того, помилки апроксимації е (повинні бути незалежними між собою та підкорятися нормальному закону розподілу

c t e N(0, про). Незалежність помилок, тобто. відсутність автокореляції

залишків зазвичай перевіряється за критерієм Дарбіна-Уотсона, заснованого на статистиці:

де е (=х ( - х (.

Якщо відхилення не корельовані, то величина DWприблизно дорівнює двом. За наявності позитивної автокореляції 0 DW DW

Про корелюваність залишків можна також судити за корелограмою для відхилень від тренду, яка являє собою графіки функції щодо коефіцієнта автокореляції, який обчислюється за формулою

де т = 0,1,2.

Після вибору найбільш підходящої аналітичної функції для тренда його використовують для прогнозування на основі екстраполяції на задану кількість часових інтервалів.

Розглянемо завдання згладжування сезонних коливань, з низки V t = x t -x t де x t- Значення вихідного часового ряду в момент /,

а л -оцінка відповідного значення тренду (t= 1,2,...» д).

Так як сезонні коливання являють собою циклічний процес, що повторюється в часі, то як згладжуючі функції використовується гармонійний ряд (ряд Фур'є) наступного виду:

Оцінки параметрів а.і (3, моделі визначають з виразів:

де - максимально допустиме число гармонік;

Кутова частота /-ї гармоніки (/ = 1,2,..., т).

Нехай т- Число гармонік, що використовуються для згладжування сезонних коливань (т

а розрахункові значення часового ряду вихідного показника визначаються за формулою

Адаптивні методи прогнозування.При використанні трендових моделей у прогнозуванні зазвичай передбачається, що основні чинники та тенденції минулого періоду зберігаються на період прогнозу або що можна обґрунтувати та врахувати напрямок змін у перспективі. Проте нині, коли відбувається структурна перебудова економіки, соціально-економічні процеси навіть макрорівні стають дуже динамічними. У зв'язку з цим дослідник часто має справу з новими явищами та з короткими часовими рядами. При цьому застарілі дані під час моделювання часто виявляються марними і навіть шкідливими. Таким чином, виникає необхідність будувати моделі, спираючись в основному на малу кількість найсвіжіших даних, наділяючи моделі адаптивними властивостями.

Важливу роль у справі вдосконалення прогнозування повинні зіграти адаптивні методи, мета яких полягає в побудові моделей, що самоналаштовуються, які здатні враховувати інформаційну цінність різних членів тимчасового ряду і давати досить точні оцінки майбутніх членів даного ряду. Адаптивні моделі гнучкі, проте на їхню універсальність, придатність для будь-якого часового ряду розраховувати не доводиться.

При побудові конкретних моделей необхідно враховувати найімовірніші закономірності розвитку реального процесу. Дослідник повинен закладати в модель тільки ті адаптивні властивості, які необхідні для стеження за реальним процесом із заданою точністю.

В основі адаптивного напрямку лежить найпростіша модель експоненційного згладжування, узагальнення якої призвело до появи цілого сімейства адаптивних моделей. Найпростіша адаптивна модель ґрунтується на обчисленні експоненційно зваженої ковзної середньої.

Експонентне згладжування вихідного часового ряду x tздійснюється за рекурентною формулою

де S,- Значення експоненційної середньої в момент /;

5, | - в момент / -!;

а – параметр згладжування, адаптації.

Вираз експоненційної середньої можна подати у вигляді:

У цій формулі експоненційна середня у момент tвиражена як сума експоненційної середньої попереднього моменту 5,_, та частки авідхилення поточного спостереження x tвід експоненційного середнього моменту / - 1.

Послідовно використовуючи рекурентне співвідношення, можна висловити експоненційну середню S,через усі попередні значення часового ряду:

де S a- величина, що характеризує початкові умови для першого застосування середньої формули, при /=1.

Звідси випливає, що

тобто. величина S, Виявляється виваженою сумою всіх членів ряду. При цьому ваги змінюються експоненційно залежно від давності спостереження, звідки й назва S t- Експонентна середня.

З останньої формули випливає, що збільшення ваги свіжіших спостережень може бути досягнуто підвищенням а.. У той же час для згладжування випадкових коливань тимчасового ряду х,величину атреба зменшити. Дві названі вимоги перебувають у протиріччі та на практиці при виборі авиходять із компромісного рішення.

Експонентне згладжування є найпростішим видом самонавчається моделі з параметром адаптації а. Розроблено кілька варіантів адаптивних моделей, які використовують процедуру експоненційного згладжування та дозволяють врахувати наявність у часового ряду х, тенденцій та сезонних коливань. Розглянемо деякі з таких моделей.

Адаптивна поліноміальна модель першого ладу.Розглянемо алгоритм експоненційного згладжування, який передбачає наявність у часового ряду x tлінійного тренду. В основі моделі лежить гіпотеза про те, що прогноз може бути отриманий за рівнянням

де.?.(/) - прогнозоване значення часового ряду на момент (/+ т);

a ir xa 2(- Оцінки адаптивних коефіцієнтів полінома першого порядку в момент /; т – величина попередження.

Експоненційні середні 1-го та 2-го порядку для моделі мають вигляд

де (5 = 1 , А оцінка модельного значення ряду з періодом попередження т дорівнює

Для визначення початкових умов спочатку за даними часового ряду знаходимо методом найменших квадратів оцінки лінійного тренду:

і приймаємо Тоді початкові умови визначаються як:

ЗАВДАННЯ ТА ВПРАВИ

1. У таблиці 13.3 представлені темпи приросту (%) наступних макроекономічних показників десяти розвинених країн світу: ВНП (*,), промислового виробництва (д 2), індексу цеп (д 3) та частки безробітних (д 4).

Таблиця 13.3

Потрібно:

  • 1) знайти оцінку коефіцієнта кореляції між темпами приросту ВНП (д,) та промислового виробництва (д 2), при а= 0,05 перевірити його значимість, а при у = 0,923 визначити його інтервальну оцінку;
  • 2) оцінити тісноту зв'язку між д, і д 3 при а = 0,05 перевірити значимість коефіцієнта кореляції між цими показниками, а при у = 0,857 знайти інтервальну оцінку для р і;
  • 3) знайти точкову та інтервальну оцінку коефіцієнта кореляції д2 по д3, прийнявши у = 0,95;
  • 4) визначити частку дисперсії д2, обумовлену впливом д4;
  • 5) при а - 0,05 перевірити значимість, а при у = 0,888 знайти інтервальну оцінку коефіцієнта кореляції між д3 і д4.
  • 2. При дослідженні взаємозв'язку цін на такі види продовольчих товарів: яловичина (Д|), олія (д 2), цукор-пісок (д 3) і хліб білий в/с (д 4) п= 22 міста Центрального району Росії отримано матрицю парних коефіцієнтів кореляції:

Для тривимірної сукупності x l9 х 2витребується:

  • 1) побудувати матрицю парних коефіцієнтів кореляції;
  • 2) за а = 0,1 перевірити значимість приватного коефіцієнта кореляції р Щ4)та знайти його інтервальну оцінку при у = 0,954. Порівняти отримані результати.

Як впливає показник х Ана тісноту зв'язку між х, і х 2?

  • 3) при а = 0,05 перевірити значущість множинного коефіцієнта кореляції /?4
  • 3. За даними задачі 1.5 для тривимірної сукупності х 2 , З? *4 потрібно:
  • 1) побудувати матрицю парних коефіцієнтів кореляції R;
  • 2) при а = 0,01 перевірити значущість приватного коефіцієнта кореляції /е 2 з і знайти його інтервальну оцінку при у = 0,9. Порівняти отримані результати. Як впливає показник х 4на тісноту зв'язку між Л"з і х 2?
  • 3) при (У. = 0,05 перевірити значущість множинного коефіцієнта кореляції /? 2 (3 4>. Дайте інтерпретацію г, 2 (34)).
  • 4. На підставі даних про динаміку темпів приросту курсу акцій за 5 місяців, наведених у табл. 13.4.

Таблиця 13.4

та припущення, що генеральне рівняння регресії має вигляд у -Р 0 4-Pjjf, потрібно:

  • 1) визначити оцінки Ъ 0та 6, параметрів рівняння регресії та залишкової дисперсії s 2 ;
  • 2) перевірити при а = 0,01 значимість коефіцієнта регресії, тобто. гіпотези Н 0: р = 0;
  • 3) з надійністю у = 0,95 знайти інтервальні оцінки параметрів Ро і р;
  • 4) з надійністю у = 0,9 встановити інтервальну оцінку умовного математичного очікування упри х 0 = 4;
  • 5) визначити при у = 0,9 довірчий інтервал передбачення у п+]у точці х = 5.
  • 5. Собівартість (у) одного екземпляра книги залежно від тиражу (х) (тис. екз.) характеризується даними, зібраними видавництвом (табл. 13.5). Визначити МНК-оцінки Ь 0і Ь )параметрів рівняння регресії гіперболічного виду у = Р 0 +Р, -, з надійністю

у = 0,9 побудувати довірчі інтервали для параметрів р 0 і р, а також умовного математичного очікування упри х = 10.

Таблиця 13.5

Тираж (х), тис. екз.

Собівартість (у)

6. У таблиці 13.6 подано дані про темпи приросту (%) наступних макроекономічних показників п = 10 розвинених країн світу за 1992 р.: ВНП - х 19промислового виробництва -х 2 , індексу цін - х у

Таблиця 13.6

Приймемо за величину, що пояснюється (у) показник х ьа за пояснюючу (х) змінну х 2 і припустимо, що рівняння регресії має вигляд:

Потрібно:

  • 1) визначити (з урахуванням лінеаризації рівняння) МНК-оцінки Ьо та Ь, параметрів рівняння регресії, оцінку s 2 залишкової дисперсії;
  • 2) перевірити при а = 0,05 значимість коефіцієнта регресії, тобто. Н„: р = 0;
  • 3) з надійністю у = 0,9 знайти інтервальні оцінки р 0 і р;
  • 4) знайти при у = 0,95 довірчий інтервал для уу точці х 0 = = x hде / = 5;
  • 5) порівняти статистичні характеристики рівнянь регресій: 1, 2 та 3.
  • 7. Завдання 6 вирішити, прийнявши за пояснювану величину (у) показник х ьа за пояснювальну (х) змінну 3 .
  • 8. У таблиці 13.7 представлені такі макроекономічні показники США за 10 років: ВНП (х,) у млрд дол.; частка безробітних (х 2) у %; індекс цін (х 3) у %; обсяг експорту (х 4) у млрд дол. та обсяг імпорту (х 5) у млрд дол.

Для показника ВНП (х,) потрібно:

1) знайти (з урахуванням лінеаризації рівняння) МНК-оцінку тренду, що визначається рівнянням виду:

  • 2) перевірити за а = 0,05 гіпотезу Н 0: Pi = 0 і дати економічну інтерпретацію коефіцієнту регресії;
  • 3) розрахувати та порівняти статистичні характеристики трендів: s 2; 8 та DW.

Таблиця 13.7

  • 9. Завдання 8 вирішити для показника х 2- Частка безробітних (у%).
  • 10. Завдання 8 вирішити для показника х 3- Індекс ланцюг (в %).
  • 11. Завдання 8 вирішити для показника х 4- обсяг експорту (у млрд

12. У таблиці 13.8 подано дані щодо місяців 2004 р. про кількість укладених у регіоні шлюбів х,.

Таблиця 13.8

Потрібно:

1) знайти (з урахуванням лінеаризації рівняння) МНК-оцінку рівняння регресії виду

де - Кутова частота;

  • б) 0;
  • в) 0,4;
  • г) 1,3?
  • 2. Відомо, що х 3посилює зв'язок між величинами х (і х 2 .За результатами спостережень отримано приватний коефіцієнт кореляції 12(3) = -0,45. Яке значення може набути парний коефіцієнт

кореляції р 12:

  • а) 0,4;
  • б) 0,2;
  • в) -0,8;
  • г) 1,2?
  • 3. Множинний коефіцієнт кореляції г 1(23) = 0,8. Визначте, який відсоток дисперсії величини т пояснюється впливом
  • * 2 і * 3:
    • а) 28%;
    • б) 32%;
    • в) 64%;
    • г) 80%.
    • 4. Що мінімізується згідно з методом найменших квадратів:

5. Дана коварійна матриця вектора

Чому дорівнює оцінка дисперсії елемента 2 вектора Ь, тобто.

  • а) 5,52;
  • б) 0,04;
  • в) 0,01;
  • г) 2,21?
  • 6. Рівняння регресії у = 2,88-0,72.v, -1,51л відповідає множинний коефіцієнт кореляції r v (12) = 0,84. Яка частка

варіації результативного показника у(у %) пояснюється змінними, що входять до рівняння регресії х, і х 2:

  • а) 70,6;
  • б) 16,0;
  • в) 84,0;
  • г) 29,4?

КОНТРОЛЬНІ ПИТАННЯ

  • 1. Що характеризує парний, приватний та множинний коефіцієнти кореляції? Сформулюйте основні властивості.
  • 2. Які завдання вирішуються методами регресійного аналізу?
  • 3. У чому полягають негативні наслідкимультиколлінеарності і як можна позбутися цього негативного явища?
  • 4. Що характеризують коефіцієнти регресії в лінійній та статечній моделях?
  • 5. Як перевіряється значущість рівняння регресії та коефіцієнтів регресії?
  • 6. Які моделі прогнозування ви знаєте та які їх особливості?
  • 7. У чому полягає статистичний підхід до прогнозування, моделювання тенденцій та сезонних явищ у статистичних дослідженнях?
  • 8. Які трендові моделі вам відомі і як оцінюється їхня якість?
  • 9. У чому особливість адаптивних методів прогнозування?
  • 10. Як здійснюється експоненційне згладжування часового ряду?

ЛІТЕРАТУРА

Айвазян С.А. Мхітарян В.С.Прикладна статистика та основи економетрики: у 2 т. М: ЮНІТІ, 2001

Статистика: підручник / за ред. В.С. Мхітаряна. М.: Економіка, 2003.

Теорія статистики: підручник / за ред. Р.А. Шмойловий. М.: Фінанси та статистика, 2007.

Економічні даніє кількісні характеристикибудь-яких економічних об'єктів чи процесів. Вони формуються під впливом безлічі чинників, в повному обсязі у тому числі доступні зовнішньому контролю. Неконтрольовані фактори можуть приймати випадкові значення з деякого безлічі значень і цим обумовлювати випадковість даних, що вони визначають. Стохастична (імовірнісна) природа економічних даних зумовлює необхідність застосування відповідних статистичних методів для їх обробки та аналізу.

Вивчення дійсності показує, що варіація кожного досліджуваного ознаки перебуває у зв'язку та взаємодії з варіацією інших ознак, що характеризують досліджувану сукупність одиниць. Варіація рівня продуктивності праці працівників підприємств залежить від ступеня досконалості застосовуваного обладнання, технології, організації виробництва, праці та управління та інших різних чинників.

При вивченні конкретних залежностей одні ознаки виступають як чинники, що зумовлюють зміну інших ознак. Ознаки цієї першої групи надалі називатимемо ознаками-факторами (факторними ознаками); а ознаки, які є результатом впливу цих факторів, називатимемо результативними.

Розглядаючи залежності між ознаками, необхідно виділити, перш за все, дві категорії залежності: 1) функціональні та 2) кореляційні.

Функціональні зв'язкихарактеризуються повною відповідністю між зміною факторної ознаки та зміною результативної величини, і кожному значенню ознаки-фактора відповідають цілком певні значення результативної ознаки. Функціональна залежність може пов'язувати результативну ознаку з однією або декількома факторними ознаками. Так, величина нарахованої заробітної платипри погодинній оплаті залежить від кількості відпрацьованих годин.

У кореляційних зв'язкахміж зміною факторного та результативної ознаки немає повної відповідності, вплив окремих факторів проявляється лише в середньому при масовому спостереженні фактичних даних. Одночасний вплив на ознаку великої кількості найрізноманітніших факторів, що вивчається, призводить до того, що одному й тому ж значенню ознаки-фактора відповідає цілий розподіл значень результативної ознаки, оскільки в кожному конкретному випадку інші факторні ознаки можуть змінювати силу і спрямованість свого впливу.

При порівнянні функціональних і кореляційних залежностей слід пам'ятати, що з наявності функціональної залежності між ознаками можна, знаючи величину факторного ознаки, точно визначити величину результативного ознаки. За наявності ж кореляційної залежностівстановлюється лише тенденція зміни результативної ознаки за зміни величини факторного ознаки.

Статистичні показники можуть полягати між собою у наступних основних видах зв'язку: балансового, компонентного, факторного та ін.

Балансовий зв'язок- характеризує залежність між джерелами формування ресурсів (засобів) та їх використанням.

Компонентні зв'язкипоказників характеризуються тим, що зміна статистичного показника визначається зміною компонентів, що входять до цього показника, як множники

Важливе значення компонентного зв'язку полягає в тому, що він дозволяє визначати величину одного з невідомих компонентів.

Факторні зв'язкихарактеризуються тим, що вони проявляються в узгодженій варіації показників, що вивчаються. При цьому одні показники виступають як факторні, інші - як результативні.

Факторні зв'язки можуть розглядатися як функціональні та кореляційні.

При функціонального зв'язкузміна результативної ознаки повністю залежить від зміни факторної ознаки:

При кореляційного зв'язкузміна результативної ознаки не повністю залежить від факторної ознаки, а лише частково, оскільки можливий вплив інших факторів.

Особливості кореляційного статистичного зв'язку

Статистика стикається з залежностями між кількісними та якісними показниками та ознаками. Її завдання: виявити ці залежності та дати їм характеристику. Серед взаємопов'язаних ознак одні можуть розглядатися як певні фактори, що впливають на зміну інших (факторні), а другі – як наслідок та результат впливу перших (результативні).

2 види зв'язку: функціональна та статистична (її окремий випадок - кореляційний зв'язок).

Функціональна: зв'язок між 2 змінними х і у, коли певному значенню х строго відповідає одне або кілька значень у, і зі зміною змінної х, змінна у також строго за правилами змінюється. Зустрічаються в математиці, фізиці тощо, де трапляються жорстко детерміновані зв'язку (площа квадрата - співвідношення величини його сторін і площі зі збільшенням), також може бути й у економіці.

Існують інші зв'язки, що зустрічаються в галузі економічних та деяких інших явищ, де взаємно діють багато факторів, комбінація яких призводить до варіації значень результативної ознаки при однаковому значенні факторної ознаки (вивчення залежності врожайності певної культури від кількості опадів, які є факторною ознакою, а врожайність - результативний => між ними немає жорстко детермінованого зв'язку, т.к. на врожайність крім опадів впливає ще багато інших факторів).

Там, де впливає багато чинників, зокрема і випадкових, виявити залежності, розглядаючи одиничний випадок, неможливо. Такі зв'язки можна знайти лише за масовому спостереженні як статистичні закономірності - статистична зв'язок.

Кореляційний зв'язок - поняття вужче, ніж статистична. Вона предмет вивчення статистики. Кореляція - особливість залежності, за якої певному значенню однієї факторної ознаки може відповідати кілька значень результативного показника.

За характером змін у парній кореляції виділяють прямий та зворотний зв'язок.

При прямій залежності значення обох змінюються в одному напрямку, при зворотній - значення факторної та результативної ознак змінюються у різних напрямках.

Кореляційні зв'язки допомагають у вирішенні наступних завдань:

· Наявність або відсутність кореляційної залежності між досліджуваними ознаками. Може бути вирішена на основі паралельного зіставлення (порівняння) значень х і у, за допомогою угруповань та побудови кореляційних таблиць;

· Вимірювання тісноти зв'язку між 2 і більше ознаками за допомогою спеціальних коефіцієнтів - кореляційний аналіз;

· Визначення рівня регресії - математичної моделі, в якій середнє значення результативної ознаки у розглядається як функція однієї або кількох змінно-факторних ознак - регресійний аналіз.

Кореляційно-регресійний аналіз має на увазі всебічне дослідження кореляційних зв'язків. Для вирішення вищепоставлених завдань у статистиці використовуються різні методи та показники (коефіцієнти), що різняться за складністю.

Використання різноманітних методів визначається конкретною метою дослідження. Для деяких потрібна лише констатація факту наявності зв'язку, а для деяких найбільш складних розроблені спеціальні комп'ютерні програми.

Теорія кореляції почала розроблятися у другій половині ХІХ ст., а особливого розквіту досягла XX в. Основоположниками теорії кореляції є англійські біометрики Гальтон і Пірсон, у Росії їх ідеї набули розвитку у працях Чупрова.

ТЕМА 11.

СТАТИСТИЧНЕ ВИВЧЕННЯ ВЗАЄМОЗВ'ЯЗКІВ

СОЦІАЛЬНО-ЕКОНОМІЧНИХ ЯВ

1. Види та форми взаємозв'язків між соціально-економічними явищами.Суспільне життя складається з великої кількості складних явищ, що формуються під впливом численних, різноманітних та взаємопов'язаних факторів. Зрозуміти та вивчити якесь явище можна, досліджуючи його у взаємозв'язку з навколишніми ознаками.

У статистиці розрізняють факторні та результативні ознаки.

Факторні (незалежні)ознакиобумовлюють зміни інших, що з ними ознак.

Результативні(залежні)ознакизмінюються під впливом факторних ознак.

Між явищами та його ознаками розрізняють передусім два види зв'язків:функціональні та стохастичні (статистичні, імовірнісні), кожна з яких має свої особливості. Окремий випадокстохастичних зв'язків – кореляційні зв'язки.

При функціонального зв'язкузміна результативної ознаки повністю залежить від зміни факторної ознаки:

Прикладом функціонального зв'язку в економіці може бути залежність продуктивності праці від обсягу виробленої продукції та витрат робочого часу. Слід зазначити, що й детермінована, не випадкова величина, те й функціонально залежить від неї величина теж детермінованою.

Для функціонального зв'язкухарактерні такі особливості:

1) кожному значенню величини факторної ознаки відповідає тільки однеабо кілька точно визначених значеньрезультативної ознаки:

2) цей зв'язок зазвичай виражається формулами,що більшою мірою притаманне точним наукам (математиці, фізиці):

3) функціональна залежність з однаковою силоюпроявляється у всіх одиниць у сукупності;

4) вона є повноїі точної, такяк зазвичай відомі перелік всіх факторів та механізм їх впливу на результативну ознаку (у вигляді рівняння).

Однак набагато частіше в економіці має місце не функціональна, а статистична залежністьколи кожному фіксованому значенню незалежної змінної відповідає не одне, а безліч значень залежної змінної, причому заздалегідь не можна сказати, яке саме значення прийме. Це з тим, що у , крім змінної , впливають і численні неконтрольовані випадкові чинники. У цій ситуації випадкова величина, а змінна може бути як детермінованою, так і випадковою величиною. Приватним випадком статистичної залежності є кореляційна, при якій функціональною залежністю пов'язані фактор та середнє значення (математичне очікування) результативного показника .


При кореляційного зв'язкузміна результативної ознаки не повністю залежить від факторної ознаки, а лише частково, тому що можливий вплив інших факторів:

Прикладом кореляційного зв'язку показників комерційної діяльності є залежність сум витрат від обсягу товарообігу. У цьому, крім факторного ознаки - обсягу товарообігу, на результативний ознака (суму витрат звернення) впливають інші чинники, зокрема і не враховані.

Кореляційні зв'язкимають такі особливості:

1) середня величина результативної ознаки змінюємося під впливом зміни багатьох факторних ознак,ряд з яких може бути невідомим;

2) різноманітність факторів, їх взаємозв'язки та суперечлива дія викликають широке варіювання результативного ознака;

3) кореляційні зв'язки виявляються над поодиноких випадках, а масі, їхнього дослідження потрібні масові спостереження;

4) зв'язок між ознаками-факторами та результативною ознакою неповна,а проявляється лише загалом, середньому.

Вивчаючи взаємозв'язки між ознаками, їх класифікують за напрямом, формою, кількістю факторів:

· по напрямкузв'язки поділяються на прямі та зворотні. При прямого зв'язкунапрям зміни результативної ознаки збігається з напрямом зміни ознаки-фактора. Зі збільшенням (зменшенням) значень факторної ознаки відбувається збільшення (зменшення) результативної ознаки. Зворотні зв'язкихарактеризуються тим, що напрямок зміни результативної ознаки не збігається з напрямом зміни ознаки-фактора. Зі збільшенням (зменшенням) значень факторної ознаки відбувається зменшення (збільшення) результативної ознаки. Наприклад, що стоїть кваліфікація робітника, то вище рівень продуктивності його праці (прямий зв'язок). Чим вища продуктивність праці, тим нижча собівартість одиниці виробленої продукції (зворотний зв'язок);

· по формі(Вигляду функції) зв'язку ділять на лінійні (прямолінійні) і нелінійні (криволінійні). Лінійназв'язок відображається прямою лінією, нелінійназв'язок – кривий (параболою, гіперболою тощо). За наявності цих зв'язків із зростанням значення факторної ознаки відбувається рівномірне зростання (або спадання) значення результативної ознаки;

по кількості факторів, що діють на результативну ознаку, зв'язки поділяються на однофакторні (парні) та багатофакторні. Однофакторні (парні)зв'язки відображають залежність між однією ознакою-фактором та результативною ознакою (при абстрагуванні від впливу інших ознак). Багатофакторні (множинні)зв'язки характеризуються залежністю між декількома факторними ознаками та результативною ознакою (чинники діють комплексно, тобто одночасно і у взаємозв'язку).

Для вивчення зв'язків та їх кількісного вираження у статистиці використовуються різні методи.

Для вираження функціональних зв'язківзастосовують балансовий метод та метод компонентних зв'язків.

Метод балансових побудовшироко використовують із аналізу зв'язків і пропорцій економіки. Статистичний баланс є системою показників, що складається з двох сум абсолютних величин, пов'язаних знаком рівності:

Прикладом балансів такого роду є баланс основних засобів і баланс трудових ресурсів у будь-якій організації. Суми показників у яких утворюють систему величин, характеризуючих обсяг ресурсів початку періоду, надходження і вибуття за джерелами, обсяг ресурсів наприкінці періоду. Наприклад, де - залишок товарів на початок звітного періоду; - Надходження товарів за період; - Вибуття товарів у досліджуваному періоді; - Залишок товарів на кінець звітного періоду.

Ліва частина формули характеризує пропозицію товарів, а права частина – використання товарних ресурсів. За допомогою балансів пов'язують у єдину систему абсолютні величини, що показують рух ресурсів.

Цю суму можна такою рівністю: залишок початку + прихід = витрата + залишок кінець. Приклад, продано роздріб = залишок початку + прихід – продано оптом – залишок кінець (табл.1).

Таблиця 1

Таблиця балансового методу

Соціально-економічні явища є результатом одночасного впливу великої кількості причин. При вивченні цих явищ необхідно виявити основні причини, абстрагуючись від другорядних.

Слід звернути увагу до етапи статистичного вивчення зв'язків:

1 етап – якісний аналізявища, тобто. аналіз природи явища за методами економічної теорії, соціології, конкретної економіки;

2 етап – побудова моделі зв'язку;

3 етап – інтерпретація результатів.

Зв'язки між ознаками та явищами, зважаючи на їх велику різноманітність, класифікуються за низкою підстав. Ознаки за їх значенням вивчення взаємозв'язку діляться на 2 класу:

1) ознаки, що зумовлюють зміну інших пов'язаних із ними ознак, називаються факторними;

2) результативні, що змінюються під впливом факторних ознак.

Зв'язки між явищами та їх ознаками класифікуються за рівнем тісноти, за напрямом та за аналітичним виразом.

У статистиці розрізняють функціональний зв'язок та стохастичну залежність. Функціональною називають такий зв'язок, при якій певному значенню факторної ознаки відповідає одне і лише одне значення результативної ознаки. Якщо причинна залежність проявляється не в кожному окремому випадку, а загалом, середньому за великої кількості спостережень, така залежність називається стохастичної. Частим випадком такого зв'язку є кореляційний зв'язок, при якому зміна середнього значення результативної ознаки зумовлена ​​зміною факторних ознак.

У напрямку виділяють зв'язок прямий і зворотний. За аналітичним виразом виділяють зв'язки прямолінійні (лінійні) та нелінійні (криволінійні).

Слід звернути увагу на основні методи виявлення наявності зв'язку, його характеру та напрямки:

Метод приведення паралельних даних грунтується на зіставленні двох чи кількох рядів статистичних величин. Припустимо, є дані про дві величини:

Х – 1 2 3 4 5 6 7 8 9

У – 5 6 9 10 14 17 15 20 23

Ми, що зі збільшенням величини Х величина У також зростає. Можна припустити, що зв'язок між ними прямий і що його можна описати або рівнянням прямої, або рівнянням параболи другого порядку.

Статистичну зв'язок між двома ознаками можна зобразити графічно і за графіком судити про наявність, напрям і форму зв'язку. На осі абсцис відкладаються значення факторного ознаки, але в осі ординат - результативного. Поєднавши отримані точки нанесених на графік значень Х і У прямими лініями, виходить ламана, яка називається ламана регресії. Число точок ламаної регресії повинне суворо відповідати числу одиниць спостереження, якими дано значення обох ознак. Крива дозволить судити про форму зв'язку, про аналітичне її вираження.



Парна регресія характеризує зв'язок між двома ознаками: результативним та факторним. Аналітично зв'язок між ними описується рівняннями прямої, параболи, гіперболи. Якщо результативний і факторний ознаки зростають однаково, приблизно арифметичної прогресії, то це свідчить про наявність лінійного зв'язку між ними, а при зворотного зв'язку- Гіперболічною. Якщо результативна ознака збільшується в арифметичній прогресії, а факторна значно швидше, то використовується параболічна або статечна функція.

Модель регресії може бути побудована як за індивідуальними значеннями ознаки, так і за згрупованими даними.



Для виявлення зв'язку між ознаками достатньо великому числуспостережень використовується кореляційна таблиця. У ньому можна відобразити лише парну зв'язок, тобто. зв'язок результативної ознаки з одним фактором, і на її основі побудувати рівняння регресії та визначити показники тісноти зв'язку. Саме рівняння регресії може мати лінійну, параболічну та ін форми. Для складання кореляційної таблиці парного зв'язку статистичні дані необхідно заздалегідь згрупувати за обома ознаками. (Х і У), потім побудувати таблицю, рядками у якій відкласти групи результативного, а, по стовпцям – групи факторного ознак.

Кореляційна таблиця дає загальне уявлення про напрямок зв'язку. Якщо обидва ознаки (Х і У) розташовуються у порядку, а частоти ( f xy) зосереджені по діагоналі зверху вниз праворуч, можна судити про прямий зв'язок між ознаками. Інакше – про зворотну.

Про тісність зв'язку між ознаками Х і У по кореляційній таблиці можна судити з купчастості розташування частот навколо діагоналі (наскільки заповнені клітини таблиці осторонь неї). Якщо клітини заповнені великими цифрами, то зв'язок слабкий. Чим ближче частоти ( f xy) розташовуються до однієї з діагоналей, тим більше зв'язок. Якщо розташування частот ( f xy) немає системності, можна судити про відсутність зв'язку.

Розглянемо аналіз статистичних даних з кореляційної таблиці, використовуючи дані прикладу з теми 9 (таблиця 9.8). Спочатку згрупуємо одиниці спостереження за значеннями факторної та результативної ознак, утворивши 4 групи. Розмір інтервалу:

Групи для факторної ознаки:

I - 4 -7 II - 7-10 III - 10-13 IV - 13-16

Групи для результативної ознаки:

I - 8,43-11,38 III - 14,33 - 17,28 II - 11,38 - 14,33 IV - 17,28-20,23

Таблиця 11.1 – Кореляційна таблиця

Середнє вироблення, тис.р./чол. у Енергоозброєність праці, кВтг/чол-ч, х
f у
8,43-11,38 9,905 -- -- 49,53 272,39
11,38-14,33 12,855 -- -- 38,57 327,80
14,33-17,28 15,805 -- -- -- 15,81 181,76
17,28-20,23 18,755 -- -- -- 18,76 271,95
F х -- 122,6 1053,9
-- 16,5 34,0 11,5 29,0 91,0 -- --
-- 90,75 289,0 132,25 420,5 932,5 -- --
-- 5,08 9,22 13,36 17,5 --- --- ---

Аналіз таблиці показує, що частоти ( f xy) розташовані по діагоналі зверху вниз, що свідчить про наявність прямого зв'язку між енергоозброєністю праці та виробленням. Спостерігається концентрація частот навколо головної діагоналі і незаповненість клітин, що залишилися, тому можна припустити досить тісний зв'язок між розглянутими ознаками.

Розрахунок та аналіз середніх значень за групами факторних ознак х підтверджує наявність прямолінійної залежності між хі у.

Вважаючи, що залежність описується рівнянням прямої ( у х=а про+а 1 х) коефіцієнти а про, а 1 визначимо із системи нормальних рівняньвиду:

Звідси: а 0 = - 2,51; а 1 = 1,38.

Отже

Вивчення зв'язку між трьома і більше пов'язаними між собою ознаками зветься множинною (багатофакторною) регресією. Побудову моделей множинної регресії слід здійснювати за етапами:

1) вибір форми зв'язку (рівняння регресії);

2) відбір факторних ознак;

3) забезпечення достатнього обсягу сукупності щоб одержати несмещенных оцінок.

Практика побудови багатофакторних моделей взаємозв'язку показує, що всі реально існуючі залежності між соціально-економічними явищами можна описати, використовуючи п'ять типів моделей:

1) лінійна: ;

2) статечна: ;

3) показова: ; (11.2)

4) параболічна: ;

5) гіперболічна: .

Треба мати на увазі, що основне значення мають лінійні моделічерез простоту і логічність їх економічної інтерпретації.

При побудові моделей регресії можна зіткнутися з проблемою мультиколлінеарності, під якою розуміється тісна залежність між факторними ознаками, що у модель. Мультиколлінеарність суттєво спотворює результати дослідження; її усунення може реалізуватися через виняток із кореляційної моделі одного або кількох лінійно-пов'язаних факторних ознак. А наявність мультиколлінеарності можна судити за величиною парного коефіцієнта кореляції ().

У рівняннях регресії параметр а 0 показує усереднений впливом геть результативний ознака неврахованих (не виділених на дослідження) чинників; параметр а 1 (а 2) Коефіцієнт регресії показує, наскільки змінюється в середньому значення результативної ознаки при зміні факторного на одиницю його власного виміру.

Перевірка адекватності моделей, побудованих з урахуванням рівнянь регресії, починається з перевірки значимості кожного коефіцієнта регресії. Значимість коефіцієнта регресії здійснюється за допомогою t- Критерія Стьюдента:

де ai 2 - дисперсія коефіцієнта регресії, яка може бути визначена за виразом:

де у 2 – дисперсія результативної ознаки;

до- Число факторних ознак.

Параметр моделі визнається статистично значущим, якщо t p>t кр(Табличне).

Перевірка адекватності усієї моделі здійснюється за допомогою величини середньої помилки апроксимації ( Е):

Значення Ене має перевищувати 12-15%.

Важливим завданням вивчення та кількісного виміру взаємозв'язку соціально-економічних явищ є вимірювання тісноти та напрями зв'язку.

Тіснота зв'язку при лінійній залежності вимірюється за допомогою лінійного коефіцієнта кореляції. У статистичній теорії розроблено і практично застосовуються різні модифікації формул розрахунку даного коефіцієнта:

Між лінійним коефіцієнтом кореляції та коефіцієнтом регресії існує певна залежність:

де а i- Коефіцієнт регресії в рівнянні зв'язку;

Середнє квадратичне відхилення відповідної факторної ознаки.

Лінійний коефіцієнт кореляції змінюється в межах від -1 до 1: -1< <1. Знаки коэффициентов регрессии и корреляции совпадают. При этом интерпретацию выходных значений коэффициента корреляции можно представить в таблице11.2:

Таблиця 11.2 – Оцінка лінійного коефіцієнта кореляції

Значимість лінійного коефіцієнта кореляції перевіряється з урахуванням t – критерію Стьюдента:

Якщо розрахункове значення t p>t кр(табличне), то гіпотеза про відсутність зв'язку відкидається, що свідчить про значущість лінійного коефіцієнта кореляції, а отже, і про статистичну суттєвість залежності між хі у. Приклад розрахунку коефіцієнта кореляції розглянуто у темі 9 .

Множинний коефіцієнт кореляції обчислюється за наявності лінійного зв'язку між результативними та декількома факторними ознаками, а також між кожною парою факторних ознак:

де 2 – дисперсія теоретичних значень результативної ознаки, розрахована за рівнянням множинної регресії;

2 – загальна дисперсія результативної ознаки.

Перевірка значущості коефіцієнта множинної кореляції складає основі F – критерію Фішера:

Гіпотеза про незначність коефіцієнта множинної кореляції відкидається, якщо Fp>Fкр(Табличне). Rзмінюється в межах від 0 до1 і за визначенням позитивний:

0>R<1.

Слід звернути увагу до статистичну оцінку соціальних явищ, яка ускладнюється тим, що багато соціальних явищ немає кількісної оцінки.

Кількісна оцінка зв'язків соціальних явищ здійснюється на основі розрахунку та аналізу цілого ряду коефіцієнтів.

Для визначення тісноти зв'язку двох якісних ознак, кожна з яких складається лише з двох груп, застосовуються коефіцієнти асоціації та контингенції . Для їх обчислення будується таблиця, що показує зв'язок між двома явищами, кожне має бути альтернативним, тобто. що складається з двох якісно відмінних один від одного значень ознаки.

Таблиця 11.3 – Таблиця для обчислення коефіцієнтів асоціації та контингенції

а в а+в
з d c+d
a+c b+d a+b+c+d

Коефіцієнти обчислюються за формулами:

Асоціації:

Контингенції:

При цьому Ка >До до. зв'язок вважається підтвердженим, якщо Ка>0,5 або До до>0,3.

Наприклад, залежність скорочення робітників від місця роботи досліджувалась у ході соціологічного опитування 200 респондентів, результати якого представлені у таблиці 11.4.

Таблиця 11.4 – Вихідні дані

Коефіцієнт асоціації:

Чим ближче за величину Кпі Кчдо 1, тим більше зв'язок.

Розглянемо допоміжну таблицю до розрахунку коефіцієнта взаємної спряженості (таблиця 11.5).

Таблиця 11.5 – Допоміжна таблиця для розрахунку коефіцієнта взаємної сполученості

у х I II III Усього
I n xy n x
II n x
III n x
Разом n у N y n y n

Наприклад, на основі опитування студентів отримано такі дані (таблиця 11.6).

Таблиця 11.6 – Вихідні дані

Чи існує взаємозв'язок між відповідями на поставлене запитання та курсом, на якому навчаються студенти?

Для цього розрахуємо коефіцієнти Пірсона та Чупрова.

Отже, зв'язок між відповідями на запитання та курсом, на якому навчаються студенти, досить тісний. Можна припустити, що старші студенти, тим більше вони зацікавлені у збільшенні навчального навантаження зі спеціальних дисциплін.

| наступна лекція ==>