Что такое социальное экономическое явление. Реферат: Социально-экономические явления и методы исследования связей между ними. Ограниченность рассматриваемой методологии

Новые социально-экономические явления и тенденции

Реальная практика внедрения Интернет технологий в различные социально-экономические системы дает примеры и сюжеты, которые важны для понимания современного контекста формирования сетевой экономики. Сбор такого рода примеров, их систематизация и классификация очень важны для понимания общей структуры социально-экономических изменений и выявления основных типов воздействий Интернет технологий на общество. Анализ такого рода эмпирического материала необходим нам для понимания того, что представляют собой проявления сетевой экономики, что является наиболее характерным объектом для ее научного исследования, и какие наиболее фундаментальные особенности отличают ее от других экономических укладов.

Примеры Интернет инноваций и их воздействие на экономику

Наблюдения за социально-экономическими приложениями современных ИКТ показывают, что наиболее заметными на данный момент явлениями в виртуальном пространстве сети Интернет являются следующие:

  • · "работа" становится "телеработой" , которую можно выполнять в режиме "телеприсутствия" ;
  • · торговля превращается в "электронную коммерцию" , средство платежа - в "цифровую наличность" , а бизнес - в "электронный бизнес" ;
  • · поддержание контактов основано на использовании электронной почты , ICQ и т.п., а обсуждения принимают вид телеконференций , веб-форумов , чатов и др.;
  • · "работа в коллективе" основывается на "компьютерных средствах коллективной работы" , дух коллективизма, комфортность и эффективность совместной работы уже зависит от groupware - особого класса компьютерными программами.

Данные явления в настоящее время в большей степени связаны с развитием бизнеса и отражают распространенное среди предпринимателей современное понимание возможностей Интернет технологий для снижения затрат и повышения эффективности бизнес деятельности.

По данным, опубликованным в журнале The Economist еще в 1999 г., около 90% высших менеджеров крупнейших международных компаний считало, что Интернет изменит или сильно повлияет на глобальный рынок в ближайшие годы. Как пример, вице-президент компании Intel (мировой лидер по производству микропроцессоров) утверждал, что через пять лет все компании будут Интернет компаниями, или они будут уничтожены конкурентами.

Отмечается, что в результате массового использования Интернет технологий в деятельности компаний в общеэкономической среде наблюдаются следующие изменения: 1)формируются новые модели ведения бизнеса (например, информационное партнерство); 2)начинают использоваться новые принципы управления бизнесом (пример - менеджмент 5-го поколения); 3)появляются новые правила успешного индивидуального поведения (например, правила К. Келли).

Первый пункт в этом списке можно проиллюстрировать материалами, также опубликованными в The Economist.

Использование компаниями Интернета позволяет им создавать трехстороннее "информационное партнерство" со своими поставщиками и заказчиками. В условиях прямых и оперативных контактов через Интернет эти связи могут превращаться в сотрудничество, направленное на коллективный поиск путей повышения эффективности по всей цепочке от спроса до потребления, а также совместного использования полученных выгод. Примерами служат компании Cisco System, General Electric, Dell, Ford, Visa и др.

Вот, например, короткое описание модели бизнеса, используемой в компании Dell (см. статью ):

Компания ежедневно продает компьютеры через свой веб-сайт на 15 млн долларов. Одной из причин этого является "информационное партнерство" компании с его поставщиками и заказчиками. Поставщики компании имеют постоянный онлайновый доступ к содержанию их заказов от компании через ее корпоративный экстранет (extranet). Они могут организовать свое производство и поставки так, чтобы Dell постоянно имел все необходимое для надлежащей организации производственного процесса. Допуская поставщиков в свою базу данных, Dell считает, что они будут постоянно в курсе о любых изменениях в его спросе. С другой стороны, Dell через свой веб-сайт дает заказчикам доступ к информации о прохождении их заказа через свою производственную цепочку. Что позволяет покупателям отслеживать изменения статуса в исполнении их заказа от момента его начала на заводе до момента окончания возле двери покупателя.

Как только фирмы добиваются успехов в снижении их затрат и в повышении эффективности за счет капиталовложений в возможность вести свою деятельность через Интернет, то у них появляется заинтересованность, чтобы их постоянные партнеры сделали тоже самое. Исследователи отмечают, что это стимулирует распространение использования Интернет технологий в экономике по всем звеньям производственно-технологических цепочек.

The Economist дает на этот счет и еще один пример (см. ):

Британская фирма Safeway, являющаяся владельцем серии супермаркетов, сконструировала, основанную на веб, интегрированную систему (value chain), которая внесла революционные изменения в методы их бизнеса. В разделе операций по закупке они открыли доступ сотням поставщиков к данным о содержании их складов. Это позволило поставщикам получать информацию в реальном времени о том, как продаются через каждый из торговых залов Safeway, поставляемые ими товары. В этих условиях поставщики могут отслеживать изменение спроса и вкуса покупателей, а также следить, чтобы запас товаров на складах Safeway не уменьшался.

Супермаркет в свою очередь может теперь легко увеличивать количество своих поставщиков, предлагая им более широкий выбор возможностей для сотрудничества и лучшие цены, т.к. его затраты на создание таких возможностей стали существенно меньше с использованием Интернет технологий. Аналогично, затраты поставщиков на контакты с супермаркетом также уменьшились.

В разделе операций по продаже товаров использование Интернет технологий дало возможность покупателям делать удаленные покупки (электронную коммерцию) и получить доступ к электронным каталогам супермаркета. Сам супермаркет получил от этого возможность собирать и анализировать данные о предпочтениях покупателей, и использовать их для организации персонифицированного продвижения (рекламы) своих товаров.

C внедрением Интернет технологий в процесс функционирования компаний они получают ранее не мыслимые способы для интеграции их операций с внешними организациями. При этом основными направлениями развития компаний становятся: а) аутсорсинг (outsourcing); б) уменьшение ее размеров; в) ее реинжениринг; г) полное изменение содержания бизнеса. Вертикальная интеграция компаний, которая была главным достижением индустриальной эпохи, в этих новых условиях может быть даже опасна, т.к. маловероятно, что отдельная взятая компания будет одинаково хороша во всех звеньях своего бизнес-процесса.

В этих условиях целями большой компании должно стать ее превращение в своеобразный E-business коммутатор, который, как это видно из предыдущих примеров, во-первых, дает мелким фирмам стимул для использования Интернет технологий, а также создает им среду для более дешевого мониторинга спроса и предложения. Целью небольшой фирмы в этих условиях становится доказательство своей жизненной необходимости для потенциальных партнеров. Компании, использующие данные инновации должны быть готовы допустить своих поставщиков и заказчиков к внутренним процессам своей работы, а также получить аналогичное понимание бизнес процессов своих партнеров. Все это создает совершенно новые стандарты на открытость и прозрачность компаний. В итоге, можно говорить, что Интернет усиливает тенденцию к разукрупнению экономических структур.

А вот как описываются принципы менеджмента 5-го поколения, которые, по мнению их автора, являются эффективнее традиционных, если на предприятии хорошо развиты информационные технологии (из обзора "Менеджмент пятого поколения: предприятие как сеть людей", см. [Чарльз Сэведж]):

  • · связывание не начальника с подчиненным, а равноправных людей (людям должны обеспечиваться прямые контакты друг с другом);
  • · каждый сотрудник должен иметь доступ к любой информации о предприятии; должен быть обеспечен доступ к знаниям любого сотрудника предприятия; работой должны заниматься "команды", работающие либо над определенным проектом, либо с определенным заказчиком, или классом клиентов; команды собираются из сотрудников разных отделов, или, более точно, из людей, компетентных в разных областях (в производстве, конструировании, финансах, рынках и т.д.);
  • · поддержание целостности предприятия за счет создания сети команд (эти команды, эти подразделения могут и даже должны быть в основном "потенциальными", чтобы предприятие всегда могло отреагировать на изменяющиеся внешние условия, новые замыслы или знания. "В организации должна быть институциализирована готовность к изменениям");
  • · работа в режиме реального времени, которая включает в себя запараллеливание работ и итеративно-коммуникационную их организацию (вместо последовательной и кооперативной);
  • · создание технико-организационных условий для формирования "виртуальных" команд, члены которых могут находиться в различных географических точках.

Известны отчасти экстравагантные, но примечательные правила успешного индивидуального поведения в сетевой экономике, сформулированные Кевином Келли. Вот некоторые из них (см. ):

  • · Все дешевеет по мере совершенствования. Следует изобретать быстрее, чем новшество станет привычным.
  • · Развивайте не продукт, а сеть деловых связей. Преданность стандартам, а не фирме.
  • · Нужно стремиться стать пусть менее совершенным, но более гибким и децентрализованным, чтобы на пике успеха провести демонтаж старого и идти к новому.
  • · Новые виды постоянно замещают старые. Балансировка на грани хаоса и самообновления.
  • · Не решайте проблемы, ищите новые возможности. Повторы, копирование, автоматизация - обесцениваются, а оригинальность, воображение, творчество - растут в цене (полный список из 12 правил в переводе на русский язык см. в [Паринов С., Яковлева Т.]).

Эти правила поведения были бы полным абсурдом для традиционных социально-экономических организаций 20-го века, но в новых условиях они, действительно, не только практически осуществимы, но и полностью соответствуют духу "информационного партнерства", "виртуальных команд" и т.п.

Переходя к анализу влияния сетевых инноваций на уровне компании, можно и здесь заметить присутствие знакомых признаков. Когда описанные выше модели ведения бизнеса, принципы менеджмента и индивидуального поведения глубоко проникают во внутрифирменную среду, ее организационная форма принимает новый вид, который получил название: "сетевая форма организации".

Считается, что главным отличием сетевых форм организации от рыночных и иерархических является: а) длительность связей между членами организации, которые б) регламентируются этими же лицами без участия вышестоящей власти. Д. Подольны и К. Пейдж описывают сетевые изменения, происходящие в последние годы во внутренней среде традиционных иерархических фирм и организаций, следующим образом:

  • · одно из основных отличий сетевой формы организации от традиционной заключается в этических или ценностных ориентациях ее участников;
  • · центральным элементом является "дух доброй воли" (spirit of goodwill), который означает использование "голоса" вместо "силы" для разрешения проблем, а также высокий уровень доверия между участниками (покупатель пытается работать с продавцом, принимая во внимание недостатки в его деятельности вместо того, чтобы сменить продавца);
  • · нормы взаимности лежат в основе сетевой организации (в отношениях между участниками преобладают чувства взаимных обязательств и ответственности, а не желание извлечь выгоду из имеющего место доверия);
  • · члены сетевой организации составляют "моральное сообщество", в котором предполагается доверительное поведение, понимание нормативных стандартов, где оппортунизм имеет мало шансов на существование.

Сетевая форма действует дополнительно к рыночному и иерархическому механизмам регулирования и поэтому конкурирует с другими двумя за обслуживание взаимодействий между людьми в экономике.

Преимущества сетевых организаций описываются следующим образом:

  • 1. Освоение новых навыков или знаний проходит лучше, чем в иерархической организации, т.к. сетевая форма предлагает лучшее разнообразие процедур поиска, чем иерархия, и обеспечивает участников более богатой и комплексной информацией, чем рынок. Это достигается двумя путями. Первый - стимулирование обучения за счет обеспечения быстрого распространения полезной информации. Второй - стимулирование синтеза новых знаний и информации на основе уже существующей у членов организации.
  • 2. Легитимность или статус сетевой организации, в большей степени, чем у традиционной организации, определяется статусом ее членов и наоборот, статус сетевой организации легко распространяется на ее членов. Эта легитимность или статус могут в свою очередь иметь определенные экономические преимущества для участников, связанные, например, с ее выживанием, ростом и прибыльностью.
  • 3. Экономические преимущества сетевой формы организации проявляются в некотором снижении транзакционных издержек по сравнению с традиционной командно-иерархической формой. Однако главным преимуществом являются не стоимостные, а качественные изменения. Например, более высокое качество продукции как следствие лучших коммуникаций между покупателем и поставщиком по вопросам, имеющим отношение к качеству. Другой пример - повышение адаптивности сетевой организации к непредсказуемым изменениям в окружающей среде.
  • 4. Среди других преимуществ отмечается возможность сетевых организаций ослаблять внешние ограничения или неопределенность путем усиления своих связей с конкретными источниками, от которых эти ограничения зависят. Сетевая организация фактически является сетью малых фирм или производителей, что дает индивидам в сравнении с крупными бюрократическими формами организаций большую автономность, меньшее неравенство в распределении богатства и усиливает дух сообщества.

Когда сетевые организации начинают доминировать в общеэкономической среде, можно говорить, что на данном рынке или в данной стране сформировались необходимые условия для возникновения сетевой экономики. Отмечается, что сетевая экономика будет иметь следующие особенности (см. ):

  • 1. Покупают только те продукты, которые можно попробовать (experience good). "Вы не можете показать людям насколько ценен ваш продукт, пока вы не дадите им его попробовать. Но как только они сделали это, у них уже нет причин, чтобы его покупать. Почему они должны платить за то, что они уже знают? Но если продавец не даст людям возможность познакомится с тем, что он продает, то, как они узнают, какую выгоду они получат, купив этот продукт?".
  • 2. Структура затрат сетевой экономики (почти нулевые предельные затраты на расширение выпуска информационных продуктов) не позволяет выживать многим конкурентам в одном сегменте рынка. Останутся сильнейшие, т.к. затраты потребителя на переключение от одного поставщика на другого равны нулю.
  • 3. Чем больше единиц продукта продано, тем больше вероятность, что пользователь найдет дополнительные продукты или услуги, которые будут использовать или усиливать ценность основного продукта (примером основного продукта может быть персональный компьютер IBM PC или операционная система Windows, для использования с которыми была произведена масса дополнительных продуктов). В сетевой экономике высокие объемы производства не только дешевле обходятся производителю, но и являются более ценными для потребителей. Следовательно, рост становится стратегическим императивом, т.к. только большой объем производства может сделать продукт ценным для потребителя.

Однако современные ИКТ подрывают некоторые свойства экономики, которые делают "невидимую руку" рыночной системы эффектным и эффективным средством для организации производства и распределения продукции. При этом рынок теряет следующие из своих фундаментальных основ (см. ):

  • 1. Исключительность . В сетевой экономике собственник товара не в состоянии простыми и дешевыми средствами исключить конкурентов из своего сегмента. «В отсутствие исключительности... потенциальные участники рынка теряют эффективный способ дать знать рыночной системе, насколько силен их спрос и на что конкретно он направлен»;
  • 2. Состязательность . Ослаблена в сетевой экономике, поскольку предельная стоимость тиражирования «цифровой» продукции (digital goods) становиться близкой к нулю. В извечной борьбе за покупателя (если это происходит в сетевой экономике) пропадают конкурентные различия между продавцами по их затратам на обслуживание дополнительных заказов. Из-за этого практически не достижимы такие характеристики «хорошего» рынка как «конкуренция в целях ограничения проявлений частной экономической мощи, отдача от инвестиций и трудовых усилий в соответствии с добавленной социальной ценностью, достаточность стимулов для инноваций и развития новых продуктов»;
  • 3. Прозрачность . Во многих секторах экономики покупка товаров в настоящее время перестает быть «прозрачной» т.к. соответствующая ей транзакция, как правило, сразу не заканчивается. Акт покупки, во все больших случаях означает возникновение долгосрочных отношений между продавцом и покупателем. Эта новая черта особенно хорошо заметна по рынку программных продуктов: периодическое обновление версий программного обеспечения превращает акт покупки в процесс долгосрочного «сотрудничества» между покупателем и продавцом.

МЕТОДИЧЕСКИЕ УКАЗАНИЯ С ТИПОВЫМИ ПРИМЕРАМИ

Статистика в современном мире представляет собой систему сбора, обработки и анализа информации. Она призвана обеспечивать количественные оценки и прогноз основных макроэкономических показателей, а также микроэкономических, таких как объемы продаж, степень риска в банковском деле, страховании и производстве, характеристики потребительского поведения населения, демографической и социальной ситуации и т.п.

В условиях рыночной экономики существенно изменились требования управляющих структур к объему, составу, достоверности и оперативности информации. Объективные условия, когда основой экономики становятся не госпредприятия, а миллионы агентов рынка, ведут к переходу от сплошного учета к выборочному по многим системам показателей. На базе выборочных данных и осуществляются статистические построения, позволяющие судить о происходящих в обществе процессах.

В рыночных условиях, когда товаропроизводитель независим и обращение к предприятию, фирме не носит директивный характер, необходимо максимально использовать информационные возможности ограниченных первичных данных для разработки свободной макроэкономической информации. Активное интегрирование экономики России в мировое сообщество потребовало от нее перехода на принятую повсеместно систему учета и статистики, которая позволяет адекватно оценивать социально-экономическое положение страны, говорить с международными партнерами на одном статистическом языке.

Динамизм современной экономики России и регионов требует ежеквартальной, ежемесячной оценки производства и использования валового внутреннего продукта, т.е. анализа итогов деятельности как сферы материального производства, так и секторов экономики - коммерческих банков, страховых компаний, бирж и других элементов рыночной инфраструктуры.

Важное значение приобретают сейчас и технологии сбора, обработки и исследования данных о социально-экономических и демографических процессах, характеризующих экономически активное население, фактическую и скрытую безработицу, уровень жизни и покупательную способность различных слоев населения.

Происходящие в обществе изменения приводят к тому, что наши знания об экономике переходного периода всегда будут отставать от потребностей управления. В связи с этим статистическая деятельность должна содержать прогностическую составляющую, способную заранее сигнализировать о появлении тех или иных «особых» (в том числе и кризисных) ситуаций, если в системе управления не произойдут изменения.

Значительная потребность в экономистах-статистиках сегодня отмечается на микроэкономическом уровне у предприятий, учреждений и фирм различных форм собственности. Следует ожидать, что в этой сфере будет работать большая часть выпускников вузов соот- ветсвующей специальности.

Таким образом, в своей деятельности экономисту-статистику приходится решать вопросы, связанные в той или иной мере со следующими разделами статистической науки:

  • методологией социально-экономических измерителей, определяющей, что именно, какие показатели необходимо измерять для успешного решения основных задач управления социально-экономическими процессами;
  • теорией и практикой выборочных статистических обследований, обеспечивающих необходимый инструментарий для правильной организации выборки и научно обоснованных методов ее математического анализа;
  • методологией современного математико-статистического анализа и прогнозирования социально-экономических данных, обеспечивающей наилучший выбор (в зависимости от поставленных целей) того или иного математико-статистического метода, реализованного в виде проблемно или методоориентированных статистических программных систем.

Все вышесказанное позволяет сформулировать требования к знаниям будущих специалистов. Экономисты-статистики должны получить хорошую гуманитарную, в частности, экономическую, языковую и правовую подготовку, владеть международной методологией статистики, хорошо ориентироваться в методологии экономических, социально-экономических измерений, бухгалтерском учете, быть высококвалифицированными пользователями современных информационных технологий. Они должны владеть методами компьютерных исследований, математико-статистическим инструментарием от элементарных до многомерных статистических методов анализа данных, методами эконометрики и анализа рядов динамики и прогнозирования.

Сегодня нужны специалисты, не только владеющие опытом предыдущих поколений, но и готовые к встрече с новыми постановками задач, обусловленными спецификой России и переходного периода.

В настоящее время экономисты-статистики должны больше внимания уделять совершенствованию и расширению сферы применения статистических методов. Причем их необходимо применять в комплексе с методами математической статистики, моделирования и прогнозирования: это позволяет делать более глубокий анализ явлений и процессов, получать научно обоснованные выводы, более точно определять объективные тенденции и закономерности. Следует отличать статистику как общественную науку от математической статистики, приемы которой применяются при обработке массовых данных как общественных, так и природных явлений. Эти науки имеют много общего. В общественных науках, как и в науках о природе, использование математико-статистических методов предполагает наличие множества факторов или элементов, подвергающихся быстрым изменениям. Отсюда вытекает общность приемов обработки и оценки данных. Различие между ними заключается в том, что математическая статистика как часть математики рассматривает массовые количественные отношения в общем виде, абстраюно, тогда как социально- экономическая статистика изучает их в связи с качеством, конкретными условиями и местом.

В данной теме следует уяснить такие наиболее используемые в экономической практике статистические методы, как корреляционный и регрессионный анализ.

Значительное внимание нужно уделить логическому анализу исходной информации и экономической интерпретации получаемых результатов, а также рассмотрению подробно разработанных типовых примеров, взятых из экономической практики.

Примеры иллюстрируют необходимость комплексного применения многомерных статистических методов. При этом корреляционный анализ используется, с одной стороны, на этапе предварительного анализа для выявления мультиколлинеарности, а с другой стороны - при оценке адекватности регрессионной модели. На окончательном этапе выбора модели рекомендуется применять как экономические, так и статистические критерии. Наряду с точечными оценками рассматриваются методы построения интервальных оценок коэффициентов и уравнений регрессии.

Различают два вида зависимости между экономическими явлениями: функциональную и статистическую. Зависимость между двумя величинами X и У, отображающими два явления, называют функциональной, при этом каждому значению величины X должно соответствовать единственное значение величины У и наоборот. Примером функциональной связи в экономике может служить зависимость производительности труда от объема произведенной продукции и затрат рабочего времени. Следует отметить, что если X - детерминированная, не случайная величина, то и функционально зависящая от нее величина У тоже является детерминированной. Если же X - величина случайная, то и У будет иметь случайный характер.

Однако гораздо чаще в экономике имеет место не функциональная, а статистическая зависимость, когда каждому фиксированному значению независимой переменной X соответствует не одно, а множество значений зависимой переменной У, причем заранее нельзя сказать, какое именно значение примет У. Это связано с тем, что на У, кроме переменной X, влияют и многочисленные неконтролируемые случайные факторы. В этой ситуации У - случайная величина, а переменная X может быть как детерминированной, так и случайной величиной. Частным случаем статистической зависимости является корреляционная, при которой функциональной зависимостью связаны фактор X и среднее значение (математическое ожидание) результативного показателя У.

Статистическая зависимость может быть выявлена лишь по результатам достаточно большого числа наблюдений. Графически статистическая зависимость двух признаков может быть представлена с помощью поля корреляции, при построении которого на оси абсцисс откладывается значение факторного признака X , а по оси ординат - результирующего У.

В качестве примера на рис. 13.1 представлены данные, иллюстрирующие прямую и обратную зависимость между х и у. В случае (а) это прямая зависимость между, к примеру, среднедушевым доходом (л;) и сбережением (у) в семье. В случае (б) речь идет об обратной зависимости. Такова, скажем, зависимость между производительностью труда (х) и себестоимостью единицы продукции (у). На указанном рисунке каждая точка характеризует объект наблюдения со своими значениями X и у.

Рис. 13.1. Поле корреляции: а - прямая зависимость между х и у б - обратная

На рисунке 13.1 также представлены прямые линии, линейные уравнения регрессии типа у = р 0 + Р г т, характеризующие функциональную зависимость между независимой переменной х и средним значением результативного показателя у. Таким образом, по уравнению регрессии, зная х, можно восстановить лишь среднее значение у.

Ставя задачу статистического исследования зависимостей, важно хорошо представлять конечную прикладную цель построения моделей статистической зависимости между результативным показателем, с одной стороны, и объясняющими переменными x v x 2 .... x h - с другой (до сих пор рассматривалась только одна объясняющая переменная л*). Отметим две основных цели подобных исследований.

Первая из них состоит в установлении самого факта наличия (или отсутствия) статистической значимости связи между Y и X. При такой постановке задачи статистический вывод имеет альтернативную природу - «связь есть» или «связи нет». Он обычно сопровождается лишь численной характеристикой - измерителем степени тесноты исследуемой зависимости. Задача оценки степени тесноты связи между показателями решается методами корреляционного анализа. При этом выбор формы связи между результативными показателем Y

и объясняющими переменными х и дг 2 ,___» х к а также выбор состава последних играет вспомогательную роль, призванную максимизировать характеристику степени тесноты связи.

Вторая цель сводится к прогнозу, восстановлению неизвестных индивидуальных или средних значений результативного показателя Y по заданным значениям объясняющих переменных методами регрессионного анализа. При этом выбор формы и вида зависимости Y от объясняющих переменных х и х 2 ,..., х к нацелен на минимализацию суммарной ошибки, т.е. отклонений наблюдаемых значений Y от значений, полученных по регрессионной модели.

Корреляционный анализ - один из методов статистического анализа взаимозависимости нескольких признаков.

Основная его задача состоит в оценке корреляционной матрицы генеральной совокупности по выборке, которая определяется на основе этой матрицы частных и множественных коэффициентов корреляции и детерминации.

Парный и частный коэффициенты корреляции характеризуют тесноту линейной зависимости между двумя переменными соответственно на фоне действия и при исключении влияния всех остальных показателей, входящих в модель. Они изменяются в пределах от -1 до +1, причем чем ближе коэффициент корреляции по модулю к 1, тем сильнее зависимость между переменными. Если коэффициент корреляции больше нуля, то связь прямая, а если меньше - обратная.

Множественный коэффициент корреляции характеризует тесноту линейной связи между одной переменной (результативной), обусловленной влиянием всех остальных переменных (аргументов), входящих в модель.

Исходной для анализа является матрица

Размерности п х к у /-я строка которой характеризует /-е наблюдение (объект) по всем к показателям (/" = 1,2,..., к).

В корреляционном анализе матрицу X рассматривают как выборку объема п из А-мерной генеральной совокупности, подчиняющейся A-мерному нормальному закону распределения.

По выборке определяют оценки параметров генеральной совокупности, а именно: вектор средний х, вектор средних квадратических отклонений s и корреляционную матрицу R порядка А:

где х~ - значение j -го показателя для /-го наблюдения;

r jf - выборочный парный коэффициент корреляции, характеризующий

тесноту линейной связи между показателями. При этом r jt является оценкой генерального парного коэффициента корреляции p jt .

Матрица R является симметричной (г и = г;/) и положительно определенной.

Кроме того, находятся точечные оценки частных и множественных коэффициентов корреляции любого порядка (порядок определяется числом фиксированных переменных). Например, частный коэффициент корреляции - 2)-го порядка между переменными х { и х 2 равен:

где Rj t - алгебраическое дополнение элемента корреляционной матрицы R.

При этом Rji = (-1У + ",

где Mj. - минор, т.е. определитель матрицы, получаемой из матрицы R путем вычерчивания у-й строки из 1-го столбца.

Множественный коэффициент корреляции (к - 1)-го порядка результативного признака л;, определяется по формуле

где Щ - определитель матрицы R.

Значимость частных и парных коэффициентов корреляции, т.е. гипотеза Н 0: р = 0, проверяется по / - критерию Стыодеита. Наблюдаемое значение критерия находится по формуле

где г - оценка частного или парного коэффициента корреляции р;

I - порядок частного коэффициента корреляции, т.е. число фиксируемых переменных (для парного коэффициента корреляции / = 0).

Напомним, что проверяемый коэффициент корреляции считается значимым, т.е. гипотеза Н {) : р = 0 отвергается с вероятностью ошибки а, если / набл по модулю будет больше, чем значение / к0 , определяемое по таблицам /-распределения для заданного аиу = и- /-2.

При определении с надежностью у доверительного интервала для значимого парного или частного коэффициента корреляции р используют Z-преобразование Фишера и предварительно устанавливают интервальную оценку для Z:

где t y вычисляют по таблице значений интегральной функции Лапласа из условия Ф(/,) = у,. Значение Z" определяют по таблице Z-npe- образования по найденному значению г. Функция Z"- нечетная, т.е.

Обратный переход от Z к р осуществляется также по таблице Z-преобразования, после использования которой получают интервальную оценку для р с надежностью у.

Таким образом, с вероятностью у гарантируется, что генеральный коэффициент корреляции р будет находиться в интервале (r mjlI , г^).

Значимость множественного коэффициента корреляции (и его квадрата - коэффициента детерминации) проверяется по /^критерию.

Например, для множественного коэффициента корреляции p v2 ..... *

проверка значимости сводится к проверке гипотезы, что генеральный множественный коэффициент корреляции равен нулю, т.е. Н 0 : p xil к = 0, а наблюдаемое значение статистики находится по формуле

Множественный коэффициент корреляции считается значимым, т.е. имеет место линейная статистическая зависимость между л*, и остальными переменными х 2 ,..., х к, если F Ha6jI > где F m определяется по таблице F-распределения для заданных a, v = к - 1, v 2 = п - к.

Регрессионный анализ - это статистический метод исследования зависимости результативной величины Y от объясняющих переменных (аргументов) х,- (/ = 1,2, ..., &), рассматриваемых в регрессионном анализе как неслучайные величины независимо от истинного закона распределения x f .

Обычно предполагается, что случайная величина Y имеет нормальный закон распределения с условным математическим ожиданием у = Ф(лг„ ..., х к), являющимся функцией от аргументов..., х к с постоянной, не зависящей от аргументов дисперсией сг.

Для проведения регрессионного анализа из + 1)-мерной генеральной совокупности (у, х ]у л: 2 , x Jy ..., х к) берется выборка объемом и, и каждое /-е наблюдение (объект) характеризуется значениями переменных (y h х л, ДГ/2, x U y ..., x ik), где Хц - значениеу-й переменной для y-го наблюдения (/ = 1, 2 ...п), у, - значение результативного признака дляу"-го наблюдения.

Наиболее часто используемая множественная линейная модель регрессионного анализа имеет вид

где р? - параметры регрессионной модели;

Г. - случайные ошибки наблюдения, не зависимые друг от друга, имеют нулевую среднюю и дисперсию а 2 .

Отметим, что модель справедлива для всех / = 1, 2,..., п линейна относительно неизвестных параметров Ро, Pi,..., Р„ Р* и аргументов.

Как следует из модели, коэффициент регрессии р, показывает, на какую величину в среднем изменится результативный признак у , если переменную x h увеличить на единицу при неизменных значениях остальных аргументов, т.е. является нормативным коэффициентом. В матричной форме регрессионная модель имеет вид

где Y - случайный вектор-столбец размерности (n х 1) наблюдаемых значений результативного признака

X - матрица размерности п х + 1) наблюдаемых значений аргументов, элемент матрицы х & рассматривается как неслучайная величина (/= 1,2,..., = 0, 1.....k;x i0 = 1);

р - вектор-столбец размерности (А + 1) х 1 неизвестных, подлежащих оценке параметров модели (коэффициентов регрессии);

е - случайный вектор-столбец размерности (п х 1) ошибок наблюдений (регрессионных остатков), компоненты вектора е, не зависимы друг от друга, имеют нормальный закон распределения с нулевым математическим ожиданием (Л/е, = 0) и неизвестной постоянной дисперсией a 2 (De., = а 2).

В матричном виде модель регрессии

В первом столбце матрицы X указываются единицы при наличии свободного члена в модели. Здесь предполагается, что существует переменная лг 0 , которая во всех наблюдениях принимает значения, равные 1.

Основная задача регрессионного анализа заключается в нахождении по выборке объемом п оценки неизвестных коэффициентов регрессии ро, Pi,..., Р у, ..., р* модели, т.е. вектора р.

Так как в регрессионном анализе х, рассматривается как неслучайные величины, а Me, = 0, то уравнение регрессии имеет вид:

для всех / = 1,2,я, или в матричной форме:

где Y -вектор-столбец с элементами

Для оценки вектора-столбца р наиболее часто используют метод наименьших квадратов, согласно которому в качестве оценки принимают вектор-столбец Ь, который минимизирует сумму квадратов отклонений наблюдаемых значений y h от модельных значений у,-, т.е. квадратичную форму:

где символом Т обозначена транспонированная матрица.

Наблюдаемые и модельные значения результативного признака у показаны на рис. 13.2.


Рис. 13.2.

Дифференцируя квадратичную форму О по и приравнивая частные производные к нулю, получим систему уравнений:

решая которую получим вектор-столбец оценок b , где b = (6 0 , 6„ Ь к) т. Согласно методу наименьших квадратов, вектор-столбец оценок коэффициентов регрессии получается по формуле

где X 1 - транспонированная матрица.V;

(Х Г Х)~ 1 - матрица, обратная матрице Х Т Х.

Зная вектор-столбец 6-оценок коэффициентов регрессии, найдем оценку у уравнения регрессии:

или в матричном виде:

где - вектор расчетных значений результативного показателя.

Оценка ковариационной матрицы вектора коэффициентов регрессии определяется выражением:

где s 2 - несмещенная оценка остаточной дисперсии о 2 , равная:

На главной диагонали ковариационной матрицы находятся дисперсии коэффициентов регрессии:

Значимость уравнения регрессии, т.е. гипотеза Я 0: р = О, или что (р 0 = Р! = ... = р* = 0), проверяется по F-критерию, наблюдаемое значение которого определяется по формуле

где

По таблице ^-распределения для заданных а и vi = к + 1, уг = л - - к- находятF Kp .

Гипотеза Я и отклоняется с вероятностью а, если Я набл > F Kp . Из этого следует, что уравнение является значимым, т.е. хотя бы один из коэффициентов регрессии отличен от нуля.

Для проверки значимости отдельных коэффициентов регрессии, т.е. гипотезы Но : р, = 0, где j = 1,2,..., к , используют /-критерий и вычисляют / на бл(А) = bj /Sfy. По таблице /-распределения для заданного а и v = п - к - 1 находят / кт.

Гипотеза Я 0 отвергается с вероятностью а, если j/ Ha6 J > t Kр. Из этого следует, что соответствующий коэффициент регрессии р/ значим, т.е. Р/ Ф 0 и переменную х,- следует включить в модель. В противном случае коэффициент регрессии незначим и соответствующая переменная в модель не включается. После проверки значимости коэффициентов регрессии реализуется алгоритм пошагового регрессионного анализа, состоящий в том, что исключается одна из незначительных переменных, которой соответствует минимальное по абсолютной величине значение / на6л После этого вновь проводят регрессионный анализ с числом факторов, уменьшенным на единицу. Алгоритм заканчивается получением уравнения регрессии со всеми значимыми по экономическим и статистическим критериям коэффициентами.

Существуют и другие алгоритмы пошагового регрессионного анализа, например с последовательным включением факторов.

Наряду с точечными оценками b h генеральных коэффициентов регрессии р, регрессионный анализ позволяет получать и интервальные оценки последних с доверительной вероятностью у.

Интервальная оценка с доверительной вероятностью у для параметра (З у имеет вид:

где / а находят по таблице /-распределения при вероятности а = 1 и числе степеней свободы v = п-к - 1.

Интервальная оценка показывает, на какую величину в лучшем и худшем случае изменится с доверительной вероятностью у величина у, если х,- увеличить на единицу.

Интервальная оценка для уравнения регрессии у в точке, определяемой вектором-столбцом начальных условий

записывается в виде

Интервал предсказания у „., с доверительной вероятностью у определяется как

где / а определяется по таблице /-распределения при v=l hv = п-к- 1.

По мере удаления вектора начальных условий х° от вектора средних х ширина доверительного интервала при заданном значении у будет увеличиваться (рис. 13.3), где х = (1, ... 9 х к).

Рис. 13.3. Точечная;" и интервальная [у-5

Одним из основных препятствий эффективного применения множественного регрессионного анализа является мулътиколлииеар- ность. Она связана с линейной зависимостью между аргументами х 2 , .... х к. В результате мультиколлинеарности матрица парных коэффициентов корреляции и матрица Х Г Х становятся слабообусловлен- ными, т.е. их определители близки к нулю.

Это приводит к неустойчивости оценок коэффициентов регрессии, завышению дисперсии s 2 h оценок коэффициентов b h так как в их

выражения входит обратная матрица (Х Г Х) Л, получение которой связано с делением на определитель матрицы (Х*Х). Отсюда следуют заниженные значения Кроме того, мультиколлинеарность приводит к завышению значения множественного коэффициента корреляции.

На практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы R больше 0,8, т.е. f > 0,8, то считают, что имеет место мультиколлинеарность, и в уравнение регрессии следует включать только один из показателей - x t или д

Чтобы избавиться от этого негативного явления, обычно используют алгоритм пошагового регрессионного анализа или строят уравнение регрессии на главных компонентах.

Пример 1. Согласно данным 20 сельскохозяйственных районов (п = 20), требуется построить регрессионную модель урожайности на основе следующих показателей:

у - урожайность зерновых культур (ц/га); т, - число колесных тракторов (приведенной мощ§юсти) на 100 га; х 2 - число зерноуборочных комбайнов на 100 га; х 3 - число орудий поверхностной обработки почвы на 100 га; х 4 - количество удобрений, расходуемых на гектар; х 5 - количество химических средств оздоровления растений, расходуемых на гектар.

Исходные данные для анализа приведены в табл. 13.1.

Исходные данные для анализа

Таблица 13.1

Решение. С целью предварительного анализа взаимосвязи показателей построена матрица R.

Таблица 13.2

Парные коэффициенты корреляции

Анализ матрицы парных коэффициентов корреляции показывает, что результативный признак наиболее тесно связан с показателем дг 4 - количеством удобрений, расходуемых на гектар

В то же время связь между аргументами достаточно тесная. Так, существует практически функциональная связь между числом колесных тракторов (л,) и числом орудий поверхностной обработки почвы

О наличии мультиколлинеарности свидетельствуют также коэффициенты корреляции:

Чтобы продемонстрировать отрицательное влияние мультиколлинеарности, рассмотрим рассчитанное на ЭВМ регрессионное уравнение урожайности, включив в него все исходные показатели:

В скобках указаны / Н авя(Р/) = h - расчетные значения /-критерия для проверки гипотезы о значимости коэффициента регрессии Я и: Р, = О, j = 1, 2, 3, 4, 5. Критическое значение / кп = 1,76 найдено по таблице /-распределения при уровне значимости a = 0,1 и числе степеней свободы v = 14.

Из уравнения следует, что статистически значимым является коэффициент регрессии только при лг 4 , так как Не

поддаются экономической интерпретации отрицательные значения коэффициентов регрессии при х х и х 5 , которые свидетельствуют о том, что повышение насыщенности сельского хозяйства колесными тракторами (*,) и химическими средствами оздоровления растений (х 5) отрицательно сказывается на урожайности. Таким образом, полученное уравнение регрессии неприемлемо.

После реализации алгоритма пошагового регрессионного анализа с исключением переменных и учетом того, что в уравнение должна войти только одна из трех тесно связанных переменных (л* ь х 2 или лг 3), получаем окончательное уравнение регрессии:

Уравнение значимо при а = 0,05 , так как F Ha6n = 266 > F KO = 3,20, найденного по таблице F-распределения при а = 0,05, v = 3 и v = 17. Значимы и коэффициенты регрессии pi и Р4, так как |/ набл | > /„,= 2,1 (при а = 0,05, v = 17). Коэффициент регрессии pi следует признать значимым (Pi ф 0) из экономических соображений; при этом /, = 2,09 лишь незначительно меньше /„, = 2,11. В случае если а = 0,1, /„, = 1,74, и коэффициент регрессии Pi статистически значим.

Из уравнения регрессии следует, что увеличение на единицу числа тракторов на 100 га пашни приводит к росту урожайности зерновых в среднем на 0,345 ц/га (/>, = 0,345).

Коэффициенты эластичности Э| = 0,068 и Э 4 = 0,161

показывают, что при увеличении показателей х х и х 4

на 1% урожайность зерновых повышается соответственно на 0,068% и 0,161%.

Множественный коэффициент детерминации г 2 = 0,469 свидетельствует о том, что только 46,9% вариации урожайности объясняется вошедшими в модель показателями (*, и х 4), т.е. насыщенностью растениеводства тракторами и удобрениями. Остальная часть вариации обусловлена действием неучтенных факторов (* 2 , х 3 , х$, погодными условиями и др.). Средняя относительная ошибка аппроксимации 5 = 10,5% свидетельствует об адекватности модели, так же как и величина остаточной дисперсии s 2 = 1,97.

Статистические методы прогнозирования

Трендовые модели прогнозирования. Статистические наблюдения в социально-экономических исследованиях обычно проводятся регулярно через равные отрезки времени и представляются в виде временных рядов x t , где t = 1, 2, ..., п. В качестве инструмента статистического прогнозирования временных рядов служат трендовые регрессионные модели, параметры которых оцениваются по имеющейся статистической базе, а затем основные тенденции (тренды) экстраполируются на заданный интервал времени.

Методология статистического прогнозирования предполагает построение и испытание многих моделей для каждого временного ряда, сравнение их на основе статистических критериев и отбор наилучших из них для прогнозирования.

При моделировании сезонных явлений в статистических исследованиях различают два типа колебаний: мультипликативные и аддитивные. В мультипликативном случае размах сезонных колебаний изменяется во времени пропорционально уровню тренда и отражается в статистической модели множителем. При аддитивной сезонности предполагается, что амплитуда сезонных отклонений постоянна и не зависит от уровня тренда, а сами колебания представлены в модели слагаемым.

Основой большинства методов прогнозирования является экстраполяция, связанная с распространением закономерностей, связей и соотношений, действующих в изучаемом периоде, за его пределы или - в более широком смысле слова - это получение представлений о будущем на основе информации, относящейся к прошлому и настоящему.

Наиболее известны и широко применяются трендовые и адаптивные методы прогнозирования. Среди последних можно выделить такие, как методы авторегрессии и скользящего среднего (Бокса-Дженкинса и адаптивной фильтрации), методы экспоненциального сглаживания (модели Хольта, Брауна и экспоненциальной средней) и др.

Для оценки качества исследуемой модели прогноза используется несколько статистических критериев.

Наиболее распространенными критериями являются следующие:

Относительная ошибка аппроксимации:

где е, = х, -х, - ошибка прогноза;

х, - фактическое значение показателя; х ( - прогнозируемое значение.

Данный показатель используется в случае сравнения точности прогнозов по нескольким моделям. При этом считают, что точность модели является высокой, когда 8

Средняя квадратическая ошибка:

где к - число оцениваемых коэффициентов уравнения.

Наряду с точечным в практике прогнозирования широко используют интервальный прогноз. При этом доверительный интервал чаще всего задается неравенствами

где t u - табличное значение, определяемое по /-распределению Стьюдента при уровне значимости а и числе степеней свободы п - к.

В литературе представлено большое число математико-статистических моделей для адекватного описания разнообразных тенденций временных рядов.

Наиболее распространенными видами трендовых моделей кривых роста, характеризующих монотонное возрастание или убывание исследуемого явления, являются:

Правильно выбранная модель должна соответствовать характеру изменений тенденции исследуемого явления. При этом величина е, должна носить случайный характер с нулевой средней.

Кроме того, ошибки аппроксимации е ( должны быть независимыми между собой и подчиняться нормальному закону распределения

c t e N (0, о). Независимость ошибок т.е. отсутствие автокорреляции

остатков, обычно проверяется по критерию Дарбина-Уотсона, основанного на статистике:

где е (=х ( - х (.

Если отклонения не коррелированны, то величина DW приблизительно равна двум. При наличии положительной автокорреляции 0 DW DW

О коррелированности остатков можно также судить по коррело- грамме для отклонений от тренда, которая представляет собой графики функции относительно т коэффициента автокорреляции, который вычисляется по формуле

где т = 0,1,2.....

После выбора наиболее подходящей аналитической функции для тренда его используют для прогнозирования на основе экстраполяции на заданное число временных интервалов.

Рассмотрим задачу сглаживания сезонных колебаний, исходя из ряда V t = x t -x t , где x t - значение исходного временного ряда в момент /,

а л- -оценка соответствующего значения тренда (t= 1,2,...»п).

Так как сезонные колебания представляют собой циклический, повторяющийся во времени процесс, то в качестве сглаживающих функций используется гармонический ряд (ряд Фурье) следующего вида:

Оценки параметров а. и (3, в модели определяют из выражений:

где - максимально допустимое число гармоник;

Угловая частота /-й гармоники (/ = 1,2,...,т ).

Пусть т - число гармоник, используемых для сглаживания сезонных колебаний (т

а расчетные значения временного ряда исходного показателя определяются по формуле

Адаптивные методы прогнозирования. При использовании трендовых моделей в прогнозировании обычно предполагается, что основные факторы и тенденции прошлого периода сохраняются на период прогноза или что можно обосновать и учесть направление из изменений в перспективе. Однако в настоящее время, когда происходит структурная перестройка экономики, социально-экономические процессы даже на макроуровне становятся очень динамичными. В этой связи исследователь часто имеет дело с новыми явлениями и с короткими временными рядами. При этом устаревшие данные при моделировании часто оказываются бесполезными и даже вредными. Таким образом, возникает необходимость строить модели, опираясь в основном на малое количество самых свежих данных, наделяя модели адаптивными свойствами.

Важную роль в деле совершенствования прогнозирования должны сыграть адаптивные методы, цель которых заключается в построении самонастраивающихся моделей, которые способны учитывать информационную ценность различных членов временного ряда и давать достаточно точные оценки будущих членов данного ряда. Адаптивные модели гибки, однако на их универсальность, пригодность для любого временного ряда рассчитывать не приходится.

При построении конкретных моделей необходимо учитывать наиболее вероятные закономерности развития реального процесса. Исследователь должен закладывать в модель только те адаптивные свойства, которые необходимы для слежения за реальным процессом с заданной точностью.

В основе адаптивного направления лежит простейшая модель экспоненциального сглаживания, обобщение которой привело к появлению целого семейства адаптивных моделей. Простейшая адаптивная модель основывается на вычислении экспоненциально взвешенной скользящей средней.

Экспоненциальное сглаживание исходного временного ряда x t осуществляется по рекуррентной формуле

где S, - значение экспоненциальной средней в момент /;

5,|- в момент/-!;

а - параметр сглаживания, адаптации.

Выражение экспоненциальной средней можно представить в виде:

В этой формуле экспоненциальная средняя в момент t выражена как сумма экспоненциальной средней предшествующего момента 5,_, и доли а отклонения текущего наблюдения x t от экспоненциальной средней момента / - 1.

Последовательно используя рекуррентное соотношение, можно выразить экспоненциальную среднюю S, через все предшествующие значения временного ряда:

где S a - величина, характеризующая начальные условия для первого применения формулы средней, при /=1.

Отсюда следует, что

т.е. величина S , оказывается взвешенной суммой всех членов ряда. При этом веса изменяются экспоненциально в зависимости от давности наблюдения, откуда и название S t - экспоненциальная средняя.

Из последней формулы следует, что увеличение веса более свежих наблюдений может быть достигнуто повышением а .. В то же время для сглаживания случайных колебаний временного ряда х, величину а нужно уменьшить. Два названных требования находятся в противоречии и на практике при выборе а исходят из компромиссного решения.

Экспоненциальное сглаживание является простейшим видом самообучающейся модели с параметром адаптации а . Разработано несколько вариантов адаптивных моделей, которые используют процедуру экспоненциального сглаживания и позволяют учесть наличие у временного ряда х , тенденций и сезонных колебаний. Рассмотрим некоторые из таких моделей.

Адаптивная полиномиальная модель первого порядка. Рассмотрим алгоритм экспоненциального сглаживания, предполагающий наличие у временного ряда x t линейного тренда. В основе модели лежит гипотеза о том, что прогноз может быть получен по уравнению

где.?.(/) - прогнозируемое значение временного ряда на момент (/ + т);

a ir xa 2( - оценки адаптивных коэффициентов полинома первого порядка в момент /; т - величина упреждения.

Экспоненциальные средние 1-го и 2-го порядка для модели имеют вид

где (5= 1 , а оценка модельного значения ряда с периодом упреждения т равна

Для определения начальных условий первоначально по данным временного ряда находим методом наименьших квадратов оценки линейного тренда:

и принимаем Тогда начальные условия определяются как:

ЗАДАЧИ И УПРАЖНЕНИЯ

1. В таблице 13.3 представлены темпы прироста (%) следующих макроэкономических показателей десяти развитых стран мира: ВНП (*,), промышленного производства (д 2), индекса цеп (д 3) и доли безработных (д 4).

Таблица 13.3

Требуется:

  • 1) найти оценку коэффициента корреляции между темпами прироста ВНП (д,) и промышленного производства (д 2), при а = 0,05 проверить его значимость, а при у= 0,923 найти его интервальную оценку;
  • 2) оценить тесноту связи между д, и д 3 , при а = 0,05 проверить значимость коэффициента корреляции между этими показателями, а при у= 0,857 найти интервальную оценку для р и;
  • 3) найти точечную и интервальную оценку коэффициента корреляции д 2 по д 3 , приняв у = 0,95;
  • 4) определить долю дисперсии д 2 , обусловленную влиянием д 4 ;
  • 5) при а - 0,05 проверить значимость, а при у = 0,888 найти интервальную оценку коэффициента корреляции между д 3 и д 4 .
  • 2. При исследовании взаимосвязи цен на следующие виды продовольственных товаров: говядина (Д|), растительное масло (д 2), сахар- песок (д 3) и хлеб белый в/с (д 4) в п = 22 городах Центрального района России получена матрица парных коэффициентов корреляции:

Для трехмерной совокупностиx l9 х 2 истребуется:

  • 1) построить матрицу парных коэффициентов корреляции;
  • 2) при а = 0,1 проверить значимость частного коэффициента корреляции р Щ4) и найти его интервальную оценку при у = 0,954. Сравнить полученные результаты.

Как влияет показатель х А на тесноту связи между х, и х 2 ?

  • 3) при а = 0,05 проверить значимость множественного коэффициента корреляции /?4
  • 3. По данным задачи 1.5 для трехмерной совокупности х 2 , С? *4 требуется:
  • 1) построить матрицу парных коэффициентов корреляции R;
  • 2) при а = 0,01 проверить значимость частного коэффициента корреляции /э 2 з и найти его интервальную оценку при у = 0,9. Сравнить полученные результаты. Как влияет показатель х 4 на тесноту связи между Л"з и х 2 ?
  • 3) при (У.=0,05 проверить значимость множественного коэффициента корреляции /? 2(3 4>. Дайте интерпретацию г, 2 (34) .
  • 4. На основании данных о динамике темпов прироста курса акций за 5 месяцев, приведенных в табл. 13.4.

Таблица 13.4

и предположения, что генеральное уравнение регрессии имеет вид у - Р 0 4-Pjjf, требуется:

  • 1) определить оценки Ъ 0 и 6, параметров уравнения регрессии и остаточной дисперсии s 2 ;
  • 2) проверить при а = 0,01 значимость коэффициента регрессии, т.е. гипотезы Н 0: р, = 0;
  • 3) с надежностью у= 0,95 найти интервальные оценки параметров Ро и р,;
  • 4) с надежностью у = 0,9 установить интервальную оценку условного математического ожидания у при х 0 = 4;
  • 5) определить при у = 0,9 доверительный интервал предсказания у п+] в точке х = 5.
  • 5. Себестоимость (у) одного экземпляра книги в зависимости от тиража (х) (тыс. экз.) характеризуется данными, собранными издательством (табл. 13.5). Определить МНК-оценки Ь 0 и Ь } параметров уравнения регрессии гиперболического вида у = Р 0 +Р, -, с надежностью

у = 0,9 построить доверительные интервалы для параметров р 0 и р, а также условного математического ожидания у при х = 10.

Таблица 13.5

Тираж (х), тыс. экз.

Себестоимость (у)

6. В таблице 13.6 представлены данные о темпах прироста (%) следующих макроэкономических показателей п = 10 развитых стран мира за 1992 г. : ВНП -х 19 промышленного производства -х 2 , индекса цен -х у

Таблица 13.6

Примем за объясняемую величину (у) показатель х ь а за объясняющую (х) переменную х 2 и предположим, что уравнение регрессии имеет вид:

Требуется:

  • 1) определить (с учетом линеаризации уравнения) МНК-оценки Ьо и Ь, параметров уравнения регрессии, оценку s 2 остаточной дисперсии;
  • 2) проверить при а = 0,05 значимость коэффициента регрессии, т.е. Н„: р, = 0;
  • 3) с надежностью у = 0,9 найти интервальные оценки р 0 и р,;
  • 4) найти при у = 0,95 доверительный интервал для у в точке х 0 = = x h где / = 5;
  • 5) сравнить статистические характеристики уравнений регрессий: 1, 2 и 3.
  • 7. Задачу 6 решить, приняв за объясняемую величину (у) показатель х ь а за объясняющую (х) переменнуюх 3 .
  • 8. В таблице 13.7 представлены следующие макроэкономические показателя США за 10 лет: ВНП (х,) в млрд дол.; доля безработных (х 2) в %; индекс цен (х 3) в %; объем экспорта (х 4) в млрд дол. и объем импорта (х 5) в млрд дол.

Для показателя ВНП (х,) требуется:

1) найти (с учетом линеаризации уравнения) МНК-оценку тренда, который определяется уравнением вида:

  • 2) проверить при а = 0,05 гипотезу Н 0: Pi = 0 и дать экономическую интерпретацию коэффициенту регрессии;
  • 3) рассчитать и сравнить статистические характеристики трендов: s 2 ; 8 и DW.

Таблица 13.7

  • 9. Задачу 8 решить для показателя х 2 - доля безработных (в %).
  • 10. Задачу 8 решить для показателя х 3 - индекс цеп (в %).
  • 11. Задачу 8 решить для показателя х 4 - объем экспорта (в млрд

12. В таблице 13.8 представлены данные по месяцам 2004 г. о числе заключенных в регионе браков х,.

Таблица 13.8

Требуется:

1) найти (с учетом линеаризации уравнения) МНК-оценку уравнения регрессии вида

где - угловая частота;

  • б) 0;
  • в) 0,4;
  • г) 1,3?
  • 2. Известно, что х 3 усиливает связь между величинами х { и х 2 . По результатам наблюдений получен частный коэффициент корреляции г 12(3) = -0,45. Какое значение может принять парный коэффициент

корреляции г 12:

  • а) 0,4;
  • б) 0,2;
  • в) -0,8;
  • г) 1,2?
  • 3. Множественный коэффициент корреляции г 1(23) =0,8. Определите, какой процент дисперсии величины.т, объясняется влиянием
  • * 2 и * 3:
    • а) 28%;
    • б) 32%;
    • в) 64%;
    • г) 80%.
    • 4. Что минимизируется согласно методу наименьших квадратов:

5. Дана ковариационная матрица вектора

Чему равна оценка дисперсии элемента Ь 2 вектора Ь, т.е.

  • а) 5,52;
  • б) 0,04;
  • в) 0,01;
  • г) 2,21?
  • 6. Уравнению регрессии у = 2,88-0,72.v, -1,51л соответствует множественный коэффициент корреляции r v(12) = 0,84. Какая доля

вариации результативного показателя у (в %) объясняется входящими в уравнение регрессии переменными х , и х 2:

  • а) 70,6;
  • б) 16,0;
  • в) 84,0;
  • г) 29,4?

КОНТРОЛЬНЫЕ ВОПРОСЫ

  • 1. Что характеризует парный, частный и множественный коэффициенты корреляции? Сформулируйте их основные свойства.
  • 2. Какие задачи решаются методами регрессионного анализа?
  • 3. В чем состоят отрицательные последствия мультиколлинеарности и как можно избавиться от этого негативного явления?
  • 4. Что характеризуют коэффициенты регрессии в линейной и степенной моделях?
  • 5. Как проверяется значимость уравнения регрессии и коэффициентов регрессии?
  • 6. Какие модели прогнозирования вы знаете и каковы их особенности?
  • 7. В чем состоит статистический подход к прогнозированию, моделированию тенденций и сезонных явлений в статистических исследованиях?
  • 8. Какие трендовые модели вам известны и как оценивается их качество?
  • 9. В чем особенность адаптивных методов прогнозирования?
  • 10. Каким образом осуществляется экспоненциальное сглаживание временного ряда?

ЛИТЕРАТУРА

Айвазян С.А. Мхитарян В.С. Прикладная статистика и основы эконометрики: в 2 т. М: ЮНИТИ, 2001

Статистика: учебник / под ред. В.С. Мхитаряна. М. : Экономика, 2003.

Теория статистики: учебник / под ред. Р.А. Шмойловой. М. : Финансы и статистика, 2007.

Экономические данные представляют собой количественные характеристики каких-либо экономических объектов или процессов. Они формируются под действием множества факторов, не все из которых доступны внешнему контролю. Неконтролируемые факторы могут принимать случайные значения из некоторого множества значений и тем самым обуславливать случайность данных, которые они определяют. Стохастическая (вероятностная) природа экономических данных обуславливает необходимость применения соответствующих статистических методов для их обработки и анализа.

Изучение действительности показывает, что вариация каждого изучаемого признака находится в тесной связи и взаимодействии с вариацией других признаков, характеризующих исследуемую совокупность единиц. Вариация уровня производительности труда работников предприятий зависит от степени совершенства применяемого оборудования, технологии, организации производства, труда и управления и других самых различных факторов.

При изучении конкретных зависимостей одни признаки выступают в качестве факторов, обусловливающих изменение других признаков. Признаки этой первой группы в дальнейшем будем называть признаками-факторами (факторными признаками); а признаки, которые являются результатом влияния этих факторов, будем называть результативными.

Рассматривая зависимости между признаками, необходимо выделить, прежде всего, две категории зависимости: 1) функциональные и 2) корреляционные.

Функциональные связи характеризуются полным соответствием между изменением факторного признака и изменением результативной величины, и каждому значению признака-фактора соответствуют вполне определенные значения результативного признака. Функциональная зависимость может связывать результативный признак с одним или несколькими факторными признаками. Так, величина начисленной заработной платы при повременной оплате труда зависит от количества отработанных часов.

В корреляционных связях между изменением факторного и результативного признака нет полного соответствия, воздействие отдельных факторов проявляется лишь в среднем при массовом наблюдении фактических данных. Одновременное воздействие на изучаемый признак большого количества самых разнообразных факторов приводит к тому, что одному и тому же значению признака-фактора соответствует целое распределение значений результативного признака, поскольку в каждом конкретном случае прочие факторные признаки могут изменять силу и направленность своего воздействия.

При сравнении функциональных и корреляционных зависимостей следует иметь в виду, что при наличии функциональной зависимости между признаками можно, зная величину факторного признака, точно определить величину результативного признака. При наличии же корреляционной зависимости устанавливается лишь тенденция изменения результативного признака при изменении величины факторного признака.

Статистические показатели могут состоять между собой в следующих основных видах связи: балансовой, компонентной, факторной и др.

Балансовая связь - характеризует зависимость между источниками формирования ресурсов (средств) и их использованием.

Компонентные связи показателей характеризуются тем, что изменение статистического показателя определяется изменением компонентов, входящих в этот показатель, как множители

Важное значение компонентной связи состоит в том, что она позволяет определять величину одного из неизвестных компонентов

Факторные связи характеризуются тем, что они проявляются в согласованной вариации изучаемых показателей. При этом одни показатели выступают как факторные, а другие - как результативные.

Факторные связи могут рассматриваться как функциональные и корреляционные.

При функциональной связи изменение результативного признака всецело зависит от изменения факторного признака:

При корреляционной связи изменение результативного признака не всецело зависит от факторного признака, а лишь частично, так как возможно влияние прочих факторов.

Особенности корреляционной статистической связи

Статистика сталкивается с зависимостями между количественными и качественными показателями и признаками. Её задача: обнаружить эти зависимости и дать им характеристику. Среди взаимосвязанных признаков одни могут рассматриваться как определенные факторы, влияющие на изменение других (факторные), а вторые - как следствие и результат влияния первых (результативные).

2 вида связи: функциональная и статистическая (её частный случай - корреляционная связь).

Функциональная: связь между 2 переменными х и у, когда определенному значению х строго соответствует одно или несколько значений у, и с изменением переменной х, переменная у также строго по правилам изменяется. Встречаются в математике, физике и тд., где встречаются жестко детерминированные связи (площадь квадрата - соотношение величины его сторон и площади при их увеличении), также могут быть и в экономике.

Существуют иного рода связи, встречающиеся в области экономических и некоторых других явлений, где взаимно действуют многие факторы, комбинация которых приводит к вариации значений результативного признака при одинаковом значении факторного признака (изучение зависимости урожайности определенной культуры от количества выпавших осадков, которые есть факторный признак, а урожайность - результативный => между ними нет жестко детерминированной связи, тк на урожайность помимо осадков влияет еще много других факторов).

Там, где воздействует много факторов, в том числе и случайных, выявить зависимости, рассматривая единичный случай, невозможно. Такие связи можно обнаружить только при массовом наблюдении как статистические закономерности - статистическая связь.

Корреляционная связь - понятие более узкое, чем статистическая. Она является предметом изучения статистики. Корреляция - особенность зависимости, при которой определенному значению одного факторного признака может соответствовать несколько значений результативного показателя.

По характеру изменений в парной корреляции выделяют прямую и обратную связь .

При прямой зависимости значения обоих изменяются в одном направлении, при обратной - значения факторного и результативного признаков изменяются в разных направлениях.

Корреляционные связи помогают в решении следующих задач:

· наличие или отсутствие корреляционной зависимости между изучаемыми признаками. Может быть решена на основе параллельного сопоставления (сравнения) значений х и у, при помощи группировок и построения корреляционных таблиц;

· измерение тесноты связи между 2 и более признаками с помощью специальных коэффициентов - корреляционный анализ;

· определение уровня регрессии - математической модели, в которой среднее значение результативного признака у рассматривается как функция одной или нескольких переменных-факторных признаков - регрессионный анализ.

Корреляционно-регрессионный анализ подразумевает всестороннее исследование корреляционных связей. Для решения вышепоставленных задач в статистике используются различные методы и показатели (коэффициенты), различающиеся по сложности.

Использование различных методов определяется конкретной целью исследования. Для некоторых требуется только констатация факта наличия связи, а для некоторых, наиболее сложных разработаны специальные компьютерные программы.

Теория корреляции начала разрабатываться во второй половине XIX в., а особенного расцвета достигла в XX в. Основоположниками теории корреляции являются английские биометрики Гальтон и Пирсон, в России их идеи получили развитие в трудах Чупрова.

ТЕМА 11.

СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗЕЙ

СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ

1. Виды и формы взаимосвязей между социально-экономическими явлениями. Общественная жизнь состоит из большого количества сложных явлений, которые формируются под влиянием многочис­ленных, разнообразных и взаимосвязанных факторов. Понять и изучить какое-либо явление можно, исследуя его во взаимосвязи с окружающими признаками.

В статистике различают факторные и результативные приз­наки.

Факторные (независимые ) признаки обусловливают изменения других, свя­занных с ними признаков.

Результативные (зависимые ) признаки изменяются под действием фактор­ных признаков.

Между явлениями и их признаками различают прежде всего два вида связей: функциональные и стохастические (статистические, вероятностные), каждая из ко­торых имеет свои особенности. Частный случай стохастических связей - корреляционные связи.

При функциональной связи изменение результативного признака полностью зависит от изменения факторного признака :

Примером функциональной связи в экономике может служить зависимость про­изводительности труда от объема произведенной продукции и затрат рабочего времени. Следует отметить, что если – детерминирован­ная, не случайная величина, то и функционально зависящая от нее ве­личина тоже является детерминированной.

Для функциональной связи характерны следующие особен­ности:

1) каждому значению величины факторного признака соответствует только одно или несколько точно определенных значений результативного признака:

2) эта связь обычно выражается формулами, что в большей степени присуще точным наукам (математике, физике):

3) функциональная зависимость с одинаковой силой проявляется у всех единиц в совокупности;

4) она является полной и точной, так как обычно известны перечень всех факторов и механизм их воздействия на результативный признак (в виде уравнения).

Однако гораздо чаше в экономике имеет место не функциональ­ная, а статистическая зависимость , когда каждому фиксированному значению независимой переменной соответствует не одно, а множе­ство значений зависимой переменной , причем заранее нельзя ска­зать, какое именно значение примет . Это связано с тем, что на , кроме переменной , влияют и многочисленные неконтролируемые случайные факторы. В этой ситуации – случайная величина, а пе­ременная может быть как детерминированной, так и случайной ве­личиной. Частным случаем статистической зависимости является кор­реляционная , при которой функциональной зависимостью связаны фактор и среднее значение (математическое ожидание) результатив­ного показателя .


При корреляционной связи изменение результативного признака не всецело зависит от факторного признака , а лишь частично, так как возможно влияние прочих факторов :

Примером корреляционной связи показателей коммерческой деятельности является зависимость сумм издержек обращения от объема товарооборота. В этой связи, помимо факторного признака - объема товарооборота , на результативный признак (сумму издержек обращения ) влияют и другие факторы, в том числе и не учтенные .

Корреляционные связи имеют следующие особенности:

1) средняя величина результативною признака меняемся под влиянием изменения многих факторных признаков, ряд из которых может быть неизвестен;

2) разнообразие факторов, их взаимосвязи и противоречивое действие вызывают широкое варьирование результативного npизнака;

3) корреляционные связи обнаруживаются не в единичных случаях, а в массе, для их исследования требуются массовые на­блюдения;

4) связь между признаками-факторами и результативным при­знаком неполная, а проявляется лишь в общем, среднем.

Изучая взаимосвязи между признаками, их классифицируют по направлению, форме, числу факторов:

· по направлению связи делятся на прямые и обратные. При прямой связи направление изменения результа­тивного признака совпадает с направлением изменения призна­ка-фактора. С увеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение) результативного признака.Обратные связи характеризуются тем, что направление изме­нения результативного признака не совпадает с направлением изменения признака-фактора. С увеличением (уменьшением) значений факторного признака происходит уменьшение (увели­чение) результативного признака. Например, чем выше квалификация рабочего, тем выше уровень производительности его труда (прямая связь). Чем выше производительность труда, тем ниже себестоимость единицы продукции (обратная связь);

· по форме (виду функции) связи делят на линейные (прямолинейные) и нелинейные (криволинейные).Линейная связьотображается прямой линией, нелинейная связь – кривой (параболой, гиперболой и т.д.). При наличии этих связей с возрастанием значения факторного признака происходит равномерное возрастание (или убывание) значения результативного признака;

по количеству факторов, действующих на результативный признак , связи подразделяются на однофакторные (парные) и многофакторные.Однофакторные (парные) связи отражают зависимость между одним признаком-фактором и результативным признаком (при абстрагировании от влияния других признаков). Многофакторные (множественные) связи характеризуются зависимостью между несколькими факторными признаками и результативным признаком (факторы действуют комплексно, т.е. одновременно и во взаимосвязи).

Для изучения связей и их количественного выражения в статистике используются различные методы.

Для выражения функциональных связей применяют балансовый метод и метод компонентных связей.

Метод балансовых построений широко используют для анализа связей и пропорций в экономике. Статистический баланс представляет собой систему показателей, которая состоит из двух сумм абсолютных величин, связанных знаком равенства:

Примером балансов такого рода служат баланс основных средств и баланс трудовых ресурсов в какой-нибудь организации. Суммы показателей в них образуют систему величин, характеризующих размер ресур­сов на начало периода, поступление и выбытие по источникам, размер ресурсов на конец периода. Например, , где – остаток товаров на начало отчетного периода; – поступление товаров за период; – выбытие товаров в изучаемом периоде; – остаток товаров на конец отчетного периода.

Левая часть формулы характеризует предложение товаров , а правая часть – использование товарных ресурсов .Посредством балансов связывают в единую систему абсолютные величины, показывающие движение ресурсов.

Данную сумму можно представить следующим равенством: остаток на начало + приход = расход + остаток на конец. Пример, продано в розницу = остаток на начало + приход – продано оптом – остаток на конец (табл.1).

Таблица 1

Таблица балансового метода

Социально-экономические явления представляют собой результат одновременного воздействия большого числа причин. При изучении этих явлений необходимо выявить основные причины, абстрагируясь от второстепенных.

Следует обратить внимание на этапы статистического изучения связей:

1 этап – качественный анализ явления, т.е. анализ природы явления методами экономической теории, социологии, конкретной экономики;

2 этап – построение модели связи;

3 этап – интерпретация результатов.

Связи между признаками и явлениями, ввиду их большого разнообразия, классифицируются по ряду оснований. Признаки по их значению для изучения взаимосвязи делятся на 2 класса:

1) признаки, обуславливающие изменение других связанных с ними признаков, называются факторными;

2) результативные, изменяющиеся под действием факторных признаков.

Связи между явлениями и их признаками классифицируются по степени тесноты, по направлению и по аналитическому выражению.

В статистике различают функциональную связь и стохастическую зависимость. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частым случаем такой связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

По направлению выделяют связь прямую и обратную. По аналитическому выражению выделяют связи прямолинейные (линейные) и нелинейные (криволинейные).

Следует обратить внимание на основные методы выявления наличия связи, ее характера и направления:

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Допустим, имеются данные о двух величинах:

Х – 1 2 3 4 5 6 7 8 9

У – 5 6 9 10 14 17 15 20 23

Мы видим, что с увеличением величины Х величина У также возрастает. Можно сделать предположение, что связь между ними прямая и что ее можно описать или уравнением прямой, или уравнением параболы второго порядка.

Статистическую связь между двумя признаками можно изобразить графически и по графику судить о наличии, направлении и форме связи. На оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного. Соединив полученные точки нанесенных на график значений Х и У прямыми линиями, получается ломаная, которая называется «ломаная регрессии». Число точек ломаной регрессии должно строго соответствовать числу единиц наблюдения, по которым даны значения обоих признаков. Кривая позволит судить о форме связи, об аналитическом ее выражении.



Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями прямой, параболы, гиперболы. Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о наличии линейной связи между ними, а при обратной связи – гиперболической. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная функция.

Модель регрессии может быть построена как по индивидуальным значениям признака, так и по сгруппированным данным.



Для выявления связи между признаками по достаточно большому числу наблюдений используется корреляционная таблица. В ней можно отобразить только парную связь, т.е. связь результативного признака с одним фактором, и на ее основе построить уравнение регрессии и определить показатели тесноты связи. Само уравнение регрессии может иметь линейную, параболическую и др. формы. Для составления корреляционной таблицы парной связи статистические данные необходимо предварительно сгруппировать по обоим признакам. (Х и У), затем построить таблицу, по строкам в которой отложить группы результативного, а по столбцам – группы факторного признаков.

Корреляционная таблица дает общее представление о направлении связи. Если оба признака (Х и У) располагаются в возрастающем порядке, а частоты (f xy ) сосредоточены по диагонали сверху вниз направо, то можно судить о прямой связи между признаками. В противном случае – об обратной.

О тесноте связи между признаками Х и У по корреляционной таблице можно судить по кучности расположения частот вокруг диагонали (насколько заполнены клетки таблицы в стороне от нее). Если клетки заполнены большими цифрами, то связь слабая. Чем ближе частоты (f xy ) располагаются к одной из диагоналей, тем теснее связь. Если в расположении частот (f xy ) нет системности, то можно судить об отсутствии связи.

Рассмотрим анализ статистических данных по корреляционной таблице, используя данные примера из темы 9 (таблица 9.8). Вначале сгруппируем единицы наблюдения по значениям факторного и результативного признаков, образовав 4 группы. Величина интервала:

Группы для факторного признака:

I - 4 –7 II - 7-10 III – 10-13 IV – 13-16

Группы для результативного признака:

I - 8,43-11,38 III – 14,33 – 17,28 II – 11,38 - 14,33 IV – 17,28-20,23

Т а б л и ц а 11.1 – Корреляционная таблица

Средняя выработка, тыс.р./чел. у Энерговооруженность труда, кВтч/чел-ч, х
f у
8,43-11,38 9,905 -- -- 49,53 272,39
11,38-14,33 12,855 -- -- 38,57 327,80
14,33-17,28 15,805 -- -- -- 15,81 181,76
17,28-20,23 18,755 -- -- -- 18,76 271,95
F х -- 122,6 1053,9
-- 16,5 34,0 11,5 29,0 91,0 -- --
-- 90,75 289,0 132,25 420,5 932,5 -- --
-- 5,08 9,22 13,36 17,5 --- --- ---

Анализ таблицы показывает, что частоты (f xy ) расположены по диагонали сверху вниз, что свидетельствует о наличии прямой связи между энерговооруженностью труда и выработкой. Наблюдается концентрация частот вокруг главной диагонали и незаполненность оставшихся клеток, поэтому можно предположить достаточно тесную связь между рассматриваемыми признаками.

Расчет и анализ средних значений по группам факторных признаков х подтверждает наличие прямолинейной зависимости между х и у .

Считая, что зависимость описывается уравнением прямой (у х =а о +а 1 х ) коэффициенты а о , а 1 определим из системы нормальных уравнений вида:

Отсюда: а 0 = - 2,51; а 1 = 1,38.

Следовательно

Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии. Построение моделей множественной регрессии следует осуществлять по этапам:

1) выбор формы связи (уравнения регрессии);

2) отбор факторных признаков;

3) обеспечение достаточного объема совокупности для получения несмещенных оценок.

Практика построения многофакторных моделей взаимосвязи показывает, что все реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей:

1) линейная: ;

2) степенная: ;

3) показательная: ; (11.2)

4) параболическая: ;

5) гиперболическая: .

Надо иметь в виду, что основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации.

При построении моделей регрессии можно столкнуться с проблемой мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель. Мультиколлинеарность существенно искажает результаты исследования; ее устранение может реализоваться через исключение из корреляционной модели одного или нескольких линейно-связанных факторных признаков. А о наличии мультиколлинеарности можно судить по величине парного коэффициента корреляции ().

В уравнениях регрессии параметр а 0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр а 1 (а 2) коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения.

Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. Значимость коэффициента регрессии осуществляется с помощью t – критерия Стьюдента:

где ai 2 – дисперсия коэффициента регрессии, которая может быть определена по выражению:

где у 2 – дисперсия результативного признака;

к – число факторных признаков.

Параметр модели признается статистически значимым, если t p >t кр (табличное).

Проверка адекватности всей модели осуществляется с помощью величины средней ошибки аппроксимации (Е ):

Значение Е не должно превышать 12-15%.

Важной задачей изучения и количественного измерения взаимосвязи социально-экономических явлений является измерение тесноты и направления связи.

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции. В статистической теории разработаны и на практике применяются различные модификации формул расчета данного коэффициента:

Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость:

где а i – коэффициент регрессии в уравнении связи;

Среднее квадратическое отклонение соответствующего факторного признака.

Линейный коэффициент корреляции изменяется в пределах от -1 до 1: -1< <1. Знаки коэффициентов регрессии и корреляции совпадают. При этом интерпретацию выходных значений коэффициента корреляции можно представить в таблице11.2:

Т а б л и ц а 11.2 – Оценка линейного коэффициента корреляции

Значимость линейного коэффициента корреляции проверяется на основе t – критерия Стьюдента:

Если расчетное значение t p >t кр (табличное), то гипотеза об отсутствии связи отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а следовательно, и о статистической существенности зависимости между х и у . Пример расчета коэффициента корреляции рассмотрен в теме 9 .

Множественный коэффициент корреляции вычисляется при наличии линейной связи между результативными и несколькими факторными признаками, а также между каждой парой факторных признаков:

где 2 – дисперсия теоретических значений результативного признака, рассчитанная по уравнению множественной регрессии;

2 – общая дисперсия результативного признака.

Проверка значимости коэффициента множественной корреляции осуществляется на основе F – критерия Фишера:

Гипотеза о незначительности коэффициента множественной корреляции отвергается, если Fp >Fкр (табличное). R изменяется в пределах от 0 до1 и по определению положителен:

0>R <1.

Следует обратить внимание на статистическую оценку социальных явлений, которая осложняется тем, что многие социальные явления не имеют количественной оценки.

Количественная оценка связей социальных явлений осуществляется на основе расчета и анализа целого ряда коэффициентов.

Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции. Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, т.е. состоящим из двух качественно отличных друг от друга значений признака.

Т а б л и ц а 11.3 – Таблица для вычисления коэффициентов ассоциации и контингенции

а в а +в
с d c +d
a +c b +d a +b +c +d

Коэффициенты вычисляются по формулам:

Ассоциации:

Контингенции:

При этом К а >К к . связь считается подтвержденной, если К а >0,5 или К к >0,3.

Например, зависимость сокращения рабочих от места работы исследовалась в ходе социологического опроса 200 респондентов, результаты которого представлены в следующей таблице 11.4.

Т а б л и ц а 11.4 – Исходные данные

Коэффициент ассоциации:

Чем ближе величины Кп и Кч к 1, тем теснее связь.

Рассмотрим вспомогательную таблицу для расчета коэффициента взаимной сопряженности (таблица 11.5).

Т а б л и ц а 11.5 – Вспомогательная таблица для расчета коэффициента взаимной сопряженности

у х I II III Всего
I n xy n x
II n x
III n x
Итого n у N y n y n

Например, на основе опроса студентов получены следующие данные (таблица 11.6).

Т а б л и ц а 11.6 – Исходные данные

Существует ли взаимосвязь между ответами на поставленный вопрос и курсом, на котором обучаются студенты?

Для этого рассчитаем коэффициенты Пирсона и Чупрова.

Следовательно, связь между ответами на вопрос и курсом, на котором обучаются студенты, достаточно тесная. Можно предположить, что чем старше студенты, тем более они заинтересованы в увеличении учебной нагрузки по специальным дисциплинам.

| следующая лекция ==>