Основи вибіркового дослідження та формування простої випадкової вибірки. Генеральна сукупність та вибіркове дослідження. Статистична достовірність Розмір вибіркової сукупності

Емпіричні вважаються одним з основних засобів вивчення суспільних відносин і процесів. Вони забезпечують отримання надійної, повної і репрезентативною інформації.

специфіка прийомів

Емпіричні забезпечують отримання фактофіксірующего знання. Вони сприяють встановленню і узагальнення обставин за рахунок опосередкованої або прямий реєстрації подій, властивих досліджуваним відносин, об'єктів, явищ. Емпіричні прийоми відрізняються від теоретичних тим, що предметом аналізу виступають:

  1. Поведінка індивідів і їх груп.
  2. Продукти діяльності людини.
  3. Вербальні дії індивідів, їх судження, погляди, думки.

вибіркові дослідження

Емпіричне вивчення завжди орієнтоване на отримання об'єктивних і точних відомостей, кількісних даних. У зв'язку з цим при його виконанні необхідно забезпечити репрезентативність інформації. Відповідно, особливе значення має правильна вибіркова сукупність. це значить, що відбір необхідно здійснювати так, щоб отримані дані вузької групи відбивали тенденції, які мають місце в загальній масі респондентів. Наприклад, при опитуванні 200-300 чоловік отримані дані можна екстраполювати на все міське населення. Показники вибіркової сукупності дозволяють по-іншому підійти до вивчення суспільно-економічних процесів в регіоні, в країні в цілому.

Термінологія

Для кращого розуміння питань, що стосуються вибіркових досліджень, необхідно роз'яснити деякі визначення. Одиницею спостереження називають безпосереднє джерело інформації. Їм може бути окремий індивід, група, документ, організація і так далі. Генеральна сукупність - це комплекс одиниць спостереження. Вони всі повинні мати відношення до проблеми, яка вивчається. Безпосереднього аналізу підлягає. Вивчення здійснюється відповідно до розроблених прийомами збору відомостей. Для визначення цієї частки всього масиву респондентів використовують поняття "вибіркова сукупність". Її властивість відбивати ключові параметри загальної маси людей іменується репрезентативністю. У ряді випадків збігу відсутні. Тоді говорять про помилку репрезентативності.

забезпечення репрезентативності

Детально питання, пов'язані з ним, розглядаються в рамках статистики. Проблеми відрізняються складністю, так як, з одного боку, мова ведеться про забезпечення кількісної репрезентації, яку дає генеральна сукупність. це означає, зокрема, що групи опитаних мають бути представлені в оптимальному числі. Кількість повинна бути достатньою для нормального представництва. З іншого боку, мається на увазі і якісна репрезентація. Вона передбачає певний суб'єктний склад, яким формується вибіркова сукупність. це значить, що, наприклад, про репрезентативності не може йти мова, якщо опитуються виключно чоловіки або тільки жінки, люди похилого віку або молодь. Вивчення повинно здійснюватися в рамках всіх представлених груп.

характеристика вибірки

Цей термін розглядається в двох аспектах. В першу чергу вона визначається як комплекс елементів від загального масиву людей, думка яких вивчається, - це вибіркова сукупність. це також процес створення певної категорії респондентів при необхідному забезпеченні репрезентативності. На практиці виділяється кілька типів і видів відбору. Розглянемо їх.

типи

Їх існує три:

  1. стихійна вибіркова сукупність. це набір респондентів, відібраних за принципом добровільності. Разом з цим забезпечується доступність входження одиниць від загальної маси людей в конкретну групу вивчення. Стихійний відбір на практиці застосовується досить часто. Наприклад, під час опитувань в пресі, на пошті. Однак цей прийом має істотний недолік. У ньому неможливо якісно представити весь обсяг генеральної вибірки. Цей прийом застосовується з урахуванням економічності. У деяких опитуваннях цей варіант є єдино можливим.
  2. стихійна вибіркова сукупність. це один з основних прийомів, що застосовуються при вивченні. В якості ключового принципу такого відбору виступає забезпечення можливості для кожної одиниці спостереження потрапити із загальної маси індивідів у вузьку групу. Для цього використовуються різні прийоми. Наприклад, це може бути лотерейний, механічний відбір, таблиця випадкових чисел.
  3. Стратифікована (квотна) вибірка. В її основі лежить формування якісної моделі загальної маси респондентів. Після цього здійснюється відбір одиниць у вибіркову сукупність. Наприклад, він виконується за віковою або статевою ознакою, по верствам населення і так далі.

види

Існують наступні вибірки:

додатково

Вибірки можуть бути також залежними і незалежними. У першому випадку процедура експерименту і результати, які будуть в ході нього отримані для однієї групи респондентів, мають певний вплив на іншу. Відповідно, незалежні вибірки не припускають наявність такого впливу. Тут, однак, слід звернути увагу на один важливий момент. Одна група випробовуваних, щодо якої психологічне обстеження проводилося двічі (навіть якщо воно було направлено на вивчення різних аспектів, особливостей, ознак), за замовчуванням буде вважатися залежною.

імовірнісні відбори

Розглянемо деякі типи вибірок:

  1. Випадкова. Вона передбачає однорідність загальної сукупності, одну ймовірність доступності всіх компонентів, а також наявність повного переліку елементів. Як правило, в процесі відбору використовується таблиця з випадковими числами.
  2. Механічна. Цей різновид випадкової вибірки передбачає впорядкування за певною ознакою. Наприклад, за номером телефону, в алфавітному порядку, за датою народження і так далі. Перший компонент вибирається у випадковому порядку. Далі здійснюється відбір кожного k елемента з кроком n. Величина загальної сукупності буде N \u003d k * n.
  3. Стратифікована. Ця вибірка використовується при неоднорідності загальної сукупності. Остання розбивається на страти (групи). У кожній з них відбір проводиться механічним або випадковим способом.
  4. Серійна. Відбір груп здійснюється випадково. Усередині них об'єкти вивчаються суціль.

невероятностной відбори

Вони припускають вибірки не за принципом випадковості, а за суб'єктивними ознаками: типовості, доступності, рівного представництва і так далі. До цієї категорії відносять відбори:

нюанс

Для забезпечення репрезентативності необхідний точний і повний перелік одиниць сукупності. Об'єктами спостереження, як правило, виступає одна людина. Відбір з переліку краще здійснювати, нумеруя одиниці і застосовуючи таблицю з випадковими числами. Але досить часто використовується і квазіслучайном метод. Він передбачає відбір з переліку кожного n елемента.

впливають фактори

Об'ємом сукупності називають кількість її одиниць. На думку фахівців, він не обов'язково повинен бути великим. Безсумнівно, чим більше число респондентів, тим точніше результат. Однак разом з цим великий обсяг не завжди гарантує успіх. Наприклад, це трапляється, коли загальний масив респондентів неоднорідний. Однорідної буде вважатися така сукупність, де контрольований параметр, наприклад, рівень грамотності, розподіляється рівномірно, тобто, порожнечі або згущення відсутні. В такому випадку буде достатньо опитати кількох людей. За результатами обстеження можна буде зробити висновок, що більша частина людей має нормальний рівень грамотності. З цього випливає, що на репрезентативність інформації вплив роблять не кількісні ознаки, а якісні характеристики сукупності - рівень її однорідності, зокрема.

помилки

Вони являють собою відхилення середніх параметрів вибіркової сукупності від значень загальної маси респондентів. На практиці помилки визначаються за допомогою зіставлення. При обстеженні дорослих людей зазвичай застосовуються відомості переписів, статистичного обліку, а також результати минулих опитувань. Контрольними параметрами зазвичай виступають Зіставлення середніх значень сукупностей (загальної та вибіркової), визначення відповідно до цього помилки і зменшення цього відхилення іменується контролем репрезентативності.

висновки

Вибіркове обстеження - спосіб збору даних про установках і поведінці людей через опитування спеціально підібраних груп респондентів. Цей прийом вважається надійним і економічним, хоча і вимагає певної техніки. В якості основи виступає вибіркова сукупність. Вона виступає як певна частка загальної маси людей. Відбір проводиться з використанням спеціальних прийомів і спрямований на отримання інформації про всю сукупності. Остання, в свою чергу, представлена \u200b\u200bвсіма можливими громадськими об'єктами або тієї їх групою, яка буде вивчатися. Найчастіше генеральна сукупність настільки велика, що проведення опитування кожного її представника буде досить дорогим і обтяжливим процесом. Тому використовується зменшена її модель. У вибіркову сукупність включаються всі ті, хто отримує анкети, хто називається респондентами, хто, власне, виступає в якості об'єкта вивчення. Простіше кажучи, її складає безліч людей, яких опитують.

висновок

Цілі обстеження визначаються за конкретними категоріями, що входять в генеральну сукупність. Що стосується конкретної частки від загальної маси людей, то її складають суб'єкти, включені до груп за допомогою математичних розрахунків. Для відбору одиниць необхідно опис об'єкта вихідної сукупності. Після визначення кількості випробовуваних визначається прийом або спосіб формування груп. Результати обстеження дозволять описати досліджувану ознаку щодо всіх представників загальної маси людей. Як показує практика, в основному проводяться вибіркові, а не суцільні дослідження.

Поняття «репрезентативність» стосовно до соціологічних опитувань - з опитуваннями громадської думки - володіє майже магічним дією на людей. Сам термін «репрезентація» має крім наукового ще і явно політичне значення.

В чому причина? Вся справа в тому, що передбачається, що вибірка (група людей, відібрана для опитування) може репрезентувати (представляти) всю генеральну сукупність. Генеральною сукупністю в разі загальноросійських опитувань є все населення країни. Тепер уявімо, що мова йде про політичне рішення - підтримку законопроекту або голосуванні на виборах. За допомогою опитування ми отримуємо відмінний механізм політичної репрезентації - механізм, при якому невелика група людей може представляти думку чи позицію всього населення країни. Тому репрезентативності дослідження відводиться таке важливе місце.

Поняття репрезентативності використовується, зрозуміло, не тільки в політичних дослідженнях. Термін застосовується практично завжди, коли мова йде про великі дослідженнях, будь то в сфері маркетингу, економічної поведінки або освіти.

Методологія репрезентативних опитувань

Як, опитавши 1500 осіб, можна робити висновки про всі росіян, яких більше 140 мільйонів (і навіть виборців понад 110 мільйонів)? Технологія, яка стоїть за репрезентативними опитуваннями, заснована на статистичних законах. Найближчим підставою служить закон великих чисел, або теорема Бернуллі.

Спрощено його зміст можна передати так. Припустимо, у нас є деякий ознака, наприклад кількість опадів за день в Єкатеринбурзі протягом ХХ століття. Якщо ми випишемо всі його значення разом з їх частотою (це називається розподілом), а потім випадково візьмемо досить велике число випадків (тобто в повному обсязі дні в ХХ столітті, але досить багато), то ми побачимо, що розподіл в нашій вибірці буде дуже схожим на розподіл за все ХХ століття. Таким чином, якщо ми відбираємо з сукупності деякі одиниці, вони дійсно можуть представляти всю сукупність, і насправді немає необхідності збирати дані по всіх випадках.

Однак є ключовою умовою: це вірно, тільки якщо проводити відбір строго випадковим чином. Єдиною проблемою тут може бути відхилення від випадковості. Так, якщо ми візьмемо тільки дані по опадам за останні роки (наприклад, тому що ці дані простіше знайти) або Опитування 1500 своїх знайомих (бо з ними простіше зв'язатися), а не випадкових людей, то вибірка, звичайно, не буде репрезентативною.

Уявіть, що з 143,5 мільйонів росіян ви випадковим чином відбираєте необхідні вам 1500 чоловік. Тоді, наприклад, частка менеджерів середньої ланки серед них буде приблизно дорівнює частці менеджерів середньої ланки в генеральної сукупності, що і показує, що ваша вибірка може представляти всю сукупність. Чи може так статися, що ці два показники будуть сильно відрізнятися? Наприклад, серед росіян він становить 14%, а в вибірці він складе лише 1%? Теоретично це можливо, однак імовірність цього настільки мала, що нею можна знехтувати (приблизно як зустріти дракона на вулиці).

Більш того, найприємніше в цій ймовірності навіть не те, що вона мала, а то, що для випадкових процесів цю ймовірність можна обчислити. Ми можемо сказати, з якою ймовірністю наше вибіркове значення відхилиться від значення в генеральній сукупності на 13% (як в прикладі вище), а з якою, скажімо, на 2,5%. Зазвичай, втім, роблять навпаки: спочатку визначають ймовірність, з якою ми хочемо, щоб наше значення не відхиляється від значення в генеральній сукупності (найчастіше його фіксують на рівні 95%), а потім вже дивляться, як і величина відхилення при тому чи іншому розмірі вибірки. Це відхилення називається довірчим інтервалом, іноді його називають помилкою вибірки або статистичною похибкою - його часто призводять поруч з результатами опитування.

Отже, ймовірність відхилення, величина відхилення (довірчий інтервал) і розмір вибірки пов'язані між собою. Виходячи з цього, формула для розрахунку розміру вибірки виглядає наступним чином:

де n - розмір вибірки, Δ - довірчий інтервал, z - значення функції нормального розподілу для даної ймовірності відхилення (для ймовірності 5% це значення становить 1,96).

Це спрощена формула, в реальних опитуваннях використовуються кілька більш складні формули. Ця формула також може давати збій, якщо значення показника сильно відрізняється від 50% (тому, наприклад, ця формула не підійде для того, щоб оцінити частку хворих на рідкісну хворобу в країні).

Ось що буде, якщо підставити в цю формулу деякі значення:

Іншими словами, якщо ми взяли випадкову вибірку росіян розміром в 1600 чоловік і оцінили якийсь показник, наприклад готовність голосувати за певного політика, то з імовірністю 95% наша оцінка не буде відрізнятися від готовності проголосувати за нього серед усіх росіян більш ніж на 2, 45%.

Розмір вибірки

Отже, чим більше розмір вибірки, тим більша ймовірність того, що ми будемо ближче до частки у генеральній сукупності. Здавалося б, це означає, що нам потрібно намагатися наблизити вибірку до 143,5 млн. Насправді, як можна бачити з таблиці, природа випадкових процесів така, що з певного моменту ймовірність потрапити в інтервал починає підвищуватися дуже повільно (і цей момент настає доволі швидко). Після того як ми відбираємо 1500 одиниць, як би ми сильно не збільшували обсяг вибірки, вірогідність, що наше значення по вибірці потрапить в значення по генеральної сукупності, буде зростати дуже і дуже повільно.

Фактично різниці між 1500 і 10 000 опитаних майже немає. Десь до 1500 ми вже можемо говорити про те, що наші оцінки будуть відрізнятися від частки у генеральній сукупності на 2-3%. Якщо ми збільшуємо вибірку далі, то ця можлива помилка буде зменшуватися, але дуже незначно. Іншими словами, вибірка в 100 000 краще, ніж вибірка в 2500, але різниця настільки мала, що не має сенсу, а в разі соціальних обстежень і економічно не обгрунтована. Зазвичай збільшення вибірки коштує дорого, і тому її не має сенсу роздувати заради того, щоб виграти один процентний пункт у величині довірчого інтервалу.

Важливо, що у формулі взагалі не фігурує розмір генеральної сукупності. Справа в тому, що, коли генеральна сукупність велика (більше 20 000), він практично не впливає на розмір вибірки. Таким чином, нам не потрібно знати, скільки людей живе в Росії, щоб побудувати репрезентативну вибірку. Зрозуміло, що вибирати 1500 з 2000 року, швидше за все, не має сенсу - простіше обстежити 2000 і отримати точну оцінку. Але, роблячи в разі необхідності вибірку, ми отримуємо можливість узагальнювати її результати для генеральної сукупності. І з цієї ж причини розмір вибірки не буде відрізнятися для великих і маленьких країн.

Репрезентативність і точність

Щоб зрозуміти сенс поняття «репрезентативність», давайте розглянемо вибірку в 15 чоловік. Як не дивно, якщо ви зробили її випадково, вона теж репрезентативна. Більш того, ви можете зробити вибірку в одну одиницю. Уявіть ящик з кулями, звідки ви випадковим чином берете один шар. Якщо це випадково обраний куля, то він теж буде репрезентувати всі кулі, що є в цьому ящику. Просто він репрезентуватиме їх неточно. Чому? Тому що є дуже велика ймовірність помилитися. Наступного разу ми можемо витягти інша куля і отримати інше уявлення про кулях в ящику. Репрезентувати неточно означає мати великий розкид оцінок.

Точно так же і 15 осіб репрезентують будь-яку генеральну сукупність, але вони репрезентують її неточно, тому що похибка, довірчий інтервал дуже великі. Нам доведеться додавати по +/- 33%, щоб отримати 95% ймовірності того, що ми потрапимо в інтервал. Якщо ми готові це допустити, то беремо 15 осіб, з'ясовуємо, що 7 з них - це менеджери середньої ланки, а далі отримуємо оцінку, що 7/15 від сукупності, тобто 47% +/- 33%, - це і є оцінка частки менеджерів у генеральній сукупності, і це абсолютно коректний висновок. Просто він не має ніякої цінності. Це ми могли сказати і без обстеження. Тому, плануючи вибірку, має сенс досягати такого обсягу, який буде доцільним з точки зору співвідношення витрат і ефективності.

Все сказане покликане донести одну просту думку, яку дуже часто не усвідомлюють: обсяг вибірки не пов'язаний з її репрезентативністю.

Маленька вибірка неточна, але вона все одно може бути репрезентативною. Обсяги вибірок, які використовуються сьогодні в масових опитуваннях в Росії, майже завжди мають досить високою точністю.

Чи загрожує же репрезентативності вибірки не її обсяг, а зсув, тобто відхилення від принципу випадковості.

Порушення принципу випадковості

Якщо ми починаємо вибирати одиниці невипадковим чином, вибірка стає репрезентативної. Наприклад, якщо що-небудь заважає нам відбирати їх випадково. Уявімо собі, що ми хочемо відібрати кулі з нашого ящика випадковим чином, але тут виявляється, що частина куль кусається. Механізм, при якому ми будемо брати тільки ті кульки, які даються нам в руки, - це механізм, який порушує випадковість і тому порушує репрезентативність. В цьому випадку, скільки б ми кульок ні взяли з ящика (навіть якщо ми візьмемо все кульки, які не кусаються), у нас буде нерепрезентативна вибірка, тому що ми не врахуємо жодного з тих, що кусаються, - вони просто минуть нашу вибірку .

Найбільша проблема з кусаються кулями полягає в тому, що вони можуть відрізнятися від тих, які йдуть до нас в руки, і відрізнятися як раз за тією ознакою, який нас цікавить. Така ситуація називається систематичною помилкою вибірки.

Потрібно відрізняти ситуацію неточною репрезентації, яку ми описали вище, від ситуації нерепрезентативність. Це різні проблеми, і у них різні способи вирішення. Не можна вирішити одну з них шляхом вирішення іншої. Якщо вибірці не вистачає репрезентативності, марно її збільшувати. Більш того, великі вибірки в соціальних обстеженнях мають властивість накопичувати помилки, тому за допомогою сильного збільшення вибірки проблему репрезентації можна тільки погіршити.

Чому репрезентативність неможлива

В примітках до таблиць з результатами опитувань часто можна побачити, що «обсяг вибірки становить 1600 осіб, вибірка репрезентативна за статтю та віком». Зі сказаного вище очевидно, що це два різних параметра: вказівка \u200b\u200bна репрезентативність не пов'язане з обсягом вибірки. Насправді тут мається на увазі те, що виконувалися певні процедури, для того щоб забезпечити відповідність між вибіркою і генеральною сукупністю. Наприклад, щоб забезпечити репрезентативність по підлозі, до вибірки набирають чоловіків і жінок в таких же співвідношеннях, які існують серед росіян за даними перепису. Але репрезентативність по підлозі не означає репрезентативності, наприклад, за політичними поглядами.

Чому доводиться вирівнювати вибірку по підлозі і іншим соціально-демографічними категоріями? Тому що справжню репрезентативність може забезпечити тільки випадкова вибірка, а реалізувати її на практиці неможливо по масі причин. Як тільки ви спробуєте це зробити, ви зіткнетеся з безліччю проблем - неважливо, яким способом ви захочете скористатися. Частина респондентів взагалі виявиться недоступною для вашого методу (скажімо, для особистих інтерв'ю великою проблемою є будинки з домофонами і охороною), ще частина буде відсутній, не відповідати або віддасть перевагу займатися своїми справами. Є люди, у яких є мовні проблеми, і вони не можуть з нами говорити. Є люди, які не розуміють, навіщо це потрібно, і вони не хочуть з нами говорити. Все це - серйозні порушення випадковості, які роблять її реалізацію неможливою.

Ті, хто зводить проблему репрезентації в масових опитуваннях до статистики, забувають про те, що люди - це дуже специфічні кульки. Є кульки, які тікають і ховаються. Є кульки, які кусаються. Вони не пасивні об'єкти, вони дають здачі. Вони кажуть: «Я не хочу брати участь у твоєму опитуванні», тим самим порушують випадковість. Тому в строгому сенсі слова репрезентативність в масових опитуваннях, звичайно, неможлива ні в якому вигляді.

Вироблений механізм, за допомогою якого зазвичай забезпечується видимість репрезентативності: ми вирівнюємо вибірку по деяким категоріям і вдаємо, що за всіма іншими можливим категоріям вона теж вирівняна. Насправді у нас немає ніяких підстав це стверджувати. Але проблема в тому, що немає і ніякої можливості це перевірити - знову ж в силу того, що деякі кульки кусаються. Для того щоб перевірити наявність систематичної помилки, перевіряючому довелося б сходити до тих, кого ми не опитали, і опитати їх. Але вони, як ми пам'ятаємо, зовсім не хочуть, щоб їх опитували. Опитати тих, хто категорично не відповідає, неможливо. Тому всі працюють на припущенні, що, якщо ми вирівняли вибірку по двом-трьом параметрам, вона репрезентує всю сукупність, хоча у цього припущення і немає ніяких серйозних підстав.

Репрезентативна вибірка - технологія, запозичена соціологами з статистики. Тому вона неминуче несе в собі елементи математико-статистичної картини світу. Мабуть, найсильніше допущення полягає в тому, що сам по собі вибіркове опитування політично і соціологічно нейтральний: участь і неучасть в опитуванні не несе в собі політичного сенсу і не пов'язане з іншими соціологічно важливими параметрами. Але сьогодні опитування стали одним з головних політичних інститутів і перетворилися в ключового посередника між великими корпораціями і споживачами. У цих умовах вірити в їхню політичну стерильність вже неможливо. Однак ми як і раніше мало знаємо про те, як опитування розуміються в сучасних суспільствах і що вони насправді репрезентують.

вибірка

вибірка або вибіркова сукупність - безліч випадків (випробовуваних, об'єктів, подій, зразків), за допомогою певної процедури вибраних з генеральної сукупності для участі в дослідженні.

Характеристики вибірки:

  • Якісна характеристика вибірки - кого саме ми вибираємо і які способи побудови вибірки ми для цього використовуємо.
  • Кількісна характеристика вибірки - скільки випадків вибираємо, іншими словами обсяг вибірки.

необхідність вибірки

  • Об'єкт дослідження дуже великий. Наприклад, споживачі продукції глобальної компанії - величезна кількість територіально розкиданих ринків.
  • Існує необхідність в зборі первинної інформації.

обсяг вибірки

обсяг вибірки - число випадків, включених до вибіркової сукупності. З статистичних міркувань рекомендується, щоб число випадків складало не менше 30-35.

Залежні і незалежні вибірки

При порівнянні двох (і більше) вибірок важливим параметром є їх залежність. Якщо можна встановити гомоморфності пару (тобто, коли одному випадку з вибірки X відповідає один і тільки один випадок з вибірки Y і навпаки) для кожного випадку в двох вибірках (і це підстава взаємозв'язку є важливим для вимірюваного на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:

  • пари близнюків,
  • два виміри якої-небудь ознаки до і після експериментального впливу,
  • чоловіки і дружини
  • і т.п.

У разі, якщо такий взаємозв'язок між вибірками відсутня, то ці вибірки вважаються незалежними, Наприклад:

Відповідно, залежні вибірки завжди мають однаковий обсяг, а обсяг незалежних може відрізнятися.

Порівняння вибірок проводиться за допомогою різних статистичних критеріїв:

  • та ін.

репрезентативність

Вибірка може розглядатися в якості репрезентативної або репрезентативної.

Приклад репрезентативної вибірки

  1. Дослідження з експериментальною і контрольною групами, які ставляться в різні умови.
    • Дослідження з експериментальною і контрольною групами із залученням стратегії попарного відбору
  2. Дослідження з використанням тільки однієї групи - експериментальної.
  3. Дослідження з використанням змішаного (факторного) плану - все групи ставляться в різні умови.

типи вибірки

Вибірки діляться на два типи:

  • імовірнісні
  • невероятностной

імовірнісні вибірки

  1. Проста імовірнісна вибірка:
    • Проста повторна вибірка. Використання такої вибірки грунтується на припущенні, що кожен респондент з рівною часткою ймовірності може потрапити до вибірки. На основі списку генеральної сукупності складаються картки з номерами респондентів. Вони поміщаються в колоду, перемішуються і з них навмання виймається картка, записується номер, потім повертається назад. Далі процедура повторюється стільки раз, який обсяг вибірки нам необхідний. Мінус: повторення одиниць відбору.

Процедура побудови простої випадкової вибірки включає в себе наступні кроки:

1. необхідно отримати повний список членів генеральної сукупності і пронумерувати цей список. Такий список, нагадаємо, називається основою вибірки;

2. визначити передбачуваний обсяг вибірки, тобто очікуване число опитаних;

3. витягти з таблиці випадкових чисел стільки чисел, скільки нам потрібно вибіркових одиниць. Якщо у вибірці має виявитися 100 осіб, з таблиці беруть 100 випадкових чисел. Ці випадкові числа можуть генеруватися комп'ютерною програмою.

4. вибрати зі списку-основи ті спостереження, номери яких відповідають виписаним випадковим числах

  • Проста випадкова вибірка має очевидні переваги. Цей метод вкрай простий для розуміння. Результати дослідження можна поширювати на досліджувану сукупність. Більшість підходів до отримання статистичних висновків передбачають збір інформації за допомогою простої випадкової вибірки. Однак метод простий випадкової вибірки має як мінімум чотири істотні обмеження:

1. часто складно створити основу виборочногo спостереження, яка дозволила б провести просту випадкову вибірку.

2. результатом застосування простий випадкової вибірки може стати велика сукупність, або сукупність, розподілена по великій географічній території, що значно збільшує час і вартість збору даних.

3. результати застосування простий випадкової вибірки часто характеризуються низькою точністю і більшою стандартною помилкою, ніж результати застосування інших імовірнісних методів.

4. в результаті застосування SRS може сформуватися нерепрезентативна вибірка. Хоча вибірки, отримані простим випадковим відбором, в середньому адекватно представляють генеральну сукупність, деякі з них вкрай некоректно представляють досліджувану сукупність. Така ймовірність особливо велика при невеликому обсязі вибірки.

  • Проста бесповторная вибірка. Процедура побудови вибірки така ж, тільки картки з номерами респондентів не повертаються назад в колоду.
  1. Систематична імовірнісна вибірка. Є спрощеним варіантом простий ймовірнісної вибірки. На основі списку генеральної сукупності через певний інтервал (К) відбираються респонденти. Величина До визначається випадково. Найбільш достовірний результат досягається при однорідної генеральної сукупності, інакше можливі збіг величини кроку і якихось внутрішніх циклічних закономірностей вибірки (змішання вибірки). Мінуси: такі ж як і в простій ймовірнісної вибіркою.
  2. Серійна (гніздова) вибірка. Одиниці відбору є статистичні серії (сім'я, школа, бригада і т. П.). Відібрані елементи піддаються суцільного обстеження. Відбір статистичних одиниць може бути організований за типом випадкової або систематичної вибірки. Мінус: Можливість більшої однорідності, ніж у генеральній сукупності.
  3. Районована вибірка. У разі неоднорідної генеральної сукупності, перш, ніж використовувати вірогідну вибірку з будь-якою технікою відбору, рекомендується розділити генеральну сукупність на однорідні частини, така вибірка називається районированной. Групами районування можуть виступати як природні утворення (наприклад, райони міста), так і будь-яка ознака, закладений в основу дослідження. Ознака, на основі якого здійснюється поділ, називається ознакою розшарування і районування.
  4. «Зручна» вибірка. Процедура «зручною» вибірки полягає у встановленні контактів з «зручними» одиницями вибірки - з групою студентів, спортивною командою, з друзями і сусідами. Якщо необхідно отримати інформацію про реакцію людей на нову концепцію, така вибірка цілком обгрунтована. «Зручний» вибірку часто використовують для попереднього тестування анкет.

невероятностной вибірки

Відбір в такій вибірці здійснюється не за принципами випадковості, а за суб'єктивними критеріями - доступності, типовості, рівного представництва і т.д.

  1. Квотна вибірка - вибірка будується як модель, яка відтворює структуру генеральної сукупності у вигляді квот (пропорцій) досліджуваних ознак. Число елементів вибірки з різним поєднанням досліджуваних ознак визначається з таким розрахунком, щоб воно відповідало їх частці (пропорції) в генеральній сукупності. Так, наприклад, якщо генеральна сукупність у нас представлена \u200b\u200b5000 осіб, з них 2000 жінок та 3000 чоловіків, тоді в квотною вибіркою у нас будуть 20 жінок і 30 чоловіків, або 200 жінок і 300 чоловіків. Квотувати вибірки найчастіше грунтуються на демографічних критеріях: стать, вік, регіон, дохід, освіту та інших. Мінуси: зазвичай такі вибірки нерепрезентативним, тому що не можна врахувати відразу кілька соціальних параметрів. Плюси: легкодоступний матеріал.
  2. Метод сніжної грудки. Вибірка будується наступним чином. У кожного респондента, починаючи з першого, просяться контакти його друзів, колег, знайомих, які підходили б під умови відбору і могли б взяти участь в дослідженні. Таким чином, за винятком першого кроку, вибірка формується за участю самих об'єктів дослідження. Метод часто застосовується, коли необхідно знайти і опитати важкодоступні групи респондентів (наприклад, респондентів, які мають високий дохід, респондентів, які належать до однієї професійної групи, респондентів, що мають будь-які схожі хобі / захоплення і т.д.)
  3. Стихійна вибірка - вибірка так званого «першого зустрічного». Часто використовується в теле- і радіоопросах. Розмір і склад стихійних вибірок заздалегідь не відомий, і визначається тільки одним параметром - активністю респондентів. Мінуси: неможливо встановити яку генеральну сукупність являють опитані, і як наслідок - неможливість визначити репрезентативність.
  4. Маршрутний опитування - часто використовується, якщо одиницею вивчення є сім'я. На карті населеного пункту, в якому буде проводитися опитування, нумеруються всі вулиці. За допомогою таблиці (генератора) випадкових чисел відбираються великі числа. Кожне велике число розглядається як що складається з 3-х компонентів: номер вулиці (2-3 перших числа), номер будинку, номер квартири. Наприклад, число 14832: 14 - це номер вулиці на карті, 8 - номер будинку, 32 - номер квартири.
  5. Районована вибірка з відбором типових об'єктів. Якщо після районування з кожної групи відбирається типовий об'єкт, тобто об'єкт, який за більшістю досліджуваних в дослідженні характеристик наближається до середніх показників, така вибірка називається районированной з відбором типових об'єктів.

6.Модальная вибірка. 7.експертная вибірка. 8.Гетерогенная вибірка.

Стратегії побудови груп

Відбір груп для їх участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої і зовнішньої валідності.

рандомизация

рандомизация, або випадковий відбір, Використовується для створення простих випадкових вибірок. Використання такої вибірки грунтується на припущенні, що кожен член популяції з однаковою ймовірністю може потрапити до вибірки. Наприклад, щоб зробити випадкову вибірку з 100 студентів вузу, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з неї 100 папірців - це буде випадковим відбором (Гудвін Дж., С. 147).

попарний відбір

попарний відбір - стратегія побудови груп вибірки, при якому групи випробовуваних складаються із суб'єктів, еквівалентних по значущим для експерименту побічним параметрам. Дана стратегія ефективна для експериментів з використанням експериментальних і контрольних груп з кращим варіантом - залученням блізнецових пар (моно- і дизиготних), так як дозволяє створити ...

стратометріческая відбір

стратометріческая відбір - рандомізація з виділенням страт (або кластерів). При даному способі формування вибірки генеральна сукупність ділиться на групи (страти), що володіють певними характеристиками (стать, вік, політичні уподобання, освіта, рівень доходів тощо.), І відбираються випробовувані з відповідними характеристиками.

наближене моделювання

наближене моделювання - складання обмежених вибірок і узагальнення висновків про цю вибірці на ширшу популяцію. Наприклад, за участю в дослідженні студентів 2-го курсу університету, дані цього дослідження поширюються на «людей у \u200b\u200bвіці від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.

Наближене моделювання - формування моделі, яка для чітко визначеного класу систем (процесів) описує його поведінку (або потрібні явища) з прийнятною точністю.

Примітки

література

Наследов А. Д. Математичні методи психологічного дослідження. - СПб .: Мова, 2004.

  • Ільясов Ф. Н. Репрезентативність результатів опитування в маркетинговому дослідженні // Соціологічні дослідження. 2011. № 3. С. 112-116.

Див. також

  • У деяких типах досліджень вибірку ділять на групи:
    • експериментальна
    • контрольна
  • когорта

посилання

  • Поняття вибірки. Основні характеристики вибірки. типи вибірки

Wikimedia Foundation. 2010 року.

Синоніми:
  • Щепкін, Михайло Семенович
  • Генеральна сукупність

Дивитися що таке "Вибірка" в інших словниках:

    вибірка - група випробовуваних, що представляють певну популяцію і відібраних для експерименту або дослідження. Протилежне поняття сукупність генеральна. Вибірка є частина сукупності генеральної. Словник практичного психолога. М .: АСТ, ... ... Велика психологічна енциклопедія

    вибірка - вибірка Частина генеральної сукупності елементів, яка охоплюється наглядом (часто її називають вибірковою сукупністю, а вибіркою - сам метод вибіркового спостереження). У математичній статистиці прийнято ... ... Довідник технічного перекладача

    вибірка - (sample) 1. Невелика кількість товару, відібране, щоб представляти все його кількість. Див .: продаж за зразком (sale by sample). 2. Невелика кількість товару, передане потенційним покупцям, щоб дати їм можливість провести його ... ... Словник бізнес-термінів

    вибірка - частина генеральної сукупності елементів, яка охоплюється наглядом (часто її називають вибірковою сукупністю, а вибіркою сам метод вибіркового спостереження). У математичній статистиці прийнято принцип випадкового відбору; це ... ... Економіко-математичний словник

    Вибірка - (sample) Довільний відбір підгрупи елементів з основної сукупності, характеристики яких використовуються для оцінки всієї сукупності в цілому. Вибірковий метод використовується, коли занадто довго або надто дорого обстежити всю сукупність ... економічний словник

навчальні цілі

  1. Ясно розрізняти поняття перепису (цензу) і вибірки.
  2. Знати сутність і послідовність шести етапів у реалізованих дослідниками для отримання вибіркової сукупності.
  3. Визначити поняття "основа вибірки".
  4. Пояснити, в чому полягає відмінність ймовірнісної і детермінованою вибірки.
  5. Розрізняти вибірку фіксованого обсягу і багатоступінчасті (послідовні) вибірки.
  6. Пояснити, що являє собою навмисна вибірка, і описати як сильні, так і слабкі її сторони.
  7. Визначити поняття квотної вибірки.
  8. Пояснити, чим є параметр в процедурі вибірки.
  9. Пояснити, що таке похідна сукупність.
  10. Пояснити, чому поняття вибіркового розподілу є найважливішим поняттям статистики.

Отже, дослідник точно визначив завдання і заручився прийнятними для її вирішення схемою досліджень і інструментами збору даних. Наступний етап дослідницького процесу повинен полягати в доборі тих елементів, які будуть обстежуватися. Можна обстежити кожен елемент даної популяції, зробивши повну перепис цієї популяції. Повне обстеження сукупності іменується переписом (цензом). Існує й інша можливість. Статистичному обстеженню піддається якась частина популяції, вибірка елементів великої групи, і за даними, отриманими на цьому підмножині, робляться якісь висновки щодо всієї групи. Можливість поширення результатів, отриманих на основі вибіркових даних, на велику групу залежить від методу, за допомогою якого була проведена вибірка. Велика частина цієї глави буде присвячена тому, як повинна формуватися вибірка і чому це так.

Перепис (ценз)
Повна перепис сукупності (популяції).
вибірка
Сукупність елементів підмножини більшої групи об'єктів.

Поняття «популяція», або «сукупність», може ставитися не тільки до людей, але і до фірм, що працюють в обробній промисловості, до організаціям роздрібної або оптової торгівлі або навіть до зовсім неживим об'єктам, таким як деталі, вироблені на підприємстві; це поняття визначається як все безліч елементів, що задовольняють певним заданим умовам. Цими умовами однозначно визначаються як елементи, що належать до цільової групи, так і елементи, які слід виключити з розгляду.

Дослідження, яке має на меті визначення демографічного профілю споживачів замороженої піци, має починатися зі з'ясування, кого слід і кого не слід відносити до таких. Чи відносяться до цієї категорії особи, хоча б один раз пробували таку піцу? Особи, які купують хоча б одну піцу в місяць? В тиждень? Особи, що з'їдають за місяць стільки піци, яке перевищує якийсь заданий мінімум? Дослідник повинен бути дуже точним при визначенні цільової групи. Необхідно також стежити за тим, щоб вибірка формувалася саме з цільової, а не «якийсь» сукупності, що має місце в разі невідповідної або неповної основи вибірки. Остання є переліком елементів, з яких буде формуватися реальна вибірка.

Дослідник може віддати перевагу вибірковий метод обстеження всієї сукупності з кількох причин. По-перше, повне обстеження сукупності навіть порівняно невеликого розміру вимагає дуже великих матеріальних і тимчасових витрат. Найчастіше до моменту завершення перепису та обробки даних інформація вже застаріває. У деяких випадках ценз просто неможливий. Скажімо, дослідники поставили собі за мету перевірити відповідність реального терміну служби електричних ламп розжарювання розрахунковому, для чого їм необхідно тримати їх у включеному стані до моменту виходу з ладу. Якщо досліджувати таким чином весь запас ламп, будуть отримані достовірні дані, проте торгувати буде вже нічим.

І нарешті, на превеликий подив новачків, дослідник може віддати перевагу вибірковий метод цензу, прагнучи до точності результатів. Проведення переписів вимагає залучення великого штату співробітників, що обертається зростанням ймовірності появи систематичних (не пов'язаних з вибіркою) помилок. Ця обставина є однією з причин того, чому Бюро перепису США використовує вибіркові спостереження для перевірки точності різного роду переписів. Ви не помилилися: вибіркові дослідження можуть проводитися для перевірки точності даних цензу.

Етапи проектування вибірки

На рис. 15.1 показана що складається з шести кроків послідовність, якої може дотримуватися дослідник, зайнятий складанням вибірки. Перш за все необхідно визначити цільову сукупність або набір елементів, про які дослідник хоче щось дізнатися.

Наприклад, при вивченні переваг дітей дослідникам необхідно вирішити, чи буде обследуемая популяція складатися тільки з дітей, тільки з батьків або з тих і інших.

Сукупність (популяція)
Безліч елементів, що задовольняють певним заданим умовам.
Основа (база) вибірки
Перелік елементів, з яких буде здійснюватися вибірка; може складатися з територіальних одиниць, організацій, осіб і інших елементів.

Якась компанія апробувала свої електричні «гонки» тільки на дітях. Дітей вони привели в повний захват. Батьки поставилися до новинки інакше. Мамам не сподобалося те обставина, що атракціонів не привчає дітей до бережного ставлення до машин, а пап не влаштовувало те, що продукт був зроблений як іграшка.
Можлива і зворотна ситуація. Якась фірма приступила до виробництва нового продукту харчування і розгорнула загальнонаціональну рекламну кампанію, в якій основна роль була відведена не по роках розвиненого ребенку.Фірма перевіряла дієвість рекламних роликів тільки на матерях, які мліли від захвату. Діти ж визнали цього «акселерата», а разом з ним і сам рекламований продукт, противним. Продукту прийшов кінець 1.

Дослідник повинен визначитися з тим, з кого або з чого складатиметься відповідна сукупність: з індивідів, сімей, фірм, інших організацій, операцій з кредитними картами і т. Д. Беручи подібні рішення, необхідно визначитися і з елементами, які повинні бути виключені з популяції. Повинна проводитися як тимчасова, так і географічна прив'язка елементів, на які в ряді випадків можуть бути накладені додаткові умови або обмеження. Наприклад, якщо мова йде про індивідів, шукана популяція може складатися тільки з осіб старше 18 років, або тільки з жінок, або тільки з осіб з освітою не нижче середнього.

Завдання визначення географічних меж для цільової популяції при міжнародних маркетингових дослідженнях може представляти особливу проблему, оскільки при цьому зростає неоднорідність даної системи. Скажімо, відносне співвідношення міських і сільських територій може істотно змінюватися від країни до країни. Територіальний аспект чинить серйозний вплив на склад населення і в межах однієї країни. Наприклад, на півночі Чилі компактно проживає переважно індіанське населення, в південних же районах країни живуть головним чином нащадки європейців.

Охоплення (инцидентность)
Виражена у відсотках частка елементів популяції або групи, які відповідають умовам включення до складу вибірки.

Взагалі кажучи, чим простіше визначається цільова популяція, тим вище її охоплення (инцидентность) і тим легше і дешевше процедура формування вибірки. Охоплення (инцидентность) відповідає вираженої в відсотках частці елементів популяції або групи, які задовольняють умовам включення до складу вибірки. Охоплення безпосередньо впливає на тимчасові і матеріальні витрати, необхідні для проведення обстеження. Якщо обхват великий (т. Е. Велика частина елементів популяції задовольняє одній або декільком простим критеріям, використовуваним для виявлення потенційних респондентів), тимчасові і матеріальні витрати, необхідні для збору даних, зводяться до мінімуму. І навпаки, зі збільшенням кількості критеріїв, яким повинні задовольняти потенційні респонденти, зростають і матеріальні, і часові витрати.

На рис. 15.2 показана частка дорослого населення, що займається тими чи іншими видами спорту. Дані малюнка свідчать про те, що обстежити людей, що займаються мотоциклетним спортом (всього 3,6% від загального числа дорослих), куди складніше і накладні, ніж обстежити людей, що здійснюють регулярні оздоровчі прогулянки (27,4% від загального числа дорослих). Головне, щоб дослідник був точний у визначенні того, які елементи повинні включатися в обследуемую сукупність і які елементи повинні виключатися з нього. Чітка постановка мети дослідження істотно полегшує вирішення цього завдання. Другий етап процесу відбору вибірки полягає у визначенні її основи, яка, як ви вже знаєте, є переліком елементів, з яких буде здійснюватися вибірка. Нехай цільової сукупністю якогось дослідження є всі сім'ї, які проживають в районі Далласа. На перший погляд, хорошою і легкодоступною основою вибірки може стати телефонний довідник Далласа. Проте при більш уважному розгляді стає очевидним, що міститься в довіднику список сімей не цілком коректний, бо номера деяких сімей в ньому пропущені (зрозуміло, в нього не входять і сім'ї, які не мають телефону), деякі ж сім'ї мають по кілька телефонних номерів . Особи, недавно змінили місце проживання і, відповідно, номер свого телефону, також не присутні в довіднику.

Досвідчені дослідники приходять до висновку, що точна відповідність між основою вибірки і цікавить їх цільової сукупністю спостерігається досить рідко. Один з найбільш творчих етапів роботи при розробці вибірки - це визначення підходящої основи вибірки в тих випадках, коли складання списку елементів сукупності викликає труднощі. Це може зажадати формування вибірки з робочих блоків і префіксів, коли, наприклад, використовується метод випадкового набору номера через недоліки телефонних довідників. Однак значне збільшення робочих блоків протягом останніх 10 років зробило цю задачу більш важкою. Подібні ситуації можуть виникати і при вибірковому спостереженні територіальних зон або організацій з подальшим взяттям підвибірок, коли, скажімо, цільової популяцією є індивіди, але точного актуального їх списку немає.

Джерело: засновано на даних, що містяться в «SSI- LITe TM: Low Incidence Targeted Sampling »(Fairfield, Conn .: Survey Sampling, Inc., 1994).

Третій етап процедури складання вибірки тісно пов'язаний з визначенням основи вибірки. Вибір методу або процедури складання вибірки багато в чому залежить від прийнятої дослідником основи вибірки. Різні типи вибірок вимагають різних типів основ вибірки. У цій та в наступному розділі буде дано огляд основних типів вибірок, що використовуються в маркетингових дослідженнях. При їх описі повинна стати очевидним зв'язок основи вибірки та методу її формування.

Четвертий етап процедури складання вибірки полягає у визначенні обсягу вибірки. Ця проблема обговорюється у гл. 17. На п'ятому етапі досліднику необхідно реально відібрати елементи, які будуть піддані обстеженню. Використовуваний для цього спосіб визначається обраним типом вибірки; при обговоренні методів вибірки ми поговоримо і про відбір її елементів. І нарешті, досліднику необхідно реально обстежити виділених респондентів. На цьому етапі існує велика ймовірність скоєння ряду помилок.
Ці проблеми і деякі методи їх вирішення розглядаються в гл. 18.

Типи планів вибірки (вибіркового контролю)

Всі методи контролю вибірки можуть бути розділені на дві категорії: спостереження за імовірнісними вибірками і спостереження за детермінованими вибірками. У вірогідну вибірку кожен член сукупності може включатися з якоїсь заданої ненульовий ймовірністю. Ймовірність включення до вибірки тих чи інших членів сукупності може бути різною, але ймовірність включення в неї кожного елемента відома. Ця ймовірність визначається особливою механічною процедурою, використовуваної для відбору елементів вибірки.

Для детермінованих вибірок оцінка ймовірності включення будь-якого елементу в вибірку стає неможливою. Гарантувати репрезентативність такої вибірки не можна. наприклад, Allstate Corporation розробляла систему для того, щоб обробляти дані по пред'явленню вимог про страхове відшкодування 14 млн домогосподарств (своїх клієнтів). Компанія планує використовувати ці дані для визначення закономірностей попиту на свої послуги - наприклад, ймовірності того, що домогосподарство, що володіє «Mersedes Benz», буде також мати будинок для відпочинку (якому буде вимагатися страховка). Незважаючи на те, що база даних дуже велика, компанія не має коштів оцінки ймовірності того, що будь-який конкретний клієнт пред'явить вимоги. Компанія, таким чином, не може бути впевнена в тому, що дані про клієнтів, які висувають вимоги, репрезентативні по відношенню до всіх клієнтів компанії; і в набагато меншому ступені - по відношенню до потенційних клієнтів.

Все детерміновані вибірки базуються швидше на приватну позицію, судженні або перевазі дослідника, а не на механічній процедурі відбору елементів вибірки. Подібні переваги часом можуть давати хороші оцінки характеристик сукупності, однак способу об'єктивного визначення відповідності вибірки поставленої задачі не існує. Оцінка точності результатів вибірки може бути проведена тільки в тому випадку, якщо були відомі ймовірності відбору тих чи інших елементів. З цієї причини робота з ймовірнісної вибіркою зазвичай вважається більш досконалим методом, що дозволяє оцінити величину помилки вибіркового спостереження. Вибірки можуть підрозділятися також на вибірки фіксованого обсягу і послідовні вибірки. При роботі з вибірками фіксованого обсягу обсяг вибірки визначається до початку обстеження, і аналізу результатів передує збір всіх необхідних даних. Нас будуть цікавити головним чином вибірки фіксованого обсягу, оскільки при маркетингових дослідженнях зазвичай використовується саме цей тип.

імовірнісна вибірка
Вибірка, в яку кожен елемент сукупності може включатися з якоїсь відомої ненульовий ймовірністю.
детермінована вибірка
Вибірка, грунтується на деяких приватних перевагах або судженнях, що обумовлюють відбір тих чи інших елементів; при цьому оцінка ймовірності включення до вибірки довільного елемента сукупності стає неможливою.

Однак не слід забувати, що існують і послідовні вибірки, які можуть бути використані з кожним з обговорюваних нижче основних планів вибіркового дослідження.

У послідовній вибірці кількість відбираються елементів заздалегідь невідомо, воно визначається на підставі серії послідовних рішень. Якщо обстеження малої вибірки не призводить до достовірного результату, коло обстежуваних елементів розширюється. Якщо результат представляється непереконливим і після цього, обсяг вибірки збільшується знову. На кожному етапі приймається рішення про те, чи вважати отриманий результат досить переконливим або ж продовжити збір даних. Робота з послідовною вибіркою дає можливість оцінити тренд (тенденцію зміни) даних у міру їх збору, що дозволяє скоротити витрати, пов'язані з додатковими спостереженнями, в тих випадках, коли їх доцільність сходить нанівець.

Як імовірнісний, так і детермінований план вибіркового спостереження діляться на ряд типів. Скажімо, детерміновані вибірки можуть бути нерепрезентативним (зручними), навмисними або квотними імовірнісні ж вибірки діляться на прості випадкові, стратифіковані або групові (кластерні), вони, в свою чергу, можуть поділятися на підтипи. На рис. 15.3 показані ті типи вибірок, які будуть обговорюватися в цій і в наступній главах.

Вибірка фіксованого обсягу (фіксована вибірка)
Вибірка, визначення розміру якої проводиться апріорно; потрібна інформація визначається за відібраними елементам.
послідовна вибірка
Вибірка, яка формується на підставі серії послідовних рішень. Якщо після розгляду малої вибірки результат представляється непереконливим, розглядається вибірка більшого обсягу; якщо і цей крок не призводить до результату, обсяг вибірки знову збільшується і т. д. Таким чином, на кожному етапі приймається рішення про те, чи можна вважати отриманий результат досить переконливим.

Слід пам'ятати про те, що основні типи вибірок можуть поєднуватися, утворюючи більш складні плани вибіркового спостереження. Якщо ви засвоїте їх основні вихідні типи, вам буде легше розібратися і з більш складними поєднаннями.

детерміновані вибірки

Як вже було сказано, при відборі елементів детермінованою вибірки визначальну роль відіграють приватні оцінки або рішення. Часом ці оцінки лунають із боку дослідника, в деяких же випадках відбір елементів сукупності віддається польовим співробітникам. Оскільки елементи відбираються не механічно, визначення ймовірності включення до вибірки довільного елемента і, відповідно, помилки вибіркового спостереження стає неможливим. Незнання помилки, зумовленої обраної процедурою вибіркового обстеження, не дозволяє дослідникам оцінити точність їх оцінок.

Нерепрезентативні (зручні) вибірки

Нерепрезентативні (зручні) вибірки часом іменуються випадковими, оскільки відбір елементів вибірки здійснюється «випадковим» чином - відбираються ті елементи, які є або представляються найбільш доступними в період проведення відбору.

Наша повсякденне життя рясніє прикладами подібних вибірок. Ми розмовляємо з приятелями і на підставі їх реакції і позицій робимо висновки щодо панують в суспільстві політичних пристрастей; місцева радіостанція закликає людей висловити своє ставлення до якогось спірного питання, яке виражається ними думка інтерпретується як переважаюче; ми закликаємо до співпраці добровольців і працюємо з тими, хто викликається нам допомогти. Проблема зручних вибірок очевидна - ми не можемо бути впевнені в тому, що вибірки такого роду дійсно представляють цільову сукупність. У тому, що думка наших приятелів правильно відображає політичні погляди, що превалюють в суспільстві, ми ще здатні поставити під сумнів, але нам часто дуже хочеться вірити в те, що вибірки більшого обсягу, відібрані подібним же чином, репрезентативні. Покажемо помилковість подібного допущення на прикладі.
Кілька років тому одна з локальних телевізійних станцій міста, в якому живе автор цієї книги, проводила щоденний опитування громадської думки з темами, що становлять інтерес для місцевої громади. Опитування, що носили назву «Пульс Медісона», проводилися наступним чином. Щовечора під час шестигодинних новин станція зверталася до глядачів з вопроc, що стосуються певної спірною проблеми, на який необхідно було дати позитивну або негативну відповідь.

У разі позитивної відповіді належало дзвонити по одному, в разі негативної відповіді - за іншим номером телефону. Кількість голосів «за» і «проти» підраховувалася автоматично. У десятигодинному випуску новин повідомлялися результати телефонного опитування. Щовечора на студію дзвонило від 500 до 1000 чоловік, які бажали висловити свою позицію з того чи іншого питання; телевізійний коментатор інтерпретував результати опитування як панівне в суспільстві думка.

Нерепрезентативна (зручна) вибірка
Іноді називається випадковою, оскільки відбір елементів вибірки здійснюється «випадковим» чином - відбираються ті елементи, які є або представляються найбільш доступними в період проведення відбору.

В одному з шестигодинних випусків глядачам було запропоновано наступне питання: «Чи не вважаєте ви, що віковий ценз на вживання алкоголю в Медісоні слід знизити до 18 років?». Існуючий легальний ценз відповідав 21 році. Аудиторія відреагувала на це питання надзвичайною активністю, - в цей вечір на студію зателефонували майже 4000 чоловік, з яких за зниження вікового цензу висловилися 78%. Видається очевидним, що вибірка з 4000 чоловік «має бути репрезентативною» для спільноти, що складається з 180 000. Нічого подібного. Як ви вже, напевно, здогадалися, певна вікова група населення була зацікавлена \u200b\u200bв відомих наслідках голосування куди сильніше інших. Відповідно, не було нічого дивного в тому, що під час обговорення цього питання, що проходив декількома тижнями пізніше, з'ясувалося, що під час, відведений для опитування, студенти діяли узгоджено. Вони дзвонили на телебачення по черзі, причому кожен по кілька разів. Таким чином, ні розмір вибірки, ні відсоток поборників лібералізації закону не з'явилися чимось дивним. Вибірка була не репрезентативної.

Просте збільшення обсягу вибірки не робить її репрезентативною. Репрезентативність вибірки забезпечується не обсягом, а належної процедури відбору елементів. Коли учасники опитування визначаються добровільно або елементи вибірки відбираються в силу їх доступності, план контролю вибірки не дає гарантії її показності. Емпіричні дані свідчать про те, що вибірки, формування яких визначалося міркуваннями зручності, рідко виявляються репрезентативними (незалежно від їх розміру). Телефонні опитування, при яких розглядається 800-900 голосів, являють собою найбільш поширену форму великих, але нерепрезентативним вибірок.

навмисна вибірка
Детермінована (цілеспрямована) вибірка, елементи якої відбираються вручну; відбираються саме ті елементи, які, на думку дослідника, відповідають цілям обстеження.
Навмисна вибірка, залежна від уміння дослідника задати початкове безліч респондентів, які мають потрібними характеристиками; потім ці респонденти використовуються в якості інформаторів, що визначають подальший відбір індивідів.

На жаль, багато людей ставляться до результатів подібних опитувань з довірою. Один з найбільш характерних прикладів використання нерепрезентативним вибірок в міжнародних маркетингових дослідженнях - обстеження тих чи інших країн на основі вибірки, що складається з іноземців, які проживають в даний момент на території країни, яка ініціювала обстеження (наприклад скандинавів, які живуть в США). Хоча подібні вибірки і можуть пролити якесь світло на певні аспекти даної популяції, необхідно пам'ятати, що ці індивіди зазвичай представляють «американізовану» еліту, зв'язок якої з власною країною може виявитися досить умовною. Не рекомендується використовувати нерепрезентативні вибірки при проведенні описових або каузальних обстежень. Вони припустимі лише при пошукових дослідженнях, що мають на меті відпрацювання певних ідей або уявлень, але навіть і в цьому випадку краще використовувати навмисні вибірки.

навмисні вибірки

Навмисні вибірки часом іменуються нецілеспрямованими; їх елементи, які на думку дослідника відповідають цілям дослідження, відбираються вручну. Procter & Gambleвикористовувала цей метод, коли демонструвала рекламу особам у віці від 13 до 17 років, що живуть недалеко від її центрального штабу в Цинциннаті. Підрозділ компанії з харчових продуктів і напоїв найняло цю групу підлітків для того, щоб та виконувала функції свого роду вибірки з споживачів. Працюючи по 10 годин на тиждень в обмін на $ 1000 і похід на концерт, вони переглядали телевізійні рекламні ролики, відвідували разом з менеджерами компанії супермаркети, щоб оглянути експозиції товарів, тестували нові продукти, обговорювали купівельну поведінку. Вибираючи представників для вибірки за допомогою процесу «найму», а не випадково, компанія могла сфокусуватися на ознаках, які вона вважала корисними, - наприклад на здатності підлітка ясно висловлювати свої думки, йдучи на ризик того, що їхні погляди можуть не виявитися репрезентативними стосовно їх віковій групі.

Як вже говорилося, відмінною рисою навмисної вибірки є спрямований відбір її елементів. У деяких випадках елементи вибірки відбираються не в силу їх репрезентативності, але завдяки тому, що вони можуть надати дослідникам цікаву для них інформацію. Коли суд керується показаннями експертизи, він, в даному разі, вдається до використання навмисної вибірки. Подібна ж позиція може взяти гору і при розробці дослідницьких проектів. При первинній опрацювання питання дослідник зацікавлений перш за все у визначенні перспектив дослідження, чим і обумовлюється відбір елементів вибірки.

Вибірка за методом "снігової кулі" є одним з типів навмисної вибірки, використовуваним при роботі з особливими видами популяцій. Ця вибірка залежить від уміння дослідника задати початкове безліч респондентів, які мають потрібними характеристиками. Потім ці респонденти використовуються в якості інформантів, що визначають подальший відбір індивідів.

Уявіть, наприклад, що компанія хоче оцінити потребу в якомусь виробі, яке дозволило б глухим людям спілкуватися по телефону. Дослідники можуть почати розробку цієї проблеми з ідентифікації ключових фігур в співтоваристві глухих; останні могли б назвати імена інших членів цієї групи, які погодилися б взяти участь в обстеженні. Вибірка при подібній тактиці зростає подібно снігової грудки.

Поки дослідник знаходиться на початкових етапах опрацювання проблеми, коли визначаються перспективи та можливі обмеження планованого обстеження, використання навмисної вибірки може бути дуже ефективним. Але ні в якому разі не можна забувати про слабкі сторони вибірки цього типу, оскільки вона ж може бути використана дослідником і при описових або при каузальних дослідженнях, що не забариться позначитися на якості їх результатів. Класичний зразок подібної забудькуватості - індекс цін на споживчі товари ( «CPI»). Як вказує Зюдман ( Sudman): «CPI визначається тільки по 56 містам і метропольного ареалам, певним чином впливати на відбір яких надає і політичний фактор. На ділі ж міста ці можуть представляти, хіба що, саме себе, в той час як індекс іменується індексом цін на споживчі товари для городян, які отримують погодинну заробітну плату*, І службовців і уявляють більшість людей індексом, що відображає рівень цін в будь-якому районі Сполучених Штатів. Сам вибір роздрібних торгових точок також проводиться невипадковим чином, внаслідок чого оцінка можливої \u200b\u200bпомилки вибірки стає неможливою»(Курсив наш) 2.

* Тобто робітників. - Прим. пер.

квотні вибірки

Третій тип детермінованою вибірки - квотні вибірки; відома її показність досягається включенням в неї тієї ж, що і в обстежуваної популяції, частки елементів, що володіють певними характеристиками (див. «Дослідницьке вікно 15.1»). Як приклад ви можете розглянути спробу створення репрезентативної вибірки студентів, що проживають на території університету. Якщо в якійсь вибірці, що складається з 500 індивідів, не буде жодного старшокурсники, ми будемо вправі засумніватися в її репрезентативності і в правомірності застосування отриманих на цій вибірці результатів до обстежуваної сукупності. При роботі з пропорційною вибіркою дослідник може простежити за тим, щоб частка старшокурсників у вибірці відповідала їх частці в загальній кількості студентів.

Припустимо, що дослідник проводить вибіркове дослідження студентів університету, при цьому він зацікавлений в тому, щоб вибірка відображала не тільки їх приналежність до тієї чи іншої статі, а й розподіл їх по курсам. Нехай загальне число студентів складає 10 000 3200 - першокурсники, 2600 - другокурсники, 2200 - студенти третього курсу і 2000 - студенти четвертого курсу; з них 7000 юнаків і 3000 дівчат. Для вибірки обсягом 1000 осіб план пропорційного вибіркового контролю вимагає наявності 320 першокурсників, 260 другокурсників, 220 третьокурсників і 200 випускників, 700 юнаків і 300 дівчат. Дослідник може реалізувати цей план, наділивши кожного інтерв'юера певної квоти, яка буде визначати, з якими студентами він повинен контактувати.

квотна вибіркаДетермінована вибірка, відбирається таким чином, що частка елементів вибірки, що володіють певними характеристиками, приблизно відповідає частці таких же елементів в обстежуваної популяції; кожному польовому працівникові задається квота, яка визначає характеристики населення, з яким він повинен контактувати.

Інтерв'юеру, якому належить провести 20 інтерв'ю, може бути дана інструкція опитати:

            • шість першокурсників - п'ять юнаків і одну дівчину;
            • шість другокурсників - чотирьох хлопців і двох дівчат;
            • чотирьох третьокурсників - трьох юнаків і одну дівчину;
            • чотирьох студентів четвертого курсу - двох хлопців і двох дівчат.

Зауважте, що відбір конкретних елементів вибірки визначається не дослідним планом, а вибором інтерв'юера, покликаного дотримуватися тільки ті умови, які були задані квотою: опитати п'ятьох першокурсників, одну першокурсницю і т. Д.

Зауважте також, що дана квота точно відображає статевий розподіл студентської популяції, але дещо спотворює розподіл студентів по курсам; 70% (14 з 20) інтерв'ю доводиться на частку юнаків, але лише 30% (6 з 20) на частку першокурсників, в той час як ті складають 32% від загального числа студентів. Квота, що виділяється кожному конкретному інтерв'юеру, може не відображати і зазвичай не відображає розподіл контрольних показників в популяції - відповідної пропорційністю повинна володіти тільки підсумкова вибірка.

Слід пам'ятати про те, що пропорційні вибірки залежать скоріше від особистих, суб'єктивних позицій або суджень, ніж від об'єктивної процедури добору елементів вибірки. Причому, на відміну від навмисної вибірки, особисте мислення тут належить не розробнику проекту, а інтерв'юеру. Виникає питання, чи можна вважати пропорційні вибірки репрезентативними, нехай вони і відтворюють властиве популяції співвідношення складових, що володіють тими чи іншими контрольними характеристиками. У зв'язку з цим необхідно зробити три зауваження.

По-перше, вибірка може разюче відрізнятися від популяції по якимось іншим важливим характеристикам, що може мати серйозний вплив на результат. Скажімо, якщо дослідження буде присвячене проблемі існують в студентському середовищі расових забобонів, небайдужим обставиною може виявитися те, звідки прибули опитувані: з міста або з сільської місцевості. Оскільки квота для характеристики «виходець з міста / села» не була означена, точне відображення цієї характеристики стають малоймовірним. Зрозуміло, існує така альтернатива: визначити квоти для всіх потенційно значущих характеристик. Однак збільшення кількості контрольних показників призводить до ускладнення специфікації. Це, в свою чергу, ускладнює - а часом і унеможливлює - відбір елементів вибірки і, вже у всякому разі, призводить до його подорожчання. Якщо, наприклад, приналежність до міського або сільського населення і соціо-економічний статус також виявляться значущими для дослідження, то інтерв'юеру, можливо, доведеться зан5ггься пошуками першокурсника, який був би городянином і належав до вищого або до середнього класу. Согласрггесь, що знайти просто першокурсника чоловічої статі куди як простіше.

По-друге, переконатися в тому, що дана вибірка дійсно є репрезентативною, вельми складно. Зрозуміло, можна перевірити вибірку на предмет відповідності розподілу характеристик, які не входять до числа контрольних, їх розподілу в популяції. Однак подібна перевірка може призводити тільки до негативних висновків. Виявити можна хіба що розбіжність розподілів. Якщо ж розподілу вибірки і популяції для кожної з цих характеристик і повторюють один одного, існує ймовірність того, що вибірка відрізняється від популяції по якомусь іншому, що не заданому явно ознакою.

І нарешті, по-третє. Інтерв'юери, будучи наданими самим собі, схильні до певних дій. Вони занадто часто вдаються до опитування своїх приятелів. Оскільки ж ті часто виявляються подібними самим інтерв'юерам, виникає небезпека помилки. Досвідчені дані, отримані в Англії, свідчать про те, що квотні вибірки мають тенденцію до:

  1. перебільшення ролі найбільш доступних елементів;
  2. зменшенню ролі невеликих сімей;
  3. перебільшення ролі сімей з дітьми;
  4. зменшенню ролі працівників, зайнятих в промисловому виробництві;
  5. зменшенню ролі осіб з найвищими і з найнижчими доходами;
  6. зменшенню ролі малоосвічених громадян;
  7. зменшенню ролі осіб, які займають низьке суспільне становище.
Інтерв'юери, які вибирають задані квоти, зупиняючи випадкових перехожих, швидше за все сконцентрують свою увагу на районах з великою кількістю потенційних респондентів, таких як торгові центри, залізничні вокзали і аеропорти, входи у великі універсами тощо. Така практика призводить до надмірного поданням тих груп осіб, які відвідують подібні місця найчастіше. При необхідності здійснення домашніх візитів інтерв'юери найчастіше виявляються рухомими міркуваннями зручності.
Наприклад, вони можуть проводити опитування тільки вдень, що призводить до недооцінки думки працюють. Крім іншого, вони не заходять в постарілі будинку і, як правило, не піднімаються на верхні поверхи будинків, що не мають ліфтів.

Залежно від специфіки досліджуваної проблеми названі тенденції можуть призводити до різного роду помилок, виправлення ж їх на стадії аналізу даних представляється вельми і вельми скрутним. З іншого боку, при об'єктивному відборі елементів вибірки дослідники отримують в своє розпорядження певні кошти, що дозволяють спростити процедуру оцінки репрезентативності даної вибірки. При аналізі проблеми репрезентативності таких вибірок дослідник розглядає не стільки склад вибірки, скільки процедуру відбору її елементів.

Дослідницьке вікно: Блискуче! Але хто буде це читати?

Щороку рекламодавці витрачають мільйони доларів на рекламні оголошення, що поміщаються на сторінках незліченних видань - від «Advertising Age» до «Yankee». Певна оцінка тексту і зображення може проводитися до його опублікування, що називається, на дому, в рекламному агентстві; справжні ж його перевірка і оцінка відбуваються тільки після публікації рекламного оголошення, оточеного дюжинами настільки ж ретельно підготовлених оголошень, які борються за увагу читача.

компанія Roper Starch Worldwide займається оцінкою читабельності рекламних оголошень, які розміщені в споживчих, ділових, галузевих і професійних журналах і газетах. Результати досліджень доводяться до відома рекламодавців і агентств - зрозуміло, за відповідну плату. Оскільки рекламодавці щодня вдаються до крайніх заходів, намагаючись донести свою рекламу до споживача, компанія Starch вирішила скласти вибірку, яка давала б передплатникам своєчасну і точну інформацію про ефективність реклами. Щороку компанія Starch опитувала більше 50 000 чоловік, розглядаючи при цьому близько 20 000 рекламних оголошень. Щорічно вивчалося близько 500 окремих видань.

Компанія Starch використовувала пропорційну вибірку, мінімальна чисельність якої становила по 100 читачів одного і 100 читачів іншої статі. Starch прийшла до висновку, що при такому обсязі вибірки основні відхилення в рівні читання стабілізуються. Читачі старше 18 років опитувалися особисто, при цьому мова йшла про всі публікаціях, крім тих, які призначалися для особливих груп населення (скажімо, для оцінки публікацій журналу «Seventeen» опитувалися дівчата відповідного віку).

При проведенні опитувань враховувалася зона поширення того чи іншого видання. Скажімо, при дослідженні журналу «Los Angeles» розглядалися читачі, які живуть в південній Каліфорнії. «Time» вивчався в масштабах країни. Опитування присвячувався окремим номерам журналу і проводився в 20-30 містах одночасно.

Кожному ітервьюеру задавалася невелика квота інтерв'ю, що служило мети мінімізації відхилення результатів опитування. Опитувальні листи рапространяется серед людей різних спеціальностей і вікових груп, що мають різні доходи. Кожне подібне дослідження давало можливість представити позиції досить широкої читацької аудиторії. При розгляді ряду професійних, ділових і галузевих видань враховувалася також специфіка їх передплати та розповсюдження. Підписні листи, присвячені виданням, що має досить вузьке поширення, дозволяли відібрати прийнятних респондентів.

При кожному опитуванні ітервьюери просили респондентів переглянути видання і питали, чи звернули ті увагу на будь-яке оголошення. Якщо відповідь була ствердною, реєстратор ставив ще цілий ряд питань, що дозволяють оцінити ступінь сприйняття рекламного оголошення.

Оцінка ця могла бути трояку:

  • Звертали увагу: ті, хто вже звертав увагу на сам факт появи такого оголошення.
  • Знайомилися: запам'яталися будь-яку частину рекламного оголошення, в якій йшлося про торговій марці або про рекламодавця.
  • Читали: особи, які прочитали рекламне оголошення хоча б до половини.

Після обстеження всіх оголошень інтерв'юери реєстрували основні класифікаційні відомості: стать, вік, заняття, сімейний стан, національність, дохід, розмір і склад сім'ї, що дозволяло здійснити перехресне табулювання ступеня читацького інтересу.

При належному використанні дані компанії Starch дозволяють рекламодавцям і агентствам визначати як невдалі, так і вдалі, які залучають і утримують увагу читача типи рекламних схем. Інформація такого роду вкрай цінна для рекламодавців, зацікавлених насамперед в ефективності проведеної ними рекламної кампанії.

Джерело: «Roper Starch Worldwide», Mamaronek, NY 10543.

імовірнісні вибірки

Дослідник може визначити ймовірність включення в вірогідну вибірку будь-якого елементу популяції, оскільки відбір її елементів здійснюється на основі якогось об'єктивного процесу і не залежить від примх і пристрастей дослідника або польового працівника. Оскільки процедура відбору елементів об'єктивна, дослідник може оцінити достовірність отриманих результатів, що було неможливо в разі детермінованих вибірок, як би ретельно не був відбір елементів останніх.

Не слід думати, що імовірнісні вибірки завжди репрезентативна детермінованих. На ділі більш репрезентативною може виявитися і детермінована вибірка. Перевага імовірнісних вибірок полягає в тому, що вони дозволяють оцінити можливу помилку вибіркового обстеження. Якщо ж дослідник працює з детермінованою вибіркою, він не має об'єктивного методу оцінки її адекватності цілям дослідження.

Проста випадкова вибірка

Більшість людей так чи інакше стикається з простими випадковими вибірками або в рамках курсу статистики в інституті, або читаючи про результати відповідних досліджень в газетах або журналах. У простій випадковій вибірці кожен елемент, що включається до вибірки, має одну і ту ж заданою вірогідністю влучення в число досліджуваних елементів і будь-яка комбінація елементів вихідної популяції може потенційно стати вибіркою. Наприклад, якщо ми захочемо скласти просту випадкову вибірку всіх студентів, що значаться в певному коледжі, нам досить буде скласти список всіх студентів, присвоїти кожній значиться в ньому прізвища свій номер і за допомогою комп'ютера зробити випадковий відбір заданої кількості елементів.

Генеральна сукупність

Генеральна сукупність
Сукупність елементів, що задовольняють певним заданим умовам; іменується також вивчається (цільової) сукупністю.
параметр
Певна характеристика або показник генеральної або досліджуваної сукупності.

Генеральною, або досліджуваної, сукупністю називається сукупність, з якої проводиться відбір. Ця сукупність (популяція) може бути описана рядом певних параметрів, які є характеристиками генеральної сукупності, кожен з яких представляє собою певний кількісний показник, який відрізняє одну сукупність від іншої.

Уявіть, що досліджуваної генеральної сукупністю є всі доросле населення Цинциннаті. Для опису цієї сукупності може бути використаний ряд параметрів: середній вік, частка населення з вищою освітою, рівень доходів і т. Д. Зверніть увагу на те, що всі ці показники мають певний фіксоване значення. Зрозуміло, ми можемо розрахувати їх, провівши повну перепис досліджуваної сукупності. Звичайно ж ми спираємося нема на ценз, а на відбирається нами вибірку і використовуємо отримані при вибірковому спостереженні значення для визначення шуканих параметрів сукупності.

Проілюструємо сказане наведеним в табл. 15.1 прикладом гіпотетичної сукупності, що складається з 20 чоловік. Робота з невеликою гіпотетичної сукупністю, подібної до цієї, має ряд переваг. По-перше, невеликий обсяг вибірки дає можливість легко обчислити параметри сукупності, які можуть використовуватися для її опису. По-друге, цей обсяг дозволяє зрозуміти, що може статися при прийнятті того чи іншого плану вибіркового контролю. Обидві ці особливості роблять простим порівняння результатів вибірки з «істинним» і в даному випадку відомим значенням сукупності, чого не можна сказати про типову ситуації, при якій дійсне значення сукупності невідомо. Порівняння оцінки з «істинним» значенням набуває в цьому випадку особливу наочність.

Припустимо, ми хочемо оцінити за двома випадково обраним елементам середній дохід осіб, що входять у вихідну сукупність. Середній дохід буде її параметром. Для оцінки цього середнього значення, що позначається нами як μ, ми повинні розділити суму всіх значень на їх кількість:

Середнє по сукупності μ \u003d Сума елементів сукупності / Кількість елементів.

У нашому випадку обчислення дають:

похідна сукупність

похідна сукупність складається з усіх можливих вибірок, які можуть бути виділені з генеральної сукупності по заданому плану вибіркового контролю (плану вибірки). Статистика - це характеристика, або показник, вибірки. Значення статистики вибірки використовують для оцінки певного параметра сукупності. Різні вибірки дають різні статистики або оцінки одного і того ж параметра сукупності.

похідна сукупність
Сукупність усіх можливих помітних вибірок, які можуть бути виділені з генеральної сукупності по заданому плану вибіркового контролю. Статистика Характеристика або показник вибірки.

Розглянемо похідну сукупність всіх можливих вибірок, які можуть бути виділені з нашої гіпотетичної генеральної сукупності, що складається з 20 індивідів, за планом вибіркового контролю, який передбачає, що вибірка обсягом n \u003d 2 може бути отримана шляхом випадкового бесповторного відбору.

Припустимо на час, що дані по кожній одиниці сукупності - в нашому випадку це ім'я і дохід індивіда - записуються на гуртки, після чого вони опускаються в глечик і перемішуються. Дослідник витягує з глека один гурток, списує з нього інформацію і відкладає його в сторону. Те ж саме він робить і з другим гуртком, вилученими з глечика. Потім дослідник повертає обидва гуртка в глечик, перемішує його вміст і повторює ту ж послідовність дій. У табл. 15.2 показані можливі результати названої процедури. Для 20 гуртків можливі 190 таких парних комбінацій.

Для кожної комбінації можна обчислити середню величину доходу. Скажімо, для вибірки АВ (k \u003d 1)

k-e вибіркове середнє \u003d Сума елементів вибірки / Кількість елементів вибірки \u003d

На рис. 15.4 показані оцінка середнього доходу по всій генеральної сукупності і величина помилки для кожної оцінки для вибірок k \u003d 25, 62,108,147і 189 .

Перш ніж приступати до розгляду залежності між вибірковим середнім доходом (статистикою) і середнім доходом за сукупністю (параметром, що вимагає оцінки), скажемо кілька слів про похідну сукупності. По-перше, на практиці ми не займаємося складанням сукупностей такого роду. Це вимагало б занадто великої витрати часу і сил. Практик обмежується складанням всього однієї вибірки потрібного обсягу. Дослідник ж користується концепцією похідною сукупності і пов'язаним з нею поняттям вибіркового розподілу при формулюванні підсумкових висновків.

Як - буде показано далі. По-друге, слід пам'ятати про те, що похідна сукупність визначається як сукупність всіх можливих різних вибірок, які можуть бути виділені з генеральної сукупності по заданому плану вибіркового контролю. При зміні будь-якій частині плану вибіркового контролю похідна сукупність також змінюється. Так, якщо при виборі гуртків дослідник буде повертати в глечик перший з виймаються дисків перш, ніж вийняти другий, похідна сукупність включатиме.

вибірки АА, ВВ і т. д. Якщо обсяг бесповторном вибірок буде дорівнює 3, а не 2, з'являться вибірки типу ABC, причому їх буде 1140, а не 190, як це було в попередньому випадку. При зміні простого випадкового відбору на будь-який інший метод визначення елементів вибірки похідна популяція також змінюється.

Слід пам'ятати і про те, що відбір вибірки заданого обсягу з генеральної сукупності рівносильний вибору одного елемента (1 з 190) з похідною популяції. Цей факт дозволяє робити багато статистичних висновків.

Вибіркове середнє і генеральне середнє

Чи вправі ми прирівнювати вибіркове середнє до значення істинного середнього генеральної сукупності? У будь-якому випадку ми виходимо з того, що вони взаємопов'язані. Однак ми також вважаємо, що буде мати місце помилка. Наприклад, можна вважати, що інформація, отримана від користувачів Інтернету, буде істотно відрізнятися від результатів опитування «звичайного» населення. В інших випадках можна припускати досить точну відповідність, інакше ми не змогли б використовувати вибіркове значення для оцінки значення генерального. Але наскільки великою може бути чинена нами при цьому помилка?

Давайте складемо всі вибіркові середні, що містяться в табл. 15.2, і розділимо отриману суму на кількість вибірок, т. Е. Давайте усереднити середні.
Нами буде отримано наступний результат:

Він збігається із середнім значенням генеральної сукупності. Кажуть, що в такому випадку ми маємо справу з несмещенной статистикою.

Статистика називається несмещенной, якщо її середнє значення за всіма можливими вибірками виявляється рівним оцінюваного параметру генеральної сукупності. Зауважте, що мова тут не йде про якийсь приватному значенні.Приватна оцінка може бути вельми далека від істинного значення - візьміть, наприклад, вибірки АВ або ST. У деяких випадках справжнє значення генеральної сукупності може виявитися недосяжним при розгляді будь-якої можливої \u200b\u200bвибірки, нехай статистика і буде при цьому несмещенной. У нашому випадку це не так: цілий ряд можливих вибірок - наприклад AT - дає вибіркове середнє, рівне істинному середньому генеральної сукупності.

Має сенс розглянути розподіл цих вибіркових оцінок, і особливо залежність між цим розкидом оцінок і варіацією рівня доходів у генеральній сукупності. В якості запобіжного варіації використовують дисперсію генеральної сукупності. Для визначення дисперсії генеральної сукупності ми повинні обчислити відхилення кожної величини від середнього значення, скласти квадрати всіх відхилень і розділити отриману суму на кількість доданків. Позначимо а ^ дисперсію генеральної сукупності. тоді:

Дисперсія сукупності σ 2 \u003d Сума квадратів різниць кожного елемента
сукупності і середнього за сукупністю / Число елементів сукупності \u003d

дисперсія середнього значення рівня доходів може бути визначена таким же чином. Тобто ми можемо знайти її, визначивши відхилення кожного середнього від їх загальної середньої, підсумувавши квадрати відхилень і розділивши отриману суму на кількість доданків.

Ми можемо визначити дисперсію середнього значення рівня доходів і іншим чином, використовуючи для цього дисперсію значень рівня доходів в генеральної сукупності, оскільки між двома цими величинами існує прямий зв'язок. Якщо бути точним, в тих випадках, коли вибірка представляє лише малу частину генеральної сукупності, дисперсія вибіркового середнього дорівнює дисперсії генеральної сукупності, поділеної на обсяг вибірки:

де σ x 2 - дисперсія середнього вибіркового значення рівня доходів, σ 2 - дисперсія рівня доходів в генеральної сукупності, n - обсяг вибірки.

Тепер порівняємо розподіл результатів з розподілом кількісної ознаки в генеральній сукупності. Малюнок 15.5 демонструє, що розподіл кількісної ознаки в генеральній сукупності, показане на поле A, є многовершинная (кожне з 20 значень з'являється тільки раз) і симетричним щодо справжнього середнього генеральної сукупності, рівного 9400.

вибіркове розподіл
Розподіл значень певної статистики, розрахованої для всіх можливих помітних вибірок, які можуть бути виділені з генеральної сукупності з даного плану вибіркового контролю.

Розподіл оцінок, показане на поле В, грунтується на даних табл. 15.3, яка, в свою чергу, складалася шляхом віднесення значень з табл. 15.2 до тієї чи іншої групи в залежності від їх величини з подальшим підрахунком їх кількості в групі. Поле В - традиційна гістограма, що розглядається в самому початку вивчення курсу статистики, яка представляє вибіркове розподілстатистики. Зауважимо принагідно наступне: поняття вибіркового розподілу є найважливішим поняттям статистики, це наріжний камінь побудови статистичних висновків. За відомим вибіркового розподілу досліджуваної статистики можна зробити висновок про відповідному параметрі генеральної сукупності. Якщо ж відомо тільки те, що вибіркова оцінка змінюється від вибірки до вибірки, але сам характер цієї зміни невідомий, визначення помилки вибіркового обстеження, пов'язаного з цією оцінкою, стає неможливим. Оскільки вибіркове розподіл оцінки описує її зміна від вибірки до вибірки, воно забезпечує основу для визначення достовірності вибіркової оцінки. Саме з цієї причини план ймовірнісної вибірки настільки важливий для статистичного висновку.

За відомими ймовірностями включення до вибірки кожного елемента сукупності інтерв'юери можуть знайти вибіркове розподіл різних статистик. Дослідники спираються саме на ці розподілу - будь це вибіркове середнє, частка вибірки, вибіркова дисперсія або якась інша статистика - при поширенні результату вибіркового спостереження на генеральну сукупність. Зауважте також, що для вибірок з об'ємом 2 розподіл вибіркових середніх є одновершінним і симетричним щодо справжнього середнього.

Отже, ми показали, що:

  1. Середнє значення всіх можливих вибіркових середніх одно генеральному середньому.
  2. Дисперсія вибіркових середніх певним чином пов'язана з генеральної дисперсією.
  3. Розподіл вибіркових середніх є одновершінним, в той час як розподіл значень кількісної ознаки в генеральній сукупності є многовершинная.

Центральна гранична теорема

Теорема, що говорить про те, що для простих випадкових вибірок обсягом n, Виділених з генеральної сукупності з генеральним середнім μ і дисперсією σ 2, при великих n розподіл вибіркового середнього x наближається до нормального з центром, рівним μ, і з дисперсією σ 2. Точність названого наближення зростає зі зростанням n.

Центральна гранична теорема. Одновершинная розподіл оцінок може розглядатися як прояв центральної граничної теореми, яка каже, що для простих випадкових вибірок обсягом n, Виділених з генеральної сукупності з істинним середнім μ і дисперсією σ 2, для великих n розподіл вибіркових середніх наближається до нормального з центром, рівним істинному середньому, і дисперсією, яка дорівнює відношенню дисперсії генеральної сукупності до обсягу вибірки, т. е .:

Наближення це стає все більш точним в міру зростання n. Пам'ятайте про це. Незалежно від виду генеральної сукупності розподіл вибіркових середніх буде нормальним для вибірок досить великого обсягу. Що ж слід розуміти під досить великим обсягом? Якщо розподіл значень кількісної ознаки генеральної сукупності є нормальним, тоді нормальним буде і розподіл вибіркових середніх для вибірок обсягом n\u003d 1. Якщо розподіл змінної (кількісної ознаки) в сукупності симетрично, але ненормально, вибірки досить малого обсягу дадуть нормальний розподіл вибіркових середніх. Якщо ж розподіл кількісної ознаки генеральної сукупності має виражену асиметрію, виникає потреба в вибірках більшого обсягу. І все-таки розподіл вибіркового середнього може бути прийнято нормальним тільки в тих випадках, коли ми маємо справу з вибіркою достатнього обсягу.

Для того щоб робити висновки, використовуючи нормальну криву, зовсім не обов'язково виходити з умови нормальності розподілу значень кількісної ознаки генеральної сукупності. Ми, скоріше, спираємося на центральну граничну теорему і в залежності від популяційного розподілу визначаємо такий обсяг вибірки, який дозволяв би працювати з нормальною кривою. На щастя, нормальний розподіл статистики забезпечується вибірками порівняно невеликого обсягу - рис. 15.6 наочно демонструє цю обставину. Оцінки довірчого інтервалу. Чи може сказане вище допомогти нам при прийнятті певних висновків про генерального середньому? Адже на практиці ми виробляємо відбір тільки однієї, а не всіх можливих вибірок заданого обсягу, і на основі отриманих даних робимо певні висновки стосовно цільової групи.

Як же це відбувається? Як відомо, при нормальному розподілі якийсь відсоток всіх спостережень має певне середньоквадратичне відхилення; скажімо, 95% спостережень укладається в ± 1,96 среднеквадратических відхилень середнього. Нормальний розподіл вибіркових середніх, до якого може бути додана центральна гранична теорема, в цьому сенсі не є винятком. Середнє такого вибіркового розподілу одно генеральному середньому μ, а його середньоквадратичне відхилення носить назву среднеквадратической помилки середнього:

Виявляється, що:

  • 68,26% вибіркових середніх відхиляються від генерального середнього не більше ніж на ± σ x;
  • 95,45% вибіркових середніх відхиляються від генерального середнього не більше ніж на ± σ x;
  • 99,73% вибіркових середніх відхиляються від генерального середнього не більше ніж на ± σ x,

т. е. певна частка вибіркових середніх в залежності від обраної величини z буде укладена в інтервалі, що визначається величиною z. Цей вислів може бути переписано у вигляді нерівності:

Генеральне середнє - z < Среднее по выборке < Генеральное среднее + z (Среднеквадратическая помилка середнього)

тим самим вибіркове середнє з певною ймовірністю знаходиться в інтервалі, межами якої є сума і різниця середнього значення розподілу і якогось числа середньоквадратичних відхилень. Це нерівність може бути перетворено до виду:

Середнє по вибірці - z (Среднеквадратическая помилка середнього)< Генеральное среднее < Среднее по выборке + z (Среднеквадратическая помилка середнього)

Якщо співвідношення 15.1 дотримується, наприклад, в 95% випадків ( z \u003d 1,96), то в 95% випадків дотримується і співвідношення 15.2. У тих випадках, коли висновок ґрунтується на одиничному вибірковому середньому, ми використовуємо вираз 15.2.

Важливо пам'ятати, що вираз 15.2 не говорить про те, що інтервал, що відповідає даній вибірці, неодмінно повинен включати генеральне середнє. Інтервал має відношення скоріше до процедури відбору. Інтервал, збудований навколо даного середнього, може включати і може не включати справжнє середнє сукупності. Наша впевненість в правильності зроблених висновків ґрунтується на тому, що 95% всіх інтервалів, побудованих за обраним планом вибіркового обстеження, будуть містити справжнє середнє. Ми вважаємо, що наша вибірка відноситься саме до цих 95%.

Для того щоб проілюструвати це важливе положення, уявімо на мить, що розподіл вибіркових середніх для вибірок з об'ємом n \u003d 2 в нашому гіпотетичному прикладі є нормальним. Таблиця 15.4 наочно ілюструє результат для перших 10 з можливих 190 вибірок, які можуть бути відібрані по заданому плану. Зауважте, що тільки 7 з 10 інтервалів включають генеральне або істинне середнє. Впевненість у правильності висновку обумовлена \u200b\u200bне якоюсь приватною оцінкою, але саме процедурою оцінки. Процедура ж ця така, що для 100 вибірок, для яких будуть обчислені вибіркове середнє і довірчий інтервал, в 95 випадках інтервал цей включатиме справжнє генеральне значення. Точність даної вибірки визначається процедурою, за допомогою якої здійснювалося формування вибірки. Репрезентативне план вибіркового обстеження не гарантує репрезентативності всіх вибірок. Процедури статистичного висновку ґрунтуються на репрезентативності плану вибіркового спостереження, саме тому для імовірнісних вибірок ця процедура настільки критична.

Імовірнісні вибірки дозволяють оцінювати точність результатів як близькість вироблених оцінок до істинного значення. Чим більше среднеквадратическая помилка статистики, тим вище ступінь розкиду оцінок і тим нижче точність процедури.

Когось може збентежити ту обставину, що довірчий рівень має відношення до процедури, а не до окремого вибіркового значенням, проте слід пам'ятати, що величина довірчого рівня оцінки генерального значення може регулюватися дослідником. Якщо ви не хочете ризикувати і боїтеся, що вам може попастися один з тих п'яти обраних вибіркових інтервалів, який не включає в себе генеральне значення, можна обрати 99% -й довірчий інтервал, при якому лише один зі ста вибіркових інтервалів не включає генеральну середню. Далі, якщо ви зможете збільшити обсяг вибірки, ви збільшите ступінь достовірності результату, забезпечуючи потрібну точність оцінки генерального значення. Більш детально ми будемо говорити про це в гл. 17.

Описувана нами процедура має ще одну складову, яка може викликати відоме збентеження. При оцінці довірчого інтервалу використовуються три величини: x, z і σ x. Вибіркове середнє x обчислюється за даними вибірки, z вибирається виходячи з потрібного довірчого рівня. Але як же бути зі середньоквадратичної помилкою середнього σ x? Вона дорівнює:

і тому для її визначення нам необхідно задатися среднеквадратическим відхиленням кількісного ознаки генеральної сукупності, т. е. 5. Що ж робити в тих випадках, коли середньоквадратичне відхилення s невідомо? Така проблема не виникає з двох причин. По-перше, зазвичай для більшості кількісних ознак, використовуваних в маркетингових дослідженнях, варіація змінюється набагато повільніше рівня більшості цікавлять маркетолога змінних. Відповідно, якщо дослідження проводиться повторно, ми можемо використовувати при розрахунках колишнє, раніше отримане значення s. По-друге, якщо сформовано вибірку і отримані дані, ми можемо оцінити дисперсію генеральної сукупності, визначивши вибіркову дисперсію. Дисперсія несмещенной вибірки визначається як:

дисперсія вибірки ŝ 2 \u003d Сума квадратів відхилень від середнього по вибірці / (Число елементів вибірки -1). Для визначення вибіркової дисперсії ми спочатку повинні знайти вибіркове середнє. Потім знаходяться різниці між кожним із значень вибірки і вибірковим середнім; ці різниці зводяться в квадрат, підсумовуються і ділять ся на число, що дорівнює кількості вибіркових спостережень мінус одиниця. Вибіркова дисперсія не тільки забезпечує оцінку генеральної дисперсії, але може використовуватися і для оцінки среднеквадратической помилки середнього. Коли генеральна дисперсія σ 2 відома, відома також і среднеквадратическая помилка σ x, оскільки:

Коли ж генеральна дисперсія невідома, среднеквадратическая помилка середнього може лише оцінюватися. Оцінка ця задається ŝ x, яка дорівнює середньоквадратичного відхилення вибірки, поділеному на квадратний корінь з обсягу вибірки, т. е.. Оцінка визначається аналогічно тому, як визначалася оцінка істинного значення, але замість генерального середньоквадратичного відхилення в розрахункову формулу підставляється середньоквадратичне відхилення вибірки. Так, скажімо, для вибірки АВ з вибірковим середнім 5800:

Відповідно, ŝ \u003d 283, а

і 95% -й інтервал тепер

що менше попереднього значення.

У табл. 15.5 зведені розрахункові формули для різних середніх і дисперсій, про які йшлося в цій главі. Формування простий випадкової вибірки. У нашому прикладі відбір елементів вибірки здійснювався за допомогою глечика, в якому знаходилися всі елементи вихідної сукупності. Це дозволило нам наочно уявити поняття похідної сукупності і вибіркового розподілу. Застосовувати ж подібний метод на практиці ми не рекомендуємо, бо при цьому підвищується ймовірність помилки. Гуртки можуть відрізнятися і розмірами, і фактурою, що в певних випадках може призводити до переваги одних іншим. Відбір учасників в'єтнамської кампанії, який провадився за допомогою лотереї, може служити прикладом помилки подібного роду.

Відбір здійснювався шляхом витягування дисків з датами народження з великого барабана. Телебачення транслювало цю процедуру на всю країну. На жаль, диски завантажувалися в барабан систематичним чином: першими йшли січневі, останніми - грудневі дати. Хоча барабан і піддавався інтенсивному розкручування, грудневі дати випадали куди частіше січневих. Згодом процедура ця була переглянута таким чином, що ймовірність подібних систематичних помилок була істотно знижена. Переважний метод формування простої випадкової вибірки заснований на використанні таблиці випадкових чисел.

Використання такої таблиці передбачає наступну послідовність кроків. По-перше, елементам генеральної сукупності повинні бути присвоєні послідовні номери від 1 до N; в нашій гіпотетичній сукупності елементу А буде присвоєно номер 1, елементу B - номер 2 і т. Д. По-друге, кількість розрядів таблиці випадкових чисел має бути таким же, як у номера N. для N\u003d 20 будуть використовуватися двозначні числа; для N між 100 і 999 - тризначні числа і т. д. По-третє, початкова позиція повинна визначатися випадковим чином. Ми можемо розкрити відповідну таблицю випадкових чисел і, закривши очі, що називається, ткнути в неї пальцем. Оскільки числа в таблиці випадкових чисел слідують у випадковому порядку, початкова позиція не має особливого значення.

І нарешті, ми можемо рухатися в будь-якому довільно обраному напрямку - вгору, вниз або поперек, відбираючи ті елементи, номери яких будуть відповідати випадковим числам з таблиці. Для того щоб проілюструвати сказане, розглянемо скорочену таблицю випадкових чисел (табл. 15.6). оскільки N \u003d 20, ми повинні працювати тільки з двозначними числами. У цьому сенсі табл. 15.6 влаштовує нас як не можна краще. Нехай ми заздалегідь вирішили рухатися вниз по стовпчику, початкова же позиція знаходиться на перетині одинадцятої рядка і четвертого стовпця, де знаходиться число 77. Це число занадто велике, і тому має бути відкинуте. Наступні два числа також будуть відкинуті, четверте ж значення 02 буде використано, оскільки 2 відповідає номеру елемента В.

Наступні п'ять чисел також будуть відкинуті як занадто великі, в той час як номер 05 вкаже на елемент Е. Таким чином, елементи Ві Е стануть нашою двоелементною вибіркою, по якій ми і будемо судити про рівень доходів даної сукупності. Можлива і альтернативна стратегія, при якій в якості основи для відбору буде використана комп'ютерна програма, що генерує випадкові числа. З'явилися останнім часом публікації свідчать про те, що числа, генеровані подібними програмами, не цілком випадкові, що може певним чином проявлятися при побудові складних математичних моделей, проте їх можна використовувати для більшості прикладних маркетингових досліджень. Зауважимо ще раз, що проста випадкова вибірка вимагає складання послідовного нумерованого списку елементів генеральної сукупності.

Іншими словами, кожен член вихідної сукупності повинен бути ідентифікований. Для деяких сукупностей зробити це не складає труднощів, наприклад при дослідженні 500 найбільших американських корпорацій, список яких наведено в журналі «Fortune». Список цей уже складено, тому формування простої випадкової вибірки в даному випадку не складе труднощів. Для інших же вихідних сукупностей (наприклад, для всіх сімей, що живуть в певному місті) складання загального списку вкрай важко, що змушує дослідників вдаватися до інших схемами вибіркового обстеження.

резюме

Навчальна мета 1
Ясно розрізняти поняття перепису (цензу) і вибірки

Повна перепис сукупності (популяції) називається цензом. вибіркасукупності, сформована з відібраних елементів.

Навчальна мета 2
Знати сутність і послідовність шести етапів, які реалізуються дослідниками для отримання вибіркової сукупності

Процес формування вибірки ділиться на шість етапів:

  1. завдання популяції;
  2. визначення основи вибірки;
  3. вибір процедури відбору;
  4. визначення обсягу вибірки;
  5. відбір елементів вибірки;
  6. обстеження відібраних елементів.

Навчальна мета 3
Визначити поняття "основа вибірки"

Основа вибірки - перелік елементів, з яких буде здійснюватися вибірка.

Навчальна мета 4
Пояснити, в чому полягає відмінність ймовірнісної і детермінованою вибірки

У вірогідну вибірку кожен член сукупності може включатися з якоїсь заданої ненульовий ймовірністю. Ймовірності включення до вибірки тих чи інших членів сукупності можуть відрізнятися один від одного, але ймовірність включення в неї кожного елемента відома. Для детермінованих вибірок оцінка ймовірності включення будь-якого елементу в вибірку стає неможливою. Гарантувати репрезентативність такої вибірки не можна. Все детерміновані вибірки засновані, скоріше, на приватну позицію, судженні або перевазі. Подібні переваги часом можуть давати хороші оцінки характеристик сукупності, проте не існує способу об'єктивного визначення відповідності вибірки поставленому завданню.

Навчальна мета 5
Розрізняти вибірку фіксованого обсягу і багатоступінчасті (послідовні) вибірки

При роботі з вибірками фіксованого обсягу обсяг вибірки визначається до початку обстеження і аналізу результатів передує збір всіх потрібних даних. У послідовній вибірці кількість відбираються елементів заздалегідь невідомо, воно визначається на підставі серії послідовних рішень.

Навчальна мета 6
Пояснити, що являє собою навмисна вибірка, і описати як сильні, так і слабкі її сторони

Елементи навмисної вибірки відбираються вручну, вони представляються досліднику відповідають цілям обстеження. Передбачається, що відбираються елементи можуть дати повноцінне уявлення про досліджуваної популяції. Поки дослідник знаходиться на початкових етапах опрацювання проблеми, коли визначаються перспективи та можливі обмеження планованого обстеження, використання навмисної вибірки може бьп дуже ефективним. Але ні в якому разі не можна забувати про слабкі сторони вибірки цього типу, оскільки вона ж може бути використана дослідником і при описових або при каузальних дослідженнях, що не забариться позначитися на якості їх результатів.

Навчальна мета 7
Визначити поняття квотної вибірки

Пропорційна вибірка відбирається таким чином, що частка елементів вибірки, що володіють певними характеристиками, приблизно відповідає частці таких же елементів в обстежуваної популяції; для цього кожному лічильнику задається квота, яка визначає характеристики населення, з яким він повинен контактувати.

Навчальна мета 8
Пояснити, чим є параметр в процедурі вибірки

Параметр - певна характеристика або показник генеральної або досліджуваної сукупності; певний кількісний показник, який відрізняє одну сукупність від іншої.

Навчальна мета 9
Пояснити, що таке похідна сукупність

Похідна сукупність складається з усіх можливих вибірок, які можуть бути виділені з генеральної сукупності по заданому плану вибіркового контролю.

Навчальна мета 10
Пояснити, чому поняття вибіркового розподілу є найважливішим поняттям статистики.

Поняття вибіркового розподілу - це наріжний камінь побудови статистичних висновків. За відомим вибіркового розподілу досліджуваної статистики можна зробити висновок про відповідному параметрі генеральної сукупності. Якщо ж відомо тільки те, що вибіркова оцінка змінюється від вибірки до вибірки, але сам характер цієї зміни невідомий, визначення помилки вибіркового обстеження, пов'язаного з цією оцінкою, стає неможливим. Оскільки вибіркове розподіл оцінки описує її зміна від вибірки до вибірки, воно забезпечує основу для визначення достовірності вибіркової оцінки.