Základný výskum a tvorba jednoduchej náhodnej vzorky. Všeobecná agregovaná a selektívna štúdia. Štatistická veľkosť presnosti selektívneho agregátu

Empirické sú považované za jeden z hlavných spôsobov štúdia sociálnych vzťahov a procesov. Poskytujú spoľahlivé, úplné a reprezentatívne informácie.

Špecifickosť techník

Empirické poskytujú príjem faktických vedomostí. Prispievajú k vytvoreniu a zovšeobecňovaniu okolností na úkor sprostredkovanej alebo priamej registrácie udalostí, ktoré sú obsiahnuté vo vzťahoch, ktoré sa naučili, objekty, javy. Empirické techniky sa líšia od teoretickej skutočnosti, že predmetom analýzy je:

  1. Správanie jednotlivcov a ich skupín.
  2. Ľudská aktivita.
  3. Slovné akcie jednotlivcov, ich rozsudky, názory, názory.

Štúdie vzorky

Empirické učenie sa vždy zameriava na získanie objektívnych a presných informácií, kvantitatívnych údajov. V tomto ohľade, keď je splnená, je potrebné zabezpečiť reprezentatívnosť informácií. Správna hodnota je teda správna selektívny agregát. na to Znamená to, že výber by sa mal vykonať tak, aby získané údaje úzkej skupiny odrážali trendy, ktoré sa konajú v celkovej hmotnosti respondentov. Napríklad, s hlasovaním 200-300 ľudí, získané údaje môžu byť extrapolované na všetky mestské populácie. Ukazovatele selektívneho agregátu umožňujú iný prístup k štúdiu sociálno-ekonomických procesov v regióne v krajine ako celku.

Terminológia

Pre lepšie pochopenie otázok súvisiacich s selektívnym výskumom je potrebné objasniť niektoré definície. Jednotkou pozorovania je priamym zdrojom informácií. Môžu to byť samostatná jednotlivec, skupina, dokument, organizácia a tak ďalej. Celkový agregát je Komplex pozorovacích jednotiek. Mali by sa vzťahovať na problém, ktorý sa študuje. Priama analýza podlieha. Štúdia sa vykonáva v súlade s vypracovanými metódami zhromažďovania informácií. Určiť tento podiel na celom množstve použitia respondentov koncepcia "selektívneho agregátu". Jeho majetok odráža kľúčové parametre celkovej hmotnosti ľudí, ktorí sa nazývajú reprezentatívnosť. V niektorých prípadoch neexistuje náhoda. Potom hovoria o chybe reprezentatívnosti.

Poskytovanie reprezentatívnosti

Podrobnosti Otázky týkajúce sa neho sú prerokované v rámci štatistiky. Problémy sa vyznačujú zložitosťou, pretože na jednej strane sa navrhuje poskytnúť kvantitatívne zastúpenie, ktoré dáva všeobecná populácia. na to Označuje najmä, že skupiny respondentov musia byť prezentované v optimálnom čísle. Množstvo by malo byť dostatočné na normálne zastúpenie. Na druhej strane existuje aj kvalitatívne zastúpenie. Zahŕňa určitý predmet, ktorý je vytvorený selektívny agregát. na to Znamená to, že napríklad reprezentatívnosť nemožno diskutovať, ak sú len muži vypočúvaní alebo len ženy, starší ľudia buď mládež. Štúdia by sa mala vykonať vo všetkých zastúpených skupinách.

Charakteristická vzorka

Tento termín sa berie do úvahy v dvoch aspektoch. V prvom rade je definovaný ako komplex prvkov zo spoločného radu ľudí, ktorých názor sa študuje - toto selektívny agregát. na to Aj proces vytvárania špecifickej kategórie respondentov s požadovaným poskytovaním reprezentatívnosti. V praxi, niekoľko typov a typov výberu vyniknúť. Zvážiť ich.

Typy

Existujú tri z nich:

  1. Spontánna selektívny agregát. na to Súbor respondentov vybraných na princípe dobrovoľnosti. Súčasne je zabezpečená dostupnosť jednotiek z celkovej hmotnosti ľudí do konkrétnej študijnej skupiny. Spontánny výber v praxi sa používa pomerne často. Napríklad, s prieskummi v tlači, v pošte. Táto technika však má významnú nevýhodu. Je nemožné kvalitatívne prezentovať celú sumu všeobecnej vzorky. Táto technika sa uplatňuje na základe ekonomiky. V niektorých prieskumoch je táto možnosť jediným možným.
  2. Spontánna selektívny agregát. na to Jedna z hlavných techník používaných v štúdii. Ako kľúčový princíp takejto výberu je možné zabezpečiť možnosti pre každú pozorovateľskú jednotku, aby sa dostali z celkovej hmotnosti jednotlivcov do úzkej skupiny. To používa rôzne techniky. Môže to byť napríklad lotéria, mechanický výber, tabuľka náhodných čísel.
  3. Stratifikovaná (lomová) vzorka. Je založený na tvorbe kvalitatívneho modelu celkovej hmotnosti respondentov. Po tom sa výber jednotiek vykonáva v selektívnej úplnej úrovni. Napríklad sa vykonáva podľa veku alebo pohlavia podľa obyvateľstva a tak ďalej.

Názory

Existujú nasledujúce vzorky:

Dodatočne

Vzorky môžu byť tiež závislé a nezávislé. V prvom prípade experimentálny postup a výsledky, ktoré budú získané pre jednu skupinu respondentov počas jej určitú vplyv na druhú. Nezávislé vzorky preto nemajú v úmysle mať taký vplyv. Tu však by ste mali venovať pozornosť jednému dôležitým bodom. Jedna skupina subjektov, v súvislosti s ktorou sa psychologické vyšetrenie uskutočnilo dvakrát (aj keď to bolo zamerané na štúdium rôznych vlastností, funkcií, funkcií), predvolená hodnota bude považovaná za závislú.

Pravdepodobnostné výbery

Zvážte niektoré typy vzoriek:

  1. Náhodné. Zahŕňa homogenitu celkového agregátu, jednej pravdepodobnosti dostupnosti všetkých komponentov, ako aj prítomnosť kompletného zoznamu prvkov. Pri výbere sa spravidla používa tabuľka s náhodnými číslami.
  2. Mechanický. Tento typ náhodného odberu vzoriek znamená objednanie na konkrétnej funkcii. Napríklad telefónnym číslom, v abecednom poradí, podľa dátumu narodenia a tak ďalej. Prvá zložka je vybraná v náhodnom poradí. Ďalej výber každého prvku k krokom n. Veľkosť celkového agregátu bude n \u003d k * n.
  3. Stratic. Táto vzorka sa používa pri nehomogenicite celkového agregátu. Ten je rozdelený na Strata (skupiny). V každom z nich sa výber vykonáva mechanickým alebo náhodným spôsobom.
  4. Sériové. Výber skupiny je náhodne. Vnútri nich sa objekty študujú pevnou látkou.

Neuveriteľné výbery

Naznačujú vzorku, ktorá nie je na princípe šance, ale podľa subjektívnych značiek: typická, prístupnosť, rovnaké zastúpenie a tak ďalej. Táto kategória obsahuje výbery:

Nuanlivosť

Ak chcete poskytnúť reprezentatívnosť, je potrebný presný a úplný zoznam jednotiek agregátu. Objekty pozorovania, spravidla, je jedna osoba. Výber zo zoznamu je lepší vykonať, číslovanie jednotiek a aplikovanie tabuľky s náhodnými číslami. Ale metóda Quasonicound sa často používa celkom často. To znamená výber zo zoznamu každého prvku N.

Ovplyvňujúce faktory

Objem agregátu sa nazýva počet jeho jednotiek. Podľa odborníkov, nemusí byť veľký. Nepochybne, tým väčší je počet respondentov, tým presnejší výsledok. Spolu s tým však veľké množstvo nie vždy zaručuje úspech. Napríklad sa to stane, keď je celkové množstvo respondentov nerovnomerné. Homogénna sa bude považovať za takú kombináciu, kde je kontrolovaný parameter, napríklad rýchlosť gramotnosti rovnomerne distribuovaná, to znamená, že nie je prázdnota alebo zahusťovadlo. V tomto prípade to bude stačiť na rozhovor niekoľko ľudí. Podľa výsledkov prieskumu bude možné dospieť k záveru, že väčšina ľudí má normálnu mieru gramotnosti. Z toho vyplýva, že vplyv informácií nie je kvantitatívnymi príznakmi, ale kvalitatívne charakteristiky agregátu sú najmä jeho homogénnosť.

Chyby

Predstavujú odchýlku priemerných parametrov vzorky stanovenej na hodnoty celkovej hmotnosti respondentov. V praxi sa chyby určujú porovnaním. Počas skúmania dospelých sa zvyčajne uplatňujú korešpondencia, štatistické účtovníctvo, ako aj výsledky minulých prieskumov. Kontrolné parametre zvyčajne vykonávajú porovnanie priemerných súborov agregátov (všeobecných a selektívnych), definície podľa tejto chyby a zníženie tohto vychýlenia sa označuje ako reprezentatívnosť.

závery

Selektívna štúdia je metóda zhromažďovania údajov o inštaláciách a správaní ľudí prostredníctvom prieskumu špeciálne vybraných skupín respondentov. Tento príjem sa považuje za spoľahlivý a ekonomický, hoci vyžaduje určité techniky. Základňa je selektívna sada. Pôsobí ako určitý podiel celkovej hmotnosti ľudí. Výber sa vykonáva pomocou špeciálnych techník a je zameraný na získanie informácií o celej celistvosti. Ten, zase, zastupuje všetky možné verejné objekty alebo skupina, ktorá bude študovaná. Všeobecne je všeobecný agregát tak veľký, že prieskum každého zástupcu bude dosť nákladný a zaťažujúci proces. Preto sa používa jeho znížený model. V selektívnom súbore, všetci tí, ktorí dostávajú dotazníky, sú zahrnuté, ktorí sa označujú ako respondenti, ktorí skutočne pôsobia ako predmet štúdia. Jednoducho povedané, predstavuje mnoho ľudí, ktorí sú obľúčente.

Záver

Ciele prieskumu sú určené konkrétnymi kategóriami zahrnutými vo všeobecnej populácii. Pokiaľ ide o konkrétny podiel celkovej hmotnosti ľudí, podlieha predmetom zahrnutým v skupinách s pomocou matematických výpočtov. Pre výber jednotiek je potrebný popis objektu pôvodného súboru. Po stanovení počtu subjektov sa stanoví recepcia alebo spôsob tvorby skupín. Výsledky prieskumu umožní opísať študované znamenie týkajúce sa všetkých zástupcov celkovej hmotnosti ľudí. Ako prax ukazuje, selektívne a nie pevné štúdie sa vykonávajú.

Koncepcia "reprezentatívnosti" vo vzťahu k sociologickým prieskumom - ankety verejnej mienky - má takmer magický účinok na ľudí. Termín "reprezentácia" sám má, ale aj očividne politický význam.

Aky je dôvod? To je, že sa predpokladá, že vzorka (skupina ľudí vybraných na prieskum) môže zastupovať (predložiť) celú všeobecnú populáciu. Všeobecná populácia v prípade všetkých ruských prieskumov je celá populácia krajiny. Teraz si predstavte, že hovoríme o politickom riešení - podpora účtu alebo volebného hlasovania. S pomocou selektívneho prieskumu získavame vynikajúci mechanizmus politického zastúpenia - mechanizmus, v ktorom môže malá skupina ľudí predstavovať stanovisko alebo pozíciu celej krajiny krajiny. Preto reprezentatívnosť štúdie je daná také dôležité miesto.

Koncepcia reprezentatívnosti sa používa, samozrejme, nielen v politickom výskume. Termín sa vzťahuje takmer vždy, pokiaľ ide o veľké štúdie, či už v oblasti marketingu, ekonomického správania alebo vzdelávania.

Metodika reprezentatívnych prieskumov

Ako, rozhovor 1500 ľudí, môžete vyvodiť závery o všetkých Rusoch, ktoré sú viac ako 140 miliónov (a dokonca voličov viac ako 110 miliónov)? Technológia, ktorá stála pre reprezentatívne prieskumy, je založené na štatistických zákonoch. Najbližšia základňa je zákon veľkých čísel alebo bernoulli teorem.

Jeho zjednodušený jeho význam je možné sprostredkovať tak. Predpokladajme, že máme nejaké znamenie, napríklad množstvo zrážok za deň v Jekaterinburgu za dvadsiateho storočia. Ak by sme vykopali všetky svoje hodnoty spolu s ich frekvenciou (to sa nazýva distribúcia), a potom náhodne berú dostatočne veľké množstvo prípadov (to znamená, že nie všetky dni v dvadsiatom storočí, ale dosť veľa), potom budeme Pozrite sa, že distribúcia v našej vzorke bude veľmi ako distribúcia pre celé dvadsiate storočie. Ak teda vyberieme niektoré jednotky z agregátu, môžu skutočne reprezentovať celý súbor a v skutočnosti nie je potrebné zbierať údaje pre všetky prípady.

Existuje však kľúčová podmienka: Toto je pravda len vtedy, ak budeme striktne náhodne náhodne. Jediný problém tu môže byť odchýlka od náhody. Takže, ak berieme len údaje o zrážok v posledných rokoch (napríklad, pretože je ľahšie nájsť tieto údaje) alebo prieskumy 1 500 vašich priateľov (pretože je ľahšie kontaktovať ich), a nie náhodných ľudí, potom vzorku , Samozrejme, nebude reprezentovaný.

Predstavte si, že od 143,5 milióna Rusov, náhodne vyberte 1500 ľudí, ktoré potrebujete. Potom sa napríklad podiel stredných manažérov medzi nimi približne rovná podielu stredných manažérov vo všeobecnej populácii, ktorá ukazuje, že vaša vzorka môže predstavovať celú celkovú. Môže to byť možné, že tieto dva ukazovatele sa budú značne líšiť? Napríklad, medzi Rusmi, to je 14% a vo vzorke bude len 1%? Teoreticky je to možné, ale pravdepodobnosť toho je tak malá, že môže byť zanedbaná (približne ako sa stretnúť s drakom na ulici).

Okrem toho najpríjemnejšia v tejto pravdepodobnosti nie je ani to, čo je malé, ale skutočnosť, že pre náhodné procesy sa táto pravdepodobnosť môže vypočítať. Môžeme povedať, s akou pravdepodobnosť, že naša selektívna hodnota sa odchyľuje od hodnoty vo všeobecnej populácii o 13% (ako v uvedenom príklade), a s tým, čo povedzme o 2,5%. Zvyčajne robia naopak: Najprv určiť pravdepodobnosť, s ktorou chceme, aby sa naša hodnota odchýlka od hodnoty vo všeobecnom množstve (najčastejšie sa upevní na úrovni 95%), a potom sa už hľadajú, čo je veľkosť odchýlky na jednej alebo inej veľkosti vzoriek. Táto odchýlka sa nazýva interval spoľahlivosti, niekedy sa nazýva chyba odberu vzoriek alebo štatistická chyba - často vedie vedľa výsledkov prieskumu.

Takže, pravdepodobnosť odchýlky, veľkosti odchýlky (interval spoľahlivosti) a veľkosť vzorky. Na základe toho je vzorec pre výpočet veľkosti vzorky nasledovný:

kde n je veľkosť vzorky, δ - interval spoľahlivosti, Z je hodnota funkcie normálnej distribúcie pre túto pravdepodobnosť odchýlky (pre pravdepodobnosť 5% Táto hodnota je 1,96).

Toto je zjednodušený vzorec, v reálnych prieskumoch sa používa niekoľko zložitejších vzorcov. Tento vzorec môže tiež zlyhať, ak je hodnota indikátora veľmi odlišná od 50% (napríklad napríklad tento vzorec nie je vhodný na odhad podielu pacientov s zriedkavým ochorením v krajine).

To je to, čo sa stane, ak sa v tomto vzorci zdôvodnené niektoré hodnoty:

Inými slovami, ak by sme vzali náhodnú vzorku Rusov vo veľkosti v roku 1600 ľudí a odhadol sa, že niektorý ukazovateľ, napríklad pripravenosť hlasovať za určitú politiku, potom s pravdepodobnosťou 95%, naše odhady sa nebude líšiť od pripravenosti na hlasovanie Pre to medzi všetkými Rusmi o viac ako 2, 45%.

Veľkosť vzorky

Takže väčšia je veľkosť vzorky, tým väčšia je pravdepodobnosť, že budeme bližšie k podielu vo všeobecnej populácii. Zdá sa, že to znamená, že musíme sa pokúsiť priviesť vzorku na 143,5 milióna. V skutočnosti, ako vidíte z tabuľky, povaha náhodných procesov je taká, že z určitého bodu sa pravdepodobne dostane do intervalu Začína sa veľmi pomaly (a tento moment príde pomerne rýchlo). Potom, čo zvoľíme 1 500 jednotiek, bez ohľadu na to, koľko sa zvýši objem vzorky, pravdepodobnosť, že naša hodnota vo vzorke spadne do hodnoty všeobecnej populácie, zvýši sa veľmi a veľmi pomaly.

V skutočnosti rozdiel medzi 1500 a 10 000 skúmanými takmer č. Niekde 1500 môžeme povedať, že naše odhady sa budú líšiť od podielu vo všeobecnej agregácii o 2-3%. Ak sa vzorka ďalej zvyšuje, potom sa táto možná chyba zníži, ale veľmi mierne. Inými slovami, vzorka 100 000 je lepšia ako vzorka 2500, ale rozdiel je tak malý, že nedáva zmysel a v prípade sociálnych prieskumov a nie je ekonomicky neboli odôvodnené. Zvyčajne je zvýšenie vzorky drahé, a preto nemá zmysel nafúknuť, aby vyhral jeden percentuálny bod hodnoty intervalu spoľahlivosti.

Je dôležité, aby vo vzorci všeobecne neobjavili veľkosť všeobecnej populácie. Faktom je, že keď je všeobecný agregát veľký (viac ako 20 000), prakticky nemá vplyv na veľkosť vzorky. Takže nemusíme vedieť, koľko ľudí žije v Rusku na vybudovanie reprezentatívnej vzorky. Je jasné, že je s najväčšou pravdepodobnosťou vybrať 1500 z roku 2000 - to nedáva zmysel - je ľahšie preskúmať 2000 a získať presné hodnotenie. Ale v prípade potreby odber vzoriek dostaneme možnosť zovšeobecniť svoje výsledky pre všeobecnú populáciu. A z toho istého dôvodu sa veľkosť vzorky nelíši pre veľké a malé krajiny.

Reprezentatívnosť a presnosť

Na pochopenie významu konceptu "reprezentatívnosti", poďme uvažovať o vzorke 15 ľudí. Podivne, ak ste to urobili náhodou, je to aj reprezentatívne. Okrem toho môžete urobiť vzorku do jednej jednotky. Predstavte si box s loptičkami, odkiaľ náhodne vezmite jednu loptu. Ak je to náhodne vybraná guľa, potom to bude reprezentovať aj všetky gule, ktoré sú v tomto balení. Len on ich zastupuje nie práve. Prečo? Pretože existuje veľmi vysoká pravdepodobnosť, že sa chystá urobiť chybu. Nabudúce môžeme ťahať inú loptu a získať ďalšiu predstavu o gule v krabici. Reprezentatívne nepresné prostriedky majú veľký rozptyl hodnotení.

Podobne 15 ľudí predstavuje akúkoľvek všeobecnú populáciu, ale nepresne to nepresne, pretože chyba, interval spoľahlivosti je veľmi vysoká. Budeme musieť pridať softvér +/- 33%, aby sme získali 95% pravdepodobnosti, že prídete do intervalu. Ak sme pripravení nechať to, vezmeme 15 ľudí, zistime, že 7 z nich sú stredná manažéri, a potom získame hodnotenie, že 7/15 z kameniva, to znamená 47% +/- 33% - to je hodnotiace podiely manažérov vo všeobecnom agregácii, a to je absolútne správny záver. Nemá len žiadnu hodnotu. To by sme mohli povedať bez preskúmania. Preto, plánovaním vzorky, má zmysel dosiahnuť takýto objem, ktorý bude vhodný z hľadiska pomeru nákladov a efektívnosti.

Všetky vyššie uvedené sú navrhnuté tak, aby vyjadrili jednu jednoduchú myšlienku, ktorá nie je veľmi rozpoznaná: veľkosť vzorky nie je spojená s jej reprezentatívnosťou..

Malá vzorka je nepresná, ale môže byť stále reprezentatívna. Objemy vzoriek, ktoré sa dnes používajú v hromadných prieskumoch v Rusku takmer vždy dostatočne vysokú presnosť.

Ohrozuje tú istú reprezentatívnosť vzorky nie jeho objem, ale posun, to znamená, že odchýlka od princípu šance.

Porušenie zásady nehody

Ak začneme výberu jednotiek nie náhodným spôsobom, vzorka sa stáva neprepriateľnou. Napríklad, ak nám niečo zabraňuje ich výberom náhodou. Predstavte si, že chceme odobrať loptičky z našej krabice náhodne, ale ukazuje sa, že časť lopty uhryzne. Mechanizmus, v ktorom budeme mať len tie gule, ktoré nám dávajú v ruke, je mechanizmus, ktorý porušuje nehodu, a preto porušuje reprezentatívnosť. V tomto prípade, koľko loptičiek berieme z krabice (aj keď berieme všetky loptičky, ktoré nie sú uhryznúť), budeme mať nerepresentatívnu vzorku, pretože neberieme do úvahy žiadne z tých, ktorí uhryznú - len to bude len Prejdite našou vzorkou.

Najväčším problémom s hryzavými guľôčkami je, že sa môžu líšiť od tých, ktorí idú do našich rúk, a sa líšia podľa znamenia, ktoré nás zaujíma. Táto situácia sa nazýva systematická chyba vzorkovania.

Je potrebné rozlišovať situáciu neaktívneho zastúpenia, ktoré sme opísali vyššie, o situácii nerechentnosti. Toto sú rôzne problémy a majú rôzne riešenia. Nie je možné vyriešiť jeden z nich riešením druhého. Ak vzorka nemá reprezentatívnosť, je zbytočné zvýšiť. Okrem toho veľké vzorky v sociálnych prieskumoch majú vlastnosť akumulovaných chýb, takže s pomocou silného zvýšenia odberu vzoriek sa problém reprezentácie môže zhoršiť.

Prečo je reprezentatívnosť nemožná

V poznámkach k tabuľkám s výsledkami prieskumov verejnej mienky je často možné vidieť, že "veľkosť vzorky je 1600 ľudí, vzorka zástupcu na podlahe a veku." Z vyššie uvedeného je zrejmé, že tieto sú dva rôzne parametre: indikácia reprezentatívnosti nesúvisí s veľkosťou vzorky. V skutočnosti to znamená, že sa vykonali určité postupy s cieľom zabezpečiť súlad medzi vzorkou a všeobecnou populáciou. Napríklad, s cieľom poskytnúť reprezentatívnosť sexu, muži a ženy získavajú vzorku v rovnakých vzťahoch, ktoré existujú medzi Rusmi podľa sčítania ľudu. Reprezentatívnosť podlahy však neznamená reprezentatívnosť, napríklad politickými názormi.

Prečo musíte zosúladiť odber vzoriek na podlahe a iných sociálno-demografických kategórií? Pretože skutočná reprezentatívnosť môže poskytnúť len náhodnú vzorku, a nie je možné ho implementovať v praxi podľa hmotnosti dôvodov. Akonáhle sa to pokúsite urobiť, narazíte na veľa problémov - nezáleží na tom, akú metódu chcete využiť. Časť respondentov bude vo všeobecnosti neprístupná pre vašu metódu (povedzme, pre osobné rozhovory, veľký problém je domy s interkomom a bezpečnosť), ďalšia časť bude chýbať, neodpovedá alebo uprednostňuje riešiť svoje záležitosti. Sú ľudia, ktorí majú jazykové problémy, a nemôžu s nami hovoriť. Sú ľudia, ktorí nechápu, prečo je to potrebné, a nechcú s nami hovoriť. To všetko je vážne porušenie náhody, ktoré znemožní realizovať.

Tí, ktorí znižujú problém reprezentácie v hromadných prieskumoch na štatistiky, zabúdajú, že ľudia sú veľmi špecifické gule. Tam sú gule, ktoré utekajú a skrývajú. Tam sú gule, ktoré uhryznú. Nie sú pasívne predmety, dávajú vzdanie sa. Hovorí sa: "Nechcem sa zúčastniť na vašom prieskume," čím ruší nehodu. Preto je v prísnom zmysle slova, reprezentatívnosť v hromadných prieskumoch, samozrejme, nie je možné v akejkoľvek forme.

Bol vypracovaný mechanizmus, s ktorým sa zvyčajne poskytuje viditeľnosť reprezentatívnosti: Zarovnajte vzorku v niektorých kategóriách a predstierame, že vo všetkých ostatných možných kategóriách je tiež zarovnaný. V skutočnosti nemáme dôvod argumentovať. Ale problém je, že neexistuje žiadna možnosť skontrolovať - \u200b\u200bopäť, pretože niektoré gule uhryznú. S cieľom skontrolovať prítomnosť systematickej chyby, ktorá bude musieť ísť na tých, ktorých sme ich nepozorovali a hlasovali sme. Ale ako si pamätáme, nechcú ich odpovedať. Pripíšte tých, ktorí sú kategoricky nereagovaní, nie je možné. Preto každý pracuje na predpoklade, že ak sme vyrovnali vzorku v dvoch troch parametroch, predstavuje celú celkovú úplnosť, hoci tento predpoklad nemá žiadny vážny dôvod.

Reprezentatívna vzorka - technológia požičaná sociológmi zo štatistiky. Preto nevyhnutne nesie prvky matematického a štatistického obrazu sveta. Snáď najsilnejším predpokladom je, že samotný selektívny prieskum je politicky a sociologicky neutrálny: účasť a neúčasti v prieskume nenesie politický význam a nie je spojený s inými sociologicky dôležitým parametrom. Miestny, ale dnes sa stali jedným z hlavných politických inštitúcií a zmenili sa na kľúčový sprostredkovateľ medzi hlavnými spoločnosťami a spotrebiteľmi. Za týchto podmienok už nie je možné veriť v ich politickú sterilitu. Stále však vieme trochu o tom, ako sú ankety chápané v moderných spoločnostiach a že skutočne predstavujú.

Vzorka

Vzorka alebo selektívny agregát - Mnohé prípady (predmety, objekty, udalosti, vzorky), s použitím určitého postupu vybraného zo všeobecnej populácie na účasť v štúdii.

Vlastnosti odberu vzoriek:

  • Kvalitatívna charakteristika vzorky - Kto presne si vyberieme a aké spôsoby vybudovania vzoriek používame na to.
  • Kvantitatívna charakteristika vzorky - Koľko prípadov si vyberiete, inými slovami, veľkosť vzorky.

Potreba vzorky

  • Predmet štúdie je veľmi rozsiahly. Napríklad spotrebitelia globálnych produktov spoločnosti sú obrovským počtom územne rozptýlených trhov.
  • Je potrebné zhromažďovať primárne informácie.

Vzorkovanie

Vzorkovanie - počet prípadov zahrnutých do selektívneho súboru. Z štatistických úvah sa odporúča, aby počet prípadov predstavoval najmenej 30-35.

Závislé a nezávislé vzorky

Pri porovnávaní dvoch (alebo viacerých) vzoriek je dôležitým parametrom ich závislosťou. Ak môžete nainštalovať homomorfný pár (tj, keď jeden prípad, jeden a len jeden prípad od odberu vzoriek X a naopak) pre každý prípad v dvoch vzorkách (a to je základom vzťahu je dôležité pre charakteristický prvok), Vzorky sa nazývajú závislý. Príklady závislých vzoriek:

  • dvojčatá
  • dve merania akéhokoľvek znaku pred a po experimentálnom náraze, \\ t
  • manželia a manželky
  • atď.

V prípade, že medzi vzorkami neexistuje takýto vzťah, potom sa tieto vzorky zvažujú nezávislý, napr.:

V súlade s tým, závislé vzorky majú vždy rovnaké množstvo a objem nezávislého sa môže líšiť.

Porovnanie vzorky sa vykonáva pomocou rôznych štatistických kritérií:

  • a atď.

Reprezentatívnosť

Vzorka sa môže považovať za reprezentatívne alebo nerepresentačné.

Príklad unrepresentačnej vzorky

  1. Štúdium s experimentálnymi a kontrolnými skupinami, ktoré sú uvedené v rôznych podmienkach.
    • Výskum s experimentálnymi a kontrolnými skupinami so zapojením stratégie párovej výberu
  2. Štúdia s použitím iba jednej skupiny - experimentálne.
  3. Štúdia s použitím zmiešaného (faktora) plánu - všetky skupiny sú uvedené v rôznych podmienkach.

Typy vzorky

Vzorky sú rozdelené do dvoch typov:

  • probabilistický
  • neuveriteľný

Pravdepodobnostné vzorky

  1. Jednoduchá pravdepodobnostná vzorka:
    • Jednoduchá opakovaná vzorka. Použitie takejto vzorky je založená na predpoklade, že každý respondent s rovnakým podielom pravdepodobnosti môže spadnúť do vzorky. Na základe zoznamu všeobecnej populácie sú karty vypracované s číslami respondentov. Sú umiestnené v palube, zmiešané a karta sa z nich odstráni, počet sa zaznamená, potom sa vráti späť. Potom sa postup opakuje toľkokrát, koľkokrát potrebujeme. Mínus: opakovanie výberových jednotiek.

Postup vytvárania jednoduchej náhodnej vzorky obsahuje nasledujúce kroky:

1. Je potrebné získať úplný zoznam členov všeobecnej populácie a čísla tohto zoznamu. Takýto zoznam, pripomíname, sa nazýva základ vzorky;

2. Určite odhadovanú veľkosť vzorky, to znamená, že očakávaný počet respondentov;

3. Výpis z tabuľky náhodných čísel toľko počtov, ako potrebujeme vzorové jednotky. Ak by mal byť 100 ľudí vo vzorke, z tabuľky sa vyberie 100 náhodných čísel. Tieto náhodné čísla môžu byť generované počítačovým programom.

4. Vyberte si z nižšie uvedených informácií, ktorých čísla zodpovedajú vybité náhodné čísla

  • Jednoduchá náhodná vzorka má zjavné výhody. Táto metóda je mimoriadne ľahko zrozumiteľná. Výsledky štúdie môžu byť distribuované do štúdia. Väčšina prístupov k získaniu štatistických záverov zahŕňa informácie o zbere pomocou jednoduchej náhodnej vzorky. Jednoduchá metóda náhodnej vzorky však má najmenej štyri významné obmedzenia:

1. Často je ťažké vytvoriť základ pozorovacej vzorky, ktorý by umožnil jednoduchú náhodnú vzorku.

2. Výsledkom použitia jednoduchej náhodnej vzorky môže byť veľká celosť, alebo celkovo distribuovaný veľkou geografickou oblasťou, ktorá výrazne zvyšuje čas a náklady na zber údajov.

3. Výsledky používania jednoduchej náhodnej vzorky sú často charakterizované nízkou presnosťou a väčšou štandardnou chybou, ako sú výsledky použitia iných pravdepodobnostných metód.

4. V dôsledku použitia SRS môže byť vytvorená nekrytá vzorka. Aj keď vzorky získané jednoduchým náhodným výberom, v priemere primerane predstavujú všeobecnú populáciu, niektoré z nich mimoriadne nesprávne predstavujú štúdium. Pravdepodobnosť toho je obzvlášť veľká s malou vzorkou.

  • Jednoduchá inštitúcia vzorky. Konštrukcia vzoriek je rovnaká, iba karty s číslami respondentov sa nevrátia späť na palubu.
  1. Systematická pravdepodobnostná vzorka. Je to zjednodušená verzia jednoduchej pravdepodobnostnej vzorky. Na základe zoznamu všeobecného súhrnného agregátu po určitom intervale (k) sú vybraní respondenti. Hodnota je určená náhodou. Najspoľahlivejším výsledkom sa dosiahne s homogénnou všeobecnou populáciou, inak je možná náhoda kroku a niektoré vnútorné cyklické vzory odberu vzoriek (odber vzoriek). Nevýhody: Rovnako ako v jednoduchej pravdepodobnostnej vzorke.
  2. Vzorka sériového (hniezda). Výberové jednotky sú štatistické série (rodina, škola, brigáda atď.). Vybrané prvky sú podrobené pevnému vyšetreniu. Výber štatistických jednotiek môže byť organizovaný typom náhodnej alebo systematickej vzorky. Mínus: možnosť väčšej homogenity ako vo všeobecnej populácii.
  3. Zónová vzorka. V prípade nehomogénnej všeobecnej populácie, pred použitím pravdepodobnostnej vzorky s akoukoľvek selekčnou technikou, sa odporúča rozdeliť všeobecný agregát pre homogénne časti, takáto vzorka sa nazýva zónový. Skupiny zónovania môžu pôsobiť ako prírodné vzdelávanie (napríklad oblasti mesta) a akékoľvek znamenie, základom štúdie. Znamenie, na základe ktorého sa vykonáva oddelenie, sa nazýva znak zväzku a zonovania.
  4. "Pohodlná" vzorka. "Pohodlný" vzorový postup je vytvoriť kontakty s "pohodlnými" vzorkovými jednotkami - so skupinou študentov, športovým tímom, s priateľmi a susedmi. Ak potrebujete získať informácie o reakcii ľudí na novú koncepciu, táto vzorka je dosť odôvodnená. "Pohodlná" vzorka sa často používa na predbežné testovanie dotazníkov.

Neuveriteľné vzorky

Výber v takejto vzorke sa nevykonáva podľa zásad šance, ale podľa subjektívnych kritérií - prístupnosť, typické, rovnaké zastúpenie atď.

  1. Štvorka vzorka - vzorka je postavená ako model, ktorý reprodukuje štruktúru všeobecnej populácie vo forme kvót (proporcie) študovaných značiek. Počet vzorových prvkov s rôznou kombináciou študovaných znakov je určený s takýmto výpočtom, takže zodpovedá ich podielu (pomerom) vo všeobecnej populácii. Napríklad, ak máme všeobecný súbor 5000 ľudí, existuje 2 000 žien a 3 000 mužov, potom v vzorovej kvóty budeme mať 20 žien a 30 mužov, alebo 200 žien a 300 mužov. Uvedené vzorky sú najčastejšie založené na demografických kritériách: pohlavie, vek, región, príjmy, vzdelávanie a ďalšie. Nevýhody: Zvyčajne takéto vzorky sú nerepresentatívne, pretože Nemôžete vziať do úvahy niekoľko sociálnych parametrov. Pros: ľahko prístupný materiál.
  2. Metóda snehovej gule. Vzorka je postavená nasledovne. Každý respondent, počnúc prvým, opýtajte sa kontaktov svojich priateľov, kolegov, známych, ktorí by boli vhodné na podmienky výberu a mohli sa zúčastniť na štúdii. S výnimkou prvého kroku je vzorka vytvorená s účasťou samotných objektov. Metóda sa často používa, ak je potrebné nájsť a pohovor s tvrdými skupinami respondentov (napríklad respondenti, ktorí majú vysoký príjem, respondenti patriaci do jednej profesionálnej skupiny, respondentov, ktorí majú akékoľvek podobné záľuby / záľuby atď. )
  3. Spontánna vzorka je vzorka tzv. "Prvým pultom". Často používané v televízii a rozhlasových hviezdach. Veľkosť a zloženie prírodných vzoriek nie je vopred známa a je určená iba jedným parametrom - činnosť respondentov. Nevýhody: Nie je možné zistiť, aký všeobecný súbor spočenec, a ako výsledok - neschopnosť určiť reprezentatívnosť.
  4. Prieskum trasy sa často používa, ak je jednotka štúdie rodina. Na mape osídlenia, v ktorom bude prieskum vyrobený, všetky ulice sú očíslované. Pomocou tabuľky (generátora) náhodných čísel sú vybraté veľké čísla. Každé veľké číslo je zobrazené tak, že pozostáva z 3 komponentov: počet ulice (2-3 prvé čísla), číslo domu, číslo bytu. Napríklad číslo 14832: 14 je číslo ulice na mape, 8 - Domové číslo, 32 - Apartmánová izba.
  5. Zónová vzorka s výberom typických objektov. Ak po zónovaní je z každej skupiny vybraný typický objekt, t.j. Objekt, ktorý pre väčšinu charakteristík študovaných v štúdii, sa približuje k priemerným ukazovateľom, takáto vzorka sa nazýva typ typických objektov-zonovaných.

6.Modálna vzorka. 7. Odborná vzorka. 8.Hetherogénna vzorka.

Stratégie pre stavebné skupiny

Výber skupín za ich účasť na psychologickom experimente sa vykonáva s použitím rôznych stratégií, ktoré sú potrebné na zabezpečenie maximálneho možného súladu s vnútornou a vonkajšou platnosťou.

Randomizácia

Randomizáciaalebo náhodný výberNa vytvorenie jednoduchých náhodných vzoriek. Použitie takejto vzorky je založené na predpoklade, že každý člen obyvateľstva s rovnakou pravdepodobnosťou môže spadnúť do vzorky. Napríklad, aby sa náhodná vzorka 100 študentov vysokých škôl, môžete zložiť papiere s menami všetkých vysokoškolských študentov v klobúku, a potom z neho získať 100 kusov papiera - to bude náhodný výber (Goodwin J., s. 147).

Výber párovania

Výber párovania - Stratégia na výstavbu skupín odberu vzoriek, v ktorých sú skupiny subjektov zostavené z predmetov ekvivalentných významných pre experiment vedľa bočných parametrov. Táto stratégia je účinná pre experimenty s použitím experimentálnych a kontrolných skupín s lepšou možnosťou - priťahujú dvojice dvojíc (mono- a vytáčanie), pretože vám umožní vytvoriť ...

Passionometrický výber

Passionometrický výber - randomizácia s prideľovaním vrstvy (alebo klastrov). S týmto spôsobom vytvárania vzorky je všeobecná súprava rozdelená do skupín (Strata) s určitými charakteristikami (pohlavie, vek, politické preferencie, vzdelávanie, úroveň príjmov atď.) A témy sú vybrané so zodpovedajúcimi vlastnosťami.

Približné modelovanie

Približné modelovanie - vypracovanie obmedzených vzoriek a zhrnutie záverov o tejto vzorke na širšiu populáciu. Napríklad, s účasťou v štúdii študentov 2. ročníka univerzity, údaje o tejto štúdii sa vzťahujú na "Ľudia vo veku od 17 do 21 rokov". Prípustnosť takýchto zovšeobecní je mimoriadne obmedzená.

Približné modelovanie - tvorba modelu, ktorý je jasne určenou triedou systémov (procesy) opisuje jeho správanie (alebo potrebné javy) s prijateľnou presnosťou.

Poznámky

Literatúra

Hresov A. D. Matematické metódy psychického výskumu. - SPB.: Reč, 2004.

  • Ilyašov F.N. reprezentatívnosť prieskumu vedie k marketingovému štúdiu // sociologický výskum. № 3. P. 112-116.

pozri tiež

  • V niektorých typoch výskumu je vzorka rozdelená do skupín:
    • experimentálny
    • kontrola
  • Kohorta

Spojenie

  • Koncepcia odberu vzoriek. Hlavné charakteristiky vzorky. Typy vzorky

Nadácia Wikimedia. 2010.

Synonymá:
  • Shchepkin, mikhail semenovič
  • Všeobecný agregát

Sledujte, čo je "vzorová" v iných slovníkoch:

    vzorka - skupina subjektov, ktoré predstavujú určitú populáciu a vybrali sa na experiment alebo výskum. Opačný koncept je súbor všeobecného. Vzorka je súčasťou celkovej všeobecnej. Praktického psychológa. M.: AST, ... ... Veľká psychologická encyklopédia

    vzorka - Vzorová časť všeobecnej kombinácie prvkov, ktorá je pokrytá pozorovaním (často sa nazýva selektívna sada a samotná vzorka je samotná volebná metóda). V matematickej štatistike, prijaté ... ... Technický adresár prekladateľa

    Vzorka - (vzorka) 1. Malé množstvo tovaru vybraného na reprezentáciu všetkých jeho počtu. Pozri: Predaj podľa vzorky. 2. Malé množstvo tovaru prenášaného potenciálnym kupcom, aby im poskytla možnosť stráviť to ... ... Obchodný slovník

    Vzorka - časť všeobecnej kombinácie prvkov, na ktoré sa vzťahuje pozorovanie (často sa nazýva selektívna sada a samotná vzorka je spôsob selektívneho pozorovania). V matematickej štatistike sa prijíma zásada náhodného výberu; toto je… … Ekonomika a matematický slovník

    Vzorka - (Vzorka) Ľubovoľný výber podskupiny prvkov z hlavného agregátu, ktorej charakteristiky sa používajú na posúdenie celej celkovej celého celku. Selektívna metóda sa používa, ak je príliš dlhá alebo príliš drahá, aby sa preskúmala celá sada ... Ekonomický slovník

Vzdelávacie ciele

  1. Je jasné, že rozlišovať koncepcie sčítania ľudu (Cencing) a odber vzoriek.
  2. Poznať podstatu a sekvenciu šiestich etáp v implementovaných výskumníkmi na získanie selektívneho agregátu.
  3. Určiť koncepciu "základnej vzorky".
  4. Vysvetlite, aký je rozdiel medzi pravdepodobnostnou a deterministickou vzorkou.
  5. Rozpočítať výber pevných objemov a viacstupňových (sekvenčných) vzoriek.
  6. Vysvetlite, že je to úmyselná vzorka a opíšte silné aj slabé stránky.
  7. Určiť koncepciu vzorky kvóty.
  8. Vysvetlite, aký parameter je v procese odberu vzoriek.
  9. Vysvetlite, čo je derivát zhody.
  10. Vysvetlite, prečo je koncepcia selektívnej distribúcie najdôležitejšou koncepciou štatistík.

Takže výskumník presne určil úlohu a nainštaloval systém výskumu a nástroje získavania údajov na jeho riešenie. Ďalšia etapa výskumného procesu by mala byť vo výbere týchto prvkov, ktoré budú preskúmané. Každý prvok tejto populácie môžete skúmať, vyrábať úplné sčítanie tejto populácie. Úplný prieskum agregátu sa nazýva sčítanie ľudu (hodnota). Existuje ďalšia príležitosť. Štatistické vyšetrenie podlieha určitej časti obyvateľstva, vzorky prvkov veľkej skupiny a podľa údajov získaných v tejto podmnožine, niektoré závery sa vykonávajú v súvislosti s celú skupinu. Schopnosť šíriť výsledky získané na základe selektívnych údajov do veľkej skupiny závisí od spôsobu, ktorým bola vzorka vykonaná. Väčšina tejto kapitoly bude venovaná tomu, ako by mala byť vzorka vytvorená a prečo je.

Sčítanie ľudu (centrá)
Kompletné sčítanie agregátu (populácia).
Vzorka
Kombinácia prvkov podmnožiny väčšej skupiny objektov.

Koncepcia "populácie", alebo "kombinácia", sa môže vzťahovať nielen na ľudí, ale aj pre firmy pracujúce vo výrobnom priemysle, organizáciám maloobchodného alebo veľkoobchodného obchodu alebo dokonca na úplne inamidatívne predmety, ako sú napríklad podrobnosti podnik; Tento koncept je definovaný ako všetky mnohé prvky, ktoré spĺňajú niektoré špecifikované podmienky. Tieto podmienky sú jednoznačne definované obidve prvky patriace do cieľovej skupiny a prvkov, ktoré by mali byť vylúčené z úvahy.

Štúdia zameraná na určenie demografického profilu spotrebiteľov spotrebiteľov mrazenej pizze by sa mala začať zistiť, kto by mal a kto by sa nemal pripísať tým. Týka sa táto kategória tváre tejto kategórie, aspoň raz sa snaží takáto pizza? Osoby kúpiť aspoň jednu pizzu mesačne? V týždni? Osoby jedia za mesiac takého radu pizze, ktorá presahuje určité minimum? Výskumník musí byť veľmi presný pri určovaní cieľovej skupiny. Je tiež potrebné zabezpečiť, aby sa vzorka vytvorila presne z cieľa, a nie "niektoré" nastavené, ktoré sa koná v prípade nevhodnej alebo neúplnej základne vzorky. Ten je zoznam prvkov, z ktorých bude vytvorená skutočná vzorka.

Výskumník môže uprednostniť metódu vzorky zisťovania celej populácie z niekoľkých dôvodov. Po prvé, úplný prieskum nastavenej aj relatívne malej veľkosti si vyžaduje veľmi veľké materiály a časové náklady. V čase ukončenia sčítania ľudu a spracovania údajov boli informácie už zastarané. V niektorých prípadoch sú kvalifikácie jednoducho nemožné. Povedzme, že výskumníci stanovili cieľ kontrolovať korešpondenciu reálnej životnosti elektrických žiaroviek. Vypočítané, pre ktoré ich potrebujú, aby ich udržali až do zlyhania zlyhania. Ak preskúmate celú zásobu svietidiel, budú získané spoľahlivé údaje, ale nebude nič obchodovať.

Nakoniec, k múdremu úžasu začiatočníkov, výskumník môže uprednostniť zvolenú metódu Cenage, ktorá sa usiluje o presnosť výsledkov. CUPISES vyžadujú zapojenie veľkých zamestnancov zamestnancov, ktorý sa zameriava na zvýšenie pravdepodobnosti vzniku systematického (nesúvisiaceho so vzorkou) chýb. Táto okolnosť je jedným z dôvodov, prečo americký sčítací kancelária používa selektívne pozorovania na overenie presnosti rôznych sčítaní. Nepočuli ste: Selektívne štúdie sa môžu vykonávať, aby sa overila presnosť hodnôt údajov.

Výberové konštrukčné fázy

Na obr. 15.1 znázorňuje sekvenciu pozostávajúcu zo šiestich krokov, ktoré môže výskumný pracovník zapojený do kompilácie odberu vzoriek dodržiavať. V prvom rade je potrebné určiť cieľový súbor alebo súbor prvkov, ktoré chce výskumník niečo vedieť.

Napríklad pri štúdiu preferencií pre deti si výskumníci musia rozhodnúť, či skúmaná populácia bude pozostávať len z detí, len od rodičov alebo od tých a iných.

Celkom (populácia)
Mnohé prvky, ktoré spĺňajú niektoré špecifikované podmienky.
Základňa (základňa) odber vzoriek
Zoznam položiek, z ktorých sa vzorka bude vykonať; Môže sa skladať z územných celkov, organizácií, jednotlivcov a iných prvkov.

Určitá spoločnosť testovala iba elektrické "preteky" len na deti. Viedli deti v plnej výške. Rodičia reagovali na novú hodnotu inak. Mama sa nepáčila, že príťažlivosť neučí deti do starostlivého postoja k strojom a otec nevyhovoval tomu, čo bol výrobok vyrobený ako hračka.
Je možná reverzná situácia. Určitá firma začala vyrábať nový potravinársky výrobok a nasadená celoštátnou reklamnou kampaňou, v ktorej hlavná úloha bola pridelená v rokoch do rozvinutého dieťaťa. Firma skontrolovala účinnosť reklám len na matkach, ktoré sa roztopili z radosti. Deti sa toto "urýchľovalo" a spolu s ním s ním inzerovaný produkt, škaredý. Produkt sa skončil 1.

Výskumník musí určiť od tých, z ktorých zodpovedajúca súbor bude: od jednotlivcov, rodín, firiem, iných organizácií, operácií s kreditnými kartami atď. Prijatím takýchto riešení je potrebné určiť prvky, ktoré by mali byť vylúčené z populácie. Musí sa vykonať dočasná aj geografická väzba prvkov, ktoré môžu byť v niektorých prípadoch ovplyvnené dodatočné podmienky alebo obmedzenia. Napríklad, ak hovoríme o jednotlivcoch, požadovaná populácia môže pozostávať len z osôb starších ako 18 rokov alebo len ženy, alebo len jednotlivcov so vzdelaním nie je nižší ako priemer.

Úlohou určovania geografických hraníc pre cieľovú populáciu s medzinárodným marketingovým výskumom môže predstavovať osobitný problém, pretože zvyšuje heterogénnosť posudzovaného systému. Povedzme, že relatívny pomer mestských a vidieckych oblastí sa môže značne líšiť od krajiny do krajiny. Územný aspekt má vážny vplyv na zloženie obyvateľstva av rámci tej istej krajiny. Napríklad na severe v Čile je indická populácia kompaktne spočívať v južných regiónoch krajiny, sú prevažne potomkov Európanov.

Pokrytie (incident)
Percento prvkov obyvateľstva alebo skupiny, ktoré spĺňajú podmienky zahrnutia do vzorky.

Všeobecne povedané, je určená jednoduchšia cieľová populácia, tým vyššie je jeho pokrytie (incident) a jednoduchšie a lacnejšie postup na tvorbu vzorky. Pokrytie (incident) Zodpovedá percentuálnym podielom prvkov populácie alebo skupiny, ktorá spĺňa podmienky zahrnutia do vzorky. Pokrytie priamo ovplyvňuje dočasné a materiálne náklady potrebné na prieskum. Ak je pokrytie veľké (t.j. väčšina prvkov obyvateľstva spĺňa jedno alebo viac jednoduchých kritérií používaných na identifikáciu potenciálnych respondentov), \u200b\u200bdočasné a materiálne náklady potrebné na zhromažďovanie údajov sú minimalizované. Naopak, s nárastom počtu kritérií, ktoré by mali byť spokojní potenciálni respondenti, a významné a dočasné náklady na náklady.

Na obr. 15.2 ukazuje podiel dospelej populácie zapojenej do tých alebo iných športov. Výkresové údaje naznačujú, že testovali ľudí, ktorí sa zaoberajú motocyklovými športmi (len 3,6% z celkových dospelých), oveľa zložitejšie a réžia, ako skúmať ľudí, ktorí robia pravidelné wellness prechádzky (27,4% z celkového počtu dospelých). Hlavnou vecou je, že výskumník je presný pri určovaní, ktoré prvky by mali byť zahrnuté do skúmanej celistvosti a ktoré prvky by mali byť vylúčené z neho. Jasné nastavenie účelu štúdie výrazne uľahčuje riešenie tejto úlohy. Druhým štátom procesu odberu vzoriek je určiť jeho základ, ktorý, ako už viete, je zoznam prvkov, z ktorých sa vzorka bude vykonať. Nech je cieľovým súborom nejakého výskumu všetky rodiny žijúce v oblasti Dallas. Na prvý pohľad môže byť dobrá a ľahko prístupná základňa vzorky telefónny zoznam Dallasu. Avšak, s viac pozorným preskúmaním, stáva sa zrejmé, že zoznam rodín obsiahnutých v adresári nie je celkom správny, pretože počet niektorých rodín je v ňom vynechané (samozrejme, nezahŕňa rodiny, ktoré nemajú telefón ) Niektoré rodiny majú niekoľko telefónnych čísel. Osoby, ktoré nedávno zmenili miesto bydliska a podľa toho počet vášho telefónu nie je tiež prítomný v adresári.

Skúsení výskumníci dospeli k záveru, že presný súlad medzi základom vzorky a cieľovým súborom záujmu je pozorovaný veľmi zriedka. Jedným z najkreatívnejších štádií práce vo vývoji vzorky je definícia vhodnej vzorky základne v prípadoch, keď zostavenie zoznamu prvkov agregátu spôsobuje ťažkosti. To môže vyžadovať, aby sa vzorka vytvárajúca z pracovných jednotiek a predpony, keď je napríklad metóda náhodného nastavenia používaná z dôvodu nedostatkov telefónnych referenčných kníh. Významný nárast pracovných blokov za posledných 10 rokov však túto úlohu zložil. Takéto situácie sa môžu vyskytnúť vo vzorke pozorovanie územných zón alebo organizácií, po ktorých nasleduje podložie, keď povedzme, že cieľová populácia sú jednotlivci, ale neexistuje žiadny presný aktuálny zoznam.

Zdroj: Na základe údajov obsiahnutých v "SSI Lite. TM: L.incidencia T.argetovaný. S.zARIADENIE "(Fairfield, Conn .: Prieskum Odber vzoriek, Inc., 1994).

Tretia fáza postupu odberu vzoriek úzko súvisí s definíciou základne vzorky. Voľba metódy alebo postupu zostavovania vzorky vo veľkej miere závisí od výskumníka vzorky základne. Rôzne typy vzoriek vyžadujú rôzne typy odberu vzoriek. Toto a ďalšia kapitola bude obsahovať prehľad hlavných typov vzoriek používaných v marketingovom výskume. Keď sú opísané, základom vzorky a spôsob jeho tvorby by mal byť zrejmý.

Štvrtým štádiu procesu odberu vzoriek je určiť veľkosť vzorky. Tento problém sa diskutuje v CH. 17. V piatej etape výskumný pracovník potrebuje skutočne vybrať prvky, ktoré budú podrobené prieskumu. Metóda použitá na to je určená zvoleným typom odberu vzoriek; Pri diskusii o metódach vzoriek budeme hovoriť o výbere jej prvkov. Nakoniec, výskumník potrebuje skutočne preskúmať pridelených respondentov. V tomto štádiu existuje vysoká pravdepodobnosť spáchania viacerých chýb.
Tieto problémy a niektoré metódy ich povolenia sa považujú v CH. osemnásť.

Typy plánov odberu vzoriek (selektívna kontrola)

Všetky metódy kontroly vzoriek možno rozdeliť do dvoch kategórií: pozorovanie pravdepodobnostných vzoriek a monitorovanie deterministických vzoriek. V pravdepodobnostnej vzorke môže byť každý člen agregátu zahrnutý s určitou nenulovou pravdepodobnosťou. Pravdepodobnosť zaradenia do výberu niektorých členov agregátu môže byť odlišná, ale pravdepodobnosť zahrnutia do každého prvku je známa. Táto pravdepodobnosť je určená špeciálnym mechanickým postupom používaným na výber prvkov vzorky.

Pre deterministické vzorky sa vyhodnotí pravdepodobnosť začlenenia akéhokoľvek prvku vo vzorke nemožné. Nie je možné zaručiť reprezentatívnosť takejto vzorky. Napríklad, Allstate Corporation Vyvinul systém s cieľom spracovať údaje o prezentácii nárokov na odškodnenie poistenia 14 miliónov domácností (jej zákazníkov). Spoločnosť plánuje použiť tieto údaje na určenie vzorov dopytu po jej službách - napríklad pravdepodobnosti, že vlastníctvo domácnosti "Mersedes Benz" bude mať aj rekreačný dom (ktorý bude vyžadovať poistenie). Napriek tomu, že databáza je veľmi veľká, spoločnosť nemá prostriedky na posúdenie pravdepodobnosti, že každý konkrétny klient bude vyžadovať požiadavku. Spoločnosť preto nemôže byť presvedčená, že údaje o klientoch, ktoré robia požiadavky, zástupcu vo vzťahu ku všetkým klientom spoločnosti; A v menšej miere - vo vzťahu k potenciálnym zákazníkom.

Všetky deterministické vzorky sú založené skôr na súkromnej pozícii, úsudku alebo preferencii výskumníka, a nie na mechanickom postupe na výber prvkov vzorky. Takéto preferencie niekedy môžu poskytnúť dobré odhady charakteristík stanovenej, avšak spôsob objektívneho stanovenia súladu vzorky neexistuje. Posúdenie presnosti výsledkov vzorky možno vykonať len vtedy, ak boli známe pravdepodobnosti výberu určitých prvkov. Z tohto dôvodu je práca s pravdepodobnostnou vzorkou zvyčajne považovaná za pokročilejšiu metódu, ktorá vám umožní odhadnúť hodnotu chyby pozorovania vzorky. Vzorky môžu byť tiež rozdelené na výber pevného objemu a sériových vzoriek. Pri práci s vzorkami pevného objemu sa veľkosť vzorky určí pred začiatkom prieskumu a analýza všetkých potrebných údajov predchádza analýzou výsledkov. Zaujímame sa o hlavnú vzorku pevného objemu, pretože tento typ sa zvyčajne používa v marketingovom výskume.

Pravdepodobnostná vzorka
Vzorka, v ktorej môže byť každý prvok agregátu zahrnutý s určitou známej nenulovú pravdepodobnosť.
Deterministická vzorka
Vzorka založená na niektorých konkrétnych preferenciách alebo rozsudkoch, ktoré určujú výber určitých prvkov; V tomto prípade sa pravdepodobnosť zahrnutia do vzorky ľubovoľného prvku agregátu stane nemožným.

Nemali by sme však zabudnúť, že existujú aj konzistentné vzorky, ktoré môžu byť použité s každou zo základných vzorových výskumných plánov diskutovaných nižšie.

V konzistentnej vzorke je počet vybraných položiek neznámy vopred, je určený na základe série po sebe nasledujúcich riešení. Ak malý prieskum vzoriek nevedie k spoľahlivému výsledku, kruh vyšetrených prvkov sa rozširuje. Ak je výsledok nejednoznačný a potom sa veľkosť vzorky znova zvyšuje. V každej fáze sa rozhodnutie zváži, či získaný výsledok je dostatočne presvedčený alebo pokračuje v zhromažďovaní údajov. Práca s konzistentnou vzorkou umožňuje zhodnotiť trend (zmena trendu) údajov, ktoré zbierajú, čo znižuje náklady spojené s dodatočnými pripomienkami, v prípadoch, keď ich uskutočniteľnosť prichádza.

Pravdepodobný a deterministický volebný plán sú rozdelené do radu typov. Poďme, deterministické vzorky môžu byť nereprezentatívne (pohodlné), úmyselné alebo citované vzorky pravdepodobnosti sú rozdelené na jednoduchú náhodnú, stratifikovanú alebo skupinu (klastra), môžu byť zase rozdelené na podtypy. Na obr. 15.3 Zobrazuje tie typy vzoriek, ktoré budú diskutované v tomto a v ďalších kapitolách.

Pevné vzorkovanie (pevné odber vzoriek)
Vzorka, ktorá určuje veľkosť, ktorá je priori; Potrebné informácie sú určené vybranými položkami.
Sériová vzorka
Vzorka vytvorená na základe série po sebe nasledujúcich riešení. Ak po zvážení malej vzorky je výsledok nejednoznačný, zvažuje sa vzorka väčšieho objemu; Ak tento krok nevedie k výsledku, veľkosť vzorky sa opäť zvyšuje, atď. V každom štádiu sa tak rozhodne, že je možné zvážiť výsledný výsledok skôr presvedčivé.

Treba pripomenúť, že hlavné typy vzoriek môžu byť kombinované, tvoriť komplexnejšie výberu pozorovacích plánov. Ak strávite svoje hlavné typy zdrojov, bude vám ľahšie riešiť zložitejšie kombinácie.

Deterministické vzorky

Ako už bolo uvedené, pri výbere prvkov deterministickej vzorky, súkromné \u200b\u200bodhady alebo riešenia zohrávajú rozhodujúcu úlohu. Niekedy tieto odhady vychádzajú z výskumníka, v niektorých prípadoch je výber prvkov agregátu venovať personálu v teréne. Vzhľadom k tomu, prvky nie sú vybrané mechanicky, stanovenie pravdepodobnosti zahrnutia do vzorky ľubovoľného prvku, a preto sa chyby pozorovania vzorky stáva nemožné. Nedostatok chýb spôsobených zvoleným postupom vzorovej skúšky neumožňuje výskumníkom odhadnúť ich presnosť ich odhadov.

Nerezident (pohodlné) vzorky

Nerezident (pohodlné) vzorky Niekedy sa nazývajú náhodne, pretože výber vzorových prvkov sa vykonáva "náhodným" spôsobom - tie prvky, ktoré sú alebo sú predložené na najprístupnejšej počas výberu.

Náš každodenný život je vyplnený príkladmi takýchto vzoriek. Hovoríme s kamarátmi a na základe ich reakcie a pozícií vyvodzujeme závery týkajúce sa politických závislostí v spoločnosti; Miestna rozhlasová stanica volá ľudí, aby vyjadrili svoj postoj k určitej kontroverznej otázke, stanovisko, ktoré vyjadrila, sa vykladá ako prevláda; Vyzývame spoluprácu dobrovoľníkov a pracujeme s tými, ktorí sú povolaní, aby nám pomohli. Problém pohodlných vzoriek je zrejmý - nemôžeme si byť istí, že vzorka tohto druhu naozaj predstavuje cieľovú sadu. V skutočnosti, že stanovisko našich kamarátov správne odráža politické názory prevládajúce v spoločnosti, sme stále schopní pochybovať, ale často chceme veriť, že vzorky väčšieho objemu, vybrané rovnakým spôsobom, reprezentantom. Ukážte omylu takýchto predpokladov na príklade.
Pred niekoľkými rokmi, jedna z miestnych televíznych staníc mesta, v ktorej autor tejto knihy žije, vykonal dennú verejnú prieskumu o témach záujmov miestnej komunity. Ankety, ktoré niesli meno "Madison Pulse", boli vykonané nasledovne. Každý večer počas šesťhranných správ, stanica sa objavila divákom s otázkami týkajúcimi sa určitého sporného problému, na ktorý bolo potrebné poskytnúť pozitívnu alebo negatívnu odpoveď.

V prípade pozitívnej reakcie bolo potrebné volať jeden po druhom, v prípade negatívnej reakcie - na iné telefónne číslo. Počet hlasov "pre" a "proti" bol vypočítaný automaticky. V desaťhodinovej správe boli hlásené výsledky telefonického prieskumu. Každý večer sa štúdio zaradilo od 500 do 1000 ľudí, ktorí chceli vyjadriť svoju pozíciu na to alebo v tejto veci; Televízny komentátor interpretoval výsledky prieskumu ako dominantného stanoviska v spoločnosti.

Non-internee (pohodlná) vzorka
Niekedy sa nazýva náhodne, pretože výber vzorových prvkov sa vykonáva "náhodným" spôsobom - sú vybrané tie prvky, ktoré sú alebo sú predložené na najprístupnejšie počas výberového obdobia.

V jednom zo šesťhodinových otázok, publikum bol navrhnutý nasledujúcu otázku: "Nevyžiadali ste vlastnosti súvisiace s vekom pre pitie alkoholu v Madisone na 18 rokov?" Existujúca právna kvalifikácia zodpovedala 21. \\ T Diváci reagovala na túto otázku s mimoriadnou činnosťou, "takmer 4000 ľudí vyzval do štúdia, z toho 78% vystúpilo s poklesom vekových centier. Zdá sa, že vzorka 4000 ľudí "musí byť reprezentatívna" pre Spoločenstvo pozostávajúcej z 180 000. Ako už ste pravdepodobne uhádli, určitá veková skupina obyvateľstva sa zaujímala o dobre známy výsledok hlasovania oveľa viac ako iné. V súlade s tým nebolo nič prekvapujúce, že pri diskusii o tejto otázke, ktorá sa konala o niekoľko týždňov neskôr, sa ukázalo, že počas obnoveného prieskumu sa študenti konali koordinovať. Nazývali televíziu zase a niekoľkokrát. Tak, ani veľkosť vzorky, ani percento zákonov liberalizácie zákona, sa teda objavili niečomu úžasné. Vzorka bola nerepresentačná.

Jednoduché zvýšenie odberu vzoriek neznamená reprezentatívne. Reprezentatívnosť vzorky nie je zabezpečená objemom, ale vhodným postupom pre výber prvkov. Keď sa účastníci prieskumu určujú dobrovoľne alebo prvky vzorky sú vybrané z dôvodu ich dostupnosti, plán kontroly vzoriek nezaručuje jeho reprezentatívnosť. Empirické dôkazy naznačujú, že vzorky, ktorých tvorba bola určená ohľadom na pohodlie, zriedka sa ukázali ako reprezentatívne (bez ohľadu na ich veľkosť). Telefónne prieskumy, podľa ktorého sa zvažujú hlasy 800-900, sú najbežnejšou formou veľkých, ale nezrezateľných vzoriek.

Úmyselná vzorka
Deterministická (cielená) vzorka, ktorej prvky sú manuálne vybrané; Sú to tie prvky, ktoré sú vybrané podľa výskumníka, splniť účel prieskumu.
Úmyselnú vzorku, v závislosti od schopnosti výskumníka stanoviť počiatočný súbor respondentov, ktorí majú potrebné vlastnosti; Potom sa títo respondenti používajú ako informátori, ktorí určujú ďalší výber jednotlivcov.

Bohužiaľ, mnohí ľudia sa týkajú výsledkov takýchto prieskumov s dôverou. Jedným z najviac charakteristických príkladov použitia neviazaných vzoriek v medzinárodnom marketingovom výskume je prieskum niektorých krajín založených na vzorke, pozostávajúcej z cudzincov žijúcich v krajine v krajine, ktorý iniciuje prieskum (napríklad škandinácie žijúce v Spojenom kráľovstve Štáty). Hoci takéto vzorky môžu vyliať nejaké svetlo na určité aspekty posudzovaného obyvateľstva, je potrebné pripomenúť, že títo jedinci zvyčajne predstavujú "amerizmu" elitu, ktorej vzťah s vlastnou krajinou môže byť dostatočne podmienený. Neodporúča sa používať neviazané vzorky počas opisných alebo kauzálnych skúšok. Sú prípustné len pri hľadaní štúdií, ktoré sú schopné vypracovať určité myšlienky alebo reprezentácie, ale aj v tomto prípade je vhodnejšie použiť úmyselné vzorky.

Úmyselné vzorky

Úmyselné vzorky sa niekedy označujú Nepozorný; \\ T Ich prvky, ktoré podľa výskumného pracovníka spĺňajú ciele štúdie, sú vybrané manuálne. Procter & Gamble.použil túto metódu, keď preukázala reklamu osobám vo veku 13 až 17 rokov, žije v blízkosti jej centrálneho centrála v Cincinnati. Rozdelenie spoločnosti na potravinárskych výrobkoch a nápojoch si najala túto skupinu adolescentov tak, aby slúži ako druh vzorky od spotrebiteľov. Práca o 10. hodine Týždeň výmenou za $ 1000 a výlet na koncert, sa pozreli cez televízne reklamy, navštívili spolu s manažérmi supermarketov, aby skontrolovali expozície tovaru, testovaných nových produktov, diskutovaných nákupných správanie. Výberom zástupcov pre vzorku prostredníctvom procesu "prenájom", a nie náhodou, spoločnosť by sa mohla zamerať na znaky, ktoré považovala za užitočnú - napríklad na schopnosť teenager, je jasné, že vyjadriť svoje myšlienky, Riziko, že ich názory nemusia byť reprezentatívne vo vzťahu k ich vekovej skupine.

Ako je uvedené, rozlišovacím znakom zámernej vzorky je smerový výber jeho prvkov. V niektorých prípadoch nie sú prvky vzorky oddelené svojou reprezentatívnosťou, ale vzhľadom na skutočnosť, že môžu poskytnúť výskumníkom vo svojich informáciách. Keď sa Súdny dvor riadi svedectvom odborných znalostí, v zmysle sa stredísk k používaniu úmyselnej vzorky. Podobná pozícia môže tiež prevládať pri vývoji výskumných projektov. V primárnej štúdii otázky sa výskumný pracovník najprv zaujíma pri definovaní vyhliadok na štúdiu, ktorá spôsobuje výber prvkov vzorky.

Odber vzoriek metódy "Snow Coma" Je to jeden z typov úmyselnej vzorky používanej pri práci so špeciálnymi typmi populácií. Táto vzorka závisí od rozsahu pôsobnosti výskumníka, ktorý stanoví počiatočný súbor respondentov s potrebnými charakteristikami. Potom sa títo respondenti používajú ako informátori, ktorí určujú ďalší výber jednotlivcov.

Predstavte si napríklad, že spoločnosť chce posúdiť potrebu určitého produktu, ktorý by umožnil nepočujúcich ľuďom komunikovať telefonicky. Výskumníci môžu začať rozvoj tohto problému s identifikáciou kľúčových údajov v nepočujúcich komunite; Ten by mohol nazvať mená iných členov tejto skupiny, ktoré by sa dohodli, že sa zúčastnia na preskúmaní. Vzorka s takýmito taktikami rastie ako zasnežená.

Pokiaľ je výskumník v počiatočných štádiách problému práce, keď sú určené vyhliadky a možné obmedzenia plánovaného prieskumu, použitie úmyselnej vzorky môže byť veľmi účinná. Ale v žiadnom prípade nemôže zabudnúť na slabé strany vzorky tohto typu, pretože to môže používať aj výskumník a opisné alebo počas kauzálnych štúdií, ktoré sa nespomínajú, aby ovplyvnili kvalitu ich výsledkov. Klasická vzorka podobná zábudlivosť - cenový index pre spotrebný tovar ("CPI"). Ako ukazuje Zyudman ( Sudman.): "CPI je určená iba 56 miest a metropolitnými rozsahmi, určitý vplyv na výber, ktorý má tiež politický faktor. V skutočnosti tieto môžu reprezentovať tieto, okrem toho, že samotná vec je, zatiaľ čo index sa nazýva index cien pre spotrebný tovar pre občanov, ktorí dostávajú hodinový plat*, I. sluha A zdá sa, že väčšina ľudí index odráža cenovú úroveň v akejkoľvek oblasti Spojených štátov. Výber retailových zásuviek sa uskutočňuje aj náhodným spôsobom, v dôsledku toho vyhodnotenie možnej chyby odberu vzoriek sa stane nemožným"(Kurzíva naše) 2.

* To znamená, že pracovníci. - Poznámka. za.

Quad vzorky

Tretí typ zisteného odberu vzoriek - quad vzorky; \\ T Jeho známa reprezentatívnosť sa dosahuje zahrnutím do nej ako v skúmanej populácii, podiel prvkov s určitými charakteristikami (pozri "Výskumné okno 15.1"). Ako príklad môžete považovať za pokus o vytvorenie reprezentatívnej vzorky študentov žijúcich na univerzite. Ak dôjde k jediným vyšším personálom v určitej vzorke pozostávajúcej z 500 jednotlivcov, budeme mať nárok na pochybnosť o jej reprezentatívnosti av legitimite používania výsledkov získaných na tejto vzorke na opýtané zhody. Pri práci s proporcionálnou vzorkou sa výskumný pracovník môže uistiť, že podiel vysokoškolákov vo vzorke zodpovedá ich podielu na celkovom počte študentov.

Predpokladajme, že výskumník vykonáva selektívnu štúdiu študentov vysokých škôl, zatiaľ čo má záujem o vzorku odráža nielen ich príslušnosť do konkrétnej podlahy, ale aj ich distribúciu ich kurzov. Nech je celkový počet študentov 10 000: 3200 - Prvý rok študentov, 2600 - Druhá ručne, 2200 - Študenti tretích kurzov a 2000 - Štvrtý študenti kurzu; Z týchto 7 000 chlapcov a 3000 dievčat. Pre vzorku 1000 ľudí, proporcionálny plán selektívneho riadenia vyžaduje 320 študentov s celými rokmi, 260 sekúnd-ručne, 220 absolventov, 700 chlapcov a 300 dievčat. Výskumný pracovník môže implementovať tento plán, ktorý dostane každý anketár určitou kvótou, ktorá určí, čo by študenti mali kontaktovať.

VzorkaDeterministická vzorka, vybraná takým spôsobom, že podiel vzorkovacích prvkov s určitými vlastnosťami približne zodpovedá podielu rovnakých prvkov v skúmanej populácii; Každý pracovník poľa dostane kvótu definujúcu vlastnosti obyvateľstva, s ktorým by sa mal kontaktovať.

Interviewer drží 20 rozhovorov, môže byť poskytnutý pokyny na anketu:

            • Šesť prváci - päť mladých mužov a jedného dievčaťa;
            • Šesť sophomores - štyria chlapci a dve dievčatá;
            • Štyri študenti tretích rokov - traja chlapci a jedna dievčina;
            • Štyri študenti štvrtého kurzu - dvaja chlapci a dve dievčatá.

Všimnite si, že výber špecifických prvkov odberu vzoriek nie je určený v pláne výskumu, ale výber anketára určeného na dodržiavanie iba týchto podmienok, ktoré boli stanovené kvótou: na vypočúvanie piatich prvých dovoleniek, jeden originál a tak ďalej.

Všimnite si tiež, že táto kvóta presne zobrazuje sexuálnu distribúciu študentskej populácie, ale trochu narúša distribúciu študentov kurzov; 70% (14 z 20) rozhovorov spadá na podiel mladých mužov, ale len 30% (6 z 20) na podiel prvák, zatiaľ čo tvoria 32% z celkového počtu študentov. Kvóta pridelená každému konkrétnemu anketáru nemusí odrážať a zvyčajne odrážať distribúciu kontrolných charakteristík v populácii - iba konečná vzorka by mala byť príslušná proporcionalita.

Treba pripomenúť, že proporcionálne vzorky závisia viac od osobných, subjektívnych pozícií alebo rozsudkov ako z objektívneho postupu na výber prvkov vzorky. Okrem toho, na rozdiel od úmyselnej vzorky, osobný úsudok nepatrí k vývojárovi projektu, ale anketár. Vzniká otázka, či môžu byť proporcionálne vzorky považované za reprezentatívne, nech sú reprodukovať inherentnú populáciu pomer komponentov s tými alebo inými kontrolnými charakteristikami. V tomto ohľade musia byť uvedené tri pripomienky.

Po prvé, vzorka sa môže líšiť od populácie pre niektoré ďalšie dôležité charakteristiky, ktoré môžu mať vážny vplyv na výsledok. Poďme povedzme, či bude štúdia venovaná problému rasových predsudkov hasení v študentskom prostredí, môže nie je ľahostajná k okolnostiam, odkiaľ pochádzajú respondenti: z mesta alebo z vidieka. Vzhľadom k tomu, kvóta pre charakteristiky "odchodu z mesta / obce" neboli merané, presné mapovanie tejto charakteristiky sa stane nepravdepodobné. Samozrejme, existuje taká alternatíva: určiť kvóty pre všetky potenciálne významné charakteristiky. Zvýšenie počtu kontrolných charakteristík však vedie k komplikácii špecifikácie. To zase sťažuje - a niekedy to znemožňuje - výber prvkov vzorky a v každom prípade vedie k jej vzostupu. Ak je napríklad pre štúdiu významná, že patrí k mestskej alebo vidiecke obyvateľstvo a sociálno-ekonomickému postaveniu, anketár môže byť v hľadaní prváka, ktorý by bol obyvateľom mesta a patril k najvyššej alebo na strednej triedy. Correclag, ktorý nájde len mužského prváka prváka, kde je ľahšie.

Po druhé, uistite sa, že táto vzorka je naozaj reprezentatívna, veľmi ťažké. Samozrejme, môžete skontrolovať vzorku na dodržiavanie distribúcie charakteristík, ktoré nie sú medzi kontrolami, ich distribúcia v populácii. Takáto kontrola však môže viesť k negatívnym záverom. Je možné identifikovať nesúlad medzi distribúciami. Ak je distribúcia odberu vzoriek a populácie pre každú z týchto charakteristík a navzájom opakujú, existuje možnosť, že vzorka sa líši od populácie podľa niektorých iných, nie je špecifikovaná explicitne.

A nakoniec, po tretie. Anketári, ktorí sa im udelili, majú tendenciu k určitým činom. Sú príliš často sa uchýlili k anketu svojich kamarátov. Pretože sa často ukázali byť podobné samotným anketárom, hrozí nebezpečenstvo chyby. Skúsené údaje získané v Anglicku naznačujú, že vzorky kvót majú tendenciu:

  1. preháňanie úlohy najprístupnejších prvkov;
  2. najmenšia úloha malých rodín;
  3. preháňanie rodín s deťmi;
  4. podhodnotenie úlohy pracovníkov zamestnaných v priemyselnej výrobe;
  5. najmenšia úloha osôb s najvyšším a najnižším príjmom;
  6. podhodnotenie úlohy nedostatočne vzdelaných občanov;
  7. najmenšia úloha osôb, ktoré zaberajú nízku sociálnu situáciu.
Anketári, ktorí si zvolia požiadané kvóty, zastavenie náhodných okoloidúcich, s najväčšou pravdepodobnosťou sústreďte svoju pozornosť v oblastiach s veľkým počtom potenciálnych respondentov, ako sú nákupné centrá, železničné stanice a letiská, vstupy do veľkých vesmírov a podobne. Táto prax vedie k opodstatneniu tých skupín osôb, ktoré najčastejšie navštevujú také miesta. V prípade potreby sa domáce návštevy anketárov často poukazujú na to, aby boli poháňané ohľadom na pohodlie.
Napríklad môžu viesť prieskumy len počas dňa, čo vedie k podcenenia názorov tých, ktorí pracujú. Okrem iného, \u200b\u200bnemajú vstúpiť do riediacich domov a spravidla nebudú stúpať na horné poschodia budov, ktoré nemajú výťahy.

V závislosti od špecifík podľa študijného problému môžu tieto trendy viesť k rôznym typom chýb, ich korekcia v štádiu analýzy údajov je prezentovaná veľmi a veľmi ťažké. Na druhej strane, s objektívnym výberom prvkov vzorky, výskumníci sú k dispozícii určité prostriedky, ktoré zjednodušujú postup posudzovania reprezentatívnosti tejto vzorky. Pri analýze problému reprezentatívnosti takýchto vzoriek sa výskumník domnieva, že nie je toľko zloženia vzorky, ako postup na výber svojich prvkov.

Výskumné okno: brilantne! Ale kto to bude čítať?

Inzerenti každý rok strávijú milióny dolárov do reklamy umiestnených na stránkach nespočetných publikácií - z reklamného veku do Yankee. Určité posúdenie textu a obraz je možné vykonať pred zverejnením, ktorý sa nazýva doma, v reklamnej agentúre; Originálne kontroly a hodnotenie sa vyskytujú len po vydaní reklamy, obklopené tuctami ako dobre vyškolenými reklamami bojujúcimi za pozornosť čitateľa.

Spoločnosť Roper Star na celom svete. Vyhodnocuje čitateľnosť reklám umiestnených v spotrebiteľských, obchodných, sektorových a profesionálnych časopisoch a novinách. Výsledky prieskumu sú upozornení inzerentov a agentúr - samozrejme pre príslušný poplatok. Pretože inzerenti sú každý deň všetko hrob, sa snaží sprostredkovať svoju reklamu na spotrebiteľa, spoločnosti Škrob. Rozhodol som sa urobiť vzorku, ktorá by poskytovala účastníkom včas a presné informácie o efektívnosti reklamy. Každý rok spoločnosť Škrob. Oznámil som viac ako 50 000 ľudí, vzhľadom na 20 000 reklám. Každoročne sa študovalo približne 500 jednotlivých publikácií.

Škrob používal proporcionálnu vzorku, ktorý minimálny počet bol 100 čitateľov jednej a 100 čitateľov druhého pohlavia. Škrob dospel k záveru, že s takýmito veľkosťou vzorky sú stabilizované hlavné odchýlky na úrovni čitateľnosti. Čitatelia starší ako 18 rokov boli rozptyľovaní osobne, zatiaľ čo bolo o všetkých publikáciách, s výnimkou tých, ktoré boli určené pre špeciálne skupiny obyvateľstva (povedzme, dievčatá relevantného veku boli vypočutí, aby vyhodnotili publikácie časopisu "sedemnásť").

Pri vykonávaní prieskumov sa zohľadnila zóna distribúcie jednej alebo inej zverejnenia. Povedzme, že pri štúdiu časopisu "Los Angeles", čitatelia žijúci v južnej Kalifornii. "Čas" bol študovaný po celej krajine. Prieskum bol venovaný jednotlivým číslam časopisu a bol vykonaný v 20-30 mestách súčasne.

Každý ITERVYER bol stanovený ako malá kvóta rozhovoru, ktorá bola cieľom minimalizácie odmietnutia výsledkov prieskumu. Ankety sa rozdelili medzi ľuďmi rôznych špecialít a vekových kategórií s rôznymi príjmami. Každá podobná štúdia umožnila prezentovať pozície pomerne širokého publika čitateľa. Pri posudzovaní viacerých profesionálnych, obchodných a sektorových publikácií boli zohľadnené aj špecifiká ich predplatného a distribúcie. Listy predplatného venované vydaniami, ktoré majú dostatok úzkej distribúcie, ktoré majú možnosť vybrať prijateľných respondentov.

S každým prieskumom sa ITERVYERS požiadali o respondentov, aby si vzali publikáciu a požiadali, či boli nakreslené na akékoľvek oznámenie. Ak bola odpoveď kladná, registrátor požiadal o niekoľko otázok na posúdenie stupňa vnímania reklamy.

Toto hodnotenie by mohlo byť Trojaka:

  • Pozor: Tí, ktorí už venovali pozornosť na samotnú skutočnosť vzhľadu takejto reklamy.
  • Zoznámil som sa: Pamätám si akúkoľvek časť reklamy, v ktorej bola o inzerovanej ochrannej známke alebo inzerentovi.
  • Prečítajte si: Osoby, ktoré čítajú reklamu aspoň polovicu polovice.

Po preskúmaní všetkých reklám, anketári zaznamenali hlavné informácie o klasifikácii: pohlavie, vek, triedy, rodinný stav, národnosť, príjmy, veľkosť a zloženie rodiny, ktoré umožnili prekročiť stupeň záujmu čitateľa.

So vhodným využívaním týchto spoločností Škrob. Umožniť inzerentom a agentúram určiť neúspešné a úspešné, priťahovanie a držanie pozornosti typov rekreačných systémov čitateľov. Informácie o tomto druhu sú mimoriadne cenné pre inzerentov, ktorí majú záujem predovšetkým v účinnosti reklamnej kampane.

Zdroj: "Roper Starch Worldwide", Mamaronek, NY 10543.

Pravdepodobnostné vzorky

Výskumný pracovník môže určiť pravdepodobnosť zaradenia do pravdepodobnostnej vzorky akéhokoľvek prvku populácie, pretože výber jej prvkov sa vykonáva na základe určitého objektívneho procesu a nezávisí od prosperity a preferencií výskumného pracovníka alebo oblasti pracovníka. Vzhľadom k tomu, postup výberu prvkov je objektívny, výskumný pracovník môže odhadnúť presnosť získaných výsledkov, ktorá bola nemožná v prípade deterministických vzoriek, a to však opatrne výber prvkov.

Nemalo by to byť považované za to, že pravdepodobnostné vzorky sú vždy reprezentatívne ako deterministické. V skutočnosti môže byť reprezentatívnejšia vzorka. Výhodou pravdepodobnostných vzoriek je, že vám umožnia odhadnúť možnú chybu prieskumu vzoriek. Ak výskumník pracuje s deterministickou vzorkou, nemá objektívnu metódu hodnotenia jeho primeranosti cieľov štúdie.

Jednoduchá náhodná vzorka

Väčšina ľudí sa nejako stretáva s jednoduchými náhodnými vzorkami alebo v rámci štatistického kurzu na inštitúte, alebo čítanie výsledkov relevantného výskumu v novinách alebo časopisoch. V jednoduchej náhodnej vzorke má každý prvok obsiahnutý vo vzorke rovnaký pravdepodobnosť vstupu do štúdií prvkov a akákoľvek kombinácia prvkov zdrojovej populácie sa môže potenciálne stať vzorkou. Napríklad, ak chceme urobiť jednoduchú náhodnú vzorku všetkých študentov uvedených v konkrétnej vysokej škole, stačí, aby sme urobili zoznam všetkých študentov, prideľte ich číslo do nej priezviská a pomocou počítača na výrobu náhodných Výber určeného počtu prvkov.

Všeobecný agregát

Všeobecný agregát
Súbor prvkov, ktoré spĺňajú niektoré špecifikované podmienky; Nazýva sa tiež študovaný (cieľový).
Parameter
Špecifická charakteristika alebo indikátor všeobecného alebo študovaného agregátu.

Alebo študovaný, agregovaný Nazýva sa, ktorej je vybraná kombinácia. Táto sada (populácia) môže byť opísaná radom určitých parametrov, ktoré sú charakteristikou všeobecnej populácie, z ktorých každý je určitý kvantitatívny ukazovateľ, ktorý rozlišuje jednu sadu ďalších.

Predstavte si, že študovaná všeobecná populácia je celá dospelá osoba Cincinnati. Ak chcete opísať túto sadu, možno použiť niekoľko parametrov: priemerný vek, podiel obyvateľstva s vysokoškolským vzdelaním, úroveň príjmu atď. Upozorňujeme, že všetky tieto ukazovatele majú špecifickú pevnú hodnotu. Samozrejme, môžeme ich vypočítať tým, že vykoná úplné sčítanie študovaného agregátu. Zvyčajne sa neopierame na hodnoty, ale na vybranej vzorke a použite hodnotu získanú selektívne monitorovaním na určenie požadovaných nastavení celkovej hodnoty.

Ukazujeme uvedený v tabuľke. 15.1 Príklad hypotetického agregátu pozostávajúceho z 20 ľudí. Práca s malým hypotetickým agregátom podobným tomu má rad výhod. Po prvé, malý odber vzoriek umožňuje ľahko vypočítať nastavenia množiny, ktoré možno použiť na jeho opis. Po druhé, tento objem umožňuje pochopiť, čo sa môže stať pri užívaní jedného alebo iného plánu selektívneho riadenia. Obe tieto vlastnosti robia jednoduché porovnanie výsledkov vzorky s "pravdivým" a v tomto prípade známa hodnota súčtu, ktoré nemožno povedať o typickej situácii, v ktorej je skutočná hodnota súboru neznáma. Porovnanie ratingu s "skutočnou" hodnotou získava v tomto prípade osobitná viditeľnosť.

Predpokladajme, že chceme vyhodnotiť v dvoch šanci na vybrané prvky priemerného príjmu jednotlivcov v pôvodnom sade. Priemerný príjem bude jeho parameter. Na vyhodnotenie tohto priemerného významu nás ako μ, musíme rozdeliť súčet všetkých hodnôt na ich číslo:

Priemerná celková hodnota μ \u003d množstvo bunkových prvkov / počet prvkov.

V našom prípade výpočty dávajú:

Derivátová kombinácia

Derivátová kombinácia Pozostáva zo všetkých možných vzoriek, ktoré môžu byť pridelené zo všeobecnej populácie podľa špecifikovaného plánu selektívneho riadiaceho plánu (plán odberu vzoriek). Štatistika - Toto je charakteristika alebo indikátor, vzorka. Hodnota štatistiky vzorky sa používa na vyhodnotenie určitého nastavenia agregácie. Rôzne vzorky dávajú rôzne štatistiky alebo odhady rovnakého súboru agregátu.

Derivátová kombinácia
Kombinácia všetkých možných odlíšiteľných vzoriek, ktoré môžu byť pridelené od všeobecnej populácie podľa špecifikovaného plánu selektívneho riadiaceho kontrolného riadenia. Funkcia štatistík alebo odber vzoriek.

Zvážte derivát všetkých možných vzoriek, ktoré môžu byť pridelené z nášho hypotetického celkového agregátu pozostávajúceho z 20 jedincov, podľa selektívneho plánu kontroly, ktorý predpokladá, že objem vzorky n \u003d 2. Je možné získať náhodne urazený výber.

Predpokladajme, že čas, ktorý údaje o každej jednotke v našom prípade, tento názov a príjem jednotlivca - sú zaznamenané na kruhoch, po ktorých sa spúšťajú v kanviciach a zmiešajú sa. Výskumník odstraňuje jeden kruh z džbán, váha z neho nenávidí a odloží ho stranou. Robí to isté s druhým kruhom extrahovaným z džbán. Výskumný pracovník potom vráti oboch kruhov v džbán, mieša jeho obsah a opakuje rovnakú sekvenciu činností. V Tab. 15.2 znázorňuje možné výsledky pomenovaného postupu. Pre 20 kruhov je možné 190 takýchto párových kombinácií.

Pre každú kombináciu môžete vypočítať priemerný príjem. Povedzte, pre odber vzoriek Ab (k \u003d 1)

k.-E selektívny priemer \u003d súčet prvkov vzorky / počet prvkov odberu vzoriek \u003d

Na obr. 15.4 Posúdenie priemerného príjmu v celej všeobecnej populácii a veľkosti chyby pri každom hodnotení vzoriek k \u003d 25, 62,108,147a 189 .

Predtým, než sa posúdila so zvážením závislosti medzi selektívnym priemerným príjmom (štatistika) a priemerným príjmom pre agregát (parameter, ktorý si vyžaduje hodnotenie), povedzme pár slov o derivácii agregátu. Po prvé, v praxi sa nezaoberáme kompiláciou týchto druhov agregátu. To by si vyžadovalo príliš veľa času a úsilia. Prax je obmedzená na prípravu iba jednej vzorky požadovaného objemu. Výskumný pracovník používa koncepcia Derivát agregátu a súvisiaci s koncepciou selektívnej distribúcie vo formulácii konečných záverov.

Ako - sa zobrazí neskôr. Po druhé, treba pripomenúť, že derivát agregátu je definovaný ako súbor všetkých možných rôznych vzoriek, ktoré môžu byť pridelené od všeobecnej populácie podľa špecifikovaného plánu kontroly vzoriek. Ak zmeníte akúkoľvek časť plánu selektívneho riadenia, derivát zhody tiež sa mení. Takže, ak pri výbere kruhu sa výskumný pracovník vráti do džbánu najprv odnímateľných diskov pred odstránením druhého, derivát celkovej úpravy bude zahŕňať.

odber vzoriek AA, BB atď. Ak bude objem hlavných vzoriek 3, a nie 2, sa objavia vzorky typu ABC, a to budú 1140, a nie 190, ako to bolo v predchádzajúcom prípade. Pri zmene jednoduchého náhodného výberu na akúkoľvek inú metódu určovania prvkov vzorky sa mení derivátová populácia.

Treba pripomenúť, že výber vzorky daného objemu od všeobecnej populácie je ekvivalentná voľbu jedného prvku (1 z 190) z derivátu populácie. Táto skutočnosť vám umožňuje urobiť veľa štatistických záverov.

Selektívny priemerný a všeobecný priemer

Máme právo vyrovnať selektívne znamenať hodnotu skutočnej priemernej všeobecnej populácie? V každom prípade vychádzame zo skutočnosti, že sú vzájomne prepojené. Veríme však tiež, že bude chyba. Predpokladá sa napríklad, že informácie získané od užívateľov internetu sa výrazne líšia od výsledkov prieskumu "bežnej" populácie. V ostatných prípadoch je možné prevziať pomerne presný zápas, inak by sme nemohli použiť hodnotu vzorky na odhad hodnoty všeobecného. Ale koľko môžeme urobiť chybu?

Poďme pridať všetky vzorkové médium obsiahnuté v tabuľke. 15.2, a rozdelíme sumu, ktorú dostane počet vzoriek, t.j. Priemerný priemer.
Budeme mať nasledujúci výsledok:

Zhoduje sa s priemernou hodnotou všeobecnej populácie. Hovorí sa, že v tomto prípade sa zaoberáme zrozumiteľné štatistiky.

Štatistiky sa nazývajú neuveriteľné, ak sa jeho priemerná hodnota pre všetky možné vzorky ukáže, že sa rovná odhadovanom parametri všeobecnej populácie. Všimnite si, že nie je o určitej súkromnej hodnote.Súkromné \u200b\u200bhodnotenie môže byť dosť ďaleko od skutočnej hodnoty - vezmite si napríklad vzorku AV alebo ST. V niektorých prípadoch môže byť skutočná hodnota všeobecnej populácie nedosiahnuteľná pri zvažovaní akejkoľvek možnej vzorky, nechať štatistiku a bude nestabilná. V našom prípade to nie je takto: niekoľko možných vzoriek - napríklad na - poskytuje selektívny priemer rovnajúcim sa skutočnej priemernej všeobecnej populácii.

Má zmysel zvážiť distribúciu týchto vzorových ratingov, a najmä závislosť medzi týmito zmenami odhadov a variačnými úrovňami príjmov vo všeobecnej populácii. Ako miera variácií sa použije dyspperzia všeobecnej populácie. Na určenie disperzie všeobecného súboru musíme vypočítať odchýlku každej hodnoty z priemernej hodnoty, preklopme štvorce všetkých odchýlok a rozdeliť výslednú sumu počtom komponentov. Označujú a ^ disperzia všeobecnej populácie. Potom:

Disperzia celotstva σ 2 \u003d súčet štvorcov rozdielov každého prvku
Agregát a priemerná celková hodnota / počet prvkov súčtu \u003d

Disperzia stredný Úroveň príjmu môže byť definovaná rovnakým spôsobom. To znamená, že ho môžeme nájsť tým, že definuje odchýlky každého priemeru z ich celkového priemeru, sčítanie štvorcov odchýlok a oddelenie množstva získaného počtom komponentov.

Môžeme definovať disperziu priemernej úrovne príjmov a inak pomocou disperzie hodnôt úrovne príjmov vo všeobecnej populácii, pretože medzi týmito dvoma hodnotami existuje priame spojenie. Ak chcete byť presné, v prípadoch, keď vzorka predstavuje len malú časť všeobecnej populácie, je disperzia priemeru vzorky rovná disperzii všeobecnej populácie rozdelenej na veľkosť vzorky:

kde σ x 2 je disperzia priemernej selektívnej hodnoty úrovne príjmu, σ 2 - disperzia úrovne príjmu vo všeobecnej populácii, \\ t n. - Vzorkovanie.

Teraz porovnajte distribúciu výsledkov s distribúciou kvantitatívnej vlastnosti vo všeobecnej populácii. Obrázok 15.5 ukazuje, že distribúcia kvantitatívneho znaku vo všeobecnej populácii zobrazenej na poli A je viacnásobná (každá z 20 hodnôt sa zobrazí len raz) a symetrické o skutočnej priemernej všeobecnej populácii rovnej 9400.

Distribúcia
Distribúcia hodnôt určitých štatistík vypočítaných pre všetky možné odlíšiteľné vzorky, ktoré môžu byť pridelené zo všeobecnej populácie dátového plánu kontroly vzorky.

Distribúcia odhadov uvedených v poli B je založené na tabuľke údajov. 15.3, ktorý bol zase zostavený pripísaním hodnôt z tabuľky. 15.2 na konkrétnu skupinu, v závislosti od ich rozsahu, po ktorom nasleduje počítanie ich počtu v skupine. Pole B - tradičný histogram, zvážený na samom začiatku štúdia štatistiky, čo predstavuje distribúciaštatistiky. Poznámka: Pojem selektívnej distribúcie je najdôležitejšou koncepciou štatistík, je základným kameňom výstavby štatistických záverov. Podľa známeho selektívneho rozdelenia študovaných štatistík môže byť uzatvorená s príslušným parametrom všeobecnej populácie. Ak len skutočnosť, že selektívne posúdenie zmeny zo vzorky na vzorku, ale charakter tejto zmeny nie je známy, určuje chybu vzorového prieskumu spojeného s týmto hodnotením sa stáva nemožným. Keďže distribúcia vzorky hodnotenia opisuje svoju zmenu zo vzorky vzorky, poskytuje základ pre určenie dôvery vzorky. Z tohto dôvodu je pre štatistickú výkon taký dôležitý.

Podľa známych pravdepodobností zahrnutia do vzorky každého prvku sady môžu anketári nájsť selektívnu distribúciu rôznych štatistík. Výskumníci sú založené na týchto distribúcii - či už ide o selektívny priemer, odber vzoriek, selektívna disperzia alebo niektoré ďalšie štatistiky - pri distribúcii výsledku selektívneho pozorovania na všeobecnej populácii. Všimnite si tiež, že pre vzorky s objemom 2 je distribúcia vzorového média Simer-axiálne a symetrické vzhľadom na skutočný priemer.

Takže sme ukázali, že:

  1. Priemerná hodnota všetkých možných vzorových médií sa rovná všeobecnému priemeru.
  2. Disperzia selektívnych priemerov určitým spôsobom je spojené so všeobecnou disperziou.
  3. Distribúcia vzorového média je podobná, zatiaľ čo distribúcia kvantitatívnych príznakov vo všeobecnej populácii je viacnásobný.

Centrálne limit teorem.

Veta hovorí, že pre jednoduché náhodné vzorky objem n.pridelené od všeobecnej populácie so všeobecným priemerom μ a disperziou σ 2, s veľkým n. Distribúcia selektívneho média X sa približuje k normálu s centrom rovným μ a s disperziou σ 2. Presnosť aproximácie hlavy sa zvyšuje so zvýšením n..

Centrálne limit teorem. Simulačné rozdelenie odhadov možno považovať za prejav centrálneho limitného teorem, ktorý tvrdí, že pre jednoduché náhodné vzorky objem n.pridelené od všeobecnej populácie so skutočným priemerom μ a disperziou σ 2 pre veľké n. Distribúcia vzorového média sa blíži normálne so stredom rovnajúcou sa pravdivým priemerom a disperziou rovnajúcou sa pomeru výčnelku všeobecnej populácie na objem vzorky, to znamená

Približujú sa, že sa stáva presnejšie, ako rastie n.. Zapamätaj si to. Bez ohľadu na typ všeobecného agregátu bude distribúcia vzorového média normálne pre vzorky dostatočne veľké. Čo by malo byť chápané ako dostatočne veľký objem? Ak je distribúcia hodnôt kvantitatívneho znaku všeobecnej populácie normálne, potom bude distribúcia vzorového média pre vzorky normálne. n.\u003d 1. Ak je distribúcia variabilného (kvantitatívneho charakteru) v agregáte symetricky, ale abnormálne, vzorka veľmi malého objemu poskytne normálnu distribúciu vzorového média. Ak má distribúcia kvantitatívneho znaku všeobecnej populácie výraznú asymetriu, potreba ďalších vzoriek vzniká. Distribúcia selektívneho priemeru však môže byť prijatý normálne len v prípadoch, keď sa zaoberáme vzorkou dostatočného objemu.

S cieľom vybudovať závery s použitím normálnej krivky, nie je vôbec potrebné pokračovať v stave normálity rozdelenia hodnôt kvantitatívneho znaku všeobecnej populácie. Skôr sa budeme spoliehať na centrálne limit teorem a v závislosti od distribúcie obyvateľstva určíme túto veľkosť vzorky, ktorá by umožnila pracovať s normálnou krivkou. Normálne rozdelenie štatistík je našťastie poskytnuté vzorkami relatívne malého objemu - obr. 15.6 Vizuálne dokazuje túto okolnosť. Odhadov dôverného intervalu. Môžu nám vyššie uvedené pomôcť pri vykonaní určitých záverov o všeobecnom priemere? Koniec koncov, v praxi sme vybrali len jednu, a nie všetky možné vzorky určeného objemu a na základe získaných údajov, urobíme určité závery týkajúce sa cieľovej skupiny.

Ako sa to stane? Ako je dobre známe, podľa normálnej distribúcie má určité percento všetkých pozorovaní určitú odchýlku RMS; Napríklad 95% pozorovaní je položené v ± 1,96 RMS odchýlok média. Normálne rozdelenie vzorového média, ku ktorému môže byť pripojený centrálny limit teorem, nie je výnimkou v tomto zmysle. Priemer takejto selektívnej distribúcie sa rovná všeobecnému priemeru μ a jeho Riconductikánová odchýlka sa nazýva priemerná chyba priemerného štvorca:

Ukazuje sa, že:

  • 68,26% selektívneho média sa odchyľuje od všeobecného priemeru najviac ± σ;
  • 95,45% selektívneho média sa odchyľuje od všeobecného priemeru najviac ± σ x;
  • 99,73% selektívneho média sa odchyľuje od všeobecného priemeru najviac ± σ x,

i.E. Určitý podiel média vzorky v závislosti od zvolenej hodnoty z. sa uzatvára v intervale určenom veľkosti z.. Tento výraz môže byť prepracovaný vo forme nerovnosti:

Všeobecne - z. < Среднее по выборке < Генеральное среднее + z. (RMS Stredná chyba)

selektívny priemer s určitou pravdepodobnosťou je teda v intervale, ktorých hranice sú súčtom a rozdiel medzi priemernou hodnotou distribúcie a niektorým počtom odchýlok RMS. Táto nerovnosť môže byť premenená na myseľ:

Priemerná vzorka - z. (RMS Stredná chyba)< Генеральное среднее < Среднее по выборке + z. (RMS Stredná chyba)

Ak sa pomer 15.1 dodržiava, napríklad v 95% prípadov ( z. \u003d 1.96), potom v 95% prípadov, je pozorovaný pomer 15.2. V prípadoch, keď je záver založený na jednom selektívnom priemere, používame výraz 15.2.

Je dôležité si uvedomiť, že výraz 15.2 neznamená to, že interval zodpovedajúci tejto vzorke musí nevyhnutne zahŕňať všeobecný priemer. Interval je skôr na výberovom konaní. Interval postavený v tomto priemere môže zahŕňať a nesmie zahŕňať skutočný priemerný agregát. Naša dôvera v správnosť predložených záverov je založená na skutočnosti, že 95% všetkých intervalov postavených v pláne výberu výberu bude obsahovať skutočný priemer. Veríme, že naša vzorka sa vzťahuje na tento 95%.

Aby ste ilustrovali túto dôležitú polohu, predstavte si v okamihu, keď distribúcia vzorových médií pre vzorky s objemom n. \u003d 2 v našom hypotetickom príklade je normálne. Tabuľka 15.4 jasne ilustruje výsledok prvých 10 z 190 vzoriek, ktoré možno vybrať podľa určeného plánu. Všimnite si, že iba 7 z 10 intervalov zahŕňa všeobecný alebo pravdivý priemer. Dôvera v správnosť záveru nie je určitým súkromným hodnotením, ale je to postup Odhadov. Postup je takýto, že pre 100 vzoriek, pre ktoré sa vypočíta selektívny priemer a interval spoľahlivosti, tento interval intervalu bude zahŕňať skutočný úverný význam. Presnosť tejto vzorky sa stanoví postupom, ktorým sa uskutočnilo tvorba vzorky. Reprezentatívny plán prieskumu vzoriek nezaručuje reprezentatívnosť všetkých vzoriek. Postupy štatistického výstupu sú založené na reprezentatívnosti nástroja na pozorovanie vzorky, čo je dôvod, prečo je tento postup tak kritický pre pravdepodobnostné vzorky.

Pravdepodobnostné vzorky nám umožňujú vyhodnotiť presnosť výsledkov ako blízkosť odhadov skutočného významu. Čím väčšia je štandardná chyba štatistiky, tým vyšší je pomer odhadov a nižší presnosť postupu.

Niekto môže zadržať skutočnosť, že úroveň spoľahlivosti súvisí s postupom, a nie na súkromnú selektívnu hodnotu, ale treba pripomenúť, že výskumník môže regulovať hodnotu úrovne dôveryhodnosti. Ak nechcete riskovať a obávate sa, že jeden z piatich zvolených selektívnych intervalov je možné chytiť, čo nezahŕňa dôveryhodnosť, môžete si vybrať 99% interval spoľahlivosti, pri ktorom len jeden zo stoviek vzorových intervalov zahŕňa všeobecné priemer. Ďalej, ak môžete zvýšiť veľkosť vzorky, zvýšite stupeň spoľahlivosti výsledku, ktorý poskytuje požadovanú presnosť posúdenia všeobecnej hodnoty. Podrobnejšie o tom budeme hovoriť v CH. 17.

Postup opísaný v USA má inú zložku, ktorá môže spôsobiť známe rozpaky. Pri hodnotení intervalu spoľahlivosti sa používajú tri hodnoty: X, z. a σ x. Selektívny priemer X sa vypočíta podľa vzorových údajov, \\ t z. Vybrané na základe požadovanej úrovne dôvery. Ale čo priemerná priemerná štvorcová chyba priemeru σ x? Je to rovnaké:

a preto pre svoju definíciu musíme byť určená štandardnou odchýlkou \u200b\u200bkvantitatívneho znaku všeobecného agregátu, t.j. 5. Čo robiť v prípadoch, keď RMS Odchýlka s. Neznáme? Takýto problém sa nevyskytuje z dvoch dôvodov. Po prvé, zvyčajne pre väčšinu kvantitatívnych prvkov používaných v marketingovom výskume, variácia sa líši omnoho pomalšie ako úroveň väčšiny premenných obchodníkov so záujmom. V súlade s tým, ak je štúdia opätovne použitá, môžeme použiť predchádzajúcu, predtým získanú hodnotu s. Po druhé, vzorka je čoskoro vytvorená a získané údaje, môžeme odhadnúť disperziu všeobecnej populácie určením selektívnej disperzie. Disperzia nestabilnej vzorky je definovaná ako:

Vzorka disperzie ŝ 2 \u003d súčet štvorcov odchýlok od priemeru vzorkou / (počet vzorkovacích prvkov -1). Ak chcete určiť selektívnu disperziu, musíme najprv nájsť selektívny priemer. Potom existujú rozdiely medzi každým z hodnôt vzorky a selektívne médium; Tieto rozdiely sú postavené na štvorcové, sú zhrnuté a rozdelené číslom rovným počtu selektívnych pozorovaní mínus jeden. Selektívna disperzia nielenže zabezpečuje odhad všeobecnej disperzie, ale môže byť tiež použitý na vyhodnotenie priemernej priemernej chyby štvorec. Keď je známa všeobecná disperzia σ 2, priemerná štvorcová chyba σ x je tiež známa ako:

Keď je všeobecná disperzia neznáma, priemerná štvorcová chyba je možné vyhodnotiť. Tento odhad je nastavený ŝ x, ktorý sa rovná štandardnej odchýlke vzorky, rozdelenej do oddývaného koreňa z veľkosti vzorky, t.j. Odhad je definovaný rovnakým spôsobom, keď sa určilo posúdenie skutočnej hodnoty, ale namiesto všeobecnej odchýlky strednej štvorcovej štvorcovej, priemerná odchýlka odberu vzoriek je nahradená do výpočtu vzorca. Povedzme, pre odber vzoriek AB so selektívnym priemerom 5800:

Podľa toho ŝ \u003d 283 a

a 95% interval

Čo je menej ako pôvodná hodnota.

V Tab. 15.5 Vypočítané vzorce pre rôzne stredné a disperzie uvedené v tejto kapitole. Tvorba jednoduchej náhodnej vzorky. V našom príklade sa výber prvkov vzorky uskutočnil s pomocou džbán, v ktorom boli umiestnené všetky prvky pôvodného súboru. To nám umožnilo jasne prezentovať pojmy derivátu súčtu a selektívnej distribúcie. Túto metódu neodporúčame v praxi, neodporúčame, pretože zvyšuje pravdepodobnosť chyby. Hrnčeky sa môžu líšiť a veľkosti a textúru, ktorú môže v určitých prípadoch viesť k preferencii jednej. Výber účastníkov vo vietnamskej kampani, ktorý sa uskutočnil s použitím lotérie, môže slúžiť ako príklad chyby tohto druhu.

Výber bol vykonaný ťahom diskov s dátummi narodenia z veľkého bubna. Televízia vysiela tento postup pre celú krajinu. Bohužiaľ, disky boli naložené do systematického bubna: prvá bola január, posledné - decembrové dátumy. Hoci bubon a vystavený intenzívnemu spriadaniu, decembrové dátumy klesli oveľa viac ako január. Následne sa tento postup revidoval takým spôsobom, aby sa výrazne znížila pravdepodobnosť takýchto systematických chýb. Výhodný spôsob tvorby jednoduchej náhodnej vzorky je založený na použití tabuľky náhodných čísel.

Použitie takejto tabuľky zahŕňa nasledujúci postup krokov. Po prvé, prvky všeobecnej populácie musia byť pridelené sériové čísla od 1 do N.; \\ T V našom hypotetickom celkovom prvku ALE Číslo 1 bude priradená, položka B. - číslo 2 atď. Po druhé, počet vypúšťaní tabuľky náhodných čísel by mal byť rovnaký ako číslo N.. Pre N.\u003d 20 Dvojciferné čísla sa použije; pre N. Medzi 100 a 999 - trojmiestnymi číslami atď. Po tretie, počiatočná poloha by sa mala stanoviť náhodne. Môžeme odhaliť zodpovedajúcu tabuľku náhodných čísel a zatváraním očí, ktoré sa nazýva, poke do nej prstom. Keďže čísla v tabuľke náhodných čísel nasledujú v náhodnom poradí, počiatočná pozícia nezáleží.

Nakoniec sa môžeme pohybovať v ľubovoľnom ľubovoľnom zvolenom smere, dole alebo naprieč, výber tých prvkov, ktorých čísla budú zodpovedať náhodným číslam z tabuľky. Na ilustráciu uvedeného, \u200b\u200bzvážte skrátenú tabuľku náhodných čísel (tabuľka 15.6). V prípade N. \u003d 20, musíme pracovať len s dvojcifernými číslami. V tomto zmysle, tabuľka. 15.6 vyhovuje nás, pretože je nemožné. Nech sme sa vopred rozhodnúť, aby sme sa presunuli po stĺpci, počiatočná poloha je na križovatke jedenásteho radu a štvrtým stĺpci, kde sa nachádza číslo 77. Toto číslo je príliš veľké, a preto by sa malo zlikvidovať. Nasledujúce dve čísla sa tiež vyhodia, použije sa štvrtá hodnota 02, pretože 2 zodpovedá číslu prvku V.

Nasledujúce päť čísel bude tiež zlikvidované ako príliš veľké, zatiaľ čo číslo 05 označuje prvok E.. Teda prvky Va E. Staneme sa našou vzorkou dvoch prvkov, podľa ktorého budeme posúdiť úroveň príjmu tohto agregátu. Alternatívna stratégia je možná, v ktorej počítačový program generuje náhodné čísla, budú použité ako základ pre výber. V poslednej dobe, publikovanie naznačuje, že čísla vytvorené takýmito programami nie sú celkom náhodné, ktoré sa určite prejavujú pri konštrukcii komplexných matematických modelov, ale môžu byť použité pre väčšinu výskumu aplikácie marketing. Opäť si poznamenávame, že jednoduchá náhodná vzorka vyžaduje kompiláciu sekvenčného číslovacieho zoznamu prvkov všeobecnej populácie.

Inými slovami, musí byť identifikovaný každý člen počiatočnej súpravy. Pre niektoré agregáty to nie je ťažké, napríklad v štúdii 500 najväčších amerických korporácií, ktorého zoznam je uvedený v časopise Fortune. Tento zoznam je už zostavený, takže tvorba jednoduchej náhodnej vzorky v tomto prípade nebude ťažké. Pre iné zdroje (napríklad pre všetky rodiny žijúce v konkrétnom meste) je kompilácia všeobecného zoznamu mimoriadne náročná, čo robí výskumných pracovníkov, ktorí sa uchyľujú na iné systémy skúšky vzoriek.

Zhrnutie

Tréningový cieľ 1.
Jasne rozlišovať koncepcie sčítania ľudu (ctowing) a odber vzoriek

Plné sčítanie agregátu (obyvateľstvo) centrá. Vzorkaagregát vytvorený z vybraných prvkov.

Tréningový cieľ 2.
Poznať podstatu a sekvenciu šiestich etapov realizovaných výskumníkmi na získanie selektívneho agregátu

Proces odberu vzoriek je rozdelený do šiestich stupňov:

  1. populácia úloh;
  2. stanovenie základne vzorky;
  3. výber výberového konania;
  4. definícia odberu vzoriek;
  5. výberové prvky;
  6. vyšetrenie vybraných prvkov.

Tréningový cieľ 3.
Určiť koncepciu "základnej vzorky"

Vzorová základňa je zoznam prvkov, z ktorých sa vzorka vykoná.

Tréningový cieľ 4.
Vysvetlite, aký je rozdiel medzi pravdepodobnosťou a deterministickou vzorkou

V pravdepodobnostnej vzorke môže byť každý člen agregátu zahrnutý s niektorými špecifikované nenulové pravdepodobnosť. Pravdepodobnosť zahrnutia do vzorky niektorých členov agregátu sa môže od seba líšiť, ale pravdepodobnosť zahrnutia do každého prvku je známa. Pre deterministické vzorky sa vyhodnotí pravdepodobnosť začlenenia akéhokoľvek prvku vo vzorke nemožné. Nie je možné zaručiť reprezentatívnosť takejto vzorky. Všetky deterministické vzorky sú založené skôr na súkromnej pozícii, rozsudku alebo preferencii. Takéto preferencie niekedy môžu poskytnúť dobré odhady charakteristík sady, ale neexistuje žiadny spôsob, ako existuje objektívne stanovenie vzorky zodpovedajúcej úlohe.

Tréningový cieľ 5.
Rozpočítať výber pevných objemov a viacnásobných (sériových) vzoriek

Pri práci so vzorkami pevného objemu sa veľkosť vzorky určuje pred začiatkom prieskumu a predchádza sa analýza všetkých požadovaných údajov. V konzistentnej vzorke je počet vybraných položiek neznámy vopred, je určený na základe série po sebe nasledujúcich riešení.

Tréningový cieľ 6.
Vysvetlite, čo je úmyselná vzorka a opíšte silné aj slabé stránky

Prvky úmyselnej vzorky sú ručne vybrané, predstavujú výskumný pracovník s cieľmi prieskumu. Predpokladá sa, že vybrané prvky môžu poskytnúť plnohodnotné zastúpenie podľa študijnej populácie. Pokiaľ výskumný pracovník je v počiatočných štádiách štúdie o probléme, keď sú určené vyhliadky a možné obmedzenia plánovaného prieskumu, použitie zámernej vzorky môže byť veľmi účinná. Ale v žiadnom prípade nemôže zabudnúť na slabé strany vzorky tohto typu, pretože to môže používať aj výskumník a opisné alebo počas kauzálnych štúdií, ktoré sa nespomínajú, aby ovplyvnili kvalitu ich výsledkov.

Tréningový cieľ 7.
Určite koncepciu odberu hádky

Proporcionálna vzorka je vybraná takým spôsobom, že podiel prvkov odberu vzoriek s určitými vlastnosťami približne zodpovedá podielu rovnakých prvkov v skúmanej populácii; Na to každé pult dostane kvótu, ktorá určuje charakteristiky obyvateľstva, s ktorým by sa mal kontaktovať.

Tréningový cieľ 8.
Vysvetlite ako parameter v procese odberu vzoriek

Parameter je špecifickým charakteristikou alebo indikátorom všeobecného alebo štúdie v štúdii; Určitý kvantitatívny ukazovateľ, ktorý odlišuje jednu celkovú časť iného.

Tréningový cieľ 9.
Vysvetlite, čo je derivát celkovej situácie

Derivát celkovej úplnosti pozostáva zo všetkých možných vzoriek, ktoré môžu byť pridelené zo všeobecnej populácie podľa špecifikovaného plánu kontroly vzoriek.

Tréningový cieľ 10.
Vysvetlite, prečo je koncepcia selektívnej distribúcie najdôležitejšou koncepciou štatistík.

Koncepcia selektívnej distribúcie je základným kameňom výstavby štatistických záverov. Podľa známeho selektívneho rozdelenia študovaných štatistík môže byť uzatvorená s príslušným parametrom všeobecnej populácie. Ak len skutočnosť, že selektívne posúdenie zmeny zo vzorky na vzorku, ale charakter tejto zmeny nie je známy, určuje chybu vzorového prieskumu spojeného s týmto hodnotením sa stáva nemožným. Keďže distribúcia vzorky hodnotenia opisuje svoju zmenu zo vzorky vzorky, poskytuje základ pre určenie dôvery vzorky.