Vlastnosti stanovenia platnosti pedagogického testu. Platnosť techniky. Podiel platnosti a spoľahlivosť faktor platnosti sa považuje za vysoký od hodnoty

Po spoľahlivosti je kľúčovým kritériom hodnotenia kvality techník platnosti. Otázka platnosti techniky je riešená až po vytvorení jeho dostatočnej spoľahlivosti, pretože nespoľahlivá technika nemôže byť platná. Ale najspoľahlivejšia technika bez vedomia o jej platnosti je prakticky zbytočná.

Treba poznamenať, že otázka platnosti až do nedávnej doby je jedným z najťažších. Najviac zakorenená definícia tejto koncepcie je ten, ktorý je uvedený v knihe A. Anastasi: "Platnosť testu je koncepcia, ktorá nás označuje, že testovacie opatrenia a ako dobre to robí."

Platnosť v podstate je to komplexná charakteristika, ktorá zahŕňa na jednej strane informácie o tom, či je metóda vhodná na meranie toho, čo bolo vytvorené, a na druhej strane - Aká je jeho účinnosť, efektívnosť, praktický nástroj.

Neexistuje jediný univerzálny prístup k definovaniu platnosti. V závislosti od toho, ktorý smer platnosti chce výskumník zvážiť, a rôzne metódy dôkaz. Inými slovami, koncepcia platnosti zahŕňa rôzne druhy jej druhov, ktoré majú svoj vlastný špeciálny význam. Technika validácie sa nazýva valizácie.

Platnosť vo svojom prvom porozumení (či metóda je vhodná na meranie toho, čo bolo vytvorené) súvisí s podstatou samotnej metodiky, t.j. Toto je vnútorná platnosť meradla. Táto kontrola sa volá teoretická valizácia.

Platnosť v druhom zmysle (Aká účinnosť, efektívnosť, praktická užitočnosť metodiky) sa nevzťahuje na techniku, pokiaľ ide o jeho účel. na to pragmatické validácie.

Sumarizing, môžeme povedať nasledovné:

  • - V teoretickej valizácii výskumného pracovníka je záujem (konštrukt), meraný metodikou, má záujem. To je v podstate to znamená, že skutočne psychologická validácia
  • - S pragmatickou validáciou je podstatou predmetu merania (psychologické vlastnosti) mimo dohľadu. Hlavným cieľom je dokázať, že "niečo" merané metodikou má spojenie s určitými oblasťami praxe.

Teoretické validácie techniky sa uskutočňuje odolnosťou jeho štrukturálnej platnosti. Štrukturálna platnosť, raisited L. Kronbach v roku 1955, sa vyznačuje schopnosťou metodiky na meranie takejto funkcie, ktorá bola odôvodnená teoreticky (ako teoretický konštrukt). Keď je ťažké nájsť primerané pragmatické kritérium, je možné zvoliť orientáciu hypotéz formulovaných na základe teoretických predpokladov o meranej vlastnosti. Potvrdenie týchto hypotéz označuje teoretickú primeranosť metodiky. Najprv je to potrebné, pokiaľ je to možné, je to predstierané opísať konštrukt, merať, ktorý je určený. To sa dosahuje formulovaním hypotéz o ňom, predpisovanie, s ktorým by mal tento konštrukt korelovať, a s ktorým by nemal. Potom sa kontroluje táto hypotéza. Táto metóda je najúčinnejšia na overenie osobných dotazníkov, pretože vytvorenie jednotného kritéria pre ich platnosť je ťažké.

Intelekt, funkcie osobnosti, motívy, inštalácie atď. Môžu pôsobiť ako konštrukt. Vytvorenie konštruktívnej platnosti je potrebná v prípadoch, keď sa používajú výsledky diagnostických meraní nielen na predpovedanie správanie, ale na závery o rozsahu, v akom majú subjekty určitú psychologickú charakteristiku. Zároveň nameraná psychologická charakteristika nemožno identifikovať s akýmkoľvek pozorovaným vlastnosťou správania, ale je teoretický koncept. Štrukturálna platnosť je dôležitá vo vývoji zásadne nových techník, pre ktoré nie sú identifikované externé kritériá platnosti.

Teda teoretická valizácia metodiky - to dokazuje svoju štrukturálnu platnosť, t.j. Zistiť, že technika meria rovnaký stav (majetok, kvalita), ktorá podľa štúdie výskumníka by mala merať. Ak sa teda vyvinula test na diagnostikovanie duševného rozvoja detí, je potrebné analyzovať, či skutočne meria tento vývoj, a nie niektoré iné vlastnosti (napríklad osobnosť, znak atď.). Preto pre teoretickú validáciu je radikálny problém vzťah medzi psychologickými javmi a ich ukazovateľmi, prostredníctvom ktorých sa tieto psychologické javy snažia vedieť. Takáto kontrola ukazuje, koľko myšlienky autora a výsledky metodiky sa zhodujú.

Najčastejšie je štrukturálna platnosť techniky určená vnútorná konzistencia ako aj konvergentný a diskriminácia platnosti. Ďalším spôsobom, ako určiť konštrukčnú platnosť, je faktorová analýza.

Vnútorná konzistencia odráža, ako sú úlohy, otázky, ktoré tvoria materiál metodiky, sú podriadené hlavnému smeru meraného ako celku, sú zamerané na štúdium rovnakého fenoménu. Analýza vnútornej konzistencie sa vykonáva koreláciou reakcií na každú úlohu so všeobecným výsledkom metodiky. Ak sa teda pozostáva z úloh, ktoré vykazovali významnú koreláciu s jeho zdieľaným skóre, hovoria, že test má vnútornú konzistenciu, pretože všetky jeho úlohy sú podriadené konštruktu uvedené v teste.

Kritériom vnútornej konzistentnosti je tiež korelácia medzi celkovou metódou techník a výsledkami výkonu jeho jednotlivých častí. Testy, kde spravodajstvo pôsobí ako konštrukt, vždy pozostávajú zo samostatne použitých podvedení (napríklad, ako je napríklad povedomie, analógie, klasifikácia, záver atď.), Z výsledkov, z ktorých je vytvorený celkový testovací bod. Významné korelácie medzi výsledkami každej časti a všeobecné skóre tiež označujú vnútornú konzistenciu celého testu.

Okrem toho sa kontrastné skupiny používajú na preukázanie vnútornej konzistencie, ktoré sú vytvorené z predmetov, ktoré vykazovali najvyššie a najnižšie celkové výsledky. Postup skupiny s vysokými výsledkami sa porovnáva s realizáciou skupiny s nízkymi výsledkami, a ak sa prvá skupina zvládňuje s úlohami lepšími ako druhý, technika je rozpoznaná ako vnútorne konzistentná.

Ako A. Anastasi zdôrazňuje, že kritérium vnútornej konzistencie techniky je významným meradlom jeho homogenitu. Keďže tento ukazovateľ pomáha charakterizovať oblasť správania alebo majetku, selektívne overená postupom, stupeň jeho homogénnosti súvisí so štrukturálnou platnosťou. Samozrejme, sám o sebe vnútornú konzistenciu techniky malého vec, ktorá môže povedať o tom, čo IT meria. Avšak, v prítomnosti starostlivo vyvinutých teoretických základov vytvorenia techniky, pevne rozumná vedecká základňa, tento postup posilňuje teoretické myšlienky o svojej psychologickej podstate.

Ďalším spôsobom, ako určiť štrukturálnu platnosť zahŕňa posúdenie techniky pre dve ukazovatele oproti sebe. Je dôležité porovnať ukazovatele overizovanej techniky, na jednej strane, s technikami, ktoré majú rovnaký teoretický konštrukt, a na druhej strane, s technikami, ktoré majú iný teoretický základ. Na tento účel navrhovaný D. T. Campbell a D. V. Fiske postup na odhad konvergentnej a diskriminačnej platnosti.

Konvergentná platnosť (z lat. - aby sa konvergoval do jedného centra, konvertovať) je záver o podobnosti (izomorfizmus - homomorfizmus) tejto metódy (techniky, skúšky, opatrenia) na inú metódu určenú na rovnaké účely (konvergentné, podobné). Je vyjadrená v požiadavke štatistickej závislosti diagnostických ukazovateľov, ak sú zamerané na meranie koncepčne súvisiacich mentálnych vlastností jednotlivca.

Diskriminačná platnosť (z lat. - rozdiel, rozdiel) je záver o rozdiele medzi rovnakou metódou (techník, testov, opatrení) od druhej, teoreticky odlišnej od prvého. Je vyjadrená v neprítomnosti štatistickej závislosti medzi diagnostickými ukazovateľmi, ktoré odrážajú koncepčne nezávislé vlastnosti.

Konvergentná a diskriminačná platnosť - to sú druhy platnosť kritérií. Táto kategória zahŕňa akékoľvek druhy platnosti, posudzované pomocou nezávislého prvku, ktorý je kritériom hodnotenia, porovnania.

Postup hodnotenia konvergentnej a diskriminačnej platnosti je teda stanoviť súčasne podobnosti aj rozdiely. psychologický fenoményMeraný nová metodika, s už známymi technikami. Zahŕňa použitie spolu so špeciálnou metódou ovplyvneného akumulátora, zvolených takým spôsobom, že je v súlade s techníkmi, ktoré sú pravdepodobne spojené s validizovaným a nie spojeným s PEI. Experimentátor musí predpovedať vopred, ktoré techniky budú vysoko korelované s validizovanými a korelácia, s ktorými techniky budú nízke. V súlade s tým je konvergentná platnosť (kontrola stupňa blízkosti priamej alebo spätnej väzby) a diskriminant platnosti (stanovenie nedostatku komunikácie). Techniky, ktoré, ale predpoklad, sú vysoko korelované s validizovanými, sa nazývajú konvergujúci a nepripravený - diskriminant.

Potvrdenie o celkovej výške teoreticky očakávaných odkazov je dôležitým kruhom informácií o štrukturálnej platnosti. V anglicko-hovoriacom psychodiagnóze je takéto prevádzkové stanovenie štrukturálnej platnosti indikované ako odhadovaná platnosť (predpokladaná platnosť).

Prítomnosť korelácie medzi novým a podobným v spôsobe konštruktu, ktorých platnosť bola predtým preukázaná, naznačuje, že vyvinutá technika "opatrenia" o tej istej psychologickej kvalite ako referenčná technika. A ak sa nová metóda súčasne ukáže, že je kompaktnejšia a ekonomickejšia pri vykonávaní a spracovaní výsledkov, potom psychodiagnostiky sú schopné používať nový nástroj namiesto starého. Táto technika sa často používa v diferenciálnej psychofyziológii pri vytváraní diagnostických techník hlavných vlastností. nervový systém muž. Osobitné miesto v postupe určovania štrukturálnej platnosti zaberá analýza faktora (platnosť faktora). To vám umožní striktne štatisticky analyzovať štruktúru väzieb študovaných techník, určiť ich faktor zloženie a faktorové zaťaženie, identifikovať skryté znaky a vnútorné zákony ich vzťahu.

V teoretickej valizácii metodiky sa teda vyžaduje použitie rôznych experimentálnych postupov, ktoré prispievajú k hromadeniu informácií o diagnostikovanom konštrukcii. Ak tieto údaje potvrdzujú hypotézu, čím potvrdzuje psychologický koncept, ktorý je založený na metodike a schopnosť metodiky slúžiť ako nástroj na meranie tohto konceptu. Ako presvedčivejšie potvrdenie, tým určnejšie je možné hovoriť o platnosti metodiky vo vzťahu k psychologickému konceptu, ktorý je založený na jeho základe.

Dôležitou úlohou je pochopiť, že opatrenia techniky zohrávajú porovnanie svojich ukazovateľov s praktickými formami činnosti. Ale tu je dôležité zvlášť dôležité, že metodika je starostlivo vypracovaná v teoretickom pláne, t.j. Mať pevnú, primeranú vedeckú bázu. Potom, keď porovnanie metód s metódou vyrobenou z každodennej praxe, externé kritérium zodpovedajúce skutočnosti, že je možné získať informácie, ktoré podporujú teoretické myšlienky o jeho podstate.

Je dôležité si uvedomiť, že ak sa preukáže teoretická platnosť, výklad získaných ukazovateľov sa stáva jasnejším a jednoznačným a názov techniky zodpovedá rozsahu jeho uplatňovania.

Týkajúci sa pragmatické validácie, to znamená kontrolu techniky z hľadiska jeho praktickej účinnosti, významu, užitočnosti, pretože diagnostická technika má zmysel použiť len vtedy, keď sa preukáže, že nameraná vlastnosť sa prejavuje v určitom čase Životné situáciev určitých činnostiach. Dostane veľký význam, najmä tam, kde vzniká otázka výberu.

Ak sa obrátite na históriu vývoja testológie, potom môže byť toto obdobie rozlíšené (1920-1930), keď vedecký obsah testov a ich teoretická "batožina" bola v menšom rozsahu. Bolo dôležité, aby skúška pracovala, pomohla rýchlo vybrať najviac pripravených ľudí. Kritérium empirického hodnotenia testovacie úlohy Považuje sa za jediné skutočné usmernenie pri riešení vedeckých a aplikovaných úloh.

Použitie diagnostických techník s čisto empirickým odôvodnením, bez odlišnej teoretickej bázy, často viedol k záverom pseudo-výučby, na neoprávnené praktické odporúčania. Nebolo možné určite menovať tieto funkcie, vlastnosti, ktoré odhalili, napríklad testy. B. M. Teplo, analyzovanie testov tohto obdobia, nazvané "slepé vzorky".

Takýto prístup k problému platnosti techniky bol charakteristický na začiatku päťdesiatych rokov. Nielen pre Spojené štáty, ale aj pre iné krajiny. Teoretická slabosť empirické metódy Validácia nemohla pomôcť, ale spôsobiť kritici od tých vedcov, ktorí boli vyzvaní, aby sa spoliehali na vývoj techník nielen k "nahému" empirickému a praxi, ale aj na teoretickej koncepcii. Prax bez teórie, ako viete, slepý a teória bez praktizovania je mŕtvy. V súčasnosti pragmatické hodnotenie metódy validácie je vnímané ako najproduktívnejšie.

Vykonávať pragmatickú valizáciu techniky, t.j. Na vyhodnotenie jeho účinnosti, účinnosti, praktického významu sa zvyčajne používa nezávislý externé kritérium - indikátor, ktorý má priamu hodnotu pre konkrétnu praktickú oblasť. Takéto kritérium môže byť výkon (pre skúšky schopností na učenie, skúšky úspechov, intelektových testov) a úspechy výroby (pre profesionálne orientálne techniky), a účinnosť reálnej činnosti - kreslenie, modelovanie atď. (pre testy Špeciálne schopnosti) a subjektívne odhady (pre osobné testy).

Americkí výskumníci D. Tiffin a E. McCormick, ktorý vykonáva analýzu externých kritérií, ktoré sa používajú na preukázanie platnosti vonkajších kritérií, rozlišujú štyri z nich: \\ t

  • 1) Kritériá vykonávania (v ich čísle môžu zahŕňať, ako je napríklad množstvo vykonanej práce, výkon, čas strávený na školenie, miera rastu kvalifikácií atď.);
  • 2) subjektívne kritériá (zahŕňajú rôzne druhy Odpovede, ktoré odrážajú postoj osoby na čokoľvek alebo niekomu, jeho názor, názory, preferenciám; Zvyčajne sa subjektívne kritériá získavajú pohovormi, dotazníkmi, dotazníkmi);
  • 3) Fyziologické kritériá (používajú sa pri štúdiu účinkov životného prostredia a iných situačných premenných na tele a ľudskú psychiku; sa meria frekvencia impulzov, krvný tlak, elektrický odpor kože, symptómy únavy atď. );
  • 4) Kritériá pletení (uplatňujú sa, keď sa za účelom štúdia obavy, napríklad problém výberu pre tieto osoby, ktoré sú menej náchylné na nehody).

Vonkajšie kritérium musí spĺňať tri základné požiadavky: malo by byť relevantné, bez rušenia (kontaminácie) a spoľahlivé.

Pod relevantnosť týka sa to sémantického súladu diagnostického nástroja s nezávislým dôležitým kritériom. Inými slovami, musí byť presvedčený, že v kritériách presne tie funkcie individuálnej psychiky, ktoré sa merajú a diagnostická technika. Externé kritérium a diagnostická technika musia byť medzi sebou vo vnútornom význame, byť kvalitatívne homogénny v psychologickej entite. Ak napríklad test meria individuálne charakteristiky myslenia, schopnosť vykonávať logické akcie s určitými objektmi, koncepciami, potom v kritériách, ktoré potrebujete hľadať prejav týchto zručností. Uplatňuje sa rovnako odborná činnosť. To nemá jeden, ale niekoľko cieľov, úloh, z ktorých každý je špecifický a predstavuje svoje podmienky implementácie. To znamená existenciu niekoľkých kritérií pre odborné činnosti. Preto by sa nemal porovnať úspech v diagnostických metódach s účinnosťou výroby ako celku. Je potrebné nájsť takéto kritérium, ktoré podľa povahy operácií vykonávaných korelovaním s metodikou.

Ak je relatívne vonkajšie kritérium, nie je známe, relevantné je meria sa majetkom alebo nie, porovnanie s ním sú výsledky psychodiagnostickej techniky sa stáva takmer zbytočným. Nedovoľuje, aby sa dostali k žiadnym záverom, ktoré by mohli posúdiť platnosť techniky.

Požiadavky sloboda od rušenia (Kontaminácia) sú spôsobené tým, že napríklad vzdelávací alebo výrobný úspech závisí od dvoch premenných: od samotného človeka jednotlivé funkciemerané technikami a na situáciu, podmienky štúdia, práce, ktoré môžu mať rušenie, "znečisťovať" aplikované kritérium. V určitej miere sa vyhnúť tomuto skupinám ľudí, ktorí sú vo viacerých alebo menej identických podmienkach, by mali byť vybrané pre výskum. Môžete použiť inú metódu. Skladá sa na úpravu účinku rušenia. Táto úprava je zvyčajne štatistická. Výkonnosť by sa teda mala prijať v absolútnych hodnotách a vo vzťahu k priemernému výkonu pracovníkov pracujúcich za podobných podmienok.

Keď hovoria, že kritérium musí mať štatisticky spoľahlivé spoľahlivosť, to znamená, že by mala odrážať stálosť a stabilitu funkcie fungujúceho.

Vyhľadáva primerané a ľahko zistené kritériá sa týkajú veľmi dôležitých a zložitých úloh validácie. V západnej testológii je veľa techník diskvalifikovaných len preto, že nie je možné nájsť vhodné kritérium na ich kontrolu. Napríklad väčšina údajov o dotazníkoch o ich platnosti je pochybná, pretože je ťažké nájsť primerané vonkajšie kritérium, ktoré spĺňa to, čo merajú.

Hodnotenie pragmatických platnosti techniky môže byť kvantitatívne a kvalitatívne.

Pre výpočet kvantitatívny indikátor je faktor platnosti - výsledky získané pri uplatňovaní diagnostickej metodiky, s údajmi získanými z externého kritéria, sa porovnajú rovnaké osoby. Používajú sa rôzne typy lineárnej korelácie (alkohol, pomocou pestera).

Koľko predmetov je potrebných na výpočet platnosti? Prax ukázala, že by nemali byť menšie ako 50 rokov, ale je to najlepšie na viac ako 200. Často vzniká otázka, čo by mala byť veľkosť faktora platnosti, aby sa považovala za prijateľnú? Všeobecne platí, že je známe, že dostatok faktora platnosti je štatisticky významný. Nízke rozpozná platnosť faktor približne 0,20 0,30, priemer - 0,30- 0,50 a vysoko - viac ako 0,60.

Ale ako A. Anastasi a K. M. Gurevich a iní autori zdôrazňujú, nie vždy vypočítať faktor platnosti, je legitímne používať lineárnu koreláciu. Táto technika je odôvodnená len vtedy, keď bola preukázaná, že úspech v určitej činnosti je priamo úmerný úspechu pri vykonávaní diagnostickej techniky. Pozícia zahraničných testológov, najmä tých, ktorí sa zaoberajú profesionálnym a obchodníkom, najčastejšie prichádza k bezpodmienečnému uznaniu, že povolanie je vhodnejšie pre toho, kto splnil úlohy v teste. Môže to však byť, že pre úspech v aktivitách musíte mať majetok na úrovni 40% testovacieho roztoku. Ďalší úspech v teste už nie je žiadny význam pre profesiu. Dobrým príkladom z monografie K. M. Gurevich: Postman by mal byť schopný čítať, ale či číta normálnou rýchlosťou alebo s veľmi vysokou rýchlosťou - už nemá zamestnanecký význam. S týmto pomerom ukazovateľov metodiky a externého kritéria môže byť najdôležitejším spôsobom na vytvorenie platnosti rozdielnym kritériom.

Ako ukázali skúsenosti zahraničných testov, žiadny štatistický postup nie je schopný plne odrážať rozmanitosť jednotlivých odhadov. Preto často pre dôkaz o technikách platnosti používajú iný model - klinické hodnotenia. Nie je to nič iné kvalita opis subjektu študovaného majetku. V tomto prípade hovoríme o používaní techník, ktoré sa nespoliehajú na štatistické spracovanie.

V modernej psychometrickom sa vyvíjajú desiatky rôznych spôsobov, ako overiť platnosť diagnostických techník spôsobených ich vlastnosťami, ako aj dočasný stav externého kritéria. Najčastejšie však nazývané nasledujúce metódy.

  • 1. Platnosť majetku to znamená, že technika je platná podľa odborníkov. Táto technika sa používa napríklad v skúškach úspechov. Testy úspechov zvyčajne zahŕňajú všetky materiály, ktoré prešli študentmi a niektoré z jeho malej časti (3-4 otázky). Je si presvedčený, že správne odpovede na tieto niekoľko otázok označujú asimiláciu celého materiálu? To by malo odpovedať na test platnosti testu. Na tento účel sa vykonáva porovnanie úspechu v skúške s odbornými hodnoteniami učiteľov (podľa tohto materiálu). Platnosť obsahu je vhodná aj na testy orientované na kritériá, pretože sa v nich používajú. expertné metódy. Predmet skúšky je špecifický - testovací obsah. Odborníci by mali vyhodnotiť obsah testovaných úloh podľa dodržiavania duševného vlastníctva, vyhlasujte ako obsah validovaného testu. Na tento účel sú odborníci podliehajú špecifikácii testov a zoznamu úloh. Ak konkrétna úloha plne vyhovuje špecifikácii, odborník ho označuje podľa potreby testovací obsah. Niekedy sa táto technika nazýva logická platnosť alebo "platnosť určovania". .
  • 2. Platnosť "Simultaneity", alebo súčasná platnosť, stanoví sa pomocou externého kritéria, pre ktoré sa informácie zhromažďujú súčasne s experimentmi na skúšobnej metóde. Inými slovami, údaje týkajúce sa teraz: výkon počas skúšobného obdobia, výkon v rovnakom období atď. Porovnávajú výsledky úspechu v teste.
  • 3. "Prediktívna" platnosť (iné meno - "Prognostická" platnosť). Je tiež určená externým kritériom, ale informácie o ňom sa zhromažďujú určitý čas po skúške. Hoci táto technika je najviac v súlade s úlohou diagnostických techník - predikcia budúceho úspechu, je veľmi ťažké ho aplikovať. Presnosť diagnostiky je v čase závislá od času určeného pre takéto prognózovanie. Čím viac času prechádza po meraní, tým väčší je potrebné zvážiť počet faktorov pri hodnotení prognostickej hodnoty techniky. Je však takmer nemožné zohľadniť všetky faktory ovplyvňujúce predikciu.
  • 4. "Retrospektívna" platnosť. Určuje sa na základe kritéria odrážajúceho udalosť alebo stav kvality v minulosti. Môže sa použiť na rýchle získanie informácií o prediktívnom schopnostiach techniky. Tak, aby ste skontrolovali, do akej miery výsledky testov testovania rýchle učenie, je možné porovnať odhady minulej gravity, minulé odborné posudky atď. U ľudí s vysokým a nízkym tento moment Diagnostické indikátory.

Pri výrobe údajov o platnosti vyvinutého technika je dôležité presne uviesť, ktorý typ platnosti je určený (obsahom, prostredníctvom simultánity atď.). Je tiež žiaduce informovať počet čísel a vlastností jednotlivcov, na ktorých bola vykonaná validácia. Takéto informácie umožňujú psychológovi, aby sa rozhodol, že sa psychológa rozhodne, koľko je recepcia pre skupinu, ku ktorej to bude aplikovať. Rovnako ako v prípade spoľahlivosti je potrebné si uvedomiť, že v jednej vzorke môže mať technika vysokú platnosť, a v ostatných - nízky. Preto, ak výskumný pracovník plánuje použiť techniku \u200b\u200bna vzorke subjektov, výrazne odlišná od toho, kto bol vykonaný test validácie, potrebuje opätovne vykonať takúto kontrolu. Faktor platnosti citovaný v príručke sa vzťahuje len na skupiny subjektov, podobné tým, na ktorých bola určená.

Anastasi A.Psychologické testovanie: v 2 tonoch, 1982.
  • Gurevich K. M.Vyhláška. op.
  • Anastasi A.Psychologické testovanie: v 2 tonách. M., 1982; Burlachuk L. F., Morozov S. M.Kniha slovníka, ale psychologická diagnóza. Kyjev. 1989; Gurevich K. M.Vyhláška. Op.; Všeobecná psychodiagnostika / ed. L. L. BODALVA, V. V. Kapitál.
  • 1. Definícia. Základná psychometrická nerovnosť

    Testovací zápas meraný duševný majetok sa volá platnosť skúšky. Platnosť je najdôležitejšou psychometrickou vlastnosťou testu. Ak vysoká spoľahlivosť naznačuje, že test skutočne meria niečo, potom vysoká platnosť naznačuje, že skúšobné opatrenia presne to, čo chceme merať. Samozrejme, náhodné faktory tiež negatívne ovplyvňujú platnosť cesta. Preto sa v psychometrickom prijímajú nasledujúcu hlavnú psychometrickú nerovnosť:


    Platnosť? Spoľahlivosť,

    to znamená, že platnosť nemôže prekročiť spoľahlivosť testu.

    Na rozdiel od spoľahlivosti, okrem náhodných faktorov, systematické faktory ovplyvňujú platnosť testu. Prinášajú systematické deformácie k výsledkom. Tieto faktory majú iné duševné vlastnosti, ktoré zasahujú do výsledkov testu testu na meranie, ktorého test je nasmerovaný na meranie.

    Chceme napríklad merať potenciál stážistov (najdôležitejšia zložka všeobecných intelektuálnych schopností osoby). Ak dáme test testu s tesným časom obmedzenia a nedostatok príležitostí vrátiť sa a opraviť predpokladanú chybu, je zrejmé, že požadovaný duševný majetok je zmiešaný v teste s falošnou duševnou vlastnosťou - odolnosť proti stresu: testy s vysokou odolnosťou proti stresu bude lepší test. To ukáže účinok systematického skreslenia.

    V modernom psychometrii boli vyvinuté desiatky rôznych teoretických a experimentálnych skúšok testov testov. Hlavným prvkom takmer všetkých týchto metód je takzvané kritérium. Kritérium platnosti - Toto nie je skúška závislá, vonkajšia pre testovacieho zdroja informácií o meranej vlastnosti. Nemôžeme posúdiť platnosť testu, kým nebude porovnávať svoje výsledky so zdrojom pravdivej (alebo vedome overenejších) informácií o meranej nehnuteľnosti - s kritériom.

    2. Typy kritérií platnosti

    V vedecký výskum Prevažujú špeciálne laboratórne kritériá. Napríklad kompaktný testovací dotazník je určený pre úzkosť. A ako kritérium platnosti sa používa špeciálny časovo náročný objektívny laboratórny experiment, v ktorom je reprodukovaná skutočná situácia úzkosti (test-dobrovoľníci ohrozujú chybné účinky súčasných úderov atď.).

    V praxi sa pragmatické kritériá používajú v praxi, pragmatické kritériá sa používajú ako kritérium platnosti - ukazovatele účinnosti činnosti, pre ktoré sa testovanie spracováva na prognózovanie.

    Veľmi často sa odborné hodnotenie používa ako kritérium platnosti. Chceme sa napríklad uistiť krátky test Na meranie úrovne disciplíny validovaného. Na tento účel sa uskutočňuje prieskum učiteľov o úrovni disciplíny známych študentov. Potom sa porovnávajú výsledky testov a odborné hodnotenie disciplinárnych disciplín.

    Dajte nám prebývať tento posledný príklad. Tu máme jednu z najjednoduchších a najobľúbenejších metód empirickej (štatistickej) merania platnosti. Toto je metóda slávnych skupín. Subjekty sa vyzývajú, aby sa zúčastnili psychometrického experimentu na testovanie platnosti skúšky testu, ktoré sú známe, v ktorej skupine podľa kritéria, ktoré sa týkajú. V prípade skúšky disciplíny sú študenti vybraní, zrejme disciplinovaní podľa odborného hodnotenia učiteľov (vysoká skupina podľa kritéria) a očividne nedisciplinovaný (nízka skupina podľa kritéria). Zúčastňujú sa žiakov s priemernými ukazovateľmi testovacích kritérií.

    Po skúške vypočítava napríklad najjednoduchšiu koreláciu medzi skúškou a kritériom (tabuľka 1).

    stôl 1Výpočet najjednoduchšej korelácie medzi testom a kritériom

    Prvok "A" v tejto tabuľke je počet testov, ktoré spadli do vysokej skupiny nad skúškou a podľa kritéria, prvok "B" - počet predmetov vo vysokej skupine na skúške, ale v nízkej skupine podľa kritéria atď.

    Samozrejme, keď skúšobná platnosť testu, prvky "B" a "C" tabuľky musia byť nula, tj test by nemal dať chyby (hovoriť, že študent je nízky, keď učitelia hovoria, že študent je vysoko okyslený - "z").

    3. Matematické vyjadrenie kritéria platnosti (koeficient Gilford)

    Zhoda zhody zhody (korelácia) medzi extrémnymi skupinami nad skúškou a podľa kritéria sa odhaduje najjednoduchším PHO-koeficientom GILFORD:

    S počtom testovanej skupiny 30 osôb (to je minimálna vzorka pre kontrolu validácie), štatisticky významný test testu s kritériom, ktorý môžeme uviesť - pH 1? 0,36. Hoci je to veľmi nízka platnosť, ale stále test v tomto prípade výrazne dáva horné skóreako náhodné šťastie.

    Metóda slávnych skupín však má vážnu nevýhodu. Nie vždy umožňuje použitie testu na prognózu. Faktom je, že pri vytváraní známych skupín sa odhaduje správanie, ku ktorému došlo v minulosti, a chceme urobiť test na predpovedanie správanie, ktoré sa stane v budúcnosti. Mnohé testy používané vo vzdelávacej psychodiagnóze majú špecifikovanú nevýhodu. Uskutočňujú sa v najlepšom teste podľa spôsobu známych skupín a nemajú prognostickú platnosť (alebo táto platnosť je prísne experimentálne osvedčená).

    4. Základné systémy validácie psychodiagnostických techník

    Riešenie problému prognostickej platnosti len pre veľké vedecké a metodické centrá. Koniec koncov, na psychometrickú štúdiu o testovaní prognostickej platnosti, je potrebné prilákať rádovo viac subjektov - nie 30, a aspoň 300, pretože nie je známe, čo z týchto 300 bude spadnúť do extrémnych skupín.

    Chceme napríklad použiť test na predpovedanie pripravenosti školákov na výcvik na univerzite. Toto je typická prognostická psychodiagnostická úloha. Niekto by mal prevziať náročný dlhodobý program na kontrolu prognostického potenciálu tohto testu. Je potrebné testovať 300-500 žiakov, a potom čakať, čo z nich pôjde na univerzitu a bude sa úspešne učiť. Po dvojročnom intervale je možné vytvoriť kritériá skupiny a vypočítať koreláciu s predchádzajúcimi skúšobnými ukazovateľmi týchto bývalých školákov. Až po realizácii takejto schémy psychometrického experimentu možno tvrdiť, že test bol skontrolovaný na prognostickú platnosť. Bez toho pokračujeme len z dôvery vo vedeckú intuíciu vývojára testu a nemáme žiadne nezávislé dôkazy o tom, že test môže byť použitý na predpovedanie.

    Rozpočívajte obvyklú lacnú schému overenia testu (podľa známych skupín) a drahé prognostické testovacej schémy testu - najdôležitejším prvkom Psychodiagnostická gramotnosť nielen pre psychológov, ale aj pre učiteľov, as, však pre všetkých zákazníkov psychodiagnostických informácií.

    Pomer merania.Faktor platnosti vyjadruje hodnotu korelácie medzi ukazovateľom testu a opatrením kritéria. Tento koeficient vám umožňuje charakterizovať platnosť s jedným číselným indikátorom, a preto sa často uvádza v príručkách na testy, čo označuje jeho veľkosť pre každý z použitých kritérií. Údaje, pre ktoré sa vypočítava faktor platnosti, môžu byť tiež prezentované vo forme tabuľky očakávaných výsledkov alebo grafu očakávaného výpadku (pozri kapitolu 3). V skutočnosti takéto tabuľky a diagramy sú vizuálne ilustrácie, ktoré faktor platnosti znamená pre test. Pripomeňme, že tabuľky očakávaných výsledkov sa vzdávajú pravdepodobnosti dosiahnutia určitej úrovne testu kritérií, ktoré dostali určitý ukazovateľ tejto skúšky. Napríklad pomocou tabuľky. 3-6, poznávanie študenta v skúške numerického uvažovania z batérie diferenciálnych testov schopností (DAT),môžete určiť pravdepodobnosť získania jedného alebo iného hodnotenia matematiky v 7. ročníku. Pre tie isté údaje je faktor platnosti 0,60. Ak sú uvedené vyššie, testovacie a kritériá premenné sú kontinuálne, potom sa na nás použil korelačný koeficient práce spoločnosti Pearson. Ak sú počiatočné údaje vyjadrené v inej forme (povedzme, pri použití dichotomického kritéria, "splnené, nenaplnené" - pozri obr. 3-7), vypočítajú sa aj iné typy korelačných koeficientov. Príslušné výpočtové postupy možno nájsť v ľubovoľnom type učebnica o štatistike.

    Podmienky ovplyvňujúce hodnotu koeficientov platnosti.Rovnako ako v prípade spoľahlivosti je dôležité presne určiť skupina skupinyktorý vypočíta faktor platnosti testu. Ten istý test môže merať rôzne funkcie, ak je daná osobám rôznych vekových kategórií, pohlavie, úrovne vzdelávania, tried atď. Ľudia s rôznymi životne dôležitými, vzdelávacími a profesionálnymi skúsenosťami môžu, pa-príklad, využívať rôzne metódy na riešenie jedna a tá istá skúšobná úloha. V dôsledku toho môže mať test vysokú platnosť daného kritéria v jednej populácii a nízkej alebo nulovej platnosti - v inom. Alebo povedzme, že som platným mierou rôznych funkcií v dvoch populáciách. Preto v technických usmerneniach pre testy určené na prácu s rôznymi populáciami by sa preto mali uviesť vhodné údaje o priekopnícke generalizáciu ™. (Populáciageneralistah "cemo).Okrem toho, keď existuje významná intrapurná variácia testovacích indikátorov "! Faktor platnosti testu sa môže výrazne líšiť v rôznych častiach rozsahu ukazovateľov a mali by sa kontrolovať v príslušných podskupinách (R. Lee, & Foley, 1986).



    Otázka jediná heterogénnosťmá tú istú hodnotu na meranie platnosti, pokiaľ ide o meranie spoľahlivosti, pretože obidva vlastnosti sú zvyčajne uvedené vo forme korelačných koeficientov. Pripomeňme, že s inými vecami, ktoré sú rovnaké, širší rozsah distribúcie ukazovateľov, tým vyššia bude korelácia. Táto okolnosť je potrebné pripomenúť pri interpretácii faktorov platnosti, ktoré vedú v testoch na testy.

    Špecifický problém, ktorý je súčasťou mnohých vzoriek validácie predvoľba.Napríklad nový test, validovaný pre odborné ciele,

    Časť 2.

    môže sa vykonať na skupine nedávno najatých zamestnancov, v súvislosti s ktorými takéto kritérium opatrenia budú k dispozícii v čase, keď účinnosť práce. Je však pravdepodobné, že títo pracovníci sú hornou (lepšou) časťou vzorky všetkých tých, ktorí chceli vstúpiť do tejto práce. Z tohto dôvodu, dolný koniec distribúcie testovacích ukazovateľov a kritérií v takejto vzorke bude orezaný. Účinok takejto predikcie bude prirodzene zníženie faktora platnosti. S následným použitím testu, keď sa bude vykonávať so všetkými žiadateľmi na prácu na ich výber, môžeme očakávať zvýšenie jeho platnosti.

    Koeficienty platnosti sa môžu meniť aj po chvíli z dôvodu zmeny výberovej miery. Ako príklad, porovnávame faktory platnosti získané z intervalu 30 rokov počas skúmania University University of Yale (Burnham, 1965). Korelácia bola určená medzi prediktívnym ukazovateľom, na základe testov College Rady a akademickým výkonom na stredných školách, na jednej strane a stredným skóre prváka - na strane druhej. Ukázalo sa, že za 30 rokov korelácia znížila z 0,71 na 0,52. Analýza zodpovedajúcich dvojrozmerných distribúcií údajov ľahko odhalila dôvod tejto redukcie. Faktom je, že v súvislosti s požadovanými požiadavkami pri prijímaní kolégia sa skupina študentov v druhom prípade homogénnejšia ako v prvom, vo vzťahu k prediktívnemu ukazovateli a opatrenia kritéria. Odtiaľ a pokles v korelácii, napriek tomu, že presnosť prognózy pokroku na vysokej škole zostal vo všeobecnosti bývalý. Inými slovami, pozorované zníženie korelácie je vôbec niesvedčil, že prediktívne ukazovatele sa stali menej platnými ako 30 rokmi. Práve to však bolo pre tento záver, ktorý by mohol prísť, chýbajú rozdiely v homogenite skupín.

    Na správne interpretovanie faktora platnosti by sa mal zohľadniť forma komunikáciemedzi testom a kritériom. Výpočet koeficientu Pearsonovského korelácie predpokladá, že tento vzťah je lineárny a zostáva nezmenený v celom rozsahu distribúcie. Štúdia oznámenia testovacích ukazovateľov s výkonom ukázala, že tieto podmienky sa všeobecne vykonávajú (zbabelca, & sa-CKETT, 1990; Hawk, 1970). Osobitné okolnosti však môžu zmeniť povahu tejto súvislosti a testovací užívateľ by mal byť vždy pripravený na takúto zmenu udalostí. Predpokladajme, že na implementáciu určitej práce, len minimálnu úroveň pochopenia čitateľného, \u200b\u200bdostatočného na čítanie pokynov, mien, atď, ale hneď, ako sa táto minimálna úroveň prekoná, potom úspech práce už nie je závislý Ďalší rozvoj tejto schopnosti, tj medzi testom a výkonom práce existuje nelineárne vzťahy. Štúdium dvojrozmernej distribúcie alebo rozptylového grafu, postavený podľa testovacích ukazovateľov na pochopenie čitateľného a meradla kritéria, v tomto prípade by preukázalo, že úroveň práce rastie, kým schopnosť pochopiť čitateľnú mieru dosiahne požadované stupeň, po ktorom zostáva o tom istom. V dôsledku toho sú body na diagrame zoskupené okolo krivky a nie priamku.

    V ostatných prípadoch môže byť najlepšia linka zhody priama, ale body zodpovedajúce jednotlivým údajom sa môžu od neho odchýliť v hornom konci stupnice viac ako v dolnej časti. Predpokladajme, že je potrebná úspešná implementácia testu akademických schopností, ale nie dostatočná podmienka pre úspešné ukončenie niektorých výcvikový kurz. To znamená, že študenti sú nízke

    Kapitola 6.Platnosť: Meranie a tlmočenie

    v tejto skúške, neuspokojivé odhady s najväčšou pravdepodobnosťou dostanú skúšky, zatiaľ čo medzi študentmi s vysokými ukazovateľmi budú pozitívne hodnotenia, a iné, kvôli nedostatočnej motivácii, nedostatok záujmu alebo iných nepriaznivých podmienok sa nevyhovuje skúšku. V tejto situácii bude existovať veľká variabilita implementácie kritériového aktivity medzi študentmi s vysokými indikátormi testov ako nízke. Takýto stav v dvojrozmernej distribúcii sa nazýva heterosezitasticita. "Pearsonovsky korelácia predpokladá homo-KEDITION, tj rovnakú variabilitu v celom rozsahu dvojrozmernej distribúcie. Vo vyššie uvedenom príklade by dvojrozmerná distribúcia bola ventilátorom v tvare - široká v hornom konci a úzky v nižšej. Už je to vizuálna analýza dvojrozmerných distribúcií, zvyčajne na stanovenie povahy vzťahu medzi testom a kritériom. Tabuľky očakávaných výsledkov a grafu očakávanej výpadku Ukážte relatívnu účinnosť testu na rôznych úrovniach.

    Rozsah faktora platnosti.Aká by mala byť veľkosť faktora platnosti? Na túto otázku neexistuje žiadna odpoveď, pretože pri výklade faktora platnosti by sa mal zohľadniť niekoľko súčasných okolností. Samozrejme, korelácia musí byť dostatočne vysoká Štatistický významnýna prijateľnej úrovni, ako je 0,01 alebo 0,05 (pozri kapitolu 4). Inými slovami, pred vykonaním akýchkoľvek záverov o platnosti testu je potrebné mať primeranú istotu, že získaný faktor platnosti sa nezobrazil v dôsledku náhodných oscilácie vzoriek všeobecný agregát s nulou koreláciou.

    Po zložení zmysluplnej korelácie medzi testovacími ukazovateľmi a kritérium je potrebné odhadnúť svoju hodnotu v aspekte cieľov, pre ktoré bol test vytvorený. Ak sa chystáme predpovedať presnú hodnotu ukazovateľa kritérií v konkrétnych osobách (povedzme, stredné skóre študenta na vysokej škole), faktor platnosti možno interpretovať na základe Štandardný odhad chýb (štandardná chyba odhadualebo skrátený SE "), ktorý je podobný chybe merania diskutovaného v súvislosti so spoľahlivosťou. Pripomeňme, že chyba merania označuje prípustný limit možnej chyby individuálneho indikátora v dôsledku zistenia testu. Podobne chyba hodnotenia označuje prípustný limit možnej chyby predpokladanej hodnoty individuálneho ukazovateľa kritéria v dôsledku nedostatočnej platnosti skúšky.

    Hodnotenie chýb sa vypočíta podľa tohto vzorca:

    gD - E. G 1, -faktor platnosti štvorcového a SD V.- Štandardná odchýlka ukazovateľa kritérií. Všimnite si, že s plnou platnosťou (R, \u003d1.00) Hodnotenie chýb by bolo nula. Na druhej strane, ak je platnosť skúšky nula, potom sa odhaduje chyba stigaET hodnoty štandardného priehybu distribúcie kritéria s e es, \u003d sd y-V / l - 0 \u003d SD Y.). Za týchto podmienok nie je pravdepodobnosť správnej predikcie

    Podmienky "homoCages" a "heterosage" (listy ", ten istý rozptyl" a "nerovnaké difúzne" boli zavedené do štatistiky A. A. Chuprova. - Poznámka. n "UCH. ed.

    Časť 2.Technické a metodické zásady

    prevyšuje pravdepodobnosť náhodného hádania a rozsah chýb predikcie sa rovná šírke distribúcie ukazovateľov kritérií. Medzi týmito dvoma limitmi a chybou hodnotenia sa uzatvárajú, čo zodpovedá skúške s platnosťou variácie.

    S odkazom na vzorec pre MORE.Ukážeme, že výraz JL- / ј umožňuje určiť hodnotu chyby hodnotenia o chybaki jednoduché hádanie(t.j. s nulovou platnosťou). Inými slovami, ak ^ | 1 - g £ \u003d 1,00, potom chyba hodnotenia je rovnako veľká ako s náhodným hádaním indikátora kritérií v konkrétnom teste. Použitie takéhoto testu nás nikde nedá rych V presnosti predikcie. Ak je faktor platnosti 0,80, Tajl-rј.\u003d 0,60, a maximálna chyba je 60% hodnoty, ktorá by náhodne hádala. Inak vyjadrujem inak, použitie tohto testu nám umožňuje predpovedať jednotlivé výsledky v kritériách aktivity s chybovým limitom, čo je o 40% menej ako v prípade hádania.

    Môže sa zdať, že aj s takouto nezvyčajne vysokou platnosťou, podobne ako 0,80, chyba predpovedaných ukazovateľov je pomerne významná. Ak hlavnou funkciou psychologických testov bola predikcia presnej polohy jednotlivca v distribúcii kritéria, takáto prospekt by vyzerala úplne odrádzať. Keď zvážime testy v aspekte chyby hodnotenia, väčšina z nich nie je obzvlášť účinná. Avšak, najčastejšie pri testovaní nie je potrebné predpovedať presný výsledok. kritériáČinnosti každej osoby, ktorá sa skúma, ale je potrebné určiť, ktorý z nich prekročí určitý minimálny štandard vykonávania, alebo kritický ukazovateľ zvolený ako kritérium. Aké sú šance na Mary Green na dokončenie zdravotnícka škola, Tom Higgins, aby sa naučili kurz výpočtovej matematiky a beverly Bruce bude úspešný ako astronaut? Ktorý z príchodu do práce je pravdepodobne dobrý úradník, poisťovací agent, mechanik? Takéto informácie sú užitočné nielen pre odborné vzdelávanie, ale aj pre kariérové \u200b\u200bporadenstvo. Napríklad študent je užitočný a prospešný vedieť, že má dobré šance na úplné ukončenie právnickej fakulty, aj keď nemôžeme s dôverou povedať, či jeho priemerné skóre 74 alebo 81 bude.

    Test môže znateľne zvýšiť svoju predvídateľnú účinnosť, ak je nainštalovaná akýkoľvekvýznamnú koreláciu s kritériom, bez ohľadu na to, aké nízke. Za určitých okolností platnosť približne 0,20-0,30 už odôvodňuje zahrnutie testu v programe výberu. Pre mnoho účelov testovanie je vyhodnotenie testu z hľadiska ich štandardnej chyby hodnotiacej hodnoty neprimerane prísne. Vo väčšine prípadov by sa mali uplatňovať iné metódy hodnotenia skúšok, ktoré by zohľadnili druhy rozhodnutí na základe ich výsledkov. Niektoré z nich budú diskutované v nasledujúcej časti.

    Kvalita jednotlivých ukazovateľov, celkových ukazovateľov (indexov) a váhy sú určené ich spoľahlivosťou a platnosťou.

    Spoľahlivosť merania je spojená s jeho stabilitou a reprodukovateľnosťou.Indikátor môže byť považovaný za spoľahlivý v takom rozsahu, v akom sa získané odhady môžu reprodukovať na tejto sade meracích objektov. Hlavný typ spoľahlivosti je opakovateľnosť spoľahlivosti(alebo Šifrózna, najkrajšia spoľahlivosť).Relatívna spoľahlivosť výskumu odráža výsledky opätovného použitia toho istého ukazovateľa (otázka, test) pre rovnakú vzorku prípadov (respondentov) v rôznych časových bodoch. Ak ľudia odpovedajú na otázku rovnako v prvom a na druhom mieste av každom nasledujúcom prípade je táto otázka spoľahlivá. Ak test duševnej schopnosti poskytuje rovnaké výsledky pri kontrole tej istej skupiny študentov stredných škôl, potom je to spoľahlivý test.

    Je dôležité si uvedomiť, že spoľahlivosť meracieho nástroja neodráža jeho presnosť alebo správnosť. Povedzme, či otázka respondentov príjmov poskytnú úplne rovnaké odpovede, nadhodnotené pre približne 100%, zaoberáme sa absolútne spoľahlivými, ale nepresnými. Ak v inom prípade, teplomer s bezchybnou spoľahlivosťou ukazuje elektrický odpor kože, nemáme dôvod hovoriť o správnosti, primeranosti merania. Vyhodnotenie spoľahlivosti-opakovateľnosti je korelácia medzi výsledkami opakovaných meraní.V prípade jediného indikátora stačí jednoducho porovnať odpovede tej istej skupiny ľudí získaných v prvom prieskume, s odpoveďami, ktoré sa dajú o dva týždne alebo mesiac neskôr, a vypočítajú korelačný koeficient (pozri CH. 8) . V praxi možno považovať za koreláciu 0,8 a vyššiu.



    Nevýhody spoľahlivosti opakovateľnosti by sa mali pripísať, po prvé, zložitosť opakovaných meraní na veľkých vzorkách typických pre sociológiu. Po druhé, skutočná hodnota premennej môže tiež zmeniť v priebehu času, napríklad, politické sympatií sa môžu zmeniť za týždeň v dôsledku niektorých škandalóznych expozícií a platu - výrazne zvýšiť mesiac v dôsledku zavedenia povinného indexovania v inflácii. V druhom prípade sa prieskumník zvýši na ťažkú \u200b\u200búlohu na oddelenie oscilácií spôsobených zmenou skutočnej hodnoty premennej, od oscilácií spojených so spoľahlivosťou indikátora. Preto je iný typ spoľahlivosti taký dôležitý - konzistencia spoľahlivosti.Spoľahlivosť-konzistencia je možné vyhodnotiť len vtedy, ak sa na meranie rovnakej premennej používa rovnaká premenná mnoho ukazovateľov.Pre takéto posúdenie je však pomerne jediné meranie. V psychologickom testovaní, napríklad použiť testovacie batérie zamerané na meranie jednej schopnosti alebo jednej osobnej kvality. Sociológovia - ak majú dostatočné finančné prostriedky a technické možnosti - používať indexy a váhy pozostávajúce z rôznych otázok individuálneho indikátora.

    Najjednoduchší spôsob, ako zhodnotiť spoľahlivosť-konzistentnosť, je "rozdelenie na polovicu".Ak máme napríklad 12 otázok, pravdepodobne merajú politickú činnosť, ak je 1 bod pridelený 1 bod, a celková politická činnosť zodpovedá celkovej 12 bodov indexu, uplatňuje sa tento postup: \\ t

    1. Otázky v náhodnom poradí sú rozdelené do dvoch rovnakých zoznamov (6 problémov v každom) a sú prezentované raz skupinu subjektov.

    2. Vypočíta sa ďalej koreiálny koeficient medzi výsledkami tých istých testov pre rôzne "polovicu" testu:Čím vyššia je jeho hodnota, tým dôkladnejšie vyhodnocuje skutočnú hodnotu politickej činnosti získanej touto súborom ukazovateľov. Nie je však vylúčený, že odhad spoľahlivosti získaný týmto spôsobom bude veľmi citlivý na spôsob "rozdelenia na polovicu": korelačný koeficient sa výrazne zmení v závislosti od spôsobu kompilovania dvoch zoznamov.

    Ďalší základný postup, ktorý nám umožňuje odhadnúť spoľahlivosť samostatnej otázky (vyhlásenia, váhy), - toto je test jeho korelácie s celkovým skóre,t.j. s celkovou hodnotou indexu. Ak táto skupina respondentov, korelačný koeficient medzi samostatnou otázkou o frekvencii zahraničných ciest a celkovým "indexom xenofóbie" bol 0,3, potom sa dá predpokladať, že uvedená otázka neodráža skutočnú hodnotu "úrovne xenofóbie "premennej a môže byť vylúčená z dotazníka. Koniec koncov, prísne definovaná spoľahlivosť je podiel meranej variácie odhadov, ktoré sa týkajú skutočného šírenia hodnôt nameranej premennej(Tu používame menej prísnu a pomerne podstatnú definíciu, pretože ešte neopakovali potrebné štatistické pojmy). Je zrejmé, že korelácia s celkovým skóre je postup uplatniteľný na to, aby mali pomerne jednoduchú štruktúru celkových indexov a mierov (príklady nájdete ďalej v tejto kapitole).

    V každom prípade je dôležité mať explicitný model meraniateoretická premenná, ako vám umožňuje predpovedať, aké očakávané vzťahy medzi jednotlivými ukazovateľmi a ako platné jednoduché metódy hodnotenia spoľahlivosti. Uistite sa, že stačí porovnať model s množstvom latentných ukazovateľov premenných s modelom, ktorý obsahuje iba kauzálne ukazovatele (pozri obr. 3a 4). Samozrejme, indikátorové účinky musia byť vysoko v súlade s latentnou, variabilnou vlastnosťou, ktorú sú povolaní na meranie a navzájom. Avšak, to nie je tak zrejmé, že príčiny ukazovateľov: povedzme, že vzdelávanie a príjmy sú dôležitými zložkami koncepcie "sociálno-ekonomického postavenia". Avšak, aj keď tvorba rastie, príjem má právo správať sa čokoľvek, to znamená, že by nemala preukázať určitú koreláciu so vzdelaním vôbec. Inými slovami, ak by mal existovať vysoký antimónový účinok zo spoľahlivého indikátora (s použitím spôsobov rozdelenia na polovicu alebo koreláciu s celkovým skóre), potom na spôsobenie ukazovateľov taký jednoduchý prístup k hodnoteniu spoľahlivosti nie je použiteľný. Je možné vyvinúť vhodnú metódu hodnotenia spoľahlivosti, iba analyzujú vzťah medzi rôznymi ukazovateľmi a rôznymi teoretickými premennými v modeli merania. Predpovedanie očakávanej orientácie a rozsahu týchto spojení môže výskumný pracovník odhadnúť stupeň dodržiavania svojich predpovedí s pozorovanými údajmi a uzavrieť kvalitu indikátora. Najjednoduchšie metódy hodnotenia spoľahlivosti empirických ukazovateľov sú faktorová analýza a cestovná analýza.V ideálnom prípade sa na posúdenie spoľahlivosti používa niekoľko indikátorov (dva alebo tri) a aspoň dva panelové vlny.

    Je veľmi dôležité si uvedomiť, že koncepcia spoľahlivosti je pripojená s náhodnými chybami merania,i.E. S chybami, ktoré nie sú systematicky spojené s nimi alebo niektoré systematicky aktívne externé premenné (povedzme, podlaha alebo vek respondentov). Typický zdroje nespoľahlivosti- Toto sú náhodné nesystematické faktory spojené s výkyvmi v oblasti pozornosti respondentov, nejednoznačnosť formulovania tejto otázky, ktorá vedie k rozdielu v jeho vnímaní v rôznych prípadoch; Nesystematické rozdiely v rozhovore; Rozdiely v kódovaní otvorených otázok, alebo s chybami pri zadávaní údajov. Napríklad, ak prinesiete ešte veľmi skúsených špecialistov, aby klasifikovali stovky osád na vopred určenú schému kódovania typov osád, potom s najväčšou pravdepodobnosťou bude možné nájsť aspoň niekoľko nezrovnalostí vo výsledných klasifikáciách. Niektoré nezrovnalosti budú spojené s prítomnosťou prípadov "limit", ktoré nie sú prístupné jednoznačnej klasifikácii navrhovaných pravidiel, niektoré s mechanickými chybami nahrávania alebo nepozornosti. Predbežné posúdenie spoľahlivosti problematiky sociologického dotazníka si vyžaduje predovšetkým "odmietnutie" nejasných na formulovaných otázkach, ku ktorým ľudia často reagujú. Rovnako nízka spoľahlivosť otázok, ku ktorým respondenti jednoducho nie sú schopní odpovedať, pretože neexistujú žiadne názory na dotknutý problém alebo o tom nič nevedia. Nie všetci respondenti, ktorí sa stretli s irelevantnou otázkou, úprimne odpovedať "Neviem" alebo "nepamätám si". Mnohí z nich poskytnú náhodnú zvolenú reakciu z zdvorilosti alebo neochoty na preukázanie ich nevedomosti.

    Metódy zvýšiť spoľahlivosťuž sme diskutovali (pozri CH. 4, 5). Po prvé, musíte sa usilovať o použitie viacerých ukazovateľov. Keď je nemožné, to znamená, že existujú teoretické alebo praktické ťažkosti pri meraní jednej premennej rôznymi spôsobmi, potom by sa mali použiť najvýraznejšie a všeobecne akceptované ukazovatele (napríklad, ak môžete požiadať o respondentu o svojom veku, Najlepšie je použiť presne takúto formuláciu otázky a tie isté kategórie reakcie, ktoré sa používajú na cenoch cenoch, rozsiahlych panelových štúdií atď.).

    Ďalšie metódy zvyšujúcej sa spoľahlivosti zahŕňajú "skríning" irelevantných problémov, analýza verbálneho znenia problému, učenia a kontroly anketárov, zlepšenie metód kódovania dát a vstupných postupov.

    Platnosťmerania, v najobecnejšom zmysle, charakterizuje korešpondenciu merania jeho účelu. Empirická validácia (odôvodnená, regulovaná) v rozsahu, v akom skutočne odráža hodnotu teoretickej premennej, ktorá sa predpokladala, že sa má merať. Je zmysle, že nemá zmysel hovoriť o platnosti určitého ukazovateľa sám o sebe. Platnosť meracieho nástroja je jednoznačná a správnosť získaných výsledkov vzhľadom na namerané vlastnosti objektov, t.j. vzhľadom na objekt merania.Je možné povedať, že platnosť určuje "čistotu" merania teoretického konštruktu. Keď je meranie priamo, t.j. Môžeme priamo vypočítať počet referenčných jednotiek meranej nehnuteľnosti a len náhodné chyby, spoľahlivosť a platnosť sú ovplyvnené výsledkami merania, platnosť nástroja merania sa rovná jej spoľahlivosti. Ak budeme merať majetok záujmu len nepriamo, pomocou niektorého indikátora, existuje rozdiel medzi spoľahlivosťou a platnosťou. Indikátor môže mať vysokú spoľahlivosť (reprodukovateľnosť), ale zároveň meraním sociologického konštruktu, ktorý nás zaujíma, nie je dosť "čisté". Už je to v intuitívnej úrovni, je zrejmé, že niečo iné môže okrem kvalitného asistenta asistenta kvality merať niečo iné, okrem asistenta kvality (napríklad nie je toľko politickej aktivity ako konformizmus). Nepriame meranie obvykle obsahuje náhodné aj nehodné chybné komponenty. Presne non-náhodný komponentvrátane v sebe systematický(korelované) chybaa menej často majú rovnakú veľkosť pre každý prípad konštantná chyba merania, Definuje platnosť indikátora. Charakteristické príklady systematickej chyby merania v sociologickom prieskume alebo experimente sú už spomínané účinky "pamäte", sociálnej vhodnosti, inštalácie pre pozitívne alebo negatívne reakcie. Ovplyvňujú nielen správnosť, platnosť indikátora variabilného výskumníka, ale aj na správnosť a rozumnosť výsledkov analýzy údajov: korelovaná chyba merania môže ovplyvniť všetky štatistické ukazovatele, vrátane vzťahu vzťahu medzi premennými a pri hodnotení význam rozdielov medzi podskupinami. Inými slovami, použitie neplatných ukazovateľov môže byť nesprávne podstatné závery.

    Problém platnosti merania je najkomplexnejším problémom sociologickej metodiky. Platné meranie je predovšetkým výsledkom platného modely meraniat.j. výsledok primeranej a jasnej konceptualizácie teoretických myšlienok. Tu budeme popisovať len hlavné typy platnostia tradičné metódy validácie, \\ ti.E. Nastavenie platnosti meraní.

    Priepustnosť v obsahuukazuje, do akej miery výskumník zvolených ukazovateľov odrážajú rôzne aspekty teoretického konceptu. Inými slovami, hovoríme reprezentatívnosťtáto sada meraní a postoja k koncepčnej štruktúre variabilnej funkcie, na úplnosť operacionalizácie teoretických konceptov. Napríklad štatistická skúška môže byť považovaná za platný nástroj na meranie štatistických znalostí študentov, pretože preskúmané otázky odrážajú obsah prednášok a učebníc. Avšak, ak sa však všetky otázky týkajú len jednej časti čítaného kurzu - povedzme, na normálnu distribúciu, výsledky skúšok budú odrážať, napríklad, zručnosť študentov, aby preložili "RAO" body do štandardných odhadov, ale nič nehovorí Znalosť korelácie a regresie.

    Hlavným postupom hodnotenia platnosti v obsahu je odborný úsudok.V niektorých prípadoch je vzťah medzi teoretickými koncepciami a meraním ich indikátorov taký zrejmé, že nie sú jednoducho potrebné žiadne špeciálne racionalizácie: Je zrejmé, že teplomer meria teplotu. Tu môžete hovoriť zrejmý(niekedy- tvárový,z angličtiny. Platnosť tváre) Platnosť indikátora. Zjavná platnosť je vyššia ako identifikácia chápania účelu vydania, skúšky alebo iného ukazovateľa sociológom a neskúseným respondentom. Otázka frekvencie nákupu šampónu, s najväčšou pravdepodobnosťou neobsahuje žiadne pricks a umožňuje posúdiť presne typ spotrebiteľského správania, ktorý je opísaný v otázke. V zložitejších prípadoch však informatívna platnosť nie je vôbec znížená na zrejmé. Súbor jednoduchých otázok o obľúbenom spôsobe vykonávania voľného času, preferovaného značky automobilov, frekvenciu čítania prestížneho časopisu atď. Môže byť zameraný na meranie "životného štýlu" respondenta (v tomto prípade, meranie vám umožňuje pripisovať Osoba k jednému z nominálnych kategórií životného štýlu - "prežívajúce", \u200b\u200b"dosiahnuté", "existenciálne", "sociálne" atď.). Posúdiť úplnosť tejto súpravy a relatívnu hodnotu otázok na meranie koncepcie "životného štýlu" len špecialisti. Základom takéhoto odborného úsudku je teoretická definícia, konceptualizácia premennej výskumu. Typicky sa odborný úsudok o platnosti obsahu vykonáva viac alebo menej spontánne po zverejnení výsledkov výskumu. Niekedy je stále možné využiť viac organizovaných postupov - metóda paralelných panelovalebo metóda viacerých sudcov. V prvom prípade dva alebo tri sériové panely špecialistov vykonávajú celý postup validácie obsahu, t.j. porovnať existujúce definície, tvoria zoznam možných ukazovateľov a vyhodnotiť ich reprezentatívnosť vzhľadom na koncepčnú plochu testu. Ak porovnanie ukazovateľov, nezávisle vybraných v dvoch alebo viacerých paneloch, detekuje mnoho náhodných hodnôt, môžeme hovoriť o vysokej podstatnej platnosti.

    Metóda niekoľkých sudcov (odborníkov) je užitočná v prípadoch, keď je premenná znakov, ktorá má byť meraná, má multidimenzionálnu štruktúru. Ak napríklad sociológ vyvíja imaginárnu škálu sociálno-ekonomického blahobytu regiónov, je užitočné odkazovať na špecialistov v oblastiach, ako je demografia, sociálna politika, Zamestnanosť, daňový systém atď. Prieskum expertov umožní identifikovať základné faktory zahrnuté do rozsahu, zhodnotiť ich porovnávací význam a nájsť relevantné empirické ukazovatele.

    Kritériá platnosti(alebo platnosť podľa kritéria) ukazuje, ako dobre sú výsledky na tomto teste alebo indikátor konzistentné s výsledkami merania iného indikátora, nazývaného kritérium.Najčastejšie je kritériom premenná, ktorá je praktická pre výskumníka, ale nemožno ho merať. Napríklad platnosť kritérií vstupné testy Je určená akademickým úspechom, ktorý študenti budú ďalej demonštrovať (t.j. akademický výkon je v tomto prípade kritérium). Môže sa tiež predpokladať, že test morálneho hodnotenia deviantného správania pre adolescentov má platnosť kritérií vo vzťahu k skutočnému zamietnutiu správe. Ukazovateľ, ktorý preukázal platnosť kritérií, možno považovať za variabilný prediktor,umožniť predpovedať individuálne hodnoty premennej kritérií. Samozrejme, že potreba prediktora, ktorá nahrádza skutočné kritérium, sa vyskytuje len v prípadoch, keď je ťažké získať odhady na kritériu, to znamená, že hovoríme o dlhodobej alebo nie udalostiach, ktoré prišli, alebo a Variabilné kritérium je ťažké merať z dôvodu praktických alebo etických úvah. Platnosť prediktora je zvyčajne vyššia, tým bližšie je k kritériu. Povedzme, že ideálnou metódou výberu kadetov leteckej školy by mohla byť skúškou krátkodobého vzdelávacieho kurzu s inšpekciou praktických zručností riadenia lietadla v konečnom dôsledku: Žalobcovia by mali každú šancu stať sa skutočnými odborníkmi. Táto metóda je však príliš drahá av praxi používajú testy inteligencie, testovanie koordinácie vizuálnych motorov a iných ukazovateľov stanovením platnosti kritéria. V inom prípade, projektívna osobná skúška (TAK TAK TEST THEMED APPERception, ktorý znamená kompiláciu príbehov z fotografií s neurčitým pozemkom), umožní identifikovať príznaky psychózy alebo traumujúcej sexuálnej skúsenosti v minulosti. Úplné psychiatrické vyšetrenie by mohlo trvať veľa času a údaje o chudobnej manipulácii v detstve je dosť ťažké dostať sa.

    Hlavné typy platnosti kritérií zahŕňajú prognostické, konkurencieschopnéa postcivo("Prediktívny-back") platnosť.

    Prognostické kritériá Platnosťpopisuje presnosť, s ktorou sa hodnoty tejto premennej - zvyčajne charakterizujú samostatnú jednotlivcov alebo skupinu - môžu byť predpovedané na základe aktuálnych hodnôt niektorých inej premennej (prediktor). Je zrejmé, že najlepším indikátorom takejto prognostickej presnosti bude korelácia medzi hodnotami premennej prediktorov a hodnôt premenlivého kritéria pre jeden a ten istývzorky. Potom - v rámci chyby vzorky - korelačný koeficient bude rovný koeficient prognostickej platnosti.

    Hospodárska platnosť kritéria -toto je stupeň zhody medzi aktuálnymi hodnotami premennej kritérií a premennej prediktorov. Jednoducho povedané, výskumník používa výsledky merania jedným funkciou, aby sa odhadol hodnota inej premennej. Dôvodom môže byť, že meranie premennej s premenlivou kritériom je ťažké určiť, trvá príliš veľa času, atď. Problém konkurenčnej platnosti je veľmi významný pre empirickú sociológiu, kde sa meria mnohé premenné správania alebo inštalácie Self-opisujúce odpovede na otázky dotazníkov, inými slovami, prostredníctvom verbálneho správania. Napríklad môžeme odhadnúť konkurenčnú platnosť dotazníka o frekvencii disco návštev študentov s vynikajúcimi študentmi s radom pozorovania skutočného správania tejto skupiny. Už včasné štúdie konkurenčnej platnosti fackografických otázok v sociológii ukázali, že aj pre relatívne "neškodné", nezmyselné ukazovatele sa konkurencieschopná platnosť môže líšiť v najširších limitoch.

    V tzv. Denverovi štúdiu platnosti, ktorú uskutočnili S. Stauffer a spoluautorov v roku 1947, odpovede respondentov boli porovnané so skutočnosťami a údajmi a údajmi oficiálnych štatistík miestnych organizácií. Išlo o registrácii voličov, účasť na hlasovaní, príspevkoch do mestskej pokladnice, o prítomnosti lístka vodiča a čitateľa, atď porovnaním údajov oficiálnych štatistík (kritérium) s odpoveďami respondentov (prediktor), výskumníkmi zistilo, že množstvo nezrovnalostí bolo z niekoľkých percent na takmer 50%, v závislosti od obsahu tejto otázky.

    Mali by sa však pripomenúť na obmedzeniach, ktoré sú obsiahnuté v ukazovateľoch objektívnych kritérií: tieto oficiálne dokumenty sú tiež často založené na vlastných defaults a často podliehajú chybám merania. V niektorých prípadoch však konkurenčný overovací postup má výhodu nad prediktívnym, pretože prvá nevyžaduje dlhodobý prieskumník o očakávaní, keď je možné merať hodnotu kritéria. Ak chce, napríklad výskumník odhadnúť platnosť kritéria skúšky odborných záujmov vyvinutých pre študentov ako prediktor úspešnej profesionálnej kariéry, potom nie je potrebné čakať na desať rokov, aby merali hodnotu kritérií. Stačí otestovať odborné záujmy pre dve "extrémne" skupiny už pracujúcich špecialistov - úspešné a najmenej skúsenosti v povolaní. Vysoká korelácia medzi skóre testu a úspechom práce (alebo štatisticky významným rozdielom medzi testovacími bodmi "extrémnych" skupín) bude uvádzať konkurenčnú platnosť testu. Podmienky, za ktorých závery o súťažnej platnosti ukazovateľa môžu byť stále chybné selektívna likvidáciazo vzorky (vlastné výber) a reaktivita prediktorovej premennej.Samo-deformácia v našom príklade sa môže vyskytnúť, ak medzi odišiel zo vzorky ( bývalí študenti, odmietnutý profesionálnou kariérou v tejto oblasti a nie je pokrytá z tohto dôvodu testovaním), bude vysoko stanovená vysoko nízka sto-sto-stolná, t.j. Prirodzená likvidácia bude non-náhodná. V prípade reaktivity indikátora budú naše predmety odpovedať na otázky motivačného testu, nie tak, ako odpovedali študenti (kvôli ich odbornej praxe, zmeny v sociálnom postavení atď.) A stále existujú nereaktívne premenné prediktora, Konkurenčná platnosť, ktorá je celkom na to, aby sa ospravedlnila. Príklady zahŕňajú také stabilné charakteristiky ako inteligentný pomer alebo "pozadie" premenné (spoločenský pôvod, štátna príslušnosť atď.).

    Nakoniec sa v niektorých prípadoch zaujímame o vytvorenie presnosti, s ktorou môžeme odhadnúť prítomnosť niektorých druhov kritérií a funkcie, ktorá je v minulosti obsiahnutá v minulosti. Príklad použitia projektívnych psychologický test Pre post-dokument "predpoveď" prognóza "urážky detí je uvedené vyššie. Táto situácia je uvedená ako hodnotenie postcivoplatnosť.

    Druhy platnosti, ktoré sú opísané v USA, sú nevyhnutné v tých situáciách, keď výskumník je úlohou porovnať určitý ukazovateľ s kritériom už existujúcim alebo v praxi. Inými slovami, platnosť kritérií indikátora je korelácia s iným, pravdepodobne "čistým", empirickým indikátorom. Existuje však ďalší prístup k platnosti, kde odhad indikátora je založený na tom, ako dobre jeho "správanie" zodpovedá teoretické očakávania.Takéto posúdenie sa môže uskutočniť len v holistickom teoretickom modeli opisujúcom vzťahu medzi teoretickými premennými, ich ukazovateľmi, náhodnými a neadrálnymi chybami merania. Predpokladajme, že chceme skontrolovať platnosť novej skupiny súdržnosti skupiny. Na základe existujúcich teoretických myšlienok môžeme predpokladať, že menšia frekvencia otvorených konfliktov a veľkú intenzitu komunikácie zodpovedá väčšej skupinovej súdržnosti. Porovnaním rôznych skupín, pokiaľ ide o skupinovú súdržnosť a identifikáciu hodnôt iných dvoch premenných (frekvencia konfliktov a intenzity komunikácie), uvidíme, ako dobre je skupina súdržnosti "vedúca" sami. Ak vzor jeho vzťahu s dvoma ďalšími premennými zodpovedá predpovede teórie, potom môžeme konštatovať, že nová váha, t.j. meria teoretickú premennú, ktorá nás zaujíma. Tento typ platnosti sa zvyčajne označuje podľa termínu "Konštruktívna platnosť". (Niekedy sa používa aj označenie "koncepčná platnosť".)

    Z štatistického hľadiska absolútna konštrukčná platnosť predpokladá, že všetky pozorované variácie hodnôt indikátora sú spojené výlučne s meraným teoretickým konštruktom. Ak je časť variácie indikátora spojená s inou premennou - či už ide o ďalší teoretický konštrukt alebo systematická chyba merania, štrukturálna platnosť bude menšia.

    Je ľahké vidieť, že hodnotenie štrukturálnej platnosti zahŕňa určité spojenie medzi kontrolou hmotnoprávnych teoretických hypotéz a testovaním kvality merania. Hodnotenie štrukturálnej platnosti prostredníctvom porovnania teoretického modelu "správania" premennej s reálnymi vzťahmi ukazovateľov vyžaduje zahrnutie modely merania(pozri vyššie) v širšom teoretický model.

    Predpokladajme, že používame nejaký celkový ukazovateľ - index "demokratizmu politický systém", Pozostávajú z radu ukazovateľov (H. 1 , H. 2 , H. 3 ), každý z nich má svoju vlastnú "hmotnosť" v demokratickom indexe. Takéto ukazovatele môžu zahŕňať prítomnosť parlamentu (nominálna dichotomická premenná), počet nezávislých televíznych a rozhlasových spoločností atď. Na teoretickom modeli očakávame, že stupeň "demokratizmu" je spätná väzba z podielu HNP stráveného na modernizáciu zbraní. Na základe tohto modelu (pozri obr. jedenásť),môžete skontrolovať štrukturálnu platnosť indexu demokratizmu.

    Z


    Obr. jedenásť.Vzájomný model pre premenné "Democtizmus"

    Hlavné kritériá pre odhadovanie psychodiagnostických techník patrí k spoľahlivosti a platnosti. Zahraniční psychológovia (A. Anastasi, E. Gizelly, J. Gilford, L. Kronbach, R. TornDagek a E. Hagen a iní významne prispeli k rozvoju týchto konceptov. Boli vyvinuté formálne logické a matematické štatistické prístroje (primárne metóda korelácie a skutočná analýza) odôvodňujú stupeň súladu techník na výrazné kritériá. V psychodiagnostike sú problematiky spoľahlivosti a platnosti techniky úzko prepojené, avšak existuje tradícia samostatnej prezentácie týchto kritických charakteristík. Po ňom začneme s ohľadom na spoľahlivosť techník.

    SPOĽAHLIVOSŤ

    V tradičnej testológii termín " spoľahlivosť"znamená relatívnu stálosť, udržateľnosť, konzistentnosť výsledkov testov počas primárnych a opätovných použití na rovnakých predmetoch. techniky spoľahlivosti - Toto je takéto kritérium, ktoré hovorí o presnosti psychologických meraní, t.j. Umožňuje súdiť, ako získané výsledky dôvery.

    Dôležitým problémom praktickej diagnózy je určenie negatívnych faktorov ovplyvňujúcich presnosť meraní:

    1. Nestabilita diagnostikovaných vlastností;

    2. Nedokončenie diagnostických techník

    3. Zmenila situáciu prieskumu

    4. Rozdiely v spôsobe správania experimentátora

    5. Výkyvy vo funkčnom stave predmetu

    6. Prvky subjektivity v hodnotiacich metódach a interpretácii výsledkov

    Odrody spoľahlivosti metodiky rovnako ako podmienky ovplyvňujúce výsledky diagnostických testov.

    Vzhľadom k tomu, všetky druhy spoľahlivosti odrážajú stupeň súdržnosti dvoch nezávisle získaných radov ukazovateľov, potom matematichesky-štatistický príjem, s ktorým je zavedená spoľahlivosť techniky - to korelácia (na Pearson alebo Spearman, CM CH. XIV). Spoľahlivosť je vyššia ako čím viac je výsledný korelačný koeficient prístupu jedného a naopak.

    hlavný dôraz je na prácu K.M. Gurevich (1969, 1975, 1977, 1979), ktorý, ktorý vynaložil dôkladnú analýzu zahraničnej literatúry na túto otázku, navrhla interpretovať spoľahlivosť ako:

    1. Spoľahlivosť meracieho prístroja, \\ t

    2. Stabilita študovaného znaku;

    3. Constance, t.j. Relatívna nezávislosť výsledkov z totožnosti experimentátora.

    Navrhuje sa ukazovateľ charakterizujúci merací prístroj, ktorý sa nazýva pomer spoľahlivosti, indikátor charakterizujúci stabilitu meranej vlastnosti - koeficient stability; A ukazovateľ hodnotenia vplyvu totožnosti experimentátora je koeficient hmotnosti.

    Platnosť

    Platnosť V podstate je to komplexná charakteristika, vrátane, na jednej strane informácie o tom, či je metóda vhodná na meranie toho, čo bolo vytvorené, a na druhej strane, čo je jeho účinnosť, účinnosť. Technika validácie sa nazýva valizatsii.

    Platnosť vo svojom prvom porozumení súvisí s samotnou metodikou, t.j. Toto je platnosť meradla. Takýto test sa nazýva teoretická valizácia. Platnosť v druhom zmysle je už aplikovaná tak, že nie je toľko na metódu, pokiaľ ide o jeho účel. na to pragmatické validácie. Takže, s teoretickou validáciou výskumníka, vlastnosť meraná metodikou má záujem. To v podstate znamená, že sa vykonáva samotná psychologická validácia. S pragmatickou valizáciou je podstata objektu merania (psychologické vlastnosti) mimo dohľadu.

    aké skúšobné opatrenia:

    1. Technika bola uznaná ako platná, ako to, čo meria, je jednoducho "zrejmé";

    2. Dôkaz o platnosti bol založený na dôvere výskumníka v tom, že jeho metóda umožňuje "porozumieť predmetu";

    3. Technika bola považovaná za platnú (t.j. schválenie bolo prijaté, že takýto test meria takúto kvalitu) len preto, že teória, na základe ktorej bola technika postavená, "veľmi dobré".

    Viesť teoretické Overenie techniky je ukázať, či je technika skutočne meraná presne nehnuteľnosť, kvalita, ktorú podľa štúdie výskumníka, by mala merať. Ukazuje sa nielen v porovnaní s príbuznými ukazovateľmi, ako aj s tými, kde na základe hypotézy významných dlhopisov by nemali byť. Je teda dôležitý pre overovanie teoretickej platnosti, na jednej strane vytvoriť určitý stupeň komunikácie s príslušným postupom (konvergentná platnosť) a absencia tejto súvislosti s technikami, ktoré majú inú teoretickú základňu (diskriminačná platnosť).

    Pre pragmatický Overenie techník, t.j. Na posúdenie jeho účinnosti, účinnosti, praktického významu sa bežne používa nezávislé vonkajšie kritérium - ukazovateľ prejavu študovaného majetku v každodennom živote. Takéto kritérium môže byť výkon (pre skúšky schopnosti učiť, skúšky úspechov, intelektových testov), \u200b\u200búspech výroby (pre profesionálne orientálne techniky), účinnosť reálnej činnosti - kreslenie, modelovanie atď. (Pre testy špeciálnych schopností), subjektívne odhady (pre osobné testy).

    Americkí výskumníci Tiffin a McCormick (1968), ktorí sa analyzovali externé kritériá, ktoré sa používajú na preukázanie platnosti externých kritérií, prideľovali svoje štyri typy:

    1) Kritériá vykonávania (v ich čísle môžu zahŕňať, ako je množstvo vykonanej práce, výkon, čas strávený na školenie atď.);

    2) subjektívne kritériá (zvyčajne subjektívne kritériá sú získané pohovormi, dotazníkmi, dotazníkmi);

    3) Fyziologické kritériá (sadzba impulzov, krvný tlak, elektrický odpor kože, príznaky únavy atď.);

    4) Kritériá pletení (uplatňujú sa, keď sa za účelom štúdia obavy, napríklad problém výberu pre tieto osoby, ktoré sú menej náchylné na nehody).

    Hodnotenie platnosti techniky môže byť kvantitatívna a kvalitatívna.

    19 Typy platnosti. Meranie platnosti

    Otázka platnosti až do nedávno je jedným z najťažších. Najviac zakorenená definícia tohto konceptu je ten, ktorý je uvedený v knihe A. Anastasi: "Platnosť skúšky je koncepcia, ktorá nám naznačuje, že testovacie opatrenia a ako dobre to robí"

    Platnosť v jeho podstate je komplexná charakteristika, vrátane, na jednej strane informácie o tom, či je metóda vhodná na meranie toho, čo bolo vytvorené, a na druhej strane, aká je jeho účinnosť, efektívnosť, praktická pomôcka.

    Z tohto dôvodu neexistuje jednotný univerzálny prístup k definícii platnosti. V závislosti od toho, ktorý smer validácie chce zvážiť výskumníka, používajú sa rôzne spôsoby dôkazov. Inými slovami, koncepcia platnosti zahŕňa rôzne druhy jej druhov, ktoré majú svoj vlastný špeciálny význam. Technika validácie sa nazýva valizácie.

    Platnosť- popisuje myšlienku testu, ktorý stanovil na túto tému. Skúška musí byť vnímaná skúmaným ako vážnym nástrojom pre vedomosti o jeho osobnosti, niečo podobné tým, že spôsobuje rešpekt a do určitej miery točí s lekárskymi diagnostickými nástrojmi. Zrejmé platnosť nadobúda osobitný význam v moderných podmienkach, keď je test testov vo verejnom vedomí tvorená mnohými publikáciami v populárnych novinách a časopisoch o tom, čo sa dá nazývať kvázi skladby, s ktorými je čitateľ navrhnutý na určenie čokoľvek: od inteligencie pred kompatibilitou s budúcim manželom.

    Súťažná platnosťodhaduje sa podľa korelácie rozvinutého testu s ostatnými, ktorých platnosť je nastavená v porovnaní s meraným parametrom. P. Klein poznamenáva, že údaje o súťažnej platnosti sú užitočné, ak existujú neuspokojivé testy na meranie niektorých premenných a nové sú vytvorené s cieľom zlepšiť kvalitu merania. V skutočnosti, ak existuje účinný test, potom čo je rovnaký nový?

    Prognostická platnosťnainštaluje sa pomocou korelácie medzi testovacími indikátormi a určitým kritériom charakterizujúcim meranú vlastnosť, ale neskôr. Napríklad prognostická platnosť akéhokoľvek spravodajského testu môže byť preukázaná koreláciou svojich ukazovateľov získaných z testu do 10 rokov, s akademickým výkonom počas konca strednej školy. L. Kronbach považuje prognostickú platnosť najviac presvedčivých dôkazov, že skúšobné opatrenia presne to, na čo bolo určené. Hlavným problémom, s ktorým výskumník čelí, sa snaží vytvoriť prognostickú platnosť svojho testu, pozostáva z výberu externého kritéria. Týka sa to najmä merania osobných premenných, kde je výber externého kritéria je mimoriadne náročná úloha, ktorá si vyžaduje veľa vynaliezavosti. Situácia je o niečo ľahšia pri určovaní externého kritéria pre kognitívne testy, avšak v tomto prípade musí výskumník "zavrieť oči" mnohým problémom. Akademický výkon sa teda tradične používa ako externé kritérium pri potvrdzovaní testov inteligencie, ale zároveň je dobre známe, že úspech v odbornej príprave je ďaleko od jediného svedectva vysokej inteligencie.

    Prírastková platnosťmá obmedzený význam a odkazuje na prípad, keď jeden test z testovanej batérie môže mať nízku koreláciu s kritériom, ale neprekrývajte sa s inými testmi z tejto batérie. V tomto prípade má tento test inkrementálnej platnosti. To môže byť užitočné pri vykonávaní slovnej zásoby pomocou psychologických testov.

    Diferenciálna platnosťmôže byť ilustrovaný na príklade testov záujmu. Testy záujmu sú zvyčajne korelované s akademickým výkonom, ale rôznymi spôsobmi pre rôzne disciplíny. Hodnota diferenciálnej platnosti, ako aj inkrementálne, obmedzené.

    Vecná platnosťurčené potvrdením, že úlohy testu odrážajú všetky aspekty študovaného správania. Zvyčajne sa stanoví testmi úspechov (význam nameraného parametra je úplne jasný!), Ktorý, ako už bolo uvedené, sú vlastne psychologické testy. V praxi, odborníci, ktorí uvádzajú, aká oblasť (oblasť) správania sú najdôležitejšie, napríklad pre hudobné schopnosti, a potom, na základe toho, sú generované testovacími úlohami, ktoré experti rezervujú.

    Konštruktívna platnosťtest sa uvádza v plnej výške, pokiaľ je to možné, opis premennej, na meranie, ktoré test je určený. Štrukturálna platnosť v podstate zahŕňa všetky prístupy k definícii platnosti, ktoré boli uvedené vyššie. Kronbach a MIL (Cronbach & Meehl, 1955), ktorý sa zaviedol do psychodiagnostickej koncepcie štrukturálnej platnosti, sa pokúsili vyriešiť problém výberu kritérií v validácii testu. Zdôraznili, že v mnohých prípadoch nemôže žiadne samostatne prijaté kritérium môže slúžiť na valizáciu samostatného testu. Je možné zvážiť, že riešenie možnosti testu je vyhľadávanie odpovede na dve otázky:

    1) existuje nehnuteľnosť; 2) Prakticky meria tento test individuálnych rozdielov na tomto majetku. Je veľmi zrozumiteľné, že problém objektivity pri výklade výsledkov na štúdiu štrukturálnej platnosti je spojený so štrukturálnou platnosťou, ale tento problém je zovšeobecnený a presahuje rámec platnosti.

    Neexistuje žiadny jediný ukazovateľ, s ktorým je stanovená platnosť psychologického testu. Na rozdiel od ukazovateľov spoľahlivosti a diskriminácie nie je možné vykonať presné štatistické výpočty potvrdzujúce platnosť techniky. Developer však musí predložiť významné dôkazy v prospech platnosti skúšky, ktorá z neho bude vyžadovať psychologické znalosti a intuícia.

    platnosť ≤ spoľahlivosť.

    To znamená, že platnosť skúšky nemôže prekročiť jeho spoľahlivosť.

    Tento pomer je však nesprávne interpretovaný ako indikácia priameho proporcionálneho pripojenia platnosti a spoľahlivosti. Zlepšenie spoľahlivosti nemusí nevyhnutne viesť k zvýšeniu platnosti. Z hľadiska ANASTASI je platnosť určená reprezentatívnosťou testu vzhľadom na merané správanie. Ak sa táto oblasť správania pozostáva z rôznych javov, hmotnoprávna platnosť testu automaticky vyžaduje znázornenie modelov všetkých týchto rôznych javov v ňom. Vezmite globálny koncept "Speech Ability" (tento psycholingvistický termín v tradičnej testológii zodpovedá termínu "verbálna inteligencia"). Patrí medzi ne takéto relatívne nezávislé zručnosti ako listy a zručnosti čítania. Ak sa postaráte o vecnú platnosť príslušnej skúšky, potom musíte zadať úlohy na kontrolu zložiek verbálnej inteligencie v ňom. Zadanie heterogénnych bodov a podsúborov (podvedení), určite znižujeme vnútornú konzistenciu, súčasnú spoľahlivosť testu, ale hľadáme výrazné zvýšenie platnosti. Na rozšírenie rozsahu testu sa teda musí psychodiagnost vyhnúť zbytočnému zvýšeniu vnútornej konzistencie. Súčasne s týmto poklesom vnútorných korelácií medzi rôznymi bodmi testu, negatívny nadbytok je nevyhnutne mizne na distribučnej krivke testovacej bodu a čoraz viac približuje k formuláru na normálnu krivku.

    Empirická platnosť. Ak sa v prípade vecnej platnosti, skúšobný odhad je vykonaný z dôvodu odborníkov (nastavenie súladu testovacej priradenia meracieho objektu), potom sa empirická platnosť vždy merala s použitím štatistickej korelácie: korelácia dvoch radov hodnôt - poukazuje na skúšku a indikátory externým parametrom zvoleným ako kritériom platnosti.

    Pragmatické tradície západnej testológie zviazali empirickú platnosť testu na externú psychológiu sociálnych a pragmatických kritérií. Tieto kritériá sú ukazovatele s priamou hodnotou pre niektorých odborníkov. Prax je vždy zameraný na zvýšenie alebo nižšie tieto ukazovatele. Napríklad v oblasti pedagogickej psychológie, tento "výkon" (ktorý by sa mal zvýšiť), v pracovnej psychológii, táto "produktivita práce" a "plynulosť personálu", v medicíne - "Zdravie pacienta". Zameriava sa priamo na tieto kategórie, psychológ, ktorý sa snaží predvídať výsledky testov s týmito ukazovateľmi, skutočne rieši dve úlohy naraz: úlohu merania platnosti a úlohy merania praktickej efektívnosti svojho psychodiagnostického programu. Ak sa získa významný korelačný koeficient, potom môžeme predpokladať, že sú riešené s pozitívnym výsledkom oboch týchto úloh okamžite. Ale ak korelácia nie je zistená, zostáva neistota: buď samotný postup sa nenašiel ( skóre Nevymýšľa sa, napríklad, stresová odolnosť operátora) alebo hypotéza prítomnosti príčinného vzťahu medzi mentálnym majetkom a sociálne významným ukazovateľom (odpor stresu neovplyvňuje percento núdzových situácií).

    Sociálno-pragmatické kritériá sú teda komplexné: umožňujú merať platnosť účinnosti, ale nie každý z týchto dvoch vlastností testu samostatne. V praxi, psychológ často očakáva ešte ťažšiu situáciu, keď zákazník vyžaduje psychológ na základe diagnózy okamžite definovaných opatrení na zasahovanie situácie (výber, poradenstvo, školenia atď.). V tomto prípade sa zvýšenie ukazovateľov (spoľahlivé v porovnaní s kontrolnou skupinou) dokazuje súčasne a platnosť účinnosti diagnózy a účinnosť samotného zásahu. A negatívny výsledok dáva ešte väčšiu neistotu, pretože sa ukáže, že je nemožné oddeliť neefektívnosť rušenia z nízkej platnosti diagnózy.

    Empirický postup validácie. Organizácia odberu vzoriek v empirickej validácii závisí od dočasného štatútu kritéria. Ak je toto kritérium udalosť v minulosti (retrospektívna validácia), potom sa zúčastniť na psychodiagnostické vyšetrenie, postačuje prilákať iba tie subjekty, ktoré boli na extrémnych póloch na tomto kritériu. V dôsledku toho sa aplikuje metóda extrémnych (kontrastových) skupín. Korelačný s celkovým testovaným bodom sa odhaduje s použitím biserialového koeficientu vzorca.

    V prípade, že kritérium je budúcou udalosťou (budúce overovanie), vzorka musí byť zložená s rezervou - s prihliadnutím na pravdepodobný objem extrémnych skupín v budúcnosti. Napríklad je potrebné zistiť, či diagnóza temperamentu umožňuje zvýšené riziko psychosomatických ochorení (hypertenzia, vredy, astma atď.). Nech na základe epidemiologických štúdií je známe, že tri roky. 1000 zdravých ľudí je 57 ľudí s týmito chorobami. To znamená, že približne 2000 ľudí by malo byť preventívnej (výstražnej) diagnostiku, aby sa dosiahol počet "vysokých" skupín (chorých) asi 100 ľudí. Potenciálna validácia odhaľuje prognostickú účinnosť diagnostického postupu. Vysoká prognostická platnosť dokazuje samotnú platnosť samotného merania a prítomnosť údajného kauzálneho spojenia.

    № 20 Spoľahlivosť ako špeciálna škála platnosti vo vzťahu k testovaniu seba-zlyhania. Metódy boja proti sociálnej schopnosti.

    Špeciálna rozmanitosť platnosti je presnosť. Hovoríme o vedomom alebo bezvedomí deformáciách, že samotný test prispieva k výsledkom testovania, vedené počas skúšky špeciálnou motiváciou, odlišnou od tej, ktorá je neoddeliteľnou skutočným správaním. Schopnosť testu chrániť informácie z motivačného skreslenia a je presnosťou testu. Najmä akútny problém spoľahlivosti stojí v prípade testovacích dotazníkov, ktoré umožňujú viac slobody pri výbere testovanej odpovede. Typická technika na zabezpečenie spoľahlivosti je prítomnosť častí klamstva v testovaných dotazníkoch, zavedenie otázok "nie je o tom", zavedenie paralelných otázok, otázky DUB. Tieto váhy sú založené hlavne na fenoméne sociálnej schopnosti - túžby tém, aby sa počas testovania poskytli sociálne schválené informácie. Ak je predmet skórovaný na stupnici lží, vyššie uvedené skóre je kritické, potom je jeho protokol deklarovaný v nepriateľstve a navrhuje sa tomu, aby tento test opäť úprimne povedané alebo vykonal ďalší test. Mnohé špecifické pasce zamerané na meranie spoľahlivosti sú často zahrnuté ako zložka do špecifickej skúšobnej štruktúry, a niekedy ani nepodlieha zverejneniu ako prvok know-how (informačný vynález) a profesionálne tajomstvá, zdieľané vývojármi len s licencovanými užívateľmi, ktorí podpísali osobitnú licenčnú zmluvu. Pri nákupe. Spoľahlivosť testov úzko súvisí so stupňom dôvery v komunikáciu, ktorá bola schopná zriadiť psychológ s touto témou. Je užitočné rozlišovať medzi dvoma diagnostickými situáciami: poradenstvo (situácia klienta) a osvedčenie (odborná situácia). V prvom prípade sa subjekt zúčastňuje na testovaní na dobrovoľnom základe a má záujem o získanie odporúčaní o výsledkoch testovania (ako napríklad v poradenstve odborného poradenstva). V druhom prípade sa testovanie vykonáva na iniciatíve učiteľa alebo správy, psychológa, rodičia, to znamená, že iné osoby a títo ostatní sa viac zaujímajú o výsledky ako samotný test. Je jasné, že v situácii osvedčenia je obzvlášť relevantná otázka spoľahlivosti. A dotazníky, ktoré nie sú dodávané s lžami, používanie v takýchto situáciách je zbytočné. Naopak, v situácii klienta, takéto techniky môžu byť použité, na ktoré bude testovateľný zodpovedný nebude zodpovedný v odbornej znalosti. Otázky spoľahlivosti a štandardizácie sú úzko spojené s ostatnými. Veľmi často dokonca objektívne testy úspechov, ak prešli štandardizáciou na dobrovoľníkov (v konzultačnej situácii), musí byť renomovaný, aby sa mohli používať v certifikačnej situácii.


    21 Technológia na vytváranie a prispôsobenie metód

    Vytvorenie pôvodnej metodiky alebo adaptácie cudzích techník nemožno znížiť len na kontrolu (alebo znovucoved) jednotlivých psychometrických vlastností - reprezentatívnosť, spoľahlivosť, platnosť, spoľahlivosť - v ľubovoľnej sekvencii. V niektorých prípadoch sa odporúča začať z jednej etapy práce, v iných - od druhej. V skutočnosti, akékoľvek skutočné použitie testu nie je situácia len "dizajnu" alebo len "aplikácií". Je možné bez preháňania povedať, že medzi extrémnymi pólmi je kontinuum:

    "Design" __________________ "Aplikácia"

    a každá situácia sa odstráni z oboch pólov do určitej fázy. Je ťažké volať takýto prípad, keď sa konštrukcia úplne nového testu začala s poškriabaním, "na prázdnom mieste." Je tiež ťažké nájsť takéto prípady, keď by všetky aspekty testovania boli úplne nezmenené a reprodukovali úplne študovanú regulačnú situáciu použitia hotového testu. Ale všetka táto rozmanitosť situácií, celá kombinácia nezávislých parametrov psychologických praktizujúcich, spravidla, sa snaží znížiť na dvojstranné modelové situácie.

    1. Situácia žiadosti. Skúška niekomu bola vyvinutá (prípadne v: iných sociokultúrnych podmienkach), testovacie normy získané na zástupcov tejto jazykovej kultúry (nejednotnosť vzorky štandardizácie a odberu vzoriek uplatňovania vo veku a profesionálne-kultúrnych prvkov sa uznávajú ako nevýznamné).

    2. Situácia adaptácie. Niekto test je navrhnutý - Skontrolujte spoľahlivosť a platnosť, ale neexistujú žiadne testovacie normy (spravidla neexistujú žiadne testy pre všetkých zástupcov tejto jazykovej kultúry). Úlohou prispôsobenia sa preto zníži na výstavbu testovacích noriem.

    3. Stavebná situácia. Existuje koncepcia mentálnych vlastností, ale neexistuje žiadny postup pre svoje meranie, ktoré spĺňa požiadavky miesta, času, možností kvantitatívnej analýzy a iných obmedzení zdrojov. Je potrebné prísť s meracím postupom, skontrolovať jeho spoľahlivosť a platnosť, vybudovať testovacie normy.

    Dajte nám prebývať predovšetkým na prispôsobenie tzv. Preložených testov. Cesta k rýchlemu dopĺňaniu repertoáru metodiky z dôvodu sady hotových cudzích techniky sa zdá, že mnoho psychológov najhospodárnejší, najkratšia spôsob, ako spoľahlivá a platná psychodiagnostika. Ak sa však adaptácia zníži len na výstavbu normatívnej distribúcie testovacích bodov, znamená to, že platnosť a spoľahlivosť prispôsobenej techniky v nových podmienkach sa prijímajú na viere a teoretickú koncepciu autora skúšky a Obsah kritérií platnosti, ktorý ho používa, sa jednoducho prenesie do našich podmienok nezmenených (v skutočnosti, pre všetky, vrátane jednoznačnej a nespoľahlivej techniky, môžete získať distribúciu). Podobný prenos dáva zanedbávajúce chyby len na testovanie v porovnaní s elementárnymi duševnými vlastnosťami (ako sú vlastnosti nervového systému, funkčné stavy, parametre senzorotorov, elementárnych kognitívnych funkcií a s použitím objektívnych postupov (psycho-fyziologická registrácia, testy s "fyzickými" kritériami " , atď.). Pri skúšaní integrálnych mentálnych vlastností osobnosti a individuálneho vedomia (funkcie, motívy, inštalácie, sebahodnotenie, všeobecné schopnosti, komunikačný štýl, hodnotové orientácie, záujmy atď.), ako aj s použitím všetkých jazykových fondov v samotnom skúšobnom postupe (vrátane nielen znenie úloh, otázok; ale aj zdrojový formulovanie pokynov na skúšku) a využívanie kultúrnych a špecifických kritérií na posúdenie správnosti výsledku (stanovenie Kľúč stupnice) je obmedzený len na zber testovacích noriem pri prispôsobovaní - je neprijateľný!

    Na overenie spoľahlivosti a platnosti v nových sociokultúrnych podmienkach je potrebná vážna empirická práca, práca skutočne zodpovedajú jej objemu vytvárania pôvodnej metodiky. Z tohto hľadiska požičiavacie skúšky cudzej všeobecnosti schopností, charakterov, charakterov, záujmov, atď. Neobsahuje to najkratší spôsob psychodiagnostiky. Táto cesta sa zdá byť kratšia len tým, ktorí úmyselne alebo nevedomosť zanedbávajú zásady psychometrie.

    Uvádzame potrebné etapy empirickej štatistickej práce pri prispôsobovaní multidimenzionálneho prekladového testovacieho dotazníka.

    1. Analýza vnútornej platnosti, vnútornej konzistencie položiek, z ktorých sa testovací dotazník skladá. Táto analýza je určená na preukázanie, že existuje nejaký druh (stále nie je nejasný, aký druh) všeobecnej diagnostickej vlastnosti ležiace na križovatke všetkých empirických indikátorov (v strede "lúča" anti-vektorov). Takáto analýza je povinná vo vzťahu ku všetkým skúšobným váhom získaným faktorovým analýzou, napríklad na testy testov EPI AISENKA a 16PF KETTELL. Nie je však potrebné uplatniť požiadavku vnútornej konzistentnosti do dotazníka "lokálnej kontroly" alebo na mnohé hlavné klinické šupiny MMPI, keďže položky na tieto šupiny boli vybrané externými kritériami a nie sú spojené s jedným "balíkom". Analýza vnútornej konzistencie sa môže aplikovať na jednorozmerné a na multidimenzionálne testy. V prvom prípade stačí mať stolný kalkulátor. Pre multidimenzionálne testy je potrebné použitie špeciálneho počítačového programu "Bod analýzy".

    2. Kontrola odolnosti voči priľnavosti. Táto kontrola je absolútne nevyhnutná pri diagnostikovaní vlastností, s ohľadom na ktorý teoreticky očakávaný invarovanie v čase. Analýza spoľahlivosti najskôr môže byť (ako aj analýza spoľahlivosti konzistentnosti) je kombinovaná so štúdiou informatizity jednotlivých bodov testu, ako aj udržateľnosti jednotlivých položiek. Bez informácií o retaentnej spoľahlivosti nemá psychológ právo používať test na vytvorenie akejkoľvek elementárnej statickej extrapolizujúcej prognózy.

    3. Analýza korelácií s príslušným vonkajším kritériom. Tento krok adaptácie je absolútne nevyhnutný, ak bol test vyvinutý pôvodne ako kritérium orientovaný, t.j. Výber bodov sa uskutočnil na základe ich korelácií s určitým kritériom platnosti. Napríklad takáto práca vykonáva tím F. B. Berezina pre skrátenú modifikovanú verziu MMPI (Berezin F. B. a kol., 1976).

    4. Skontrolujte alebo reštartujte testovacie normy. Táto fáza už bola uvedená vyššie. Bohužiaľ, len tento stupeň práce adaptácie testov až do nedávnej doby uznali všetky psychológovia podľa potreby. V tomto prípade však nie je vždy reprodukovaná potrebná štatistická práca na overovaní stability získanej distribúcie testovacích bodov na rozdelenie vzorky.

    5. Osobitná fáza multidimenzionálnych testov - kontrola reprodukovateľnosti štruktúry vzťahov medzi váhami. Napríklad ortogonalita, štatistická nezávislosť faktorov "extraverzia - introversion" a "neurotizmus - stabilita", sú zásadne základom testu Eizenka. Na reprodukovateľnosť štruktúry stupnice medzi faktormi 16PF je založená správnosť počítania sekundárnych faktorov (Yampolsky L. G., 1981; Melnikov V. M., Yampolsky L. G., 1985).

    Dokonca aj rýchly pohľad na päť uvedených stupňov vám umožňuje uistiť sa, že prispôsobenie zahraničných testov je trochu horšie v objeme empirickej a štatistickej práce, ktorá vytvára originálne techniky. Bolo by ešte primeranejšie použiť termín "prispôsobenie", ale výrazy "štúdium cudzej techniky na domácej vzorke".

    №22 Požiadavky na psychometrický prípravok psychológa

    Pre efektívny rozvoj praktickej psychodiagnostiky dnes sa vyžaduje prudký nárast psychometrickej kultúry všetkých psychológov pomocou meracích psychodiagnostických techník. Všetci psychológovia by mali mať najjednoduchšie metódy testovania testovania a platnosti techniky.

    Až do tohto dňa, nie celkom odôvodnené oddelenie (a dokonca kontrastné) psychológovia, ktorí sa považujú za špecialistov v oblasti klinických metód a psychológovia, ktorí sa považujú za otestovať sami. Ale vo väčšine skutočných praktických situácií sa vyžaduje kombinácia týchto metód. Klinické, dialógové metódy sú potrebné v počiatočných štádiách práce v danej oblasti, aby sa psychológa podarilo vybudovať jasnú zmysluplnú predstavu o predmete psychodiagnostiky. Sú potrebné aj v osobitných kontroverzných prípadoch, ktoré si vyžadujú individuálny prístup. Ale keď je psychológ povinný vykonávať zrýchlené, masové vyšetrenia, odvolanie na niektoré štandardizované, meracie techniky sa stáva nevyhnutným. Vyžaduje psychometrickú gramotnosť pri výbere tohto druhu techník: nie je možné použiť techniky, ktoré nie sú známe, aký druh psychometrického ladenia boli vystavené.

    Univerzálna psychometrická gramotnosť psychológov nevylučuje pridelenie špecialistov z ich životného prostredia - psychometristickí psychologickí psychológovia, ktorí sa profesionálne zaoberajú psychometrickými sekrétmi. Preto sa odporúča, aby ste tu priniesli dva zoznamy. regulačné požiadavky - psychológovi a psychológovi-psychometristovi.

    Požiadavky na psychológ:

    1. Psychológ by mal byť schopný kvalifikovať na riešenie psychometrickej dokumentácie metodická literatúra Psychodiagnostický, by mal vedieť, aké psychometrické charakteristiky testu by mali uviesť svojich vývojárov, na ktoré sa tieto psychometrické charakteristiky zodpovedajú typu testu, na jednej strane a skutočnú úlohu, na ktorú je potrebné použiť na strane druhej. Napríklad v prípadoch, keď potrebujete použiť test na predikciu s významným pokrokom, ale nedostali informácie o overení prognostickej platnosti, test nie je možné považovať za pripravený na riešenie tejto úlohy.

    2. Psychológ musí správne určiť, do akej miery sú dobre známe testovacie normy týkajúce sa požadovanej metodiky platia vo svojej situácii, pričom sa zohľadnia kontingent subjektu a typu diagnostickej situácie, existuje "prevod v rámci priemyslu "Situácia a je potrebné vyriešiť testovacie normy. V prípade potreby by mal byť psychológ schopný samostatne vykonávať rebeling, budovanie a analýzu distribúcie testovacích bodov.

    3. Psychológ by mal byť schopný nezávisle zhromažďovať údaje, vykonávať korelačnú úpravu a merať empirickú účinnosť platnosti metódy s ohľadom na dané kritérium. V prípade potreby by mal byť psychológ schopný nezávisle špecifikovať operačné ukazovatele informácií o kritériách.

    4. Psychológ by mal byť schopný nezávisle určiť vznik príliš vysokých chýb vo výsledkoch, strate metodiky požadovanej úrovne spoľahlivosti, pričom kontroluje jeho hypotézu štatisticky.

    5. Psychológ je povinný vykonávať dvojitú dokumentáciu: všetky kópie protokolov by mali byť pripravené na prevod do materskej metodickej organizácie (vedecký a akademický alebo priemysel), aby doplnili celkovú dátovú banku a zlepšili psychometrické charakteristiky metodiky. Všetky úpravy vyrobené na metodike (znenie pokynov, individuálnych otázok, postupnosť prezentácie), psychológ musí koordinovať s hlavou metodickej organizácie, pretože amatérske úvod na miesta rôznych súkromných modifikácií znamená stratu psychometrickej čistoty Získaných výsledkov sa nezvyšuje a spomaľuje vytvorenie modifikácií prispôsobených špecifickým podmienkam a vlastniť potrebné psychometrické vlastnosti. Dôkladné dodržiavanie daných metodických noriem je nevyhnutným atribútom psychometrickej kultúry psychológa.

    6. Psychológ by mal byť schopný samostatne identifikovať a merať úroveň motivačných skreslení, ktoré určujú falšovanie subjektov údajov, by malo byť schopné správne odrezať nespoľahlivé protokoly, štatisticky stanoviť dosiahnutie prijateľnej úrovne spoľahlivosti pre hmotnostné výsledky Skupinová psychodiagnóza.

    7. Psychológ musí zvládnuť recepcie komplexného kvantitatívneho počítania indikátorov nepriamych testov, ako aj integrálne ukazovatele vyžadujúce agregáciu rôznych numerických informácií. Musí byť schopný dať úlohu programátora (alebo psychológ-psychometricko) na držanie výpočtov na počítači.

    Psychologický psycho meter by mal byť schopný:

    1. Plánuje sa plánovať a implementovať všetky stupne psychometrického dizajnu alebo prispôsobenie psychodiagnostických techník: kontrola spoľahlivosti a platnosti na úrovni jednotlivých testovacích položiek, skúšok nespoľahlivých a neplatných bodov, výstavby a analýzy distribúcie testovacích bodov, vypracovanie matematických rovníc na predpovedanie alebo "rozhodujúce pravidlá" na uznanie.

    2. Usporiadajte skladovanie a spracovanie psychodiagnostických údajov na počítači, vlastniť zručnosti práce na počítači v rámci štandardných operačných systémov, poznať štruktúru databáz používaných v psychodiagnostike a bude môcť spravovať databázy.

    3. Usporiadajte prácu psychológov - psychodiagnostika, aby vykonali dokumentáciu pre použité metódy, aby spĺňali metodické normy, na poznámku a integráciu výsledkov vo všeobecných bankách psychodiagnostických informácií.

    4. Udržujte metódy kartónu v rámci špecifikovanej oblasti (sektorové psychologická služba), starostlivo hierarchizujúce techniky z hľadiska psychometrickej bezpečnosti, aby sa udržali knižnicu metodických materiálov a metodické odporúčania o používaní štandardizovaných techník.

    №23 Psychodiagnostické situácie a úlohy

    Psychodiagnostické úlohy možno odlíšiť z hľadiska, kto a ako používať diagnostické údaje a aká je zodpovednosťou psychodiagnostiky pri výbere spôsobov, ako zasiahnuť v situácii skúmaných.

    · Údaje používajú riadiaci úradník pre stanovenie neočkologickej diagnózy alebo formulácie správneho rozhodnutia. Táto situácia je typická pre použitie psychodiagnostických údajov ako súčasť aktivít rôznych provízií (administratívne, certifikácia, disciplinárne). Psychológ je rozsudkom o špecifických vlastnostiach myslenia, osobnosti zamestnanca a riadenie inštitúcie rozhodne, že psychológ nenesie osobnú zodpovednosť. V tomto prípade psychológ pôsobí ako odborník, čím sa hodnotí spolu s ostatnými účastníkmi. Musí zabezpečiť, aby povaha použitia výsledkov neprekračovala požiadavky profesionálnej etiky. Na tento účel musí dokument, ktorý pripravuje psychológ pre zákazníka, musí obsahovať informácie o obmedzeniach používania výsledkov.