Педагогикалық тестің дұрыстығын анықтау ерекшеліктері. Жарамдылық әдістері. Жарамдылық коэффициенті және сенімділік, өйткені жарамдылық коэффициенті мәні жоғары болып саналады

Сенімділіктен кейін әдістердің сапасын бағалаудың негізгі критерийі - бұл жарамдылық. Техниканың дұрыстығы туралы мәселе оның сенімділігі жеткілікті болғаннан кейін ғана шешіледі, өйткені сенімсіз техника жарамсыз болуы мүмкін емес. Бірақ оның жарамдылығын білмейтін ең сенімді әдіс іс жүзінде пайдасыз.

Айта кету керек, жарамдылық мәселесі жақында ең қиын болып табылады. Осы тұжырымдаманың ең көп тамырлы анықтамасы - А. Анастаси кітабында берілген: «Тестің дұрыстығы - бұл сынақ шаралары және оның қаншалықты жақсы екенін көрсететін тұжырымдама».

Заңдылық негізінде, бұл бір жағынан, оның ішінде бір жағынан, оның құрылғанын өлшеуге жарамды, ал екіншісіне, оның тиімділігі, тиімділігі, практикалық пайдалылығы қандай екендігі туралы ақпараттан тұрады.

Жарамдылықты анықтау үшін бірыңғай жалпыға ортақ көзқарас жоқ. Жарамдылықтың қандай бағытына байланысты, зерттеуші қарастырғысы келеді және Әр түрлі әдістер дәлелі. Басқаша айтқанда, жарамдылық тұжырымдамасында оның ерекше мағынасы бар түрлерінің әртүрлі түрлері кіреді. Тексеруді тексеру әдісі шақырылады валидизация.

Алғашқы түсінігіндегі жарамдылық (әдіс оның жасалғанын өлшеуге жарамды ма) әдіснаманың мәніне байланысты, яғни I.E. Бұл өлшеу құралының ішкі дұрыстығы. Бұл тексеру шақырылады теориялық валидация.

Екінші мағынада жарамдылық (тиімділік, тиімділік, тиімділік, әдіснаманың практикалық пайдалылығы) оның мақсатына қатысты емес. ол прагматикалық тексеру.

Қорытындылай келе, біз мынаны айта аламыз:

  • - Зерттеушіні теориялық тексеруде әдістеме бойынша өлшенетін мүлік (салу) мүдделі. Бұл іс жүзінде дегенді білдіреді психологиялық тексеру
  • - Прагматикалық тексерумен өлшеу объектісінің мәні (психологиялық қасиеттері) көрінбейді. Әдістемен өлшенген «бір нәрсе» белгілі бір тәжірибемен байланысқанын дәлелдеуге арналған.

Теориялық тексерудің теориялық тексеруі оның құрылымдық негіздемесін тексеру арқылы жүзеге асырылады. Құрылымдық жарамдылық, кронбах 1955 жылы қайта жабдықталған, 1955 жылы теориялық негізделетін осындай мүмкіндікті өлшеу әдістемесімен сипатталады (AS) теориялық құрылыс). Тиісті прагматикалық критерийді табу қиын болған кезде, өлшенген мүлік туралы теориялық болжамдар негізінде тұжырымдалған гипотезалар бағытын таңдауға болады. Бұл гипотезалардың растауы әдістеменің теориялық негізділігін көрсетеді. Алдымен, мүмкіндігінше қажет, бұл құрылысты сипаттау, ол жоспарланған өлшемді сипаттайды. Бұған бұл туралы гипотезаларды қалыптастыру арқылы, бұл құрылыстағы нұсқамалар, және олай болмауы керек. Осыдан кейін бұл гипотеза тексеріледі. Бұл әдіс жеке сауалнаманы тексеру үшін тиімді, өйткені олардың жарамдылығының бір критерийі құрылғаннан бері қиын.

Интеллект, тұлға ерекшеліктері, мотивтер, қондырғылар және т.б. құрылыс бола алады. Диагностикалық өлшеулердің нәтижелері іс-әрекетті болжау үшін ғана емес, сонымен қатар пәндер белгілі бір психологиялық сипаттамасы бар тұжырымдар үшін сындарлы жарамдылықты қалыптастыру қажет болған жағдайда қажет. Сонымен бірге, өлшенген психологиялық сипаттаманы кез-келген байқалған мінез-құлықтың мүмкіндігінен анықтауға болмайды, бірақ теориялық тұжырымдама. Құрылымдық негіздеме сыртқы жарамдылық критерийлері анықталмаған түбегейлі жаңа әдістерді әзірлеуде маңызды.

Осылайша, ұстап тұру Әдістеменің теориялық тексеруі - бұл оның құрылымдық дұрыстығын дәлелдейді, яғни. Техника зерттеушіні зерттеуге сәйкес бірдей құрылысты (мүлік, сапа) өлшейтінін анықтау үшін. Сонымен, егер балалардың психикалық дамуын диагностикалау үшін сынақ әзірленсе, оның басқа да басқа да ерекшеліктерді емес, бұл дамуды шынымен өлшейтін-шынымен де, оны талап ету қажет (мысалы, тұлға, сипат және т.б.). Сондықтан, теориялық тексеру үшін, түбегейлі проблема - бұл психологиялық құбылыстар мен олардың индикаторлары арасындағы байланыс, олар арқылы олардың индикаторлары, олар арқылы олар білуге \u200b\u200bтырысады. Мұндай тексеру автордың идеясы мен әдістеменің нәтижелері қаншалықты сәйкес келеді.

Көбінесе техниканың құрылымдық дұрыстығы ол арқылы анықталады Ішкі консистенция сонымен қатар жүгенбе және кемсітушіліктің жарамдылығы. Құрылымдық дұрыстығын анықтаудың тағы бір тәсілі факторлық талдау.

Ішкі консистенция Әдістеменің материалын құрайтын міндеттердің, сұрақтардың негізгі бағыты бойынша бағаланған сұрақтардың қандай-да маңызды бағыттарға бағаланады, сол құбылысты зерттеуге бағытталған. Ішкі консистенцияны талдау әдістеменің жалпы нәтижесімен әр тапсырмаға корреляциялық жауаптармен жүзеге асырылады. Сонымен, егер тест, егер тест өзінің ортақ баллымен айтарлықтай арақатынас көрсеткен міндеттерден тұрса, олар тестке ішкі консистенцияға ие, өйткені оның барлық міндеттері сынақтан ұсынылған құрылысқа бағынады.

Сондай-ақ, ішкі консистенциясы критерийі сонымен қатар техниканың жалпы әдісі мен оның жеке бөліктерін орындау нәтижелері арасындағы корреляция болып табылады. Заманауи салынатын сынақтар, мұнда барлау әрекет етеді, әрқашан жеке сынақ субтестен тұрады (мысалы, мысалы, ақпарат, мысалы, ақпарат, аналогтар, аналогтар, жіктеу, жіктеу, қорытынды), нәтижесінде жалпы сынақ нүктесі пайда болады. Әрбір субтастин мен жалпы баллдың нәтижелері арасындағы маңызды корреляциялар бүкіл тестілеудің ішкі консистенциясын көрсетеді.

Сонымен қатар, қарама-қайшы топтар ішкі консистенцияны дәлелдеу үшін қолданылады, олар ең жоғары және ең төменгі нәтиже көрсетті. Жоғары нәтижелері бар топтың тәртібі төмен нәтижелері бар және егер бірінші топ екінші топ екінші топқа қарағанда екінші топқа қарағанда жақсы болса, техника ішкі дәйекті деп танылса.

A. Анастаси атап өткендей, техниканың ішкі дәйектілігі критерийі оның біртектілігінің маңызды шарасы болып табылады. Бұл көрсеткіш, өйткені бұл индикатор мінез-құлық пен мүліктің аймағын сипаттауға көмектеседі, оның біртұтас бөлігі, оның біртектілігі дәрежесі құрылымдық әрекет етуге байланысты. Әрине, бұл оның іс-шаралары туралы айтуға болатын кішкентай нәрсе техникасының ішкі консистенциясы. Алайда, техниканың мұқият дамыған теориялық негіздер болған кезде, нақты ақылға қонымды ғылыми база, бұл процедура оның психологиялық мәні туралы теориялық идеяларды күшейтеді.

Құрылымдық заңдылықты анықтаудың тағы бір тәсілі бір-біріне қарама-қарсы екі индикаторға арналған әдісті бағалауды қамтиды. Валидленген техниканың индикаторларын бір жағынан, бір жағынан, теориялық құрылғылар, ал екіншісінде, басқа теориялық негізі бар әдістермен салыстыру маңызды. Бұл үшін ұсынылған Д. Т. Кэмпбелл және Д.В. Фижке конвергентті және кемсітетін жарамдылығын бағалау тәртібі.

Конвергентті жарамдылық (лат. - бір орталықтан, түрлендіру, түрлендіру) осы әдістің ұқсастығы (изоморфизм - гомоморизм) туралы қорытынды (әдістер, тест, шаралар) (техникалар, тест, шаралар), сол мақсаттарға арналған (конвергент, соған ұқсас). Ол диагностикалық көрсеткіштердің статистикалық тәуелділігінің талабында, егер олар жеке адамның тұжырымдамалық психикалық қасиеттерін өлшеуге бағытталған болса.

Кемсітушіліктің жарамдылығы (лат. - айырмашылық, айырмашылық) - бұл бір әдістің (техникасы, сынағы, шаралары) арасындағы айырмашылық туралы қорытынды, ал екіншісінен біріншісінен ерекшеленеді. Ол тұжырымдамалық тәуелсіз қасиеттерді көрсететін диагностикалық көрсеткіштер арасында статистикалық тәуелділік болмаған жағдайда көрінеді.

Конвергентті және кемсітсіз жарамдылық - бұл түрлер критерийлердің жарамдылық мерзімі. Бұл санатқа бағалау, бағалау, салыстыру критерийі болып табылатын тәуелсіз мүмкіндікті пайдаланып, кез-келген жарамдылық түрлері кіреді.

Сонымен, конвергентті және дискриминациялық жарамдылықты бағалау тәртібі - бір уақытта өлшенген психологиялық құбылыстардағы ұқсастықтар мен айырмашылықтарды құру. жаңа әдістеме, бұрыннан белгілі әдістермен. Бұл арнайы аккумуляторды қолдануды қамтиды, олар басқарумен және PEI-мен байланысты емес әдістерге сәйкес келетін әдістермен үйлескен. Эксперимент жүргізуші алдын-ала болжай алуы керек, олар қандай әдістер тексеріледі және қандай әдістер аз болатын корреляциялар. Осыған сәйкес конвергентті жарамдылық бар (тікелей немесе кері байланыстың жақындық дәрежесін тексеру) және дискриминациялық жарамдылық (байланыс болмауы). Дәлелдендірілген, бірақ болжамдар жасалған, бірақ конверттелген, және корреляцияланбаған, бірақ сәйкес емес - дискриминант деп аталады.

Теориялық тұрғыдан күтілетін сілтемелер жиынтығын растау - құрылымдық жарамдылық туралы ақпараттың маңызды шеңбері. Ағылшын тілінде сөйлеу психодиагнозында құрылымдық әрекет етудің мұндай жеделдігі көрсетілгендей көрсетілген бағаланған жарамдылық (болжанған жарамдылық).

Деп конструмент әдісіне ұқсас және ұқсас құрылымның болуы, бұрын дәлелденген, дәлелденген техниканың анықтамалық техникамен бірдей психологиялық сапа туралы «шараларды» көрсететінін көрсетеді. Егер жаңа әдіс бір уақытта бір уақытта ықшамдық және үнемді болып қалса, нәтижелерді жүргізу және өңдеу бойынша үнемді болып қалса, онда психодиагноздар ескідің орнына жаңа құралды қолдана алады. Бұл әдіс әсіресе негізгі қасиеттердің диагностикалық әдістерін құру кезінде әсіресе дифференциалды психофизиологияда жиі қолданылады. жүйке жүйесі адам. Құрылымдық жарамдылықты анықтау тәртібіндегі ерекше орын алады фактивті талдау (фактордың жарамдылығы). Бұл сізге зерттелген техникалар сілтемелерінің құрылымын қатаң талдауға, олардың факторлардың құрамы мен факторларының факторларының, жасырын белгілер мен олардың қарым-қатынасының ішкі заңдарын анықтауға мүмкіндік береді.

Осылайша, әдістемені теориялық тексеруде диагноз қойылған құрылғы туралы ақпараттың жинақталуына ықпал ететін түрлі тәжірибелік процедураларды қолдану қажет. Егер бұл мәліметтер болжамды растаса, онда әдістемелерге негізделген психологиялық тұжырымдаманы растайтын, және әдістеменің осы тұжырымдаманы өлшеу құралы болу мүмкіндігі. Сенімді растаудан гөрі, оның негізіне негізделген психологиялық тұжырымдамаға қатысты әдістеменің дұрыстығы туралы неғұрлым белгілі болуы мүмкін.

Маңызды рөл - техниканың шаралары оның көрсеткіштерін қызметтің практикалық түрлерімен салыстыруды ойнайды. Бірақ мұнда әдістеме теориялық жоспарда мұқият ойластырылғаны өте маңызды, Қатты, ақылға қонымды ғылыми база болуы керек. Содан кейін, әдістерді күнделікті тәжірибемен салыстырғанда, оның мәні бойынша теориялық идеяларды қолдайтын ақпаратқа сәйкес келетін сыртқы критерийді салыстыруға болады.

Егер теориялық жарамдылық дәлелденген болса, алынған индикаторларды түсіндіру айқын және теңгерімсіз болып, техниканың атауы оны қолдану аясына сәйкес келеді.

Қатысты прагматикалық тексеру, бұл техниканы тексеруді оның практикалық тиімділігі, маңыздылығы, пайдалылығы тұрғысынан, өйткені диагностикалық техника өлшенген мүліктің белгілі бір көрінгені дәлелденген кезде ғана қолдануға болатындығын білдіреді Өмірлік жағдайлар, белгілі бір іс-шараларда. Оған өте маңызды, әсіресе таңдау сұрақтары туындайды.

Егер сіз тестілеудің даму тарихына кіріссеңіз, онда осы кезеңді (1920-1930 жылдар) бөлуге болады, олар сынақтардың ғылыми мазмұны және олардың теориялық «багаж» аз дәрежеде болған кезде. Сынақ жұмыс істегені маңызды болды, ең көп дайындалған адамдарды тез таңдауға көмектесті. Эмпирикалық бағалау критерийі тест тапсырмалары Бұл ғылыми және қолданбалы тапсырмаларды шешудегі жалғыз нақты нұсқаулық болып саналды.

Диагностикалық әдістерді таза эмпирикалық негіздемесі бар, ерекше теориялық негізсіз қолдану көбінесе жалған практикалық ұсыныстарға әкелді, негізсіз практикалық ұсыныстарға әкелді. Бұл белгілерді, мысалы, анықталған қасиеттерді, мысалы, сынақтарды атау мүмкін болмады. Б.М. Бұл кезеңдегі жылу, талдау сынақтарын «соқыр үлгілер» деп атады.

Жарамдылық техникасы проблемасына осындай көзқарас 1950 жылдардың басында тән болды. Тек Америка Құрама Штаттары үшін ғана емес, сонымен бірге басқа елдер үшін де. Теориялық әлсіздік эмпирикалық әдістер Тексеру көмектесе алмады, бірақ «жалаңаш» эмпирикке және практикаға ғана емес, сонымен қатар теориялық тұжырымдамаларға қатысты әдістердің дамуына сендіре алмады. Теориясыз жаттығулар, сіз білесіздер, соқырлар, және практикасыз теория өлді. Қазіргі уақытта прагматикалық бағалау тексеру әдістері ең нәтижелі ретінде қабылданады.

Техниканы прагматикалық тексеру жүргізу үшін, I.E. Оның тиімділігін, тиімділігін, практикалық маңыздылығын бағалау, әдетте, тәуелсіз қолданылады сыртқы критерий - нақты тәжірибенің тікелей мәні бар индикатор. Мұндай өлшем орындалуы мүмкін (оқу қабілеті, жетістіктер, жетістіктер, интеллектуалдық сынақтар), өндірістік жетістіктер (кәсіби бағдар беру әдістері үшін), ал нақты белсенділіктің тиімділігі, сурет салу, модельдеу және т.б. (ерекше қабілеттерге арналған) және субъективті бағалау (жеке тест үшін).

Американдық зерттеушілер Д. Тиффин және Е.Маккормик, сыртқы өлшемдердің дұрыстығын дәлелдеу үшін қолданылатын сыртқы өлшемдер бойынша талдау жүргізу, олардың төртеуі:

  • 1) орындау критерийлері (олардың нөмірі бойынша олар орындалатын, орындау, оқу уақыты, біліктілікті арттыру, біліктілік деңгейі және т.б.) болуы мүмкін;
  • 2) субъективті критерийлер (олар кіреді әр түрлі түрлері Адамның кез-келген адамға немесе біреуге деген көзқарасын, оның пікірі, көзқарастары, қалауы бойынша жауаптар; Әдетте, субъективті критерийлер сұхбаттар, сауалнамалар, сауалнамалар арқылы алынады);
  • 3) физиологиялық критерийлер (олар қоршаған ортаның және басқа жағдайлық айнымалылардың әсерін зерттеуде қолданылады; импульстің таралуы, қан қысымы, қан қысымы, терінің электр тұрақтылығы, шаршау белгілері және т.б. );
  • 4) Экипналық критерийлер (зерттеудің мақсаты болған кезде қолданылады, мысалы, жазатайым оқиғаларға аз сезімтал болған адамдарға іріктеу мәселесі).

Сыртқы критерий үш негізгі талаптарға сай болуы керек: ол өзекті, кедергісіз, кедергіден (ластанудан) және сенімді болуы керек.

Астында дәл түсінік бұл диагностикалық құрттың семантикалық сәйкестігін тәуелсіз өмірлік маңызды критериймен білдіреді. Басқаша айтқанда, бұл критерийлерде, олар өлшенетін және диагностикалық әдістеме критерийлеріне сенімді болуы керек. Сыртқы критерий және диагностикалық әдістеме ішкі мағынада болуы керек, психологиялық ұйымда сапалы түрде біртіндеп болуы керек. Мысалы, сынақ ойлаудың жеке сипаттамаларын, белгілі бір объектілермен логикалық әрекеттерді, ұғымдармен логикалық әрекеттерді орындау қабілеті, концепциялар, содан кейін осы дағдылардың көрінісін іздеу керек. Ол бірдей қолданылады кәсіби қызмет. Оның әрқайсысы жоқ, бірақ бірнеше мақсаттар, міндеттер, олардың әрқайсысы нақты және оны жүзеге асыру үшін жағдайларын ұсынады. Бұл кәсіби қызмет үшін бірнеше критерийлердің барын білдіреді. Сондықтан, диагностикалық әдістердің жетістігін тұтастай өндіріс тиімділігімен салыстырмауы керек. Әдістемасымен байланысқан операциялардың сипаты бойынша осындай критерийді табу қажет.

Егер салыстырмалы түрде сыртқы критерий болса, ол белгісіз, оны мүлікпен өлшейді, жоқ па, онымен салыстыру психодиагностикалық техниканың нәтижелері пайдасыз болады. Бұл техниканың дұрыстығына баға бере алатын кез келген қорытындыға келуге мүмкіндік бермейді.

Талаптар кедергіден (ластану) бостандығы олар, мысалы, білім беру немесе өндіріс жетістіктері екі айнымалыға байланысты: адамнан, оның жеке сипаттамаларына, оның жеке сипаттамалары, оның жеке сипаттамалары, оның жеке сипаттамалары, оқу, оқу шарттары, жұмыс күші, еңбегінің шарттары, « Ластану «Қолданылған өлшем. Бұған жол бермеу үшін, одан да аз немесе аз адамдарға арналған адамдардың мұндай топтарын зерттеу үшін таңдау керек. Сіз басқа әдісті қолдана аласыз. Ол кедергілердің әсерін түзетуден тұрады. Бұл түзету әдетте статистикалық. Осылайша, қойылым абсолютті құндылықтарда, және ұқсас шарттарда жұмыс істейтін жұмысшылардың орташа жұмысына қатысты қабылдау керек.

Олар критерийдің статистикалық тұрғыдан сенімді болуы керек дейді сенімділік, бұл дегеніміз, бұл оның тұрақтылығы мен жұмыс функциясының тұрақтылығын көрсетуі керек дегенді білдіреді.

Тиісті және оңай анықталған критерийлер тексеріліп, тексерудің маңызды және күрделі тапсырмаларына қатысты. Батыс тестілеу кезінде көптеген техникалар дисквалификацияланады, өйткені оларды тексеру үшін қолайлы критерийді табу мүмкін болмады. Мысалы, олардың жарамдылығы туралы мәліметтердің көп бөлігі күмәнді, өйткені олар өлшейтін тиісті сыртқы критерийді табу қиын.

Прагматикалық жарамдылық әдістерін бағалау сандық және сапалы болуы мүмкін.

Есептеу үшін сандық индикатор - жарамдылық коэффициенті - Диагностикалық әдісті қолдану кезінде алынған нәтижелер, сыртқы өлшемнен алынған мәліметтер, сол адамдар. Сызықтық корреляцияның әр түрлі түрлері қолданылады (алкоголь, кутер).

Жарамдылық мерзімін есептеу үшін қанша пән қажет? Тәжірибе көрсеткендей, олар 50-ден кем болмауы керек екенін көрсетті, бірақ бұл 200-ден көп нәрсе. Бұл көбінесе сұрақ туындайды, жарамдылық факторының мөлшері қандай болуы керек? Жалпы, жеткілікті жарамдылық факторы статистикалық тұрғыдан маңызды екендігі атап өтілді. Төмен деңгейдің төмендігі шамамен 0,20 0.30, орташа - 0.30- 0.30 және жоғары деңгейде таниды - 0,60-тан асады.

Бірақ А. Анастаси мен К.М. Гурьевич және басқа авторлар сияқты, басқа авторлар әрдайым жарамдылық факторын есептеуге бола бермейді, сызықты корреляцияны қолдану заңды. Бұл әдіс қандай-да бір әрекетке жетістікке жеткені дәлелденген жағдайда, диагностикалық әдісті орындаудағы сәттілікке тікелей пропорционал болып табылады. Шетелдік тестологтардың позициясы, әсіресе кәсіби және сауда корпорациясымен айналысатындар, көбінесе кәсібі кәсібі сынақтан өткен тапсырмаларды орындағаны үшін қолайлы деп санайды. Бірақ сіз іс-шаралардағы жетістіктер үшін сізге сынақ ерітіндісінің 40% деңгейінде мүлік болуы керек. Тесттегі одан әрі табыстар енді мамандық үшін маңызды емес. Монографияның жақсы мысалы К.М. Гурьевич: Пошта оқушысы оқи алады, бірақ ол қалыпты жылдамдықпен немесе өте жоғары жылдамдықпен оқиды ма, жоқ па, ол бұдан былай еңбекке толмайды ма? Әдістеме және сыртқы критерий индикаторларының осы арақатынасымен, жарамдылықты орнатудың жеткілікті әдісі, айырмашылық критерийі болуы мүмкін.

Шетелдік сынақтардың тәжірибесі көрсеткендей, жеке бағалаудың әртүрлілігін толық көрсете алмады. Сондықтан, көбінесе жарамдылық техникасының дәлелі үшін басқа модельді - клиникалық бағалауды қолданады. Бұл ештеңе емес сапа зерттелген мүліктің сипаттамасы. Бұл жағдайда біз статистикалық өңдеуге сенбейтін әдістерді қолдану туралы айтып отырмыз.

Қазіргі психометрияларда, олардың ерекшеліктерінен туындаған диагностикалық әдістердің дұрыстығын тексерудің әртүрлі тәсілдері, сонымен қатар сыртқы өлшемнің уақытша мәртебесі жасалады. Алайда, жиі келесі әдістер деп аталады.

  • 1. Меншік жарамдылығы бұл техниканың сарапшылар бойынша жарамды екенін білдіреді. Бұл әдіс, мысалы, жетістіктер сынақтарында қолданылады. Әдетте, жетістіктер сынақтарында студенттерден өткен барлық материалдар, ал оның кейбір бөлігі (3-4 сұрақ) кірмейді. Осы бірнеше сұрақтарға дұрыс жауаптар бүкіл материалды игеруді көрсетеді деп сендіре ме? Бұл тексерудің қолданылуын тексеруден өтуі керек. Ол үшін тестілеуді мұғалімдердің сараптамалық бағалауымен салыстыру (осы материалға сәйкес) жүзеге асырылады. Мазмұнның дұрыстығы сонымен қатар өлшемдерге бағытталған тесттерге сәйкес келеді, өйткені олар сараптамалық әдістерді қолданады. Емтихан нысаны нақты - сынақ мазмұны. Сарапшылар сынақ тапсырмаларының мазмұнын психикалық меншікті сақтау бойынша бағалауы керек, тексерілген тест мазмұны ретінде мәлімдейді. Осы мақсатта мамандар сынақ және тапсырмалар тізіміне сәйкес келеді. Егер нақты тапсырма сипаттамаға толық сәйкес келсе, сарапшы оны сынақ мазмұнына сәйкес білдіреді. Кейде бұл әдіс логикалық жарамдылық деп аталады немесе «анықтаудың дұрыстығы» деп аталады. .
  • 2. «Бір уақытта» жарамдылығы, немесе ағымдағы жарамдылық, ол ақпараттың сынақ әдісі бойынша тәжірибелермен бір уақытта жиналатын сыртқы өлшемді пайдалану анықталады. Басқаша айтқанда, қазір мәліметтер: сынақ мерзімі ішінде орындау, сол кезеңдегі қойылым және т.б. Олар тестілеудегі жетістік нәтижелерін салыстырады.
  • 3. «Болжалды» жарамдылық (Басқа атауы - «Болжам» жарамдылығы). Сондай-ақ, ол сыртқы өлшеммен анықталады, бірақ ол туралы ақпарат тестілеуден кейін біраз уақыт жиналады. Бұл әдіс диагностикалық әдістердің міндетіне сәйкес келеді - болашақ жетістікке жету, оны қолдану өте қиын. Диагностика дәлдігі уақытқа байланысты, ол осындай болжам үшін көрсетілген уақытқа байланысты. Өлшеуден кейін көбірек уақыт өткен сайын, техниканың болжамды құнын бағалау кезінде факторлардың санын ескеру қажет. Алайда, болжамға әсер ететін барлық факторларды ескеру мүмкін емес.
  • 4. «Ретроспективті» жарамдылық. Ол өткен жағдайдағы оқиғаны немесе сапа жағдайын көрсететін өлшем негізінде анықталады. Оны техниканың болжамды мүмкіндіктері туралы жылдам алу үшін пайдалануға болады. Осылайша, қабілеттілік тестінің сынақ нәтижелерінің мөлшерін тексеру жылдам оқыту, өткен ауырлық қабілеттілігін, өткен сарапшылардың пікірлерін және т.б. салыстыруға болады. Қазіргі уақытта жоғары және төмен диагностикалық көрсеткіштері бар адамдарда.

Дамыған техниканың дұрыстығы туралы мәліметтерді енгізген кезде, қандай-да бір жарамдылықтың қандай түрін дәл көрсету керек (мазмұн бойынша, сонымен қатар т.б.). Сондай-ақ, валидация жүргізілген адамдардың саны мен ерекшеліктерін хабарлаған жөн. Мұндай ақпарат психологқа психологқа оны қабылдауға болатын топқа қанша қабылдау туралы шешім қабылдауға мүмкіндік береді. Сенімділік жағдайында болғандықтан, бір үлгіде техниканың жоғары дұрыстығы болуы мүмкін, ал екіншісінде - төмен. Сондықтан, егер зерттеуші техниканы пәндердің үлгісіндегі қолдануды жоспарлап отырса, валидацияны тексеру жүргізілді, оған айтарлықтай ерекшеленеді, оған мұндай тексеруді қайта қарау қажет. Нұсқаулықта келтірілген жарамдылық коэффициенті ол анықталғандарға ұқсас пәндер топтарына ғана қолданылады.

Анастаси А.Психологиялық тестілеу: 2 тоннада, 1982 ж.
  • Гуревич К.М.Жарлық. op.
  • Анастаси А.Психологиялық тестілеу: 2 тонна. М., 1982; Бурлачук Л. Ф., Морозов С. М.Сөздік кітап, бірақ психологиялық диагноз. Киев. 1989 ж.; Гуревич К.М.Жарлық. ОП.; Жалпы психодиагностика / ed. Л. Бодалева, В. В. Капитал.
  • 1. Анықтама. Негізгі психометриялық теңсіздік

    Сынақ матчы өлшенген психикалық меншікті мүлік деп атайды тестіңіздің жарамдылығы. Жарамдылық - тесттің маңызды психометриялық қасиеті. Егер жоғары сенімділік тестілеуді шынымен бір нәрсені өлшей алса, онда жоғары дұрыстығы сынақ тестілеу біз өлшей алатын нәрсені дәл өлшейтінін білдіреді. Әрине, кездейсоқ факторлар қамырдың дұрыстығына теріс әсер етеді. Сондықтан психометриялық мынадай психометриялық теңсіздік қабылданады:


    Жарамдылық? Сенімділік,

    бұл дегеніміз, жарамдылық тестдің сенімділігінен аспауы керек.

    Бірақ сенімділіктен айырмашылығы, кездейсоқ факторлардан басқа, жүйелі факторлар сынақтың дұрыстығына әсер етеді. Олар нәтижелерге жүйелі бұрмаланулар әкеледі. Бұл факторлардың басқа психикалық қасиеттері бар, олар тест сынағының нәтижелеріне кедергі келтіреді, оны өлшеуге бағытталған өлшеуге бағытталған.

    Мәселен, біз тыңдаушының әлеуетін өлшеп қана қойғымыз келеді (адамның жалпы зияткерлік қабілеттерінің маңызды құрамдас бөлігі). Егер біз сынақ тестілеу уақыты және қабылданған қатені қайтару және түзету мүмкіндігі болмаса, қабылданған қатені түзететін болсақ, қажетті ақыл-ой меншіктің жалған ақыл-ой меншігімен араласатыны анық, стресске төзімділік: стресске төзімділік тестілеу жақсы болады. Бұл жүйелі бұрмаланудың әсерін көрсетеді.

    Заманауи психометриялық жағдайда ондаған түрлі теориялық және тәжірибелік тестілеуден тексерілген сынақтардың сынақ сынақтары жасалды. Осы әдістердің барлығының негізгі элементі деп аталатын критерий болып табылады. Жарамдылық критерийі - Бұл өлшеуге тәуелді емес, өлшенген мүлік туралы ақпарат көзіне сыртқы емес. Біз оның нәтижесін оның нәтижелерін ол өлшенген мүлік туралы шынайы (немесе біле тұра тексерілген) ақпарат көзімен салыстырғанға дейін бағалай алмаймыз - критериймен.

    2. Жарамдылық критерийлерінің түрлері

    Ғылыми зерттеулерде арнайы зертханалық критерийлер басым. Мысалы, ықшам сынақ анкетасы мазасыздыққа арналған. Жарамдылық критерийі ретінде арнайы уақытты қажет ететін объективті зертханалық эксперимент қолданылады, оларда алаңдаушылық жағдайының нақты жағдайы көбейеді (тест-еріктілер ағымдағы соққылардың қателіктеріне қауіп төндіреді және т.б.).

    Іс жүзінде прагматикалық критерийлер практикада қолданылады, прагматикалық критерийлер жарамдылық критерийлері ретінде қолданылады - бұл болжамның тиімділігінің көрсеткіштері, ол үшін тестілеу қарастырылған.

    Сараптамалық бағалау жарамдылық критерийі ретінде қолданылады. Мысалы, біз тәртіптілік деңгейінің қысқаша сынағы тексерілгеніне көз жеткізгіміз келеді. Ол үшін мұғалімдердің сауалнамасы танымал студенттердің пән деңгейі туралы жүргізілуде. Осыдан кейін тест нәтижелері және пәндер пәндерінің сараптамалық рейтингі салыстырылады.

    Осы соңғы мысалда тұрайық. Мұнда бізде эмпирикалық (статистикалық) жарамдылығын өлшеудің қарапайым және ең танымал әдістерінің бірі бар. Бұл әйгілі топтардың әдісі. Субъектілер тестілеудің дұрыстығын тексеру үшін психометриялық экспериментке қатысуға шақырылады, олар олар қандай топқа қатысты, олар олар айтады. Пәнді сынақтан өткізген жағдайда, студенттер таңдалады, анық, атап айтқанда, мұғалімдердің сараптамалық бағалауы бойынша (жоғары топ) және анық түсіндірілмеген (төмен топ) (төмен топ). Тестілеу критерийлері бойынша орташа көрсеткіштері бар оқушылар қатыспайды.

    Сынақтан кейін, мысалы, тест пен өлшем арасындағы қарапайым корреляцияны есептейді (1-кесте).

    Кесте 1Тест және критерий арасындағы қарапайым корреляцияны есептеу

    Осы кестедегі «А» элементі - тестілеуден жоғары топқа және критерийлерге, «В» элементі - тестілеу бойынша жоғары топтағы пәндер саны, бірақ төмен топта критерий бойынша және т.б.

    Сынақтың сынақ қабілеттілігі, «В» және «C» кестелерінің элементтері нөлдік болуы керек, яғни сынақ қателіктер бермеуі керек (егер мұғалімдер оқушының айтуынша, студенттердің айтуынша, сөйлесуі керек) «« Бастапқы »ісі).

    3. Жарамдылық критерийінің математикалық көрінісі (Гилфорд коэффициенті)

    Тест үстіндегі төтенше топтар арасындағы сәйкестік (корреляция) арасындағы сәйкестік (корреляция) сәйкес келеді және критерийге сәйкес ГИЛФОРНЫҢ ҚҰРЫЛЫСЫ:

    Тексерілген 30 адамнан тұратын топтың санымен (бұл тексеру үшін ең төменгі үлгі), тест статистикалық маңызды сынақ, критерийлермен тестілеудің статистикалық маңызды сынағы - PH 1? 0.36. Бұл өте төмен жарамдылық, бірақ бұл жағдайда әлі де сынақ айтарлықтай береді Үздік ұпайларкездейсоқ сәттілікке қарағанда.

    Алайда әйгілі топтардың әдісі өте кемшілігі бар. Бұл әрқашан болжам үшін тест қолдануға бола бермейді. Бұрын танымал топтардың қалыптасуында, бұрын болған мінез-құлық бағаланып, болашақта болатын мінез-құлыққа тест тапқымыз келеді. Білім беру психодиагнозында қолданылатын көптеген сынақтарда белгілі бір кемшілік бар. Олар белгілі топтар әдісіне сәйкес ең жақсы тестілеуден өтеді және болжамдық негіздемеге ие емес (немесе бұл жарамдылық қатаң тәжірибелік дәлелденген).

    4. Психодиагностикалық әдістердің негізгі тексеру схемалары

    Тек ірі ғылыми-әдістемелік орталықтар үшін болжамдық негіздеме мәселесін шешу. Бәрінен бұрын, болжамды дұрыстығын тексеру бойынша психометриялық зерттеуге, 30-дан емес, кем дегенде 300-ге дейін, кем дегенде 300 рет, өйткені ол белгісіз, өйткені бұл 300-сі экстремалды топтарға түседі.

    Мәселен, біз мектеп оқушыларының университетте оқуға дайындығын болжау үшін қолданғымыз келеді. Бұл әдеттегі болжамдық психодиагностикалық тапсырма. Біреу осы тестілеудің болжамды әлеуетін тексеру үшін қиын ұзақ мерзімді бағдарламаны алуы керек. 300-500 оқушыларын сынап, содан кейін күтіңіз, олардың қайсысы университетке барады және онда сәтті үйренеді. Екі жылдық интервалдан кейін критерийлер топтарын құруға және бұрынғы мектеп оқушыларының алдыңғы сынақ көрсеткіштерімен корреляцияны есептеуге болады. Тек психометриялық эксперименттің схемасын іске асырғаннан кейін ғана тест болжамды жарамдылығына тексерілгеннен кейін. Онсыз біз тест әзірлеушісінің ғылыми түйсікіне деген сенімнен береміз және тестілеуді болжауға болатын тәуелсіз дәлелдер жоқ.

    Кәдімгі арзан тестілеуді тексеру схемасын (белгілі топтарға сәйкес) және қымбат болжамды тексеру схемасын анықтауға арналған - ең маңызды элемент Психодиагностикалық сауаттылық тек психологтар үшін ғана емес, сонымен қатар психодиагностикалық ақпараттың кез-келген клиенттері үшін де, сонымен қатар мұғалімдер үшін де.

    Өлшеу коэффициенті.Жарамдылық факторы тест индикаторы мен өлшемнің өлшемі арасындағы корреляциялық құндылықты білдіреді. Бұл коэффициент сізге жарамдылықты бірыңғай сандық индикатормен сипаттауға мүмкіндік береді, сондықтан ол жиі қолданылатын критерийлердің әрқайсысы үшін тестілеуге арналған нұсқаулықтарда беріледі. Жарамдылық факторы есептелген деректер күтілген нәтижелер кестесі немесе күтілетін түсім кестесі түрінде ұсынылуы мүмкін (3 тарау). Шын мәнінде, мұндай кестелер мен диаграммалар - бұл дұрыстығы факторы сынаққа арналған көрнекі суреттер болып табылады. Еске салайық, күтілетін нәтижелердің кестелері осы тест бойынша белгілі бір индикаторға ие болған белгілі бір критерийлік белсенділіктің белгілі бір деңгейіне қол жеткізу ықтималдығы беріледі. Мысалы, кестені пайдалану. 3-6, студенттерді әртүрлі қабілеттердің дифференциалды сынақтарының батареясынан сандық пайымдауды сынақтан өткізуді біле отырып (Дат),сіз 7-сыныпта бір немесе басқа математиканы бағалау ықтималдығын анықтай аласыз. Дәл осы мәліметтер үшін жарамдылық коэффициенті - 0,60. Егер, жоғарыдағы мысалдағыдай, сынақ және критерийлер айнымалылары үздіксіз, содан кейін Пирсон жұмысының корреляция коэффициенті бізге қолданыла бастады. Егер бастапқы деректер басқа нысанда көрсетілсе (дайаля, Dichotom »критерийін қолданғанда, орындалды, орындалмаған, орындалмаған» - 3-7 суретті қараңыз), корреляциялық коэффициенттердің басқа түрлері есептеледі. Тиісті есептеу процедураларын статистика бойынша кез-келген Type оқулығынан табуға болады.

    Жарамдылық коэффициенттерінің мәніне әсер ететін жағдайлар.Сенімділік жағдайындағыдай, дәл анықтау маңызды топтық таңбаол сынақтың жарамдылық факторын есептейді. Дәл осындай тест әр түрлі функцияларды өлшей алады, егер ол әр түрлі жастағы адамдар, білім деңгейі, сыныптар, сыныптар және т.б., әр түрлі өмірлік, білім беру және кәсіби тәжірибесі бар адамдар, мысалы, әр түрлі әдістермен, әр түрлі әдістерді пайдалана алады бір және бірдей тест тапсырмасы. Демек, тест бір популяцияда берілген критерийдің жоғары дұрыстығына ие болуы мүмкін және төмен немесе нөлдік жарамдылық болуы мүмкін - басқасында. Немесе, екі популяцияда әр түрлі функциялардың жарамды шарасы болуын айтайық. Сондықтан, әртүрлі популяциялармен жұмыс істеуге арналған тесттерге арналған техникалық нұсқауларда, Пионерлерді жалпылау ™ туралы тиісті мәліметтер берілуі керек. («Тұқымдар».Сонымен қатар, тест индикаторларының айтарлықтай өзгеруі болған кезде «!, Сынақ негізділігі факторы индикаторлар диапазонының әр түрлі бөліктерінде айтарлықтай өзгеше болуы мүмкін және тиісті кіші топтарда (Р. Ли, Фоли, 1986) тексеру керек.



    Сұрау жалғыз гетерогендікбұл сенімділікті өлшеу үшін бірдей мәнге ие, өйткені екеуі де сипаттамалық коэффициенттер түрінде беріледі. Еске сала кетейік, басқа заттармен бірдей болғандықтан, индикаторларды таратудың кең ауқымы, соғұрлым арақатырақ болады. Бұл жағдайды сынақтарда өткізуге әкелетін жарамдылық факторларын түсіндіру кезінде бұл жағдайды ескеру қажет.

    Тексерудің көптеген үлгілеріне тән нақты проблема байланысты алдекция.Мысалы, кәсіби мақсаттар үшін тексерілген жаңа тест,

    2-бөлім.

    оны жақында жалданған қызметкерлер тобында жүзеге асыруға болады, оған қатысты мұндай өлшемдер уақытында қол жетімді болады. Алайда, бұл жұмысшылар бұл жұмысты енгізгісі келгендердің бәрінің жоғарғы (жақсырақ) бөлігі болып табылады. Сондықтан, сынақ индикаторлары мен осындай үлгідегі өлшемдердің төменгі ұшы кесіледі. Мұндай болжаудың әсері табиғи түрде жарамдылық факторының төмендеуі болады. Тестілеуді кейіннен пайдалану арқылы барлық үміткерлермен оларды таңдау үшін жұмыс істеуге болатын кезде, біз оның жарамдылығының ұлғаюын күтуге болады.

    Жарамдылық коэффициенттері сонымен бірге таңдау жылдамдығының өзгеруіне байланысты біраз уақыттан кейін өзгеруі мүмкін. Мысал ретінде, біз Йель университетінің университетінің емтихан кезінде 30 жыл ішінде алынған жарамдылық факторларын салыстырдық (Бурхэм, 1965). Корреляция болжалды индикатор, колледж кеңесінің сынақтарына, сонымен қатар орта мектептердегі академиялық үлгерімге, бір жағынан, ал екінші жағынан - екінші жағынан - бірінші жағынан. 30 жылдан кейін корреляция 0,71-ден 0,52-ге дейін төмендегені белгілі болды. Деректердің тиісті екі өлшемді таралуын талдау осы төмендеудің себебі анықталды. Колледжді қабылдау кезінде талап етілетін талаптарға байланысты, екінші жағдайда студенттер тобы біріншіден гөрі біртектес болды, болжамды көрсеткішке де, өлшемдермен де, өлшемдер бойынша де біртекті болды. Осы жерден және корреляцияның төмендеуі, ал колледждегі прогресстің дәлдігі сақталғанына қарамастан, бұрынғы, ал бұрынғыдай. Басқаша айтқанда, корреляцияның байқалған төмендеуі мүлде жоқбұл болжамдық көрсеткіштер 30 жыл бұрын аз мөлшерде болғанын куәландырды. Бірақ бұл тұжырымға дәл осы қорытындыға, топтардың біртектілігіндегі айырмашылықтарды жіберіп алған.

    Дұрыс түсіндіру үшін жарамдылық факторын ескеру қажет байланыс нысанытест пен өлшем арасында. Пирсоновка корреляциялық коэффициентінің есебі бұл байланыс сызықты болып, бүкіл тарату ауқымында өзгеріссіз қалады деп болжайды. Тест индикаторларының қарым-қатынасын зерттеуде осы шарттардың жалпы орындалуы (қорқақ және Са-Ккетт, 1990; Хоук, 1970). Осыған қарамастан, ерекше жағдайлар осы қосылымның сипатын өзгерте алады, ал сынақ пайдаланушысы әрдайым осындай оқиғаларға дайын болуы керек. Кейбір жұмыстарды жүзеге асыру үшін, нұсқаулықты, нұсқауларды, атауларды және т.б. оқуға жеткілікті, бірақ бұл минималды деңгейден асып түсуге жеткілікті, бірақ бұл ең төменгі деңгейден асып түседі, бірақ жұмыстың сәттілігі енді тәуелді емес Бұл қабілеттің одан әрі дамуы, яғни тест пен жұмыстың арасынан жұмыс жасау арасында сызықтық емес қатынастар бар. Критерийдің оқылуы мен өлшемін түсіну үшін сынақ индикаторлары бойынша салынған екі өлшемді үлестіру немесе шашыраңқы диаграмманы зерттеу, бұл критерийдің оқылатын және өлшемін түсінуге арналған, бұл жағдайда жұмыс деңгейі оқылатын дәрежені түсінуге дейін өсіп келе жатқанын көрсетеді дәрежесі, содан кейін ол шамамен бірдей қалады. Демек, диаграммадағы нүктелер түзу сызық емес, қисық сызықпен топтастырылған.

    Басқа жағдайларда, ең жақсы сәйкестік сызығы тікелей болуы мүмкін, бірақ жеке мәліметтерге сәйкес нүктелер одан төменірек масштабтың жоғарғы жағында ауытқуы мүмкін. Академиялық қабілеттер сынағын сәтті жүзеге асыру қажет делік, бірақ белгілі бір оқу курсын сәтті аяқтау үшін жеткілікті шартты емес делік. Бұл студенттердің төмен екенін білдіреді

    6-тарау.Жарамдылық мерзімі: өлшеу және түсіндіру

    осы сынақтан өтпеген жағдайда, сынақтарды алуы мүмкін, ал жоғары көрсеткіштері бар студенттер арасында жағымды бағалаулар болады, ал басқалары, ал басқалары, ал басқалары, қызығушылық пен басқа да қолайсыз шарттардың болмауы емтиханды тапсыра алмайды. Бұл жағдайда студенттер арасында критерийлік белсенділіктің төмендеуінің үлкен өзгергіштігі болады. Екі өлшемді таралудың мұндай жағдайы гетередизм деп аталады. «Пирсоновский корреляциясы». Гомо-кедитозды, яғни екі өлшемді таралудың барлық түріндегі өзгергіштігі. Жоғарыдағы мысалда, екі өлшемді таралуы жанкүйер болуы мүмкін пішінді - жоғарғы жағында кең және төменгі жағынан тар. Қазірдің өзінде екі өлшемді таралуға арналған визуалды талдау сынақ пен өлшемдер арасындағы қатынастардың сипатын құру үшін жеткілікті. Күтілетін нәтижелердің кестелері және күтілетін түскі ас кестелері де дұрыс Әр түрлі деңгейдегі тестіліктің салыстырмалы тиімділігін көрсетіңіз.

    Жарамдылық факторының мөлшері.Жарамдылық факторының мөлшері қандай болуы керек? Бұл сұраққа бірде-бір жауап жоқ, өйткені жарамдылық факторын түсіндіру кезінде бірқатар бірқатар жағдайларды ескеру қажет. Әрине, корреляция жеткілікті жоғары болуы керек статистикалық маңызды0,01 немесе 0,05 сияқты қолайлы деңгейде (4 тарауды қараңыз). Басқаша айтқанда, сынақтың жарамдылық мерзімі туралы қорытынды жасамас бұрын, алынған жарамдылық факторы кездейсоқ тербелістердің нәтижесінде пайда болғанына сенімді болу қажет. жалпы агрегат нөлдік корреляциямен.

    Тест индикаторлары мен критерийлер арасында маңызды корреляцияны қалыптастыра отырып, тестілеудің мақсаттарында оның құндылығын бағалау қажет. Егер біз белгілі бір тұлғалардағы критерийлер индикаторының нақты құнын болжай алмасақ (колледждегі студенттің орта баллдығы), жарамдылық факторы түсіндірілуі мүмкін Қателіктердің стандартты бағасы (бағалаудың стандартты қателігі)немесе қысқартылған Se »), қайсысы сенімділікке байланысты талқыланған бағалау қатесіне ұқсас. Еске сала кетейік, өлшеу қателігі тест нәтижесінде жеке индикатордың ықтимал қателігінің рұқсат етілген шегін көрсетеді. Сол сияқты, бағалау қателігі сынақ жарамдылығы жеткіліксіз болғандықтан, жеке критерий индикаторының болжамды мәнінің ықтимал қателігінің рұқсат етілген шегін көрсетеді.

    Қателерді бағалау келесі формула бойынша есептеледі:

    gd - e. G 1, -шаршы дұрыстығы факторы және SD V.- критерийлер индикаторының стандартты ауытқуы. Толық жарамдылығы бар екенін ескеріңіз (r, \u003d1.00) Қателерді бағалау нөлге тең болар еді. Екінші жағынан, егер тест жарамдылығы нөл болса, онда қате есептеледі дабылaet өлшемді бөлудің стандартты ауытқуының мәні \\ s e es, \u003d sd y-V / l - 0 \u003d С.Д.). Осы жағдайларда дұрыс болжау ықтималдығы жоқ

    «Хомоктар» және «Хетеросаж» және «Хетеросаж» (әріптер »және« бірдей шашырау »және« бірдей шашырау »және« бір-бірсіз диффузиялық »және Статистикаға енгізілді. А. А. Чупров. - Ескерту. n «дж. ред.

    2-бөлім.Техникалық және әдістемелік қағидалар

    кездейсоқ болжау ықтималдығынан асып, болжау қателері ауқымы өлшем көрсеткіштерінің еніне тең. Осы екі лимиттер мен бағалау қателері арасында өзгереді, вариация дұрыстығы бар сынақтарға сәйкес келеді.

    Формулаға сілтеме жасау SE A.Біз jl- / kes өрнектің бағалау қателігінің мәнін анықтауға мүмкіндік беретінін көрсетеміз жөнінде қателікki қарапайым болжам(I.e., нөлдік жарамдылықпен). Басқаша айтқанда, егер ^ | 1 - g g £ \u003d 1.00, содан кейін бағалау қатесі белгілі бір сынақта критерийлер индикаторын кездейсоқ болжау сияқты үлкен. Осындай тест қолдану бізге ешқайда бермейді рыч Болжау дәлдігі бойынша. Егер жарамдылық коэффициенті 0,80 болса, ..\u003d 0.60, ал максималды қате - кездейсоқ болжамайтын адамның құнының 60% құрайды. Мен басқаша білдіріп отырмын, осы сынақты пайдалану қателіктер лимиті бар шарттардың жеке нәтижелерін болжауға мүмкіндік береді, бұл болжанғаннан 40% -ға аз.

    0,80 сияқты, мұндай өте жоғары жарамдылықпен де, болжамды көрсеткіштердің қателігі айтарлықтай болуы мүмкін. Егер психологиялық тесттердің негізгі функциясы болса, жеке тұлғаның нақты позициясын болжау болса, мұндай болжам толығымен көңілсіз болып көрінді. Біз бағалау қателігінің аспектісінде тест қарастырған кезде, олардың көпшілігі әсіресе тиімді емес. Дегенмен, тестілеу кезінде нақты нәтиже қажет емес. Әр өлшемдертексерілетін әр адамның іс-әрекеті, бірақ олардың қайсысы орындалудың минималды стандартынан немесе критерий ретінде таңдалған сыни индикатордан асып түсетіндігін анықтау керек. Мэри Гриннің аяқталу мүмкіндігі қандай медициналық мектеп, Том Хиггинс Математиканы есептеу курсынан, ал бөртпе Брюс ғарышкер ретінде жетістікке жетеді ме? Жұмысқа келгендердің қайсысы жақсы қызметкер, сақтандыру агенті, механик болуы мүмкін? Мұндай ақпарат тек кәсіптік білім алу үшін ғана емес, сонымен бірге кәсіби бағдар беру үшін де пайдалы. Мысалы, студент пайдалы және оның заң факультетін толық аяқтауға жақсы мүмкіндіктері барын білу үшін пайдалы және егер біз оның орташа балл 74 немесе 81 балл болатындығы туралы айта алмасақ та.

    Сынақ оның болжамды тиімділігін айтарлықтай арттыра алады, егер ол үшін орнатылса ІркімҚаншалықты төмен болса да, өлшемдермен маңызды корреляция. Кейбір жағдайларда, шамамен 0,20-0.30 дұрыстығы тексеру бағдарламасына тестілеуді ақтайды. Көптеген мақсаттағы тестілеу үшін тестілеу олардың стандартты бағалау нүктесінен олардың бағалау қателігі негізсіз қатаң болып табылады. Көптеген жағдайларда, сынақтарды бағалаудың басқа әдістері қолданылуы керек, олар өз нәтижелері негізінде қабылданған шешімдер түрлерін ескеретіндігімен қолданылуы керек. Олардың кейбіреулері келесі бөлімде талқыланады.

    Жеке индикаторлардың сапасы, жалпы индикаторлар (индекстер) және таразылардың сенімділігі мен жарамдылығынан анықталады.

    Өлшеудің сенімділігі оның тұрақтылығы мен репродуктивтілігімен байланысты.Көрсеткішті бағалау объектілерінің осы жиынтығында алынған бағалаулардың көшірілуі мүмкін деп санауға болады. Сенімділіктің негізгі түрі сенімділік-қайталану(немесе дифрициялық, жалған сенімділік).Зерттеулер салыстырмалы сенімділігі әр түрлі нүктелердегі істерді (респонденттерді) (респонденттерді) бірдей түрде пайдалану нәтижелерін көрсетеді. Егер адамдар сұраққа бірінші және екінші жағдайда бірдей жауап берсе, және кез-келген келесі жағдайда, содан кейін бұл сұрақ сенімді. Егер психикалық қабілеттілік тесті жоғары сынып оқушыларының бір тобын тексеру кезінде бірдей нәтиже берсе, онда бұл сенімді тест.

    Өлшеу құралының сенімділігі оның дәлдігі немесе дұрыстығын көрсетпейді. Мысалы, егер кірістер респонденттері туралы мәселе екі бірдей бірдей жауап берсе, онда екі бірдей бірдей жауап береді, шамамен 100% -ға, біз толықтай сенімді, бірақ дәл емес. Егер, басқа жағдайда, мінсіз сенімділігі бар термометр терінің термометрі терінің электр кедергісін көрсетеді, бізде дұрыстығы, өлшеудің жеткіліктілігі туралы айтуға негіз жоқ. Сенімділік-қайталануды бағалау - қайталанған өлшеулер нәтижелері арасындағы корреляция.Бір индикатор жағдайында алғашқы сауалнамада алынған адамдардың жауаптарын екі апта немесе айдан кейін берілген жауаптармен салыстырыңыз және корреляциялық коэффициентті есептеңіз (8-ді қараңыз) . Іс жүзінде, жақсылық 0,8 және одан жоғары корреляция деп санауға болады.



    Сенімділік-қайталанудың кемшіліктері, біріншіден, әлеуметтануға тән үлкен үлгілерде қайталанған өлшеулердің күрделілігі. Екіншіден, айнымалы мәннің нақты мәні уақыт өте келе өзгеруі мүмкін, мысалы, кез-келген жанжалды экспозициялар мен жалақы салдарынан бір апта ішінде өзгеруі мүмкін, ал жалақы салдарынан ай сайын өзгеруі мүмкін. Соңғы жағдайда, зерттеуші индикатордың сенімділігімен байланысты тербелістерден, тербелістерден туындаған тербелістерді бөлу қиынға соғады. Сондықтан сенімділіктің тағы бір түрі өте маңызды - сенімділік-консистенция.Деп сенімділік-консистенцияны дәл сол айнымалы қолданылған кезде ғана бағалауға болады көптеген көрсеткіштер.Бірақ мұндай бағалау үшін бірыңғай өлшеу. Мысалы, психологиялық тестілеуде бір қабілетті немесе бір жеке сапаны өлшеуге бағытталған тест батареяларын қолданыңыз. Әлеуметтанушылар - егер оларда қаражат және техникалық мүмкіндіктер жеткілікті болса - әр түрлі индикаторлық мәселелерден тұратын индекстер мен таразыларды қолданыңыз.

    Сенімділік-консистенцияны бағалаудың ең оңай жолы - «жартысынан бөліну».Егер, мысалы, бізде 12 сұрақ бар, онда бізде 12 сұрақ бар, мұнда 1 балл 1 ұпай тағайындалады, ал жалпы саяси белсенділіктің жалпы саны 12 баллдық индекске сәйкес келеді, келесі рәсім қолданылады:

    1. Кездейсоқ тәртіппен сұрақтар екі бірдей тізімге бөлінеді (әрқайсысына 6 мәселе) және бір рет бір рет ұсынылады.

    2. Келесі келесі есептелген тестілеудің әр түрлі «жартысына» бірдей сынақтардың нәтижелері арасындағы корреляция коэффициенті:оның мәні неғұрлым жоғары болса, индикаторлар жиынтығымен алынған саяси қызметтің шынайы құндылығын неғұрлым жоғары бағалайды. Шығарылмайды, алайда, осы жолмен алынған сенімділіктің бағасы «жартысына бөлу» әдісіне өте сезімтал болады: корреляциялық коэффициент екі тізімді құрастыру әдісіне байланысты айтарлықтай өзгереді.

    Жеке сұраққа (мәлімдемелер, таразылар) сенімділігін бағалауға мүмкіндік беретін тағы бір қарапайым процедура, - бұл оның жалпы баллмен байланысының сынағы,i.E. жиынтық мәнімен. Егер респонденттердің осы тобы, егер шетелдік сапарлардың жиілігі мен «Ксенофобияның» жиілігі туралы жеке сұрақ арасындағы корреляция коэффициенті 0,3 құрады, содан кейін аталған сұрақ «деңгейдің шын мәнін көрсетпейді деп болжауға болады «Ксенофобия» айнымалысы және сауалнамадан шығарылуы мүмкін. Өйткені, қатаң анықталған сенімділік - бұл Өлшенген айнымалы мәндерінің шынайы таралуына қатысты бағаланған бағалаудың үлесі(Біз мұнда аз қатаң және айтарлықтай анықтама береміз, өйткені олар әлі де қажетті статистикалық тұжырымдамаларды талқылаған жоқ). Жалпы баллмен байланысқан процедура - бұл жалпы индекстер мен таразылардың қарапайым қарапайым құрылымы бар және таразылардың қарапайым құрылымы (сіз осы тараудан таба аласыз).

    Қалай болғанда да, нақты болуы керек Өлшем моделітеориялық айнымалы, өйткені тек ол жеке индикаторлар арасындағы күтілетін қатынастардың қандай болатындығын және сенімділікті бағалаудың қарапайым әдістерін болжауға мүмкіндік береді. Үлгіні тек еншілес айнымалы индикаторлармен, мысалы, тек себептік көрсеткіштері бар модельмен салыстыру жеткілікті екеніне көз жеткізу үшін (3-суретті қараңыз)және 4). Көрсеткіш әсері жасырын, олардың өлшемге шақырылған өзгермелі сипатқа және бір-бірімен өте сәйкес келуі керек екені анық. Алайда, бұл индикаторлардың себептеріне соншалықты айқын емес: «Білім мен кірістер», «әлеуметтік-экономикалық жағдай» ұғымының маңызды құрамдас бөліктері де маңызды делік. Алайда, егер қалыптасу өсіп келе жатқан болса да, табыс кез-келген нәрсені ұстануға құқылы, яғни ол біліммен белгілі бір арақатына көрсетпеуі керек. Басқаша айтқанда, егер сенімді индикаторлық әсерден жоғары антимон әсер етуі керек болса (жартысын бөлу әдістерін қолдана отырып), егер индикаторлар сенімділікке қатысты қарапайым тәсілге сәйкес келмейді. Мұнда сенімділікті бағалаудың қолайлы әдісін жасауға болады, тек әр түрлі индикаторлар мен өлшеу моделіндегі әр түрлі теориялық айнымалылар арасындағы байланысты талдауға болады. Осы байланыстардың күтілетін бағыты мен көлемін болжау, зерттеуші сақталған мәліметтердің сақталу дәрежесін бақыланатын мәліметтермен және индикатордың сапасын қорытындылауы мүмкін. Эмпирикалық көрсеткіштердің сенімділігін бағалаудың ең әмбебап әдістері факторды талдау және сапарларды талдау.Ең дұрысы, сенімділікті бағалау үшін бірнеше индикаторлар (екі немесе үш) және кем дегенде екі панельдік толқындар қолданылады.

    Сенімділік түсінігі қосылғанын есте ұстаған жөн кездейсоқ өлшеу қателері,i.E. қателіктермен, бір-біріне жүйелі түрде немесе жүйелі түрде белсенді сыртқы айнымалылармен қателіктермен (айтыңыз, респонденттердің едені немесе жасы). Ерекше сенімсіздік көздері- респонденттердің назарындағы өзгерістерге, бұл мәселе деген жазбаудың өзгеруіне байланысты кездейсоқ емес факторлар, бұл мәселе деген түсініксіздік, оның әр түрлі жағдайларда келіспеушіліктерге әкеледі; сұхбаттасудағы жүйелі емес айырмашылықтар; Ашық сұрақтарды кодтаудағы немесе деректерді енгізу кезінде қателер бар айырмашылықтар. Мысалы, егер сіз тіпті тәжірибелі мамандарды алсаңыз, елді мекендердің түрлерін кодтау схемасы бойынша жүздеген елді мекендерді жіктеуге әкелсеңіз, онда нәтижесінде алынған классификацияларда кем дегенде бірнеше сәйкессіздіктер табуға болады. Кейбір сәйкессіздіктер ұсынылған ережелер бойынша біржақты жіктеуге мүмкіндік бермейтін «шектеу» жағдайларының болуымен байланысты болады, кейбіреулері жазба немесе интенсацияның механикалық қателері бар. Әлеуметтік сауалнама мәселелерінің сенімділігіне алдын-ала бағалау алдымен адамдар жиі жауап беретін тұжырымдалған мәселелерден бас тартуды талап етеді. Респонденттерге жауаптардың төмен сенімділігі жауап бере алмайды, өйткені олар көтерілген мәселелер бойынша пікірлер жоқ немесе ол туралы ештеңе білмейді. Қатыспаған барлық респонденттерге қатысты емес, маңызды емес сұрақ туындамайды, «мен білмеймін» немесе «есімде жоқ» немесе «Мен білмеймін». Көбісі таңдалған жауап ретінде сыпайылықты сезіне алады немесе олардың надандық көрсетпеушілігін көрсетеді.

    Әдіс сенімділікті арттырубіз талқыладық (Ч. 4, 5). Біріншіден, сіз бірнеше индикаторларды қолдануға тырысуыңыз керек. Бұл мүмкін емес болған кезде, бұл әр түрлі жолдармен өлшеу кезінде теориялық немесе практикалық қиындықтар бар, содан кейін ең жақсы және жалпы қабылданған индикаторлар қолданылуы керек (мысалы, егер сіз респонденттен оның жасына дейін ғана сұрасаңыз, Сұрақтың нақты тұжырымдамасы мен жауаптың формуляциясын және жалпыхалықтық жалпыхалықтық санақ, кең ауқымды панельді зерттеулерде және т.б. қолданған дұрыс.

    Сенімділікті арттырудың басқа әдістеріне маңызды емес мәселелерді, эфирлік тұжырымдаманы талдау, сұхбаттасу, сұхбат берушілерді оқыту және бақылау, мәліметтерді кодтау әдістері мен енгізу рәсімдерін жетілдіру кіреді.

    ЗаңдылықӨлшемдер, ең жалпы мағынада оның мақсатын өлшеудің сәйкестігін сипаттайды. Эмпирикалық тексеру жылдамдығы (негізделген, реттеледі), ол өлшенетін теориялық айнымалы мәнді көрсетеді. Әрине, оның индикатордың дұрыстығы туралы айтудың мағынасы жоқ. Өлшеу құралының дұрыстығы - бұл заттардың өлшенген қасиеттеріне қатысты алынған нәтижелердің дұрыстығы және дұрыстығы, I.E. өлшеу объектісіне қатысты.Дәлелділік теориялық құрылысты өлшеудің «тазалығын» анықтайды деп айтуға болады. Өлшеу тікелей болған кезде, I.E. Біз өлшенген мүліктің анықтамалық блогының санын тікелей есептей аламыз, ал өлшеу нәтижелері бойынша тек кездейсоқ қателіктер, сенімділік және жарамдылық әсер етеді, өлшеу құралының жарамдылығы оның сенімділігіне тең. Егер біз пайыздық мүлікті жанама түрде өлшесек, кейбір индикаторды пайдаланып, сенімділік пен жарамдылық арасындағы айырмашылық бар. Көрсеткіштің жоғары сенімділігі (репродукция) болуы мүмкін, бірақ сонымен бірге бізді мүдделердің әлеуметтануын өлшеуіміз мүмкін, бірақ бізді мүдделерге дейін өлшеу «таза» емес. Интуитивті деңгейде, тағы бір нәрсе сапалы көмекшінің сапа көмекшісі (мысалы, саяси белсенділік сияқты емес). Жанама өлшеу әдетте кездейсоқ және кездейсоқ емес қате қате компоненттер бар. Дәл солай кездейсоқ емес компонентоның ішінде өзінде жүйелі(корреляцияланған) ҚателікӘрбір жағдайдың бірдей мөлшері бірдей тұрақты өлшеу қатесі, Индикатордың дұрыстығын анықтайды. Әлеуметтік түсіру немесе эксперименттегі жүйелі өлшеу қателеспесінің мысалдары «жадтың» айтылған әсерлері, әлеуметтік ұмтылыстар, оң немесе теріс жауап беру. Олар айнымалы зерттеушінің индикаторының дұрыстығына, дұрыстығына, дұрыстығына ғана емес, сонымен қатар деректерді талдау нәтижелерінің дұрыстығы мен ақылға қонымды мәні бар: аралық өлшеу қатесі кез-келген статистикалық көрсеткіштерге, соның ішінде айнымалылар арасындағы қатынастар мен бағалауға әсер етуі мүмкін кіші топтар арасындағы айырмашылықтардың маңыздылығы. Басқаша айтқанда, жарамсыз индикаторларды қолдану дұрыс емес тұжырымдар болуы мүмкін.

    Өлшеу дұрыстығы проблемасы - социологиялық әдіснаманың ең күрделі мәселесі. Жарамды өлшеу - бұл ең алдымен жарамды Өлшеу модельдеріи.Е. Теориялық идеяларды ақылға қонымды және нақты тұжырымдастыру нәтижесі. Мұнда біз тек негізгі сипаттаймыз жарамдылық түрлеріжәне дәстүрлі тексеру әдістері,i.E. Өлшеулердің дұрыстығын орнату.

    Мазмұндағы жарамдылықзерттеуші сайланған индикаторлардың қандай дәрежеде теориялық тұжырымдаманың әртүрлі аспектілерін көрсететінін көрсетеді. Басқаша айтқанда, біз айтып отырмыз Өкілдікбұл өлшеулер жиынтығы және айнымалы-тұжырымдамалық құрылымға деген көзқарас теориялық ұғымдарды пайдалану толықтығында. Мысалы, Статистикалық сараптама студенттердің статистикалық білімдерін өлшеуге арналған құрал ретінде қарастырылуы мүмкін, өйткені емтихан сұрақтары дәрістер мен оқулықтардың мазмұнын көрсетеді. Алайда, барлық сұрақтар оқу курсының тек бір бөліміне ғана қатысты болса, айтыңыз, емтихан нәтижелері, мысалы, студенттердің «шикізат» ұпайларын стандартты бағалауды білдіреді, бірақ ештеңе туралы ештеңе айтпайды Корреляция және регрессия туралы білім.

    Мазмұндағы жарамдылығын бағалаудың негізгі тәртібі сараптамалық қорытынды.Кейбір жағдайларда теориялық тұжырымдамалар мен олардың көрсеткіштерін өлшеу олардың көрсеткіштерін өлшеу соншалықты айқын, ешқандай нақты негіздемелер қажет емес, термометр температураны өлшейтіні анық. Мұнда сіз туралы сөйлесе аласыз анық(кейде бет,ағылшын тілінен. Беттің дұрыстығы) индикатордың жарамдылығы. Беттің дұрыстығы, мақсатты мәселенің, тест немесе кәсіби әлеуметтанушы және тәжірибелі респонденттің жеке басын түсіну немесе басқа индикаторы туралы жоғары түсінік. Сусабын сатып алу жиілігі барлық ықтималдылықта, барлық мүсіндер жоқ және бұл мәселеде сипатталған тұтынушылық мінез-құлықтың түрін дәл айтуға мүмкіндік береді. Алайда, неғұрлым күрделі жағдайларда ақпараттық жарамдылық мүлдем азайтылған жоқ. Көңілді, артықшылықты автомобиль брендін, артықшылықты автомобиль брендін, оқу жиілігін және т.б. «Өмірдің» және т.б. туралы қарапайым сұрақтар жиынтығы, ол «өмір салтын» алуы мүмкін (бұл жағдайда өлшеу сізге мүмкіндік береді) Адамның номиналды өмір салтын номинацияларының біріне - «тірі», «қол жеткізілді», «экзистенциалды», «әлеуметтік», т.б.). Осы жиынтықтың толықтығын және «өмір салты» ұғымын өлшеуге қатысты мәселелердің салыстырмалы құндылығын тек мамандар ғана жүргізуге болады. Осындай сараптамалық пайымдаудың негізі - теориялық анықтама, зерттеу айнымалысын концептуализациялау. Әдетте, мазмұнның қолданылуына қатысты сараптамалық қорытынды зерттеу нәтижелері жарияланғаннан кейін өздігінен немесе аз болады. Кейде көп ұйымдастырылған процедураларды қолдануға болады - параллель панельдер әдісінемесе бірнеше судьялар әдісі. Бірінші жағдайда, мамандардың екі немесе үш сериялық панельдері барлық мазмұнды тексеру процедурасын орындайды, I.E. Қолданыстағы анықтамаларды салыстырыңыз, мүмкін индикаторлардың тізімін жасаңыз және тестілеу тұжырымдамалық аймағына қатысты олардың өкілдіктерін бағалаңыз. Егер екі немесе одан да көп панельдерде өздігінен таңдалса, көптеген сәйкессіздіктерді анықтаса, көптеген сәйкессіздіктерді анықтайды, біз жоғары мазмұнды жарамдылық туралы айта аламыз.

    Бірнеше судьялардың әдісі (сарапшылар) әдісі, өлшенуі керек, өлшенетін түрлендірілген, көп өлшемді құрылымға ие болған жағдайларда пайдалы. Егер, әлеуметтанушы, әлеуметтанушы өңірлердің әлеуметтік-экономикалық әл-ауқасарын дамытып жатса, онда демография, әлеуметтік саясат, жұмыспен қамту, салық жүйесі және т.б., мамандарға қатысты мамандар мен т.б. Масштабтағы айтарлықтай факторларды анықтауға, салыстырмалы мәнді бағалауға және тиісті эмпирикалық көрсеткіштерді табуға мүмкіндік береді.

    Критериалды жарамдылық(немесе өлшем бойынша жарамдылық)) осы сынақ немесе индикатордың нәтижелері қалай аталатынын қалай көрсетеді, бұл басқа индикаторды өлшеу нәтижелеріне сәйкес келеді критерий.Көбінесе, критерий - бұл зерттеуші үшін практикалық, бірақ дәл қазір өлшеу мүмкін емес. Мысалы, критерийлердің жарамдылығы кіру емтихандары Ол студенттерді әрі қарай көрсететін академиялық жетістіктермен анықталады (мысалы, академиялық үлгерім бұл жағдайда критерий). Сондай-ақ, жасөспірімдерге девиантты мінез-құлықтың моральдық бағалау сынағы нақты бас тарту әрекетіне қатысты өлшемдердің жарамдылығы бар деп болжауға болады. Дәлелденген критерийлердің жарамдылығы дәлелденген индикаторды қарауға болады айнымалы болжаушы,критерийлер айнымалының жеке мәндерін болжауға мүмкіндік береді. Әрине, нақты критерийді алмастыратын болжаушының қажеттілігі критерий бойынша бағалауды алу қиын болған жағдайда ғана пайда болады, яғни біз келген немесе келмеген оқиғалар туралы айтамыз немесе а Тәжірибелік өлшемді практикалық немесе этикалық көзқарастарға байланысты өлшеу қиын. Болжамдардың дұрыстығы, әдетте, неғұрлым жоғары болса, бұл критерийге жақынырақ. Айталық, авиация мектебінің курсанттарын іріктеудің тамаша әдісі финалда әуе кемесін басқарудың практикалық дағдыларын тексерумен қысқа мерзімді оқу курсы болуы мүмкін: үміткерлер нақты мамандар болу мүмкіндігіне ие болар еді. Алайда, бұл әдіс тым қымбат және практикада ақыл-ой сынақтарын, визуалды-қозғалтқышты үйлестіруді және олардың өлшемдерін олардың жарамдылығын орнату арқылы сынақтан өткізу және басқа индикаторларды сынау. Басқа жағдайда, проекциялық жеке тест (TAT TAT - TAT - TAT - Тақырыптар туралы түсінік. Толық психиатриялық емтихан көп уақытты қажет етуі мүмкін, ал балалық шақтағы жұмыс істемеу туралы мәліметтерді алу қиынға соғады.

    Критерийлердің негізгі түрлерінің негізгі түрлері болжам, бәсекеге қабілеттіжәне посткиво(«Болжалды-артқа») жарамдылық.

    Болжамдық критерийлердің жарамдылық мерзімібұл айнымалы мәндер, әдетте, бөлек жеке тұлғаны немесе топты сипаттайтын дәлдігі сипатталған, әдетте, кейбір басқа айнымалы мәндер (болжаушы). Мұндай болжамдық дәлдіктің ең жақсы индикаторы болжамшы айнымалы мәндер арасындағы және ауыспалы өлшемнің мәндер арасындағы корреляция болады бір және бірдейҮлгілер. Содан кейін - Үлгі қатесі ішінде - корреляция коэффициенті болжамды жарамдылық коэффициентіне тең болады.

    Критерийдің бәсекелестік негізділігі -бұл критерийлер айнымалының ағымдағы мәндер мен болжамсыз айнымалы арасындағы сәйкестік деңгейі. Қарапайым салған, зерттеуші басқа айнымалы мәнді бағалау үшін өлшеу нәтижелерін бір функция бойынша пайдаланады. Айнымалы критерийдің өлшемін анықтау қиын болуы мүмкін, сондықтан көп уақытты қажет етеді, бәсекеге қабілеттілік мәселесі, бәсекеге қабілеттілік мәселесі эмпирикалық әлеуметтану үшін өте маңызды, онда көптеген мінез-құлық немесе орнату айнымалысы тікелей өлшенбейді, бірақ арқылы Өзін-өзі сипаттау, сауалнаманың сұрақтарына жауаптар, басқаша айтқанда, ауызша мінез-құлық арқылы. Мысалы, біз студенттердің осы топтың нақты мінез-құлқын бірнеше бақылаулармен студенттердің дискотикалық сапарларының жиілігі туралы сауалнаманың бәсекеге қабілеттілігін бағалай аламыз. Қазірдің өзінде әлеуметтанудағы фактографиялық мәселелердің алдын-ала зерттеулері көрсетті, тіпті салыстырмалы түрде «зиянсыз», нонсенс индикаторлары, бәсекелестік жарамдылық мерзімі әр түрлі болуы мүмкін.

    Денвері деп аталатын Денвердің дұрыстығын зерттеу 1947 жылы С.Тауффер және бірлескен авторлар жүргізген, респонденттердің жауаптары жергілікті ұйымдардың ресми статистикасының фактілері мен мәліметтерімен салыстырылды. Бұл сайлаушыларды тіркеу, дауыс беруге қатысу, дауыс беруге қатысу, қала қазынасына қосқан үлестер, жүргізуші куәлігінің (критерийдің) және т.б., респонденттердің жауаптарымен (болжамыңыз), зерттеушілермен салыстырғанда Айқындықтың мөлшері бірқатар пайыздан 50% -дан шамамен 50% -ға дейін, мәселенің мазмұнына байланысты болды.

    Алайда, объективті критерийлер индикаторларына тән шектеулер туралы есте сақтау керек: бұл ресми құжаттар көбінесе өзін-өзі дефолтқа негізделеді және көбінесе өлшеу қателеріне ұшырайды. Осыған қарамастан, кейбір жағдайларда конкурстық тексеру рәсімі болжамды түрде артықшылыққа ие, өйткені біріншіден, критерийдің мәні өлшенген кезде, бірінші кезекте күтуге болатын зерттеушіні қажет етпейді. Егер, мысалы, зерттеуші студенттерге сәтті кәсіби мансаптың болжамдары ретінде жасалған кәсіби мүдделер сынағының өлшемдерін бағалаған болса, критерийлердің құнын өлшеу қажет емес. Қазірдің өзінде жұмыс істейтін мамандардың екі «экстремалды» топтары үшін кәсіби мүдделерді тексеру жеткілікті - қазіргі уақытта мамандық бойынша сәтті және ең аз тәжірибесі бар. Тест ұпайлары мен сәтті (немесе сәтті (немесе тестілеу балдары »тестілеудің статистикалық маңызды айырмашылығы (немесе« экстремалды »топтардың арасындағы жоғары арақатура) сынақ жарысының дұрыстығын көрсетеді. Индикатордың бәсекелестік негізділігі туралы қорытындылар әлі де қате болуы мүмкін жағдайлар таңдамалы жоюҮлгіден (өзін-өзі таңдау) және болжамдық айнымалы реактивтілік.Біздің мысалдағы өзін-өзі дефляциялау үлгінің зейнетке шыққанында пайда болуы мүмкін ( бұрынғы студенттер, осы саладағы кәсіби мансаптан бас тартты және осы себеппен қарастырылмаған) тестілеуден өтпеген) жоғары деңгейдегі аз мөлшерде, яғни жоғары деңгейдегі, яғни, табиғи қоқысқа кездейсоқ емес болады. Индикаторлық реактивтілік болған жағдайда, біздің пәндеріміз студенттер жауап бергендей емес, мотивациялық тест сұрақтарына жауап бермейді (кәсіби тәжірибелеріне, әлеуметтік жағдайға өзгерістер және т.б.) және реактивті емес болжамдар да бар, Бекітілген бәсекелестік әрекет ету. Мысалдарда барлау коэффициенті немесе «фондық» айнымалылар (әлеуметтік, ұлт және т.б.) тұрақты сипаттамаларды қамтиды.

    Соңында, кейбір жағдайларда біз бұрын-соңды жеке тұлғаға (топқа) тән өлшемдер мен белгілердің барын бағалауға болатын дәлдікті қалай орнатуға болатындығын қызықтырамыз. Балалардың жарақаттарының «болжамына» постпортқа арналған проективті психологиялық тестті қолданудың мысалы жоғарыда келтірілген. Бұл жағдай бағалау ретінде көрсетілген посткивожарамдылық.

    Бізде сипатталған жарамдылық түрлері зерттеуші болып табылатын осы жағдайларда өте маңызды, онда белгілі индикаторды бұрыннан бар немесе практикада қолданылған критериймен салыстыру керек. Басқаша айтқанда, көрсеткіштің өлшемдері индикатордың дұрыстығы басқасымен, болжанған «таза», эмпирикалық индикатормен байланыс болып табылады. Дегенмен, жарамдылыққа тағы бір көзқарас бар, онда индикатордың бағасы оның «мінез-құлқының» қаншалықты сәйкес келетініне негізделген теориялық күтулер.Мұндай бағалау тек теориялық айнымалылар, олардың көрсеткіштері, кездейсоқ және кездейсоқ емес өлшеу қателері арасындағы байланысты сипаттайтын тұтас теориялық модельде ғана жүргізілуі мүмкін. Біз топтық келіспеушіліктің жаңа тобының дұрыстығын тексергіміз келеді делік. Қолданыстағы теориялық идеяларға сүйене отырып, біз ашық қақтығыстардың кіші жиілігі және коммуникациялардың үлкен қарқындылығы үлкен топтық тұраққа сәйкес деп болжауға болады. Топтық тұрғыдағы және басқа екі айнымалылардың құндылықтарын (қақтығыстардың жиілігі және коммуникациялардың қарқындылығын) сәйкестендіру арқылы әр түрлі топтарды салып, біз топтық бірліктің қаншалықты жақсы «жетекші» екенін көреміз. Егер оның басқа екі айнымалымен қарым-қатынасының үлгісі теорияның болжамдарына сәйкес келсе, онда біз жаңа тергеу масштабы, яғни бізді қызықтыратын теориялық айнымалыны өлшей аламыз. Жарамдылық түрінің бұл түрін әдетте мерзімге белгілейді «Конструктивті жарамдылық». (Кейде «тұжырымдамалық жарамдылық» белгісі де қолданылады.)

    Статистикалық тұрғыдан алғанда, абсолютті құрылымдық жарамдылық индикатор мәндеріндегі барлық байқалған өзгеріс тек өлшенген теориялық құрылысты ескереді деп болжайды. Егер индикатордың өзгеру бөлігі басқа айнымалымен байланысты болса - бұл басқа теориялық құрылыс немесе өлшеудің жүйелі қателігі ме, жоқ па, құрылымдық жарамдылық аз болады ма.

    Құрылымдық заңдылықты бағалауға дәлелді теориялық гипотезаларды тексеру және өлшеудің сапалық сынақтарын тексеру арасындағы байланысты болу оңай. Шынында да, индикаторлардың нақты қатынастарымен «мінез-құлықтың» теориялық моделін салыстыру арқылы құрылымдық негізділікті бағалау қосуды қажет етеді Өлшеу модельдері(жоғарыдан қараңыз) теориялық модель.

    Біз жалпы индикаторды қолданамыз делік, «Демократизм» индексі саяси жүйе«,« Бірқатар индикаторлардан тұрады (Х. 1 , Сағ. 2 , Сағ. 3 ), олардың әрқайсысының демократиялық индексіндегі «салмақ» бар. Мұндай көрсеткіштер парламенттің болуын қамтуы мүмкін (номиналды дихотомиялық айнымалы), тәуелсіз теледидар және радио компанияларының саны және т.б. Теориялық модельге сүйене отырып, біз «Демократизм» дәрежесі қаруды модернизациялауға жұмсалған GNP үлестерінен кері байланыста болады деп күтеміз. Осы үлгі негізінде (қараңыз) Інжір. он бір),сіз біз ойлап тапқан демократиялық индекс құрылымдық дұрыстығын тексере аласыз.

    -Ден


    Інжір. он бір.«Демократизм» айнымалыларының өзара байланысы моделі

    Психодиагностикалық әдістерді бағалаудың негізгі критерийлері сенімділік пен жарамдылыққа жатады. Шетелдік психологтар (А. Анастаси, Е.Гизелли, Дж.Гилфорд, Л. Кронбах, Л.Кронбах, Р. Торнка және Е. Хағанда », ал басқалары осы ұғымдардың дамуына үлкен үлес қосты. Оларға ғылыми-логикалық және математикалық-статистикалық аппараттар (ең алдымен корреляция әдісі және нақты талдау) жасалған, техниканың белгіленген критерийлерге сәйкестігін негіздейді. Психодиагнозда сенімділік және жарамдылық әдістері мәселелері бір-бірімен тығыз байланысты, дегенмен, осы сыни сипаттамалардың жеке презентациясы дәстүрі бар. Оны сүйене отырып, техниканың сенімділігін ескерейік.

    Сенімділік

    Дәстүрлі тестілеуде, термин « сенімділік«Салықтық тұрақтылық, тұрақтылық, тестілеу нәтижелерінің біржолғы және бірізділігі, оны сол тақырыптарда қайта қолдану және қайта қолдану. сенімділік техникасы - Бұл психологиялық өлшемдердің дұрыстығы туралы айтатын критерий, яғни. Сізге сенім нәтижелері алынғанын анықтауға мүмкіндік береді.

    Практикалық диагностиканың маңызды мәселесі - өлшеу дәлдігіне әсер ететін жағымсыз факторларды анықтау:

    1. Диагноз қойылған қасиеттерінің тұрақсыздығы;

    2. Диагностикалық әдістердің жетілмегендігі

    3. Сауалнама жағдайы өзгертілді

    4. Экспериментатордың мінез-құлқындағы айырмашылықтар

    5. Тақырыптың функционалдық жағдайындағы тербелістер

    6. Бағалау әдістері және нәтижелерді түсіндірудегі субъективтілік элементтері

    Диагностикалық сынақтардың нәтижелеріне әсер ететін жағдайлар сияқты әдістеменің сенімділігінің сенімділігі.

    Сенімділіктің барлық түрлері екі есе өз бетінше алынған индикаторлардың, содан кейін техниканың сенімділігі анықталған математикалық статистикалық қабылдаудың үйлесімділігі дәрежесін көрсетеді - бұл архаттандыру (Пирсон немесе найза, см. XIV). Сенімділіктің тиімділігі жоғарыдан жоғары, нәтижесінде пайда болған корреляция коэффициентіне жақындайды және керісінше.

    негізгі баса, Қ.М. жұмысында. Гуревич (1969, 1975, 1975, 1977, 1977, 1979), ол осы мәселе бойынша шетелдік әдебиеттерге мұқият талдау жүргізіп, сенімділікке ие болуды ұсынды:

    1. Өлшеу құралының сенімділігі,

    2. Зерттелген белгінің тұрақтылығы;

    3. Констант, и.e. Нәтижелердің салыстырмалы тәуелсіздігі экспериментатордың жеке басын куәландырады.

    Өлшеу құралын сипаттайтын индикатордың сенімділік коэффициентіне, өлшенген мүліктің тұрақтылығын сипаттайтын индикатор - тұрақтылық коэффициентін сипаттайтын көрсеткіш; Және эксперимент жүргізушінің жеке басын бағалау көрсеткіші - бұл ent-коэффициенті.

    Заңдылық

    Заңдылық Негізінде, бұл жан-жақты сипаттама, оның ішінде бір жағынан, әдіс, оның жасалғанын өлшеуге жарамды, ал екінші жағынан оның тиімділігі, тиімділігі қандай екендігі туралы ақпарат туралы ақпарат. Тексеруді тексеру әдісі шақырылады validizatsii.

    Алғашқы түсініктің дұрыстығы әдісі өзіне байланысты, И.Е. Бұл өлшеу құралының дұрыстығы. Мұндай сынақ теориялық тексеру деп аталады. Екінші мағынадағы жарамдылық әдісі, оның мақсатына қатысты емес. ол прагматикалық тексеру. Сонымен, зерттеушінің теориялық тексеруімен әдістеме бойынша бағаланған мүлік мүдделі. Бұл, айтарлықтай, психологиялық тексерудің өзі жүзеге асырылатындығын білдіреді. Прагматикалық валидациямен өлшеу объектісінің мәні (психологиялық қасиеттері) көрінбейді.

    Қандай сынақ шаралары:

    1. Техника жарамды деп танылды, өйткені ол өлшейтіндіктен «айқын»;

    2. Дәлелдеменің дәлелі зерттеушінің оның әдісі «тақырыпты түсінуге» мүмкіндік беретіндігіне негізделді;

    3. Техника жарамды деп саналды (I.E. мақұлдау осындай сапаны осындай сапаны қабылдады), оның негізінде техника салынып, «өте жақсы» теориясы болды.

    Теориялық жүргізу Техниканы тексеру - бұл техниканың дәл мүлікпен шынымен өлшенетіндігін көрсету, зерттеушіге сәйкес, оның сапасы, оны зерттеу керек. Бұл тек тиісті индикаторлармен салыстырғанда ғана емес, сонымен қатар маңызды облигациялар гипотезасы негізінде болмауы керек. Осылайша, теориялық жарамдылықты тексеру, бір жағынан, бір жағынан, байланысты процедурамен (конвергентті жарамдылық) және басқа теориялық базасы бар техникамен байланысты және осы қосылымның болмауы үшін маңызды (дискриминант).

    Прагматикалық үшін Техниканы тексеру, I.E. Оның тиімділігін, тиімділігін, практикалық маңыздылығын бағалау үшін тәуелсіз сыртқы критерий жиі қолданылады - күнделікті өмірде зерттелген мүліктің көрінуінің көрсеткіші. Мұндай өлшем орындалуы мүмкін (сабақ беру қабілеттерін, жетістіктерді, интеллектуалды сынақтарды, интеллектуалды тестілерді), өндірістік жетістіктер (кәсіби бағдар беру әдістері үшін), нақты белсенділіктің тиімділігі - сурет салу, модельдеу және т.б. (Ерекше қабілеттерге арналған), субъективті бағалау үшін (жеке тест үшін).

    Американдық зерттеушілер Тиффин және Маккормик (1968), сыртқы критерийлердің дұрыстығын дәлелдеу үшін пайдаланылған сыртқы критерийлерді талдап, төрт түрін бөлді:

    1) орындау критерийлері (олардың нөмірі бойынша олар орындалатын жұмыс, орындау, оқытуға жұмсалған уақыт және т.б.);

    2) субъективті критерийлер (әдетте субъективті өлшемдер сұхбаттар, сауалнамалар, сауалнамалар арқылы алынады);

    3) физиологиялық критерийлер (импульстің мөлшері өлшенеді, қан қысымы, терінің электр кедергісі, шаршау белгілері және т.б.);

    4) Экипналық критерийлер (зерттеудің мақсаты болған кезде қолданылады, мысалы, жазатайым оқиғаларға аз сезімтал болған адамдарға іріктеу мәселесі).

    Техниканың қолданылуын бағалау сандық және сапалы болуы мүмкін.

    № 19 Жарамдылық түрлері. Жарамдылық мерзімі

    Дәлелділік туралы мәселе жақында ең қиын болып табылады. Осы тұжырымдаманың ең көп тамырлы анықтамасы - А. Анастаси кітабында берілген: «Тестінің жарамдылығы - бұл тест шаралары және оның қаншалықты жақсы екенін көрсететін тұжырымдама» деген тұжырымдама »

    Оның мәні бойынша жарамдылық жани-жан-жақты сипаттама, оның ішінде бір жағынан, әдіс, оның жасалғанын өлшеуге жарамды, ал екінші жағынан оның тиімділігі, тиімділігі, практикалық пайдалылығы қандай екендігі туралы ақпарат.

    Осы себепті, жарамдылықты анықтауға бірыңғай жалпыға ортақ көзқарас жоқ. Валидацияның қай бағыты зерттеушіні қарастырғысы келетініне байланысты, зерттеушілердің әртүрлі тәсілдері қолданылады. Басқаша айтқанда, жарамдылық тұжырымдамасында оның ерекше мағынасы бар түрлерінің әртүрлі түрлері кіреді. Тексеруді тексеру әдісі шақырылады валидизация.

    Айқын жарамдылық- Тақырыпта белгіленген тест идеясын сипаттайды. Сынақты жеке тұлғаны білудің маңызды құралы, құрметпен және белгілі бір дәрежеде және белгілі бір дәрежеде медициналық диагностикалық құралдармен жасалған. Айқындықтың қазіргі жағдайында ерекше маңызы бар, егер олар қоғамдық санадағы тестілеуді сынақтан өткізгенде, танымал газеттер мен журналдардағы танымал газеттер мен журналдарда, олармен кез-келген нәрсені анықтау ұсынылады: үйлесімділікке дейін болашақ жұбайымен.

    Бәсекеге қабілеттілікол дамыған сынақтың басқа да, жарамдылығы өлшенген параметрмен салыстырғанда басқалармен байланысады. П. Клейн конкурстық жарамдылық туралы мәліметтер бірнеше айнымалыларды өлшеуге қанағаттанарлық емес сынақтар болған кезде пайдалы екенін айтады, ал өлшеу сапасын жақсарту үшін жаңа пайда болады. Шын мәнінде, егер тиімді тест болса, онда не жаңасы бар?

    Болжамдық жарамдылықол сынақ индикаторлары арасындағы корреляция және өлшенген мүлікті сипаттайтын кейбір критерийлер арқылы орнатылады, бірақ кейінірек. Мысалы, кез-келген барлау сынағының болжамдық негізділігі оның 10 жасқа дейінгі тестілеуден алынған индикаторлардың, орта мектептің соңында академиялық үлгерімімен көрсетілуі мүмкін. Л.Кронбах тестілеудің дәлелі дәл келтірілген дәлелдердің болжамды дәлелдерінің болжамды дұрыстығын қарастырады. Зерттеуші алдында тұрған негізгі проблема, оның тестілеудің болжамды негізін құруға тырысады, сыртқы критерийді таңдаудан тұрады. Бұл әсіресе, бұл көбінесе сыртқы өлшемдерді таңдау өте қиын міндет болып табылатын жеке айнымалыларды өлшеуге қатысты, бұл көптеген тапқырлықты талап етеді. Алайда, жағдай танымдық тесттердің сыртқы критерийін анықтаған кезде, алайда, зерттеуші көптеген мәселелерге «көздерін жұмып» болуы керек. Осылайша, академиялық үлгерім әдетте ақыл-ойдың сынақтарын тексеру кезінде сыртқы критерий ретінде қолданылады, бірақ сонымен бірге жаттығудағы жетістіктер жоғары интеллекттің жалғыз айғақтарынан алыс екендігі белгілі.

    Қарапайым жарамдылықол шектеулі мағынаға ие және істі тексеру батареясынан бір сынақ өлшемімен бір тест критерийлермен арақатынасы болуы мүмкін, бірақ осы батареядан басқа сынақтармен қабаттаспаңыз. Бұл жағдайда бұл сынақ біршама дұрыстығы бар. Бұл психологиялық тесттерді қолдана отырып, лексиканы өткізген кезде пайдалы болуы мүмкін.

    Дифференциалды жарамдылықоны қызығушылық тестілерінің мысалында көрсетуге болады. Қызығушылық тестілері әдетте академиялық үлгеріммен, бірақ әртүрлі пәндер бойынша әртүрлі жолдармен байланысты. Дифференциалды жарамдылық мәні, сонымен қатар көбейту, шектеулі.

    Маңызды негіздеметест тапсырмаларының оқытылатын мінез-құлықтың барлық аспектілерін растайтын растау арқылы анықталады. Әдетте ол жетістіктер сынақтарымен анықталады (өлшенген параметрдің мағынасы толығымен таза!), Ол айтылғандай, шын мәнінде психологиялық сынақтар болып табылады. Іс жүзінде, мысалы, мінез-құлықтың (аймағын) ең маңызды, мысалы, музыкалық қабілеттер үшін, мысалы, мамандар үшін сарапшылар резерві бойынша жасалатын сарапшылар пайда болады.

    Конструктивті жарамдылықтест мүмкіндігінше толық, айнымалы сипаттамасы, тест тағайындалатын өлшемді сипаттайды. Негізінде құрылымдық әрекет етуде жоғарыда аталған жарамдылық анықтамасының барлық тәсілдері кіреді. Кронбах және Мил (Кронбах және Мил (Кронбах және Мэй, 1955), ол психодиагностиктерге енгізілген құрылымдық әрекет тұжырымдамасы, тестілеуді тексеруде критерийлерді таңдау мәселесін шешуге тырысты. Олар көптеген жағдайларда бөлек алынған критерий бөлек тестілеуді тексере алмайды. Тест сауалнамасын шешу екі сұраққа жауап іздеу болып табылады деп санауға болады:

    1) жылжымайтын мүлік бар; 2) осы Сынақты іс жүзінде осы мүліктің жеке айырмашылықтарын іс жүзінде өлшейді. Құрылымдық негізділікті зерттеудегі нәтижелерді түсіндірудегі объективтіліктің проблемасы құрылымдық әрекет етумен байланысты, бірақ бұл проблема жалпылама болып табылады және жарамдылық шеңберінен тыс болып табылады.

    Бірде-бір индикатор жоқ, оның көмегімен психологиялық тесттің жарамдылығы орнатылған. Сенімділік пен кемсітушілік көрсеткіштерінен айырмашылығы, техниканың дұрыстығын растайтын нақты статистикалық есептеулерді жүргізу мүмкін емес. Осыған қарамастан, әзірлеуші \u200b\u200bпсихологиялық білім мен оның түйсіктерін қажет ететін тестілеудің пайдасына айтарлықтай дәлелдер келтіре алады.

    дайындық ≤ Сенімділік.

    Бұл дегеніміз, тестің дұрыстығы оның сенімділігінен аспауы керек дегенді білдіреді.

    Алайда, бұл қатынас дұрыс түсіндірілмеген, жарамдылық пен сенімділіктің тікелей пропорционалды қосылуы ретінде дұрыс түсіндірілмеген. Сенімділікті арттыру міндетті түрде жарамдылықтың өсуіне әкелмейді. A. An. Анастаси тұрғысынан жарамдылық өлшенген мінез-құлыққа қатысты тестің өкілдіктерімен анықталады. Егер бұл мінез-құлық саласы әр түрлі құбылыстардан тұрады, сынақтың негізді жарамдылық мерзімі автоматты түрде осы әр түрлі құбылыстардың үлгілерін ұсынады. «Сөйлеу қабілеті» жаһандық тұжырымдамасын қабылдаңыз (дәстүрлі тестілеудегі психолингвистикалық термин «ауызша интеллект» терминіне сәйкес келеді. Оларға хаттар мен оқу дағдылары сияқты салыстырмалы түрде тәуелсіз дағдылар кіреді. Егер сіз тиісті тестілеудің негізділігі туралы ойласаңыз, онда сіз ондағы ауызша интеллект компоненттерін тексеру үшін тапсырмаларды енгізуіңіз керек. Гетерогенді нүктелер мен субсоталар (субтест) енгізу, біз ішкі консистенцияны, тестілеудің бір уақытта сенімділігін төмендетеміз, бірақ біз жарамдылықтың едәуір артуын сұраймыз. Осылайша, тест аясын кеңейту үшін психодиагности қажетсіз ішкі консистенциядан аулақ болу керек. Бір мезгілде, тестілеудің әртүрлі нүктелері арасындағы ішкі корреляциялардың төмендеуімен қатар, теріс артық артық артық мөлшерде тестілеу нүктесін тарату қисығында жоғалып кетеді және ол формаға қалыпты қисық сызыққа барады.

    Эмпирикалық жарамдылық. Егер, дәлелді жарамдылық жағдайында сарапшылар есебінен сарапшылар есебінен жүзеге асырылса (өлшеу объектісінің тест тапсырмасының сәйкестігін орнату), содан кейін эмпирикалық жарамдылық әрқашан статистикалық корреляция көмегімен өлшенеді: екі жолдың арақатынасы - сынақ және индикаторлардың үстіндегі сілтегіштер жарамдылық критерийі ретінде таңдалады.

    Батыс тестілеудің прагматикалық дәстүрлері тестілеудің эмпирикалық дұрыстығын әлеуметтік және прагматикалық критерийлердің сыртқы психологиясына байланыстырды. Бұл критерийлер белгілі бір тәжірибешілер үшін тікелей мәні бар индикаторлар болып табылады. Тәжірибе әрқашан осы көрсеткіштерді көбейтуге немесе төмендетуге бағытталған. Мәселен, педагогикалық психология саласында бұл «орындау» (оны көбейту керек), еңбек психологиясында, бұл «еңбек өнімділігі» және «қызметкерлердің өнімділігі», «пациенттің денсаулығы». Осы санаттарға тікелей назар аудара отырып, психолог тест нәтижелерін осы көрсеткіштермен алдын-ала болжауға тырысып, іс жүзінде екі тапсырманы бірден шешеді: дұрыстығын өлшеу міндеті және оның психодиагностикалық бағдарламасының практикалық тиімділігін өлшеу міндеті. Егер айтарлықтай корреляция коэффициенті алса, онда біз олар бірден осы екі тапсырманың оң нәтижесімен шешіледі деп болжауға болады. Егер корреляция анықталмаса, ол белгісіздік болып қала берсе: процедураның өзі (сынақ ұпайы, мысалы, оператордың стресске төзімділігі көрінбейді), немесе ақыл-ой арасындағы себептік қатынастардың болуы мүмкін емес Меншікті және әлеуметтік маңызы бар индикатор (стресске төзімділік төтенше жағдайлардың пайызына әсер етпейді).

    Осылайша, әлеуметтік-прагматикалық критерийлер жан-жақты: олар сізге тиімділіктің дұрыстығын өлшеуге мүмкіндік береді, бірақ тесттің осы екі қасиетінің әрқайсысының әрқайсысы бөлек емес. Іс жүзінде, психолог, егер клиент психологты көбінесе қиын жағдайдан күтеміз, егер клиент психологты бірден белгіленген шаралардың диагностикасы негізінде (таңдау, кеңес беру, оқыту және т.б.) диагностикалауды қажет етеді. Бұл жағдайда индикаторлардың ұлғаюы (бақылау тобымен салыстырғанда сенімді) бір уақытта және диагностиканың тиімділігі және араласудың тиімділігін дәлелдейді. Теріс нәтиже тіпті үлкен белгісіздік береді, өйткені диагноздың төмен жарамдылығынан кедергілерді ажырату мүмкін емес.

    Эмпирикалық тексеру процедурасы. Іріктеуді эмпирикалық тексеруді ұйымдастыру критерийдің уақытша мәртебесіне байланысты. Егер бұл критерий бұрынғы оқиға болса (ретроспективті тексеру), содан кейін психодиагностикалық емтиханға қатысу үшін ол осы критерий бойынша төтенше полюстерде болған тақырыптарды ғана тарту үшін. Нәтижесінде экстремалды (контраст) топтар әдісі қолданылады. Жалпы сынақ нүктесімен корреляцияланған формуланың бисеральды коэффициентінің көмегімен бағаланады.

    Егер критерий болашақ оқиға (болашақ тексеру) болса, үлгі болашақта экстремалды топтардың ықтимал көлемін ескере отырып, резервтік түрде құрылуы керек. Мысалы, темперамент диагнозы психосоматикалық аурулардың жоғарылауына мүмкіндік беретінін білу керек (гипертония, жаралар, астма және т.б.). Эпидемиологиялық зерттеулер негізінде үш жыл ішінде бұл белгілі. 1000 дені сау адам - \u200b\u200bбұл аурулары бар 57 адам. Бұл дегеніміз, шамамен 2000 адам «биік» топтардың (науқастардың) санын 100 адам алу үшін алдын-алу (ескерту) диагностикасы болуы керек дегенді білдіреді. Болашақ тексеру диагностикалық процедураның болжамды тиімділігін көрсетеді. Жоғары болжамдық әрекет етудің өзіндік өлшемін өзі де, болжанған себептік қосылыстың да дәлдігін дәлелдейді.

    № 20 сенімділік тестілеудің өзін-өзі дефолтына қатысты арнайы әр түрлі түрдегі сенімділік ретінде. Әлеуметтік ұмтылу әдістері.

    Ерекшеліктің ерекше әртүрлілігі - дәлдік. Біз саналы немесе бейсаналық бұрмалаулар туралы айтып отырмыз, сынақтардың өзі сынақтан өтуге ықпал етеді, бұл нақты мінез-құлықтан ерекшеленетін ерекше мотивациямен, ерекше мотивациямен басшылыққа алды. Тестілеудің мотивациялық бұрмалаушылықтан қорғаудың және сынақтың дәлдігі болып табылады. Әсіресе, сенімділіктің өткір проблемасы сынақ сауалнамалары жағдайында, бұл кез-келген жауапты таңдауда көбірек бостандыққа мүмкіндік береді. Сенімділікті қамтамасыз етудің типтік әдісі - бұл тест сауалнамаларында өтеуіштердің таразының болуы, «Сұрақтарды енгізу», «бұл туралы емес», параллель мәселелерді енгізу, дубльдің сұрақтары. Бұл таразылар негізінен әлеуметтік ұмтылыстың құбылысына негізделген - пәндерді тестілеу кезінде әлеуметтік мақұлданған ақпарат беру тілектері. Егер осыған байланысты өтіріктің масштабында алынған болса, онда оның хаттамасы өте маңызды болса, онда оның хаттамасы жағымсыз болып табылады және оған бұл тестілеуді одан да ашық немесе басқа тест тапсырады. Сенімділікті өлшеуге бағытталған көптеген нақты тұзақтар көбінесе белгілі бір сынақ құрылымына қосылады, кейде тіпті ноу-хау (ақпараттық өнертабыс) және кәсіби құпия ретінде, олар тек лицензияланған пайдаланушылармен бөліседі арнайы лицензиялық келісімге қол қойды. Сатып алу кезінде. Тестінің сенімділігі осы тақырыппен психолог құра алатын қарым-қатынасқа деген сенім дәрежесімен тығыз байланысты. Екі диагностикалық жағдайды ажырата білу пайдалы: кеңес беру (клиенттердің жағдайы) және аттестаттау (сараптама жағдайы). Бірінші жағдайда, субъект ерікті негізде тестілеуге қатысады және тестілеу нәтижелері бойынша ұсыныстар алуға мүдделі (мысалы, кәсіптік бағдар беру кеңесінде). Екінші жағдайда, тестілеу оқытушының немесе әкімшіліктің, психологтың, ата-аналардың, яғни басқа адамдарға, және басқалардың нәтижелеріне қарағанда нәтижелерге көбірек қызығушылық танытады. Аттестаттау жағдайында сенімділік мәселесі әсіресе өзекті екені түсінікті. Осындай жағдайларда қолданылмайтын, олармен бірге берілмеген сауалнамалар пайдасыз. Керісінше, клиенттің жағдайында мұндай әдістерді қолдануға болады, олар жүргізіліп жатқан болады, оған жауап берілетін болады, оған сараптама жүргізілмейді. Сенімділік және стандарттаудың сенімділігі бір-бірімен тығыз байланысты. Жетістіктердің объективті сынақтары, егер олар еріктілер бойынша стандарттаудан өткен болса (кеңес беру жағдайында), егер олар сертификаттау жағдайында қолданылуы үшін танымал болуы керек.


    № 21 әдістерді құру және бейімдеу технологиясы

    Жеке әдістемелік әдістеме жасау немесе шетелдік техниканы бейімдеу жеке психометриялық қасиеттерді тексеру (немесе тексеру) - өкілдік, сенімділік, сенімділік, дұрыстығы, сенімділік - еркін реттеледі. Кейбір жағдайларда, жұмыстың бір кезеңінен, басқаларында - екіншісінен басталған жөн. Шын мәнінде, тестілеудің кез-келген нақты сынағы тек «дизайн» немесе тек «қосымшалардың» жағдайы емес. Төтенше тіректер арасында континум бар деп айту мүмкін емес:

    «Дизайн» __________________ «қолдану»

    Әрбір жағдай екі полюстен белгілі бір кезеңге дейін шығарылады. Мұндай жағдайды толығымен жаңа тест дизайны «бос жерден» бастаған кезде басталған кезде қоңырау шалу қиын. Сондай-ақ, тестілеудің барлық аспектілері толығымен өзгермейтін және дайын сынақты пайдаланудың толықтай зерттелетін нормативтік жағдайын көбейту қиынға соғады. Бірақ жағдайлардың барлығы, жағдайлардың барлығы, психология-практиктердің тәуелсіз параметрлерінің барлық комбинаторикасы, әдетте, екі-үш модельдік жағдайды азайтуға тырысады.

    1. Қолдану жағдайы. Біреудің сынағы әзірленді (мүмкін: мүмкін: басқа да әлеуметтік-мәдени жағдайлар), осы тіл мәдениеті өкілдерінде алынған тест стандарттары (стандарттау және сыныптағы және кәсіби-мәдени ерекшеліктер бойынша өтінім беру үлгілерінің сәйкес келмеуі »деп танылды елеусіз).

    2. Бейімделу жағдайы. Біреу сынағы жасалған - сенімділік және жарамдылық тексеріледі, бірақ сынақ нормалары жоқ (әдетте, осы тіл мәдениетіне ешқандай сынақтар жоқ). Бейімделудің міндеті, сондықтан тест нормаларын жасауға дейін қысқарады.

    3. Құрылыс жағдайы. Психикалық қасиеттер туралы түсінік бар, бірақ оның өлшемі, уақыт, уақыт, сандық талдау және басқа ресурстардың шектеулеріне сәйкес келетін оның өлшеу процедурасы жоқ. Өлшеу процедурасын ойлап, оның сенімділігі мен жарамдылығын тексеріп, сынақ нормаларын қалыптастыру қажет.

    Ең алдымен, аударылған тестілердің бейімделуіне тоқталайық. Дайын шетелдік техникалар жиынтығына байланысты әдістеменің репертуарын тез толтырудың жолы көптеген психологтардың ең үнемді, сенімді және жарамды психодиагностиктердің ең қысқа тәсілі болып көрінеді. Егер бейімделу тек тестілеу нүктелерінің нормативтік таралуын салуға азаятын болса, бұл бейімделген техниканың жаңа жағдайда жарамдылық және сенімділігі сенім бойынша және тест авторының теориялық тұжырымдамасы мен сенімділігі Қолданыстағы жарамдылық критерийлерінің мазмұны өзгермеген жағдайда ғана аударылады (іс жүзінде, кез-келген, оның ішінде, оның ішінде, оның ішінде және сенімсіз әдіс үшін, сіз таратуға болады). Ұқсалдық аударым тек қарапайым психикалық қасиеттерге, мысалы, жүйке жүйесінің қасиеттері, функционалды күйлер, сенсорлы күйлер, элективті когогнитивті функциялар, психофизиологиялық тіркеу, «физикалық» жетістіктермен тестілеу ).)..) сынақ процедурасындағы кез-келген лингвистикалық қаражаттың өзі (тек тапсырмалар сөзін ғана емес, сұрақтарды да, сұрақтарды, сонымен қатар тестілеуге арналған нұсқаулықтың бастапқы тұжырымдамасы) және нәтиженің дұрыстығын бағалаудың мәдени және нақты өлшемдерін қолдану (анықтау) Масштабты кілт) бейімделу кезінде тек тест нормаларын жинауға мүмкіндік бермейді!

    Жаңа әлеуметтік-мәдени жағдайларда сенімділік пен жарамдылықты тексеру үшін маңызды эмпирикалық жұмыс қажет, бұл түпнұсқа әдістеме жасау көлеміне сәйкес келеді. Осы тұрғыдан алғанда, қабілеттердің шетелдік қабілеттілігі, мінез-құлық белгілері, мінез-құлық белгілері, мүдделер және т.б. қарыз алу психодиагноздың ең қысқа тәсілі болып шықпайды. Бұл жол тек психометрия қағидаларын әдейі немесе білместен көрмейтіндер үшін қысқа болып көрінеді.

    Көпөлшемді аударма сынағының анкетасын бейімдеу кезінде эмпирикалық-статистикалық жұмыстың қажетті кезеңдерін қарастырамыз.

    1. Ішкі дұрыстығын талдау, сынақ анкетасы кіретін заттардың ішкі консистенциясы. Бұл талдау барлық эмпирикалық көрсеткіштердің қиылысуына қатысты жалпы диагностикалық меншікті (ол әлі белгісіз) жалпы диагностикалық меншіктің қандай түр бар екенін көрсетуге арналған (ол әлі күнге дейін антивирустардың «сәулесінің» орталығында). Мұндай талдау факторды талдау арқылы алынған барлық сынақ шкалаларына қатысты, мысалы, EPI AISENKA тестілері және 16pf Ketell. Бірақ «жергілікті бақылау» сауалнамасы немесе MMPI-дің көптеген негізгі клиникалық таразыларындағы ішкі консистенция қажеттілігін қолдану қажет емес, өйткені бұл таразыларға элементтер сыртқы өлшемдер бойынша таңдалды және бір «жиынтықтан» байланысты емес. Ішкі консистенцияны талдау бір өлшемді және көп өлшемді сынақтарға қолданыла алады. Бірінші жағдайда, жұмыс үстелінің калькуляторы жеткілікті. Көп өлшемді сынақтар үшін «Пойнаны талдау» арнайы компьютерлік бағдарламасын қолдану қажет.

    2. адгезияға төзімділікті тексеру. Бұл тексеру кезектесіп, теориялық тұрғыдан күтілетін өзгерістерді диагностикалау кезінде қажет. Сенімнің ең жақсы сенімділігін талдау болуы мүмкін (сонымен қатар сәйкесттің сенімділігін талдау) тестілеудің жеке пункттерінің ақпараттық, сонымен қатар жеке заттардың тұрақтылығын зерттеумен біріктірілуі мүмкін. Қалған сенімділік туралы ақпаратсыз психологтың элементтік статикалық экстраполизді болжаудың кез-келген болжамын құру үшін тест пайдалануға құқығы жоқ.

    3. Тиісті сыртқы өлшеммен корреляцияларды талдау. Егер тестілеудің бұл қадамы бастапқы критерийлерге қатысты, яғни ұпайларды іріктеу олардың қолданыстағы критерийлерімен олардың корреляцияларының негізінде жүргізілді. Мысалы, мұндай жұмыс Ф. Б. Березина командасы ММПИ-дің қысқартылған өзгертілген нұсқасы бойынша (Березин Ф. Б., 1976).

    4. Тест нормаларын тексеру немесе қайта қосу. Бұл кезең жоғарыда айтылды. Өкінішке орай, тек жұмыстың осы кезеңі тек барлық психологтарды қажет болған жағдайда ғана білді. Бірақ бұл жағдайда сынақ пункттерінің үлгіні алудың тұрақтылығын тексеру бойынша қажетті статистикалық жұмыстар үлгіні бөлу үшін әрдайым қайта шығарылмады.

    5. Көп өлшемді тесттердің нақты кезеңі - таразылар арасындағы қатынастар құрылымының репродукциясын тексеру. Мысалы, ортогоналибалдылық, «экстраверсия - интроверсия» және «нейротизм - тұрақтылық» факторларының статистикалық тәуелсіздігі Eizenka Test үшін түбегейлі негіз болып табылады. 16 ЖҚ факторлары арасындағы таразылардың репродуктивтілігі туралы, қайталама факторларды санаудың дұрыстығы (YAMPORL L. G., 1981; Мелников В. М. Мельников В., 1985).

    Тіпті бес листингтен тұратын кезеңді тез қарау тіпті шетелдік тесттердің бейімделуіне түпнұсқа техниканы құратын эмпирикалық және статистикалық жұмыстардың аздығына көз жеткізуге мүмкіндік береді. «Бейімделу» терминін емес, «ішкі үлгідегі шетелдік техниканы зерттеу» деген сөздерді қолдануға бұдан да жеткілікті болар еді.

    №22 Психологтың психометриялық дайындыққа қойылатын талаптар

    Практикалық психодиагностиктердің тиімді дамуы үшін бүгінде психодиагностикалық әдістерді қолданып барлық психологтардың психометриялық мәдениетінің күрт артуы қажет. Барлық психологтар тестілеуді және жарамдылық әдістерін сынаудың қарапайым әдістері болуы керек.

    Осы күнге дейін психологтардың негізі (және тіпті қарама-қарсы) психологтар емес, өздерін клиникалық әдістер саласында және өздерін тестілеуді ойластырған психологтар. Бірақ көптеген нақты тәжірибелерде осы әдістердің тіркесімі қажет. Психологтың психодиагностика пәні туралы нақты мағыналы идея қалыптастыру үшін, клиникалық, диалогтық әдістер жұмыстың бастапқы кезеңдерінде қажет. Олар сонымен қатар дараланған тәсілді қажет ететін арнайы даулы жағдайларда қажет. Бірақ психолог жедел, жаппай емтихандарды жүргізу қажет болған кезде, кейбір стандартталған, өлшеу техникасына шағым болмайды. Ол осындай әдістерді таңдауда психометриялық сауаттылықты қажет етеді: белгісіз, олар қандай психометриялық күйін келтіруді қолдану мүмкін емес.

    Психологтардың әмбебап психометриялық сауаттылығы психометриялық секрециялармен кәсіби түрде айналысатын психометрлік психологиялық психологиялық психологиялық психологтарды бөлуді жоққа шығармайды. Сондықтан, мұнда екі тізім әкелген жөн. нормативтік талаптар - психологқа және психолог-психометрге.

    Психологқа қойылатын талаптар:

    1. Психолог психометриялық құжаттамамен келісе алуы керек Әдістемелік әдебиеттер Психодиагностикалық, тестілеудің қандай психометриялық сипаттамаларын осы психометриялық сипаттамалары тест түріне, бір жағынан, екіншісіне қолдану керектігін және оны қолдану керектігін көрсетуі керек екенін білулері керек. Мысалы, сізге айтарлықтай жетістіктерге жету үшін сынақ қажет болған жағдайда, бірақ болжалды прогресс туралы ақпарат алу қажет болған жағдайда, болжамды жарамдылықты тексеру туралы ақпарат, тест осы тапсырманы шешуге дайын деп саналмайды.

    2. Психолог талап етілетін әдістеме бойынша танымал тест стандарттары оның жағдайында, диагностикалық жағдайда, «индустриялық аударым) болған жағдайда, оның жағдайында қолданылуы керек. «Жағдай және тестілеу нормаларын шешу қажет пе? Қажет болған жағдайда психолог бүлік шығарып, тестілеу пункттерін бөлуді және талдауды өз бетінше орындауы керек.

    3. Психолог мәліметтерді өз бетінше жинай, корреляциялық өңдеуді жүргізе біліп, осы өлшемге қатысты әдісті қолданыстағы тиімділікті өлшеуі керек. Қажет болған жағдайда, психолог критерийлер туралы ақпараттың операциялық көрсеткіштерін дербес көрсете алады.

    4. Психолог нәтижелердегі тым жоғары қателіктердің пайда болуын, оның гипотезасын тексеру кезінде қажетті сенімділік деңгейіндегі әдістеменің жоғалуын дербес анықтай білуі керек.

    5. Психолог екі құжаттаманы жүргізуге міндетті: Хаттаманың барлық көшірмелері негізгі мәліметтер банкін толтыру және әдістеменің психометриялық сипаттамаларын жақсарту үшін негізгі әдістемелік ұйымға (ғылыми және академиялық) беруге дайын болуы керек. Әдістемеге (нұсқаулықтар, жеке мәселелер, жеке мәселелер, жеке мәселелер, жеке мәселелер, презентация тізбегі) енгізілген барлық өзгерістер, психолог жетекшілік етуші ұйыммен келісуі керек, өйткені әртүрлі жеке өзгертілген орындардағы көркемөнерпаздар психометриялық тазалыққа әкеледі Алынған нәтижелер, тездетілмейді және белгілі бір шарттарға бейімделген өзгертулер құруды баяулатады және қажетті психометриялық қасиеттерге ие болады. Берілген әдістемелік стандарттардың мұқият сақталуы психологтың психометриялық мәдениетінің қажетті атрибуты болып табылады.

    6. Психолог сараптылық бұрмалаушылықтардың деңгейін дербес анықтап, өлшей алуы керек, бұл тестілік деректер субъектілерінің бұрмалаушылығын анықтай білуі керек, олар анықталмаған протоколдарды дұрыс кесіп, статистикалық қол жеткізуді жаппай нәтижелерге сәйкес жеткізе алады Топтық психодиагноз.

    7. Психолог жанама сандық санауды кешенді сандық санауды, сондай-ақ әртүрлі сандық ақпараттың жинақталуын қажет ететін интегралды көрсеткіштерді игеруі керек. Ол бағдарламаны (немесе психолог-психометриялық) компьютердегі есептеулерді жүргізу үшін тапсыра алуы керек.

    Психологиялық психо есептегіш мыналарды білуі керек:

    1. Психологометриялық дизайн бойынша барлық кезеңдерді жоспарлау және жүргізу және психодиагностикалық әдістерді бейімдеу жоспарлануда: жеке тестілеу және дұрыс емес заттар деңгейіндегі сенімділік пен жарамдылықты, сенімсіз және жарамсыз пункттерді тексеру, бөлу және бөлуді талдау Тестілеу пункттері, болжау үшін «шешуші ережелер» үшін математикалық теңдеулер жасау.

    2. Компьютерде психодиагностикалық мәліметтерді сақтау және өңдеу, стандартты операциялық жүйелер шеңберіндегі компьютерде жұмыс істеу дағдыларын, психодиагностиктердегі мәліметтер базасын және мәліметтер базасын басқара алуға болатындығын ұйымдастырыңыз.

    3. Психологтар-психодиагностиктердің жұмысын ұйымдастырады, қолданылған әдістерді, әдістемелік стандарттарға сәйкес, жалпы психодиагностикалық ақпараттың нәтижелерін ескеруге және интеграциялауға арналған.

    4. Карточкалық файлдарды белгілі бір аймақта (салалық психологиялық қызмет), мұқият иерарчизируяның әдістемелік материалдар кітапханасын сақтау, және Әдістемелік ұсыныстар стандартталған әдістерді қолдану туралы.

    №23 Психодиагностикалық жағдайлар және міндеттер

    Психодиагностикалық тапсырмаларды диагностикалық деректерді кім және қалай қолдану және қалай қолдану керектігі тұрғысынан ерекшеленуі мүмкін және зерттеу жүргізілген жағдайда араласу жолдарында психодиагностиктердің міндеті не болып табылады.

    Мәліметтер · Деректерді қызметтен тыс дәрігердің қолданылмақ диагноз қою немесе әкімшілік шешімді қалыптастыру үшін пайдаланады. Бұл жағдай әр түрлі комиссиялардың (әкімшілік, сертификаттау, тәртіптік) қызметі аясында психодиагностикалық мәліметтерді қолдануға тән. Психолог ойлаудың нақты ерекшеліктері, қызметкердің жеке басы туралы шешім қабылдайды, ал мекемені басқару психолог жеке жауапкершілікті алып жүрмейтін шешім қабылдайды. Бұл жағдайда психолог сарапшы ретінде, оның бағалауын басқа қатысушылармен бірге береді. Бұл нәтижелерді пайдалану сипатының кәсіби этиканың талаптарынан тыс қалмауын қамтамасыз етуі керек. Осы мақсатта тапсырыс беруші үшін психологты дайындаған құжатта нәтижелерді қолдануға шектеулер туралы ақпарат болуы керек.