Vilka typer av validering finns det? Vad det är? Du hittar svar på dessa och andra frågor i artikeln. Validitet är i sig en enskild egenskap som omfattar dels data om huruvida tekniken är lämplig för att mäta vad den utvecklats för, dels vad som är dess effektivitet, praktiska användbarhet, effektivitet. Att kontrollera giltigheten av en teknik kallas validering. Vi kommer att överväga det mer i detalj nedan.
Visningar
Många människor frågar: "Vad är validering?" Det sägs att det raffinerade sinnet inte har några gränser. Metodologer verkar konkurrera med varandra i vem som ska upptäcka eller uppfinna fler typer och typer av validitet. Vilka bara namn har inte dykt upp på sistone! Det visar sig att det finns:
- extern och intern giltighet;
- convergent;
- discriminant;
- uppenbart;
- faktoriellt;
- predictive;
- konstruktivt;
- kriterium;
- meningsfullt och så vidare.
Det finns inget sätt att förstå, och ännu mer att förnuftigt skilja en variant från en annan. Förvirring i definitioner och klassificeringar leder till att olika författare tillskriver helt olika sätt att förbättra den till samma form av giltighet.
Externa kriterier
För att utföra den pragmatiska valideringen av metodiken, det vill säga för att bedöma dess praktiska betydelse, effektivitet, effektivitet, används vanligtvis ett externt oberoende kriterium - en indikator för att visa vilken kvalitet som studeras i vardagen. Ett sådant kriterium kan vara både produktionsprestationer (för tekniker med professionell inriktning) och akademisk prestation (för tester av intelligens, prestationer eller inlärningsförmåga) och effektiviteten av faktiska aktiviteter - modellering, ritning och så vidare (för tester av särskilda färdigheter), personliga bedömningar (för identitetsverifiering).
Typer av externa valideringskriterier är följande:
- prestationsmått (dessa kan inkludera till exempel mängden genomfört arbete, tiden som spenderas på utbildning, akademiska prestationer, kvalifikationernas tillväxttakt och liknande);
- fysiologiska tecken (används när man studerar miljöns påverkan och andra situationsvariabler på människans psyke och kropp);
- blodtryck, puls, trötthetssymtom, hudens elektriska motstånd och så vidare mätsnästa;
- subjektiva mått (inkludera olika typer av svar som speglar en persons inställning till någon eller något, dennes åsikter, åsikter, preferenser; som regel erhålls sådana mått med hjälp av frågeformulär, frågeformulär, intervjuer);
- tecken på olyckor (används när syftet med studien till exempel rör problemet med att välja ut personer som är mindre olycksbenägna till arbete).
Empirisk giltighet. Vad handlar det om?
Få människor vet vad empirisk validering är. När det gäller innehållsvaliditet utvärderas testet av experter (som fastställer att testuppgifterna överensstämmer med innehållet i mätobjektet). Och den empiriska mäts alltid med statistisk korrelation: korrelationen mellan två typer av värden beräknas - testresultat och index för en extern parameter vald som ett tillförlitlighetskriterium.
Konstruktiv
Alla känner inte till typerna av valideringsmetoder. Vad är konstruktionsvaliditet? Det har att göra med själva den teoretiska konstruktionen och består av att leta efter faktorer som förklarar testprestandabeteende.
Som en specifik typ legitimeras konstruktionsvaliditet i en artikel av Mil och Cronbach (1955). Med hjälp av denna form av validitet utvärderade författarna alla testundersökningar som inte direkt syftade till att förutsäga några signifikanta kriterier. Forskningen innehöll information om psykologiska konstruktioner.
Innehållsgiltighet
Du fortfarandedu frågar: "Validering - vad är det." Tänk på innehållets giltighet. Det kräver att varje problem, fråga eller uppgift som hör till ett visst område har en identisk chans att bli ett testobjekt.
Content Validity utvärderar testenhetens lämplighet för det uppmätta beteendeområdet. Verifikationer skapade av två grupper av utvecklare utförs på ett urval av de som kontrolleras. Testernas tillförlitlighet beräknas genom att dela upp frågorna i två zoner, vilket resulterar i ett index över innehållets giltighet.
Predictive
Vi fortsätter att överväga valideringsmetoder. Prediktiv validitet fastställs också av ett externt, ganska tillförlitligt kriterium. Men information om honom samlas in en tid efter verifieringen.
Den externa måttstocken är vanligtvis en individs yrke, som visas i varje bedömning, för den typ av yrke som han valdes för på grundval av resultaten från diagnostiska tester.
Även om den här metoden är mest lämpad för uppgiften med diagnostiska verktyg - förutsägelse av framtida framgång, är den mycket svår att tillämpa. Noggrannheten i prognosen är omvänt beroende av den tid som tilldelats för en sådan förutsägelse. Ju längre tid som går efter mätningen, desto fler faktorer behöver man ta hänsyn till när man utvärderar teknikens prediktiva värde. Det är dock nästan omöjligt att ta hänsyn till alla faktorer som påverkar förutsägelsen.
Retrospective
Håller med, validering är en mycket komplicerad process. Det är känt att retrospektiv giltighet avslöjas på grundval av kriteriet,återspeglar tillståndet för en kvalitet eller händelse i det förflutna. Kan användas för att omedelbart få prediktiva teknikkällor. Så, för att revidera i vilken utsträckning goda resultat av ett färdighetstest motsvarar snabb inlärning, kan man jämföra tidigare expertutlåtanden, prestationsbedömningar och så vidare hos individer med låga och höga diagnostiska index för tillfället.
Diskriminerande och konvergent
Typer av validering är av intresse för många. Låt oss ta reda på vad diskriminerande och konvergent giltighet är. Strategin att införa etablerade objekt i testet beror på hur psykologen avslöjar den diagnostiska konstruktionen. Om Eysenck definierar kvaliteten "neuroticism" som oberoende av introversion-extroversion, betyder detta att hans frågeformulär lika bör representera positioner som kommer att godkännas av neurotiska extroverta och introverta.
Om det i praktiken visar sig att posterna från "introversion-neuroticism"-kvadranten kommer att råda i uppgiften, så innebär detta utifrån Eysencks teori att indikatorn "neuroticism" är laddad med en irrelevant indikator - "introversion". En identisk effekt uppträder när det finns en bias i provet - om det finns fler neurotiska introverta personer i det än samma extraverta.
För att undvika sådana komplexiteter är psykologer villiga att ta itu med empiriska saker som bara informerar om en enda faktor. Men i verkligheten är detta krav aldrig uppfyllt: varje empiriskt index visar sig inte vara bestämtbara av den faktor som vi behöver, men också av andra - irrelevant för problemet med mätning.
Således, för faktorer som är begreppsmässigt definierade som ortogonala mot det uppmätta (förekommer med det i alla kombinationer), är testskaparen skyldig att, när han väljer objekt, använda strategin med oäkta balansering.
Motsvarigheten av poäng till den uppmätta indikatorn garanterar testets konvergenta giltighet. Överensstämmelse mellan poster med avseende på irrelevanta källor ger diskriminerande giltighet. Empiriskt visar det sig i avsaknad av signifikant korrelation med testet, som mäter den konceptuellt unika kvaliteten.
Verktygssats
I den allmänna uppsättningen av valideringsmetoder inkluderar författare vanligtvis:
- icke-formaliserad (från enkla knep för att noggrant granska listan med alternativ i frågeformuläret till mer sofistikerade procedurer för teoretisk steg-för-steg-analys);
- formaliserad, som inkluderar förfaranden och tekniker för matematisk statistik: testning av statistiska hypoteser, beräkning av uppskattningar, korrelationsanalys, konstruktion av konfidensintervall, bedömning av samband mellan variabler, spridning, faktoriell, regressions- och strukturanalys, och så på.
Skapa verktyg
Och ändå, vad är validering? Sofistikerade valideringsverktyg skapades först av psykologer. Redan 1959 utvecklades en speciell teknik av D. Fiske och D. Campbell (USA). Hon fick en helt naturlig för engelska, men oöversättbar tillvårt språk, namn: multi-method-multi-damn matris (MTMM). Denna matris var en tabell över korrelationer. Den bestod av två mycket attraktiva uppfinningar, varav den ena var avsedd att avslöja konvergent sanning och den andra för diskriminerande sanning.
Dess författare hävdade att vem som helst kan bevisa intern acceptans om:
- värden mellan vilka en hög nivå av teoretiskt samband antas kommer att finna en identisk nivå i empirin (konvergens);
- värden som är teoretiskt orelaterade kommer att visa sig vara orelaterade empiriskt efter utförandet av testet (diskriminering).
I grova drag bör konvergent validitet ange att det finns mycket mer likhet mellan två team av anställda, till exempel byggnadsarbetare och löpande bandarbetare, när det gäller chanser på arbetsmarknaden än mellan ägare och anställda. Om det teoretiskt avsedda sambandet hittas empiriskt är ditt exempel giltigt.
Diskriminerande validitet visar graden av identifiering av olika fenomen. För att ta samma exempel på arbetsmarknaden skulle man förvänta sig att en väl utformad teori med sina medel skulle kunna skilja mellan ägares och anställdas möjligheter på arbetsmarknaden. Du kan inte förväxla dem, och din teori kan skilja dem åt.
Om du skapade en skala som mäter matematiska förmågor, bör, i fall av giltighet av de konvergerande indexen för matematiska talanger, korrelera väl med en persons allmänna färdigheter, om ett sådant förhållande på teoretisk nivådet finns, och dåligt - med estetiska förmågor som kräver helt andra talanger av en person än räknefärdigheter, om naturligtvis en låg korrelation proklameras av din teori.
Typer
Validering är processen att ställa in, förbättra de skapade psykodiagnostiska metoderna. Dess grundläggande uppgift är att se till att tekniken diagnostiserar exakt vad utvecklaren behöver. Man skiljer på teoretisk och pragmatisk validering.
För den första typen är kardinalproblemet förhållandet mellan mentala fenomen och deras index, med vars hjälp dessa fenomen försöker bli kända. Det visar att resultaten av metodiken och författarens abstrakta avsikt är desamma.
För att fastställa abstrakt giltighet är det mycket svårt att hitta något oberoende kriterium som ligger utanför metodiken. I psykodiagnostikens historia i de tidiga stadierna var därför beroendet av det instinktiva konceptet som testet mäter:
- En metod ansågs giltig om den helt enkelt var "uppenbar".
- Giltighetsbeviset baserades på prospektörens tro att hans teknik kunde "förstå testpersonen".
- Skolningen ansågs endast giltig eftersom teorin bakom tekniken var "ganska bra".
Nästa började sökandet efter bevis motiverade av vetenskapen. Det bör noteras här att den omärkliga ansamlingen av en arsenal av teknologier med en redan underbyggd och kändgiltighet. Om en psykodiagnostiker skapar ett schema för att bedöma en kvalitet och det är känt att andra, giltiga teknologier är inriktade på samma bedömning, då kan du studera sambandet, jämföra resultaten enligt någon annans och din egen metod.
Om korrelationskoefficienten är för hög har det genererade schemat imponerande abstrakt giltighet. Om du är osäker på vad exakt en teknik utvärderar, jämför resultaten för den med resultaten för någon annans giltiga system som känner igen intilliggande (misstänkta) egenskaper. Om korrelationsvärdena visar sig vara oväntat stora kan man dra slutsatsen att metoden inte uppskattar vad som förväntades.
Därmed, om det redan finns andra system som syftar till att mäta exakt samma normer eller relaterade, kan vi fastställa diskriminerande och konvergent giltighet.
Nyanser
Så, vad är validering? Med enkla ord är detta en revidering av produkten för att se hur den matchar de deklarerade egenskaperna. Det vill säga, någon smartphone-validering kommer inte att passera förrän då. Tills kunder ser till att den har kameran och lagringen de är villiga att betala för.
Valideringskriteriet är ett mått på mental kvalitet som är oberoende och direkt från testet som valideras och som det psykodiagnostiska schemat syftar till.
Current validity - en egenskap hos testet som återspeglar dess förmåga att skilja mellan försökspersoner på grundval av en diagnostisk egenskap som är föremål för studien i dettametod.
Kompetitiv validitet uppskattas av korrelationen mellan det skapade testet och andra, vars giltighet i förhållande till den uppmätta parametern fastställs. Differentiell validitet kan förklaras av exemplet med intressetester.