Testmetode fordeler og ulemper. Online testing

Å teste elever i skolen er på ingen måte en nymotens oppfinnelse, slik mange nå ønsker å forestille seg. Periodiske tester og selvstendig arbeid, frontalundersøkelser og personlige oppgaver utført av skoleelever var også rettet mot å identifisere graden av assimilering av den ervervede kunnskapen. Med bruken av datamaskiner på skolene, har jobben med å skrive og sjekke tester om en rekke emner i en rekke fag blitt mye enklere. Men selve testene dukket opp på skolene mye tidligere.

Hva er fordelene og ulempene med testing som kontrollmetode?

Mange lærere brukte såkalte prøvekort i arbeidet. Hvert kort representerte en unik individuell oppgave de ble delt ut til klassen i bokstavelig talt 10-15 minutter. Etter dette ble kortene samlet inn og timen fortsatte. Slike testoppgaver tillot læreren å bestemme fullstendigheten av elevenes assimilering av materialet fra forrige leksjon. Dessuten krevde det svært kort tid å sjekke slike korttester - bare noen få sekunder per kort. Samtidig brukte læreren minst fem minutter på å kontrollere ett selvstendig arbeid, og da kun under forutsetning av at han tidligere hadde jobbet med lignende oppgaver.

Holdningene til prøver i skolen er langt fra klare. Mange tror at tester ikke gjenspeiler det reelle kunnskapsnivået elevene har tilegnet seg. Dette er delvis sant, siden man ikke i noe tilfelle helt kan stole på testresultater med unntak av alle andre metoder for å teste kunnskap. Mens de tar tester, kan elevene gjøre en mindre feil som vil påvirke resultatet, eller rett og slett skynde seg og bli nervøs, eller du vet aldri hva annet. Men effektiviteten til tester som et middel til å raskt vurdere klasseromsprestasjoner kan ikke nektes. Spørsmålet er bare at det er uakseptabelt å akseptere alle testresultater ubetinget, det er nødvendig å kontrollere testresultatene og gjennomføre en differensiert analyse for hver elev individuelt.

Når du sjekker selvstendig arbeid, for eksempel i matematikk, kan læreren se fremdriften til elevens beregninger og identifisere den irriterende skrivefeilen som førte til feilen. Kanskje distraherte noen studenten i det øyeblikket, og han hadde ikke tid til å sjekke på egen hånd. En erfaren og objektiv lærer vil aldri anse dette som en feil, spesielt hvis både formlene og løsningen var helt riktige. Testing krever bare riktig svar. Når du tar prøver som krever at du gjør noe for å få svar, oppfordres studentene til å levere utkastene sammen med prøvekortene. Da vil både lærer og elev ha grunn til å gå gjennom prøvesvarene og gi riktig karakter. applikasjon enkle tester, der det for eksempel er nødvendig å erstatte i formelen ønsket verdi, svar entydig på spørsmålet "ja" eller "nei" eller navngi måleenheten, mest nøyaktig gjenspeiler assimileringen av materialet og krever ikke avklaring. Og bruk av slike tester i skolene bør gjennomføres så ofte som mulig.

Kvaliteten på slike tester i dag overlater dessverre mye å være ønsket. Poenget her er ikke bare at det ikke er nok kildemateriale eller midler til å selvstendig utvikle tester, men også at selve holdningen til tester over tid har blitt negativ og utviklingen fra tidligere år har gått tapt. Men å teste på skolen er ikke bare en hyllest til moten og kan ikke oppfattes formelt, som en slags pålagt plikt. Testing gir god mulighet Elevene kan tydelig se hull i læringen og prøve å rette dem opp. Når alt kommer til alt, når han går inn i en høyere utdanningsinstitusjon, og spesielt under studiene, vil en student måtte møte oppfatningen fra lærere som vil vurdere kunnskapen deres objektivt, uavhengig av deres tidligere skoleprestasjoner. Det er veldig viktig å vise helt fra begynnelsen at kunnskapen som ble tilegnet på skolen, og viktigst av alt ønsket om å få den, ikke var forgjeves for eleven.

Hva du bør vurdere når du utvikler tester

Det er flere ting du bør vurdere når du utformer tester. viktige faktorer. For det første bør tester kun kompileres på grunnlag av materialet som dekkes, skal ikke tas i betraktning her. For det andre bør tiden som er tildelt for å fullføre en bestemt testoppgave beregnes under hensyntagen til hastigheten på å fullføre slike oppgaver, ikke på gjennomsnittet for klassen, men på grunnlag av den tregeste eleven om nødvendig, bør slike barn gis ekstra tid uten at det går på bekostning av innlæringen av nytt materiale. For det tredje bør konstruksjonen av tester gå fra enkel til kompleks, slik at eleven ikke snubler over de første oppgavene og ikke kaster bort dyrebar tid. For det fjerde må alle testoppgaver være gjennomførbare, det vil si at de må forhåndssjekkes for skrivefeil. Hvis minst ett av disse kravene ikke er oppfylt, er det umulig å snakke om en fullstendig og objektiv vurdering av kunnskap.

Testmetoden er en av de viktigste innen moderne psykodiagnostikk. Når det gjelder popularitet innen pedagogisk og profesjonell psykodiagnostikk, har den hatt førsteplassen i verdens psykodiagnostiske praksis i nesten et århundre.

I denne delen skal tester forstås som metoder som består av en rekke oppgaver med valg mellom ferdige alternativer svar. Ved beregning av prøveskår får de utvalgte svarene en entydig kvantitativ tolkning og summeres opp. Totalskåren sammenlignes med kvantitative testnormer, og etter denne sammenligningen formuleres standard diagnostiske konklusjoner.

Populariteten til testmetoden forklares av følgende hovedfordeler:

1) standardisering av forhold og resultater. Testmetoder er relativt uavhengige av kvalifikasjonene til brukeren (utøveren), for rollen som selv en laboratorieassistent med videregående opplæring kan trenes. Dette betyr imidlertid ikke at det ikke er nødvendig å involvere en kvalifisert spesialist med en fullverdig høyere psykologisk utdanning for å utarbeide en omfattende konklusjon på et batteri av tester;

2) effektivitet og økonomi. En typisk test består av en rekke korte oppgaver, som hver vanligvis ikke tar mer enn et halvt minutt å gjennomføre, og hele testen tar vanligvis ikke mer enn en time. En gruppe forsøkspersoner testes samtidig, og sparer dermed betydelig tid på datainnsamling;

3) kvantitativt differensiert karakter av vurderingen. Granulariteten til skalaen og standardiseringen av testen gjør at vi kan betrakte den som et "måleinstrument" som gir en kvantitativ vurdering av de målte egenskapene. Testresultatenes kvantitative karakter gjør det mulig å anvende et velutviklet psykometrisk apparat som lar en vurdere hvor godt en gitt test fungerer på et gitt utvalg av forsøkspersoner under gitte forhold;

4) optimal vanskelighetsgrad. En profesjonelt utført test består av oppgaver med optimal vanskelighetsgrad. I dette tilfellet scorer gjennomsnittsfaget omtrent 50 % av maksimalt mulig antall poeng. Dette oppnås gjennom foreløpige tester - et psykometrisk eksperiment (eller aerobatikk). Hvis det under aerobatikk blir kjent at omtrent halvparten av den undersøkte kontingenten kan takle oppgaven, anses en slik oppgave som vellykket og blir stående i testen;

5) pålitelighet. Dette er trolig den viktigste fordelen med tester i pedagogisk psykodiagnostikk. Lottokarakteren til moderne eksamener med trukket heldige eller uheldige lodd har lenge blitt snakk om byen. Lotteriet for eksaminanden gir her lav reliabilitet for sensor - svar på ett fragment læreplan, som regel, er ikke en indikasjon på nivået av assimilering av alt materiale. I motsetning til dette dekker enhver velkonstruert test hoveddelene av læreplanen (kunnskapsområdet som testes eller manifestasjonen av en eller annen ferdighet eller evne). Som et resultat blir muligheten for «haleledere» til å bli fremragende studenter, og for en utmerket student å plutselig mislykkes, kraftig redusert;

6) Rettferdighet. Det er den viktigste sosiale konsekvensen av fordelene ovenfor. Det skal forstås som beskyttelse mot eksaminatorbias. God test setter alle inn like forhold. Sensorens subjektivitet manifesteres sterkest, som kjent, ikke i tolkningen av løsningsnivået for problemet (det er ikke så lett å kalle svart hvit, eller et løst problem uløst), men i det tendensiøse utvalget av oppgaver - lettere for ens egen, vanskeligere for andres. Tester gir skolens viktigste funksjon som et sosialt filter - funksjonen "sosial og faglig seleksjon". Hvor rettferdig slik utvelgelse viser seg å være, er av enorm betydning for samfunnsutviklingen. Derfor er det så viktig for alle som har tilgang til tester og deres resultater å lære kulturen for kompetent og human bruk av tester, fordi bare en pliktoppfyllende og kvalifisert holdning hos brukere til tester gjør dem til et verktøy som øker, og ikke reduserer. , rettferdighetsnivået i samfunnet;

7) mulighet for databehandling. I i dette tilfellet Dette er ikke bare en ekstra bekvemmelighet som reduserer det menneskelige arbeidet til kvalifiserte utøvere under masseundersøkelse. Som et resultat av databehandling økes alle testparametere (for eksempel med tilpasset datatesting reduseres testtiden kraftig). Databehandling er et kraftig verktøy for å sikre informasjonssikkerhet(diagnostisk pålitelighet). Dataorganisering av testing, som involverer opprettelsen av kraftige informasjonsbanker testoppgaver, lar deg teknisk forhindre misbruk fra skruppelløse sensorer. Valget av oppgaver som tilbys til et bestemt emne kan gjøres fra en slik bank av dataprogrammet selv direkte under testingen, og presentasjonen av en bestemt oppgave til et gitt emne i dette tilfellet er like mye en overraskelse for sensoren som for sensoren. Emne.

I mange land er implementeringen av testmetoden (samt motstand mot denne implementeringen) nært knyttet til sosiopolitiske forhold. Innføring av velutstyrte testtjenester i utdanning er et viktig verktøy i kampen mot korrupsjon som rammer den regjerende eliten (nomenklatura) i mange land. I Vesten opererer testtjenester uavhengig av utstedende (skoler) og mottakende (universiteter) organisasjoner og gir søkeren et uavhengig sertifikat for testresultater, som han kan gå til enhver institusjon med. Denne uavhengigheten til testtjenesten fra utstedende og mottakende organisasjoner er en tilleggsfaktor i demokratiseringen av prosessen med å velge profesjonelt personell i samfunnet, og gir en talentfull og enkelt effektiv person en ekstra sjanse til å bevise seg selv.

2. Ulemper ved testmetoden

Testmetoden har noen svært alvorlige ulemper som ikke tillater at hele diagnosen av evner og kunnskap utelukkende reduseres til testing, som for eksempel:

1) fare for «blinde» (automatiske) feil. Lavt kvalifiserte utøveres blinde tro på at testen skal fungere korrekt automatisk gir noen ganger opphav til alvorlige feil og hendelser: Testpersonen forsto ikke instruksjonene og begynte å svare helt annerledes enn det standardinstruksjonene krever, testpersonen for noen grunn brukte forvrengningstaktikker, et skifte i å feste en sjablongnøkkel til svarskjemaet (for manuell, ikke-datamaskinscoring), etc. Brukeren bør ikke gå til testen med en magisk holdning, som om denne magiske svarte boksen alltid skal fungere skikkelig uten menneskelig kontroll;

2) fare for vanhelligelse. Det er ingen hemmelighet at den tilsynelatende enkle å gjennomføre tester forfører folk som ikke er egnet for noe dyktig arbeid. Utstyrt med tester av uforståelig kvalitet, men med høylytte reklamenavn, tilbyr testende ignoranter aggressivt sine tjenester til alle og enhver. Alle problemer er ment å løses ved hjelp av 2-3 tester - for alle anledninger. En ny etikett er festet til den kvantitative testpoengsummen - en konklusjon som skaper inntrykk av samsvar med den diagnostiske oppgaven. Et eksempel på slik profanering er den utbredte bruken av MMPI klinisk test for personellutvelgelse i vårt land. Skruppelløse banning og grunnleggende uvitenhet går hånd i hånd innen testing;

3) tap av individuell tilnærming, stress. Testen er den mest generelle rangeringen som alle mennesker er utstyrt under. Muligheten for å gå glipp av den lyse individualiteten til en ikke-standard person er dessverre ganske sannsynlig. Dette føler testpersonene selv, og det gjør dem nervøse, spesielt i situasjonen med sertifiseringstesting. Personer med redusert motstand mot stress opplever til og med en viss forstyrrelse av selvreguleringen – de begynner å bekymre seg og gjøre feil i grunnleggende saker for seg selv. Å legge merke til en slik reaksjon på en test i tide er en oppgave som ligger innenfor makten til en kvalifisert og pliktoppfyllende utøver;

4) tap av individuell tilnærming, reproduksjon. Kunnskapstester appellerer først og fremst til standardanvendelse av ferdigkunnskap;

5) mangel på mulighet til å avsløre individualitet i nærvær av standard, gitte svar, er dette en uopprettelig mangel ved testmetoden. Fra et synspunkt om å identifisere kreativt potensial, begrenses de fleste tester nettopp av at de ikke appellerer til kreativ, konstruktiv aktivitet. Uansett, noen standardiserte kreativitetstester omhandler svært abstrakt materiale, mens prestasjons- (kunnskaps-) tester tilpasset livet viktig materiale(profesjonelt relevant), som regel utføres i form av et standardsett med oppgaver med et gitt svar;

6) mangel på tillit. Den sjelløse og formaliserte karakteren til selve testprosedyren resulterer i at forsøkspersonen er fratatt følelsen av at psykologen er interessert i ham personlig, i å hjelpe med hans problemer og vanskeligheter. Dialogiske metoder (samtale, spill) i denne forbindelse har utvilsomme fordeler: ved å kommunisere direkte med emnet kan en kvalifisert psykolog etablere tillitsfull kontakt, vise personlig involvering, skape en atmosfære som lindrer spenning og beskyttelse;

7) tap av individuell tilnærming, utilstrekkelig kompleksitet. Noen ganger utsetter ukvalifiserte testologer et barn for tester som er for vanskelige for hans alder. Han har ennå ikke utviklet de nødvendige konseptene og konseptuelle ferdighetene for å forstå hvordan generelle instruksjoner til testen, og betydningen av individuelle spørsmål.

Tester kan derfor ikke gjøres til den eneste omfattende metoden for noen diagnose (både pedagogisk og profesjonell og personlig) - de krever parallell bruk av gratis skriftlig arbeid (i personlig diagnostikk blir essays plass tatt av projektive tester med gratis svar ), samt et muntlig intervju (intervju). Dermed er stedet for tester å utfylle de ovennevnte tradisjonelle metodene. I denne egenskapen er tester uunnværlige, siden de ikke har mange av ulempene som ligger i tradisjonelle metoder.

En rolig bevissthet om fordelene og ulempene ved testmetoden frigjør alle (utøvere, kunder, fag) fra både overdreven avhengighet av testmetoden og fra å neglisjere den.

Testing som et middel til å undervise og overvåke kunnskap har vært brukt i lang tid. Selve ordet test, oversatt fra engelsk, betyr å sjekke, teste. Her mener vi med testing en spørreundersøkelse: spørsmål med forslag til svar, der forsøkspersonen velger ett eller flere riktige.

Spørsmålene som stilles kan være muntlige eller trykte, men på det nåværende utviklingsstadiet av samfunnet, utstyret utdanningsinstitusjoner og bedrifter med midler datateknologi stor nok til å utføre sertifiserings- og verifiseringsarbeid ved bruk av datamaskiner.

Den største fordelen med automatisert testing er åpenbart brukervennlighet, redusert arbeidsintensitet og eliminering av feil under testing (datamaskiner opplever ikke en reduksjon i oppmerksomhet på grunn av tretthet). I tillegg er fjernundervisning, hvor interessen øker, vanskelig å forestille seg uten bruk av passende programvare.

Blant ulempene med testing kan man merke seg vanskeligheten med å formulere svar på spørsmål om emner relatert til de generelle lovene for utvikling av natur, samfunn (filosofi, historie, økonomi, noen grener av astronomi, fysikk, etc.), som er karakteriserte ved tvetydige svar, og binær logikk "ja/nei" er ikke nok. Dessuten er det umulig å kontrollere kreativ kunnskap gjennom testing. Så, testing av forståelse og ferdigheter i noen områder av humaniora og sosio-politiske disipliner er utenfor omfanget av testing. Det finnes andre vurderingsmetoder for dette.

Betydelig ulempe testing, indirekte relatert til problemene ovenfor, er at elevene venner seg til ferdige formuleringer, og mister (ikke får) evnen til å uttrykke tanker fritt og kompetent. På den annen side finner folk som er flaue over å snakke seg på lik linje med «høyttalere».

Noen ganger ber brukerne våre om å eliminere den "overdrevne objektiviteten" til testprogrammet, noe som betyr at under en muntlig undersøkelse kan læreren velge kompleksiteten til spørsmålene som stilles, med tanke på beredskapsnivået til respondenten, noe som er umulig når du bruker datamaskin testing. Det er vanskelig å si om en slik mangel bør elimineres.

I tillegg er det testfeil som er vellykket eliminert i SunRav-programvare. La oss liste noen av dem.

Ufullkommenhet ved testing tilskrives ofte en viss ufleksibilitet i den endelige vurderingen.

I SunRav TestOfficePro-programmet konfigureres oppsummering av testtakerens arbeid og generering av en vurdering iht. forskjellige parametere. Du kan vurdere:

  • prosentandel riktige svar,
  • forholdet mellom riktige svar og feil eller gitte,
  • summere poeng (hvert svar, både riktig og feil, kan tildeles sin egen koeffisient).

Og også i SunRav TestOfficePro er det mulig å lage en adaptiv test, der overgangen til neste oppgave skjer avhengig av svarene på de forrige. Denne funksjonen er spesielt etterspurt når du lager tester som brukes til læring og mestring av materiale.

Dermed er arbeidsintensiteten i det første trinnet - å lage testdatabaser, introdusere testing i organisasjonen - midlertidig. Generelt er databasert kunnskapstesting utvilsomt mer kostnadseffektiv enn muntlige eller skriftlige tester.


Enhver programvareutvikler står før eller siden overfor oppgaven med å vurdere kvaliteten på produktet som utgis. Ofte ledere små prosjekter anser det som en uoverkommelig luksus å ty til tjenestene til profesjonelle testere. Tross alt, ved første øyekast, hvem, hvis ikke utvikleren eller brukeren selv, kan den beste måten finne feil i programmet? I hovedsak, i dette tilfellet, kommer hele studien ned på beta-testing ("betatesting er intensiv bruk av en nesten ferdig versjon av et produkt (vanligvis programvare eller maskinvare) for å identifisere det maksimale antallet feil i driften for deres påfølgende eliminering før den endelige utgivelsen av produktet til markedet, til masseforbrukeren").

Praksisen med å bruke klienter - forbrukere av et produkt som testere - har nylig blitt ganske populær. Vi vil prøve å vurdere fordeler og ulemper med betatesting og testing av spesialister som er åpenbare ved første øyekast. Viser de seg alle å være "fordeler" eller "ulemper" ved nærmere undersøkelse?

Fordeler og ulemper med beta-testing

proffer :

1. Tilbakemelding.
Den ubestridelige fordelen med beta-testing blir reell tilbakemelding med produktbrukere. Til dette formål bruker de ulike instrumenter: samle tilbakemeldinger, stille spørsmål, med jevne mellomrom involvere ekte forretningsbrukere i testprosessen.

Faktisk, i noen tilfeller er det bare brukere som kan teste programvaren for å identifisere de mest praktiske, mest interessante, eller omvendt, de mest uakseptable modulene og funksjonene. Etter å ha mottatt slike tilbakemeldinger, kan utviklere raskt avgrense produktet under hensyntagen til de uttrykte ønskene: endre systemlogikken, rediger testskript.

Programvarefeil oppdages også ved bruk av sjeldne miljøer. Derfor, når du velger en beta-teststrategi, bør du vurdere det beste resultat vil oppnås forutsatt at et stort antall brukere med ulik bakgrunn er involvert. Et utmerket eksempel på slikt arbeid er strategien til det berømte selskapet Google. Ved å bruke kraftig utstyr systematiserer og klassifiserer selskapet anmeldelser fra titusenvis av brukere, og bringer programvareproduktene til perfeksjon.

2. Spare penger.

Fordelen med betatesting ved første øyekast er den lave kostnaden. Ideelt sett får vi testdekning uten ekstra investeringer. Den mest brukte metoden for betatesting er innen spillindustrien. Erfaringen fra mange utviklingsselskaper bekrefter den økonomiske gjennomførbarheten av denne metoden. En reduksjon i selskapets totale kostnader kan også oppnås ved å bruke betatester som et verktøy for å promotere systemet. Gratis replikering av betaversjoner sikrer økt interesse blant sluttbrukere for den endelige versjonen av produktet.

Men går alt alltid så bra? Som praksis viser, kan mangelen på en kompetent beta-teststrategi føre til katastrofale resultater. La oss se på dette ved å bruke ekte eksempler.

For ikke lenge siden gjorde et bestemt selskap som produserer dataspill en betaversjon fritt tilgjengelig. Hensikten med handlingen var å motta feilrapporter fra brukere. Ting fungerte ikke med en gang: svært få anmeldelser ble mottatt. Utviklerne måtte tilby bonuser i form av nødvendige artefakter i spillet for hver feilrapport som var igjen. Først etter dette trinnet ble det endelig mottatt nødvendig informasjon.

Som et resultat av denne "vinn-vinn"-strategien brukte selskapet mye mer tid enn det hadde planlagt. Dessuten pådro hun seg ekstra kostnader for å "vedlikeholde" hele utviklingsteamet mens hun ventet på resultater.

Et annet nylig eksempel: en japansk utvikler ga ut et velkjent spill for mobile enheter i beta-testing. Se for deg overraskelsen til brukere da det viste seg at de ikke alltid var i stand til å bare starte spillet på enhetene sine. Ikke bare det, men betatestere spredte for tidlig informasjon om spillet på nettet, noe som forstyrret kampanjeplanene. Faktisk førte "besparelsene" til den kommersielle feilen ved lanseringen av spillet. Samtidig brukte selskapet, som i forrige sak, ekstra tid og penger.

De beskrevne situasjonene viser at betatesting, planlagt uten involvering av erfarne spesialister, ikke alltid fører til kostnadsbesparelser.

Minuser:

1. Lave kvalifikasjoner av testere.

Det er viktig å huske at hoveddeltakerne i betatesting er frivillige blant vanlige brukere av det fremtidige produktet. Disse menneskene har ikke alltid de minste tekniske ferdighetene til å gi en kvalitetsvurdering av programvaren. Selvfølgelig om tydelig lokalisering og klar beskrivelse Du trenger ikke engang å huske en feil under betatesting - testere på heltid vil fortsatt måtte håndtere det.

2. Ufullstendig testdekning.

En viss analogi med beta-testing kan sees i den legendariske filmen "Operation Y...". Ifølge handlingen står "gjengen" overfor oppgaven med å iscenesette et ran av et lager der "alt allerede er stjålet før deg." "Testbenken" er en garasje, ombygd for å oppnå egenskapene til et ekte lager ("Produkt"). Gjengen velger hovednøkler og gjennomfører "testscenarier" for å infiltrere og simulere et ran. Generelt skal operasjonen være vellykket, MEN ... "feigingen", trent "på katter", snubler i et avgjørende øyeblikk over et alternativt scenario: "Hvor er bestemor?" - "Jeg er for henne". Som et resultat viser operasjon Y seg å være en fiasko. Praksis viser at ved testing av ikke-profesjonelle, forblir en del av funksjonaliteten alltid avdekket.

Fordeler og ulemper med testing av spesialister

Nå skal vi prøve å formulere de viktigste fordelene og ulempene ved å jobbe med profesjonelle testere.

proffer:

Det er mange fordeler ved å jobbe med et erfarent team, vi vil fokusere på bare noen få av dem.

1. En integrert tilnærming til testing.

Den største fordelen som interesserer alle er åpenbart den høye kvaliteten på testingen, oppnådd gjennom maksimal dekning av alle stadier av arbeidet. Mangler som mangler i applikasjoner som stasjonær eller mobil programvare fører til store økonomiske tap for både utvikleren og hans klienter. Evnen til å utarbeide planer og koordinere testdekning med forretningsanalytikere gir tillit til å minimere vesentlig risiko. Testere deltar i prosessen med å bestemme sammensetningen av utgivelsen, sjekke påliteligheten til prosedyren for både tilbakerulling av fullversjon og delvise endringer og datakonvertering.

2. Rapportering av testresultater.

Basert på resultatene av spesialistenes arbeid, mottar kunden ikke bare en liste over fullførte scenarier, men også et sett med rapporter som inneholder konklusjoner om kvaliteten på det utgitte produktet og programvareflaskehalser, samt forslag til forbedringer. Basert på slike rapporter har produsenten mulighet til raskt å ta ytterligere beslutninger om produktet. Alle nødvendige rettelser og endringene er lagt opp slik at utviklere umiddelbart kan begynne å implementere dem.

3. Høy kvalitet testing basert på erfaring fra spesialister.

La oss gå tilbake til eksemplet med "Operasjon "Y". Kvalifiserte spesialister ville aldri ha gått glipp av alternative scenarier, og utfallet av arrangementet kunne vært helt annerledes. Erfaring er en stor ting! Samtidig har testteamet det fulle ansvar for sitt arbeid, noe som ikke kan sies om betatestingsdeltakerne.

Minuser :

Ulempene med å ansette spesialister inkluderer oftest "konseptet med to "Der": "dyrt og tidkrevende". Ikke alle bedrifter har råd til å utvide staben og ansette testmedarbeidere på permanent basis, spesielt når det gjelder oppstart. Derfor er outsourcing for tiden veldig populært. Det gjør det mulig å tiltrekke seg et team av spesialister til et spesifikt prosjekt.

En annen trend er overgangen fra tradisjonelle utviklings- og testmetoder (Waterfall) til fleksible (Agile). Janet Gregory og Lisa Crispin har publisert et utmerket papir som beskriver plassen til utviklere og testere i smidige prosjekter. Vi skal imidlertid ikke glemme at enhver tester må ha minimale tekniske ferdigheter og kunne navigere i fagområdet godt.

På den annen side viser eksemplene som presenteres i denne artikkelen at håp om å spare tid og penger ved å bruke "avkortet" beta-testing ofte viser seg å være urealistiske. Dette betyr at "lang og dyr" bare er en vanlig klisje, som ikke alltid bekreftes i praksis.

Konklusjon

Så uten kvalitetstesting risikerer du definitivt å levere et produkt med feil til kunden din. Men kvalitetstesting innebærer også å innhente informasjon om hvorvidt produktet som slippes oppfyller forventningene til sluttbrukerne. Du må selv bestemme hvilken testmetode du skal bruke på prosjektet ditt, eller bruke en strategi som kombinerer begge tilnærmingene. Vi håper at denne artikkelen vil hjelpe deg med å ta et informert valg.

Hva er testing

Metoder for psykologisk forskning er de vitenskapelige teknikkene og midlene ved hjelp av hvilke det er mulig å registrere og beskrive psykologiske forskjeller både mellom mennesker og mellom grupper av mennesker forent av visse egenskaper.

Målet med moderne psykologisk diagnostikk er å skaffe pålitelig informasjon for videre konstruksjon av vitenskapelige teorier og utvikling av praktiske anbefalinger.

Følgende hovedmetoder for psykologisk forskning skilles ut: observasjon, undersøkelse, testing og eksperiment. Testmetoden er en av de viktigste innen moderne psykodiagnostikk.

Når det gjelder popularitet innen pedagogisk og profesjonell psykodiagnostikk, har den hatt førsteplassen i verdens psykodiagnostiske praksis i nesten et århundre.

Test(oversatt fra engelsk som «test» eller «test») er en kort, standardisert test som kan standardiseres og bearbeides matematisk. Ved hjelp av tester streber de etter å identifisere visse evner, ferdigheter, evner (eller mangel på slike), og å mest nøyaktig karakterisere visse personlighetsegenskaper. I mange tilfeller bruker psykologisk forskning ikke én, men flere metoder, som hver utfyller de andre, og avslører nye aspekter ved mental aktivitet.

Historie om testing

Selv i antikken fantes det mer eller mindre standardprosedyrer for å identifisere individuelle forskjeller mellom mennesker. I Kina, for mer enn fire tusen år siden, ble derfor senior embetsmenn pålagt å bestå en streng eksamen i nærvær av keiseren på kunnskap om ritualer og seremonier, bueskyting, ridning, evnen til å skrive, telle og spille musikk. I det gamle Babylon og Egypt måtte en søker til stillingen som skriftlærde bevise besittelse av passende ferdigheter, forstå økonomi, lover, jordbruk. Bibelen beskriver unike måter å velge ut krigere til spesielt vanskelige og farlige oppgaver, avhengig av deres handlinger ved et hvilested. I antikkens Hellas og Roma ble det utviklet svært detaljerte klassifiseringer av karakterer og mønstre for deres bestemmelse basert på atferdsegenskaper.

Selv om alt dette og mye mer historisk gikk foran testing, bør fremveksten av vitenskapelige tester bare dateres til slutten av det nittende århundre. Selve begrepet ble introdusert av Francis Galton (1822 -1911), som var engasjert i forskning på syns- og hørselsstyrke, muskelstyrke, etc. Imidlertid fikk dette begrepet størst popularitet etter publiseringen av artikkelen "Mentale tester og målinger" i 1890, skrevet av en amerikansk psykolog James Cattell (1860-1944)

Cattell utviklet flere dusin tester rettet mot å vurdere elementære sansemotoriske prosesser (følsomhet, reaksjonstid, antall lyder gjengitt etter en enkelt lytting, etc.).

Den utbredte bruken av tester begynte i 1905, da Bean-Simon-testen ble foreslått for å diagnostisere utviklingen av barns intelligens.

Testveiledning

Metoden for objektiv psykologisk vurdering er basert på en test (eller prøve), som kan være:

1) en stimulans av en viss modalitet, hvis dette er en psykofysisk studie;

2) oppgaver ulike nivåer vanskeligheter hvis det er pedagogisk psykologi;

3) oppgaver knyttet til studiet av oppmerksomhet, hukommelse, intelligens, etc. i generell og utviklingspsykologi.

For at disse testene (prøvene) skal gi objektive og målbare data, testes de først på et stort antall emner. For eksempel i pedagogisk psykologi - på barn på samme alder eller personer med samme utdanningsnivå, etc. I dette tilfellet, fra alle de foreslåtte problemene, velges de som er vellykket løst av et betydelig antall av alle fag (for eksempel to tredjedeler).

Denne prosedyren kalles normalisering, eller å bestemme "normen". Beslutningene til de fagene hvis kunnskap, ferdigheter og evner måles, blir deretter sammenlignet med dem.

Resultatene av disse målingene blir evaluert i betingede poeng (eller i rangestimat), kombinert til en rekkefølgeskala og indikerer hvor et gitt emne kan okkupere i forhold til den tilsvarende gruppen av emner (det vil si til "normen").

Oppgave psykologiske tester, dermed for å måle forskjeller mellom individer eller mellom svarene til ett individ under forskjellige forhold.

Typer tester

Tester varierer i form:

Test spørreskjema er et system med gjennomtenkte, nøye utvalgte og testede spørsmål ut fra deres pålitelighet og gyldighet, etter svarene man kan bedømme psykologiske egenskaper fag.

Testoppgave innebærer å vurdere en persons psykologi og atferd basert på hans handlinger. I tester av denne typen tilbys faget en rekke spesielle oppgaver, basert på resultatene som de bedømmer tilstedeværelse eller fravær og graden av utvikling av kvaliteten som studeres.

Følgende typer tester skilles ut:

1. Personlighetstester designet for å identifisere personlige egenskaper og karaktertrekk. Settet med identifiserte kvaliteter avhenger av det teoretiske konseptet som ligger til grunn for testen. Disse testene kan avsløre uttrykksnivået til hver egenskap (for eksempel Cattell-testen), eller, basert på totalen av data, klassifisere en person som en eller annen type (for eksempel Myers-Briggs-testen). Det finnes både komplekse tester som beskriver personlighet som helhet, og tester for evt viss kvalitet(for eksempel tester for å bestemme Eysencks temperament osv.). Noen tester er utformet for å identifisere patologier av karakter og personlig utvikling (for eksempel MMPI).

2. Intelligens tester designet for å bestemme nivået på intelligens og utdanning. Intelligensetester involverer flere oppgaver (aritmetiske, logiske, grafiske osv.), som er ordnet i rekkefølge med økende vanskelighetsgrad (for eksempel Wenger-testen). Vanligvis har du en begrenset mengde tid til å fullføre en intelligenstest.

3.Evneprøver . Evner er de individuelle psykologiske egenskapene til en person som bidrar til hans suksess i enhver aktivitet. Evner manifesteres i aktivitet, dannes i aktivitet og eksisterer i forhold til en bestemt aktivitet. Det er generelle og spesifikke evner. Generelle evner som ligger i alle mennesker er de grunnleggende formene for mental refleksjon: evnen til å føle, oppfatte, huske, tenke; samt, i større eller mindre grad, evnene som ligger i alle mennesker for universelle menneskelige aktiviteter: lek, læring, arbeid, kommunikasjon. Spesielle evner er ikke iboende hos alle mennesker: et øre for musikk, et nøyaktig øye, særegenheter ved motoriske ferdigheter, minne, etc.

4. Projektive tester . I moderne psykodiagnostikk skilles de separat. Projektive tester er basert på en projeksjonsmekanisme som avslører ens egne ubevisste tanker, egenskaper og mangler (for eksempel ART, TAT-tester). Disse typer tester inkluderer også tegning, farge (for eksempel Luscher-testen), konstitutive og tolkningsteknikker. Ved hjelp av en projektiv test kan en psykolog introdusere subjektet i en imaginær, plot-udefinert situasjon, gjenstand for vilkårlig tolkning. En slik situasjon kan for eksempel være søken etter en bestemt mening i et bilde som skildrer ukjente mennesker, det er ikke klart hva de gjør. Vi må svare på spørsmål om hvem disse menneskene er, hva de tenker og hva som vil skje videre. Basert på den meningsfulle tolkningen av svarene, bedømmes respondentenes egen psykologi.

Anvendelse av tester

Som et metodisk verktøy er tester mye brukt i moderne forskning. Men før han bestemmer seg for hvilke av de hundrevis av tilgjengelige tester som kan brukes til forskning, spør psykologen:

1) hva er formålet med testen?

2) for hvilken gruppe mennesker passer det best?

3) hvordan skiller det seg fra andre metoder for å studere menneskelig personlighet?

4) hvor ansvarlig var den utformet?

5) hvor nøyaktig er den?

6) hvor tilstrekkelige og gyldige er resultatene?

Hvert måleinstrument er pålagt å være så nøyaktig som mulig, slik at resultatene som oppnås kan stole på som nær den "sanne" verdien til attributten som måles. Nøyaktighet kan derfor forstås som et mål på sikkerheten som en test måler den med.

Fordeler og ulemper med testing

Populariteten til testmetoden forklares av følgende hovedårsaker: fordeler .

1) Standardisering av forhold og resultater. Testmetoder er relativt uavhengige av kvalifikasjonene til brukeren (utøveren), men dette betyr ikke at det ikke er nødvendig å involvere en kvalifisert spesialist med en fullverdig høyere psykologisk utdanning for å utarbeide en omfattende konklusjon på et batteri av tester. .

2) Effektivitet og effektivitet. En typisk test består av en serie korte oppgaver, som hver vanligvis ikke tar mer enn et halvt minutt å fullføre, og hele testen tar ikke mer enn en time (i skolepraksis er dette én leksjon); En gruppe forsøkspersoner testes samtidig, og sparer dermed betydelig tid (arbeidstimer) på datainnsamling.

3) Kvantitativt differensiert karakter av vurdering. Granulariteten til skalaen og standardiseringen av testen gjør at vi kan betrakte den som et «måleinstrument» som gir en kvantitativ vurdering av egenskapene som måles (kunnskap, ferdigheter på et gitt område). En god test gjør det mulig å skille ikke bare tre kategorier av studenter - fremragende studenter, "gjennomsnittlige studenter" og "lavt presterende", men også å skille testtakere på skalaens poler - for å skille de som rett og slett er dyktige fra de som er veldig dyktige og talentfulle, og blant de som henger etter, for å skille de som ikke er håpløse fra de som er "håpløse" (eller helt uforberedte). I tillegg gjør den kvantitative karakteren til testresultater det mulig å anvende et velutviklet psykometrisk apparat på tester, som lar en vurdere hvor godt en gitt test fungerer på et gitt utvalg av forsøkspersoner under gitte forhold.

4) Optimal vanskelighetsgrad. En profesjonelt utført test består av oppgaver med optimal vanskelighetsgrad. I dette tilfellet scorer den gjennomsnittlige testpersonen omtrent 50 prosent av maksimalt mulig antall poeng. Dette oppnås gjennom foreløpige tester - et psykometrisk eksperiment, eller aerobatikk. Hvis det under aerobatikk blir kjent at omtrent halvparten av den undersøkte kontingenten kan takle oppgaven, anses en slik oppgave som vellykket og blir stående i testen.

5) Pålitelighet. Dette er kanskje den viktigste fordelen med testene. «Lotteri»-karakteren til moderne eksamener med trekking av «heldige» eller «uheldige» billetter har lenge vært snakk om byen. Lotteriet for eksaminanden resulterer her i lav reliabilitet for sensor - svaret på ett fragment av læreplanen er som regel ikke en indikasjon på mestringsnivået i hele stoffet. I motsetning til dette dekker enhver velkonstruert test hoveddelene av læreplanen (kunnskapsområdet som testes eller manifestasjoner av en eller annen ferdighet eller evne). Som et resultat reduseres muligheten for "halene" til å bli fremragende studenter, og for den fremragende studenten å plutselig "mislykkes", kraftig.

6) Rettferdighet. Rettferdighet er den viktigste fordelen med testmetoden. Det skal forstås som beskyttelse mot eksaminatorbias. En god test setter alle testtakere på lik linje. Subjektiviteten til sensorene, som vi vet, manifesteres sterkest ikke i tolkningen av løsningsnivået for problemet (det er ikke så lett å kalle svart hvit, eller et løst problem uløst), men i det tendensiøse utvalget av oppgaver: lettere for sine egne, vanskeligere for andre.

7) Mulighet for databehandling. Som et resultat av databehandling økes alle testparametere (for eksempel med adaptiv datamaskintesting reduseres testtiden kraftig). Dataorganiseringen av testing, som innebærer opprettelse av kraftig informasjon "banker med testoppgaver", gjør det mulig å teknisk forhindre misbruk av skruppelløse sensorer. Valget av oppgaver som tilbys til et konkurrerende fag kan gjøres fra en slik bank av dataprogrammet selv direkte under testing, og presentasjonen av en bestemt oppgave til et gitt emne er i dette tilfellet like mye en overraskelse for sensoren som for sensoren. Emne.

8) Psykologisk tilstrekkelighet. Dette er den viktigste psykologiske konsekvensen av optimal kompleksitet. Tilstedeværelsen i testen (sammenlignet med tradisjonelle eksamensalternativer) av et stort antall korte oppgaver med gjennomsnittlig vanskelighetsgrad gjør at mange testtakere kan tro på seg selv og aktivere den psykologisk optimale "å overvinne"-holdningen Egenskapen til optimal kompleksitet er viktig for test ved at den ikke bare gir målestyrken til testen, men også den optimale psykologiske stemningen til forsøkspersonene. En testsituasjon med optimal kompleksitet er en optimal stimulans – folk opplever normalt nivå stress (spenning) nødvendig å vise høyeste resultat. Mangel på stress (i tilfelle av en enkel test), og enda mer et overskudd (i tilfelle av en vanskelig en), forvrenger måleresultatene. Dette blir som regel fullstendig misforstått av arrangørene av våre konkurranseeksamener, som ved høy konkurranse prøver å gi søkerne vanskeligere problemer ("å fylle ut"), noe som skaper overflødig stress, som ikke gir muligheten til å bevise seg for mennesker som er godt forberedt, men som har redusert motstand mot stress.

Testmetoden har noen svært alvorlige mangler , som ikke tillater å redusere all diagnostikk av evner og kunnskap kun til testing, for eksempel:

1) Faren for "blinde" (automatiske) feil. For eksempel forsto ikke forsøkspersonen instruksjonene og begynte å svare helt annerledes enn det standardinstruksjonene krever, forsøkspersonen brukte av en eller annen grunn forvrengningstaktikker, det skjedde et skifte i bruken av sjablongnøkkelen til svarskjemaet (med manuell, ikke-datamaskinscore), etc. .

2) Faren for banning. Det er ingen hemmelighet at den tilsynelatende enkle å gjennomføre tester forfører folk som ikke er egnet for noe dyktig arbeid. Utstyrt med tester av uforståelig kvalitet, men med høylytte reklamenavn, tilbyr testende ignoranter aggressivt sine tjenester til alle og enhver. Alle problemer er ment å løses ved hjelp av 2-3 tester - for alle anledninger. En ny etikett er festet til den kvantitative testpoengsummen - en konklusjon som skaper inntrykk av samsvar med den diagnostiske oppgaven. Et eksempel på slik profanering er den utbredte bruken av MMPI klinisk test for personellutvelgelse i vårt land. Skruppelløse banning og grunnleggende uvitenhet går hånd i hånd innen testing;

3) Tap av individuell tilnærming, stress. Testen er den mest generelle rangeringen som alle mennesker er utstyrt under. Muligheten for å gå glipp av den lyse individualiteten til en ikke-standard person er dessverre ganske sannsynlig. Dette føler testpersonene selv, og det gjør dem nervøse, spesielt i situasjonen med sertifiseringstesting. Personer med redusert motstand mot stress begynner å bekymre seg og gjøre feil i grunnleggende saker. Å legge merke til en slik reaksjon på en test i tide er oppgaven til en kvalifisert og pliktoppfyllende utøver;

4) Mangel på mulighet til å avsløre individualitet. Fra et synspunkt om å identifisere kreativt potensial, begrenses de fleste tester nettopp av at de ikke appellerer til kreativ, konstruktiv aktivitet. De er laget i form av et standard sett med oppgaver med et gitt svar;

6) Mangel på tillit. Den formaliserte karakteren av testprosedyren fratar testpersonen følelsen av at psykologen er interessert i ham personlig, i å hjelpe med hans problemer og vanskeligheter. Dialogiske metoder (samtale, spill) i denne forbindelse har utvilsomme fordeler: ved å kommunisere direkte med faget kan en kvalifisert psykolog etablere tillitsfull kontakt, vise personlig engasjement og skape en atmosfære som lindrer spenning og beskyttelse.

Konklusjon

Tester kan derfor ikke gjøres til den eneste omfattende metoden for noen diagnose (både pedagogisk og profesjonell og personlig) - de krever parallell bruk av gratis skriftlig arbeid (i personlig diagnostikk blir essays plass tatt av projektive tester med gratis svar ), samt et muntlig intervju (intervju). Stedet for tester er å utfylle de tradisjonelle metodene nevnt ovenfor. I denne egenskapen er tester uunnværlige, siden de ikke har mange av ulempene som ligger i tradisjonelle metoder.


Relatert informasjon.


Dele