Testausteoria. Fyysisen kulttuurin testien teorian perustan esittely


Ensimmäinen komponentti, testien teoria sisältää kuvauksen tilastollisten diagnostisten tietojenkäsittelymallien. Seuraavassa on vastauksen analysointimallit testitehtävissä ja kokonaistestitulosten laskentamallia. Mellenberg (1980, 1990) kutsui sitä "Psykometria". Klassinen testiteoria, nykyaikainen testiteoria (tai koe-tehtävien vastausten malli - IRT) ja malli


tehtävänäytteet muodostavat kolme tärkeintä testiteorian malleja. Psykodiagnostiikan aihe on kaksi ensimmäistä mallia.

Klassinen testiteoria. Tämän teorian perusteella on kehitetty useimmat henkiset ja henkilökohtaiset testit. Tämän teorian keskeinen käsite on "luotettavuus" käsite. Luotettavuudessa on ymmärrettävä tulosten johdonmukaisuus uudelleenarvioinnin aikana. Viitekirjoissa tämä käsite on yleensä hyvin lyhyt, ja sitten annetaan yksityiskohtainen kuvaus Matemaattisten tilastojen laite. Tässä johdantokappale, luvussa esitetään pakatun kuvauksen merkintäkonseptin pääarvosta. Klassisessa testiteoriassa luotettava on useiden mittausmenetelmien tulosten toistaminen (pääasiassa testien mittaukset). Luotettavuuden käsite sisältää mittausvirheen laskemisen. Testausprosessin aikana saadut tulokset voidaan edustaa todellisen tulos- ja mittausvirheen summana:

Xi \u003d ti.+ EJ.

missä Xi- Saadun tulosten arviointi TI on todellinen tulos ja EJ.- Mittausvirhe.

Saadun tulosten arviointi on pääsääntöisesti oikeiden vastausten määrä testin tehtäviin. Todellista tulosta voidaan tarkastella todellisena arviointia Platonicin mielessä (Gulliksen, 1950). Odotettujen tulosten käsite on laajalle levinnyt, ts. Pisteiden esitykset, jotka voidaan saada suuren määrän mittausmenettelyjen toistoa (Herra & Novifi, 1968). Saman arviointimenettelyn toteuttaminen yhdellä henkilöllä ei ole mahdollista. Siksi sinun on etsittävä muita ratkaisuja ongelmaan (Witlman, 1988).

Tämän konseptin puitteissa tehdään joitain oletuksia suhteessa todellisiin tulosten ja mittausvirheisiin. Jälkimmäiset hyväksytään itsenäisenä tekijänä, joka tietysti on hyvin perusteltu oletus, koska satunnaiset vaihtelut tuloksissa eivät anna Covariants: r se \u003d 0.

Oletetaan, että todellisten pisteiden ja mittausvirheiden välinen korrelaatio ei ole olemassa: r ee \u003d 0.


Kokonaisvirhe on 0, koska Todellisena arvion mukaan otetaan aritmeettinen merkitys:

Nämä olettamukset johtavat meidät tietyn luotettavuuden määritelmän seurauksena todellisen tuloksen suhteeksi yhteiseen dispersioon tai ilmaisuun: 1 miinus suhde, jossa mittausvirheen numero ja nimittäjä - yleinen dispersio: Yleinen dispersio: Yleinen dispersio:


Tai

Tästä kaavasta luotettavuuden määrittelystä saamme tämän dispersiovirheen S 2 (e)yhtä suuri kuin yleinen dispersio tapauksissa (1 - R xx "); näin ollen vakiovirhe Mittaukset määräytyvät kaavalla:

Luotettavuuden ja sen johdannaisten teoreettisen perustelun jälkeen on tarpeen määrittää testin luotettavuusindeksi. Testivarmuuden arvioimiseksi on käytännön menettelytapoja, kuten vaihdettavien lomakkeiden (rinnakkaisten testien) avulla, jakamalla tehtäviä kahteen osaan, uudelleen testaamalla ja sisäisen johdonmukaisuuden mittaamiseksi. Jokainen hakemisto sisältää testitulosten vakaat indeksit:

r xx '\u003d r (x 1, x 2)

missä r xx ' - Stabiilisuuskerroin ja x 1 ja x 2 - kahden ulottuvuuden tulokset.

Gllixenin (1950) käyttöön otettiin käyttöön ja kehittänyt vaihdettavien lomakkeiden luotettavuuden käsite. Tämä menettely on varsin työläs, koska se liittyy tarpeeseen luoda rinnakkainen tehtävyys.

r xx '\u003d r (x 1, x 2)

missä r xx ' - vastaavuuskerroin ja x 1 ja x 2 - Kaksi rinnakkaista testiä.

Seuraavassa menettelyllä on pääkokeen jakaminen kahteen osaan A ja B on helpompi käyttää. Kummassakin osissa saadut indikaattorit korreloivat. Spearman-ruskean kaavan avulla koko testin luotettavuus kokonaisuudessaan arvioidaan:

missä ja B - testin kaksi rinnakkaista osaa.

Seuraava menetelmä on testitehtävien sisäisen johdonmukaisuuden määritelmä. Tämä menetelmä perustuu yksittäisten tehtävien covariantsin määritelmään. SG - mielivaltaisesti valitun työn dispersio ja kahden mielivaltaisen valittujen tehtävien sgh - kovarianssi. Useimmin käytetty kertoimen sisäisen johdonmukaisuuden määrittämiseksi on Kronbachin "alfa-kerroin". Kaavaa käytetään myös KR20 ja λ-2(Lambda-2).

Luotettavuuden klassisessa käsitteessä määritetään mittausvirheet sekä testausprosessissa että havaintoprosessissa. Näiden virheiden lähteet ovat erilaiset: nämä voivat olla myös henkilökohtaisia \u200b\u200bominaisuuksia ja testausolosuhteiden ominaisuuksia ja testitehtäviä itse. On olemassa erityisiä menetelmiä virheiden laskemiseksi. Tiedämme, että havainnot voivat olla virheellisiä, metodiset välineet ovat epätäydellisiä samalla tavoin kuin ihmiset itse ovat epätäydellisiä. (Kuinka ei muista Shakespeare: "Olet epäluotettava, jonka nimi on henkilö"). Se, että mittausvirheiden klassisessa mittauksessa on selkeää ja selitettävä on tärkeä positiivinen kohta.

Klassisella testausteorisella on useita olennaisia \u200b\u200bpiirteitä, joita voidaan pitää haittoina. Jotkut näistä ominaisuuksista on merkitty hakuteoksia, mutta niiden merkitys (arjen näkökulmasta) korostuu harvoin, koska ei ja se, että niitä tulisi pitää puutteita teoreettisesta tai menetelmällisiä näkökulmasta.

Ensimmäinen. Klassinen testausteoria ja luotettavuuden käsite keskittyvät laskemiseen, jotka johtuvat erillisissä tehtävissä saadut arvioiden lisäämisen. Joten, kun työskentelet


Toinen. Luotettavuustekijä merkitsee mitattujen indikaattoreiden varianssia. Tästä seuraa, että luotettavuustekijä on pienempi, jos (muiden indikaattoreiden tasa-arvo) näyte on homogeenisempi. Testitehtävien sisäisen johdonmukaisuutta ei ole, tämä kerroin on aina "kontekstillinen". Esimerkiksi Crocker ja Aldjina (1986) tarjoavat esimerkiksi erityisen kaavan "korjauksen homogeeniseen näytteeseen", joka on tarkoitettu testaamalla korkeimmille ja pienimmille tuloksille. Diagnostista on tärkeää tietää näytteen asetusten muunnelmien ominaisuudet, muuten se ei voi käyttää tämän testin käsikirjassa määritetyn sisäisen johdon kertoimia.

Kolmas. Tietojen ilmiö keskimääräisestä aritmeettisesta indikaattorista on looginen seuraus luotettavuuden klassisesta käsitteestä. Jos testausvaihteluiden arvostus (eli se ei ole tarpeeksi luotettavaa), on täysin mahdollista, että menettelyn toistuminen, alhaiset indikaattorit saavat suurempia pisteitä ja päinvastoin, suuret indikaattorit ovat alhaiset. Tätä mittausmenetelmien esineitä ei voida vääristää kehitysprosessien todellisen muutoksen tai ilmenemisen vuoksi. Mutta samalla rajaa heitä ei ole helppoa, koska Et voi koskaan poistaa muutoksen mahdollisuutta kehityksen aikana. Täydellinen luottamus on välttämätöntä "vertailu kontrolliryhmään.

Klassisen teorian periaatteiden mukaisesti kehitettyjen testien neljäs ominaisuus on sääntelytietojen läsnäolo. Testisääntöjen tuntemus antaa tutkijan asianmukaisesti tulkita testin tuloksia. Norman ulkopuolella testausarviot ovat merkityksellisiä. Testausnormien kehittäminen on melko kallis yritys, koska psykologin pitäisi saada testituloksia edustavasta näyteestä.

2 J. Ter Laak

Jos puhumme luotettavuuden klassisen käsitteen puutteista, Siy TSMA: n lausunto on tässä (1992, r. 123-125). Hän toteaa, että testien klassisen teorian ensimmäinen ja tärkein oletus on, että testitulokset ovat väliajan periaatteen alaisia. Kuitenkaan tutkimusta ei vahvista tätä olettamusta ei ole. Itse asiassa se on "mittaus mielivaltaisesti vakiintunut sääntö" Tämä ominaisuus asettaa testien klassisen teorian vähemmän suotuisan asennon verrattuna mittausasteikkoihin ja tietenkin verrattuna nykyaikaiseen testiteoriaan. Monet dataanalyysimenetelmät (dispersioanalyysi. Regressioanalyysi, korrelaatio ja tekijä analyysi) perustuvat aikavälin asteikon olemassaoloon. Sillä ei kuitenkaan ole oikeutta. Harkitse todellisten tulosten laajuutta psykologisten ominaisuuksien arvoina (esimerkiksi aritmeettiset kyvyt, älykkyys, neurotismi) voi olla oletettavasti oletettavasti.

Toinen huomautus koskee testin testituloksia - nämä eivät ole absoluuttisia indikaattoreita yhden tai muun testattavan psykologisen ominaispiirteen, niitä on harkittava ainoastaan \u200b\u200btestin toteuttamisen tuloksina. Kaksi testiä voi hakea samat psykologiset ominaisuudet (esimerkiksi älykkyys, suulliset kyvyt, ekstroversion) tutkimusta, mutta tämä ei tarkoita sitä, että nämä kaksi testiä ovat samat ja niillä on samat valmiudet. Kahden ihmisen indikaattoreiden vertailu, jotka on testattu eri testeillä, virheellisesti. Sama pätee kahden eri testin täyttämiseen yhdellä aiheella. Kolmanneksi huomautuksella viitataan oletukseen, että standardin mittausvirhe on sama suhteessa mitattujen yksittäisten kykyjen tasoon. Tästä oletuksesta ei kuitenkaan ole empiiristä todentamista. Joten esimerkiksi ei ole takeita, jotka testasivat hyvät matemaattiset kyvyt, kun työskentelet suhteellisen yksinkertaisen aritmeettisen testin kanssa, saavat korkeat kohdat. Tällöin henkilö, jolla on alhainen tai keskipitkä kyky on erittäin arvostettu.

Nykyisen testausteorian tai vastausten analyysin teorian puitteissa testitehtävissä kuvataan kuvaus suuressa


vastaajien mahdollisten vastausten määrä. Nämä mallit eroavat säätiön oletuksiinsa sekä saadut tiedot. Rashan mallia pidetään usein synonyyminä vastausanalyysin teorioille testitehtävissä (1rt). Itse asiassa tämä on vain yksi malleista. Kaava, joka on esitetty kuvaamaan ominaispiirin käyrä G on seuraava:

missä g.- erillinen tehtävä testin; ejr- eksponenttien funktio (epälineaarinen riippuvuus); δ (Delta) - taikinan vaikeuden taso.

Muut testin tehtävät, esimerkiksi h,myös saada omat ominaiskäyrät. Ehdot ΔH\u003e Δ g (gtarkoittaa että h.- Vaikeampi tehtävä. Näin ollen indikaattorin arvosta Θ ("Theta" - testin kyvyiden piilevät ominaisuudet) onnistuneen tehtävän todennäköisyys h.vähemmän. Tätä mallia kutsutaan tiukaksi, koska on selvää, että vähäisellä vakavuudella, tehtävän todennäköisyys on lähellä nollaa. Tässä mallissa ei ole paikkaa arvaamiseen ja oletuksiin. Tehtäville, joilla on vaihtoehtoja, ei ole tarvetta tehdä oletuksia menestyksen todennäköisyydestä. Lisäksi tämä malli on tiukka siinä mielessä, että kaikilla testin tehtävillä on oltava sama syrjivä kyky (suuri syrjivä heijastus käyrän jyrkässä, tässä on mahdollista rakentaa suojalaite, jonka mukaan kussakin Tyypillinen käyrä, tehtävän todennäköisyys muuttuu enintään 1). Tästä johtuen olosuhteet eivät ole kaikki tehtävät, jotka voidaan sisällyttää Rashan mallin perusteella luotuihin testeihin.

Tähän malliin on useita vaihtoehtoja (esimerkiksi Birnbaura, 1968, katso Lord & Novik). Se tekee tehtävistä eri syrjiviä

kyky.

Hollantilainen Explorer Mokken (1971) kehitti kaksi mallia vastausten analysoimiseksi testin tehtävissä, joiden vaatimukset eivät ole niin tiukkoja kuin kiireessä, ja siksi voi olla realistisempi. Tärkein kunto

viya Mokken esittää kannan, jonka tehtävän ominaiskäyrän on noudatettava yksitoikkoisesti ilman taukoja. Kaikki testin tehtävät samanaikaisesti pyritään tutkimaan samoja psykologisia ominaisuuksia, jotka on mitattava sisään.Kaikki tämän riippuvuuden muodot sallitaan, kunnes se keskeytyy. Näin ollen ominaiskäyrän muotoa ei määritellä millä tahansa spesifisellä toiminnalla. Tällainen "vapaus" avulla voit käyttää enemmän testitehtäviä ja arvioinnin taso ei ole korkeampi kuin tavallinen.

Testin (IRT) vastausten (IRT) vastausten menetelmiä eroaa useimpien kokeellisten ja korrelaatiotutkimusten menetelmästä. Matemaattinen malli on suunniteltu opiskelemaan käyttäytymistä, kognitiivisia, emotionaalisia ominaisuuksia sekä kehitysilmiöitä. Nämä tarkasteltavana olevat ilmiöt rajoittuvat usein vastauksiin tehtäviin, jotka sallivat Mel-Lenbergin (1990) kutsua IRT: n "minite-teorian teoriaa mini-käyttäytymisestä". Tutkimuksen tulokset voidaan esittää jossain määrin johdonmukaisuuden käyrällä erityisesti tapauksissa, joissa teoreettiset ajatukset tutkituista ominaisuuksista ovat poissa. Tähän asti käytettävissemme on vain yksiköt älykkyystestit, kyvyt ja henkilökohtaiset testit, jotka on luotu lukuisten IRT-teorian mallien perusteella. Rashan mallin muunnelmia käytetään useammin saavutustestien kehittämisessä (Verhelst, 1993), ja Mocenen malli sopii paremmin kehitysilmiöille (ks. Myös Ch. 6).

Vastaus testataan testin tehtävänä on IRT-mallien pääyksikkö. Vastauksen tyyppi määräytyy ihmisten vakavuuden asteittain tutkituista ominaisuuksista. Tällainen ominaisuus voi olla esimerkiksi aritmeettiset tai spatiaaliset kyvyt. Useimmissa tapauksissa tämä on yksi tai toinen älykkyys, saavutusten ominaisuudet tai henkilökohtaiset ominaisuudet. Oletetaan, että tämän henkilön aseman välillä tietyssä ominaisuudessa ja yhden tai muun tehtävän onnistuneen toteutuksen todennäköisyyden välillä on epälineaarinen riippuvuus. Tämän riippuvuuden epälineaarisuus tietyssä mielessä on intuitiivinen. Kuuluisia lausekkeita "kaikki alkua on vaikea" (hidas


lineaarinen alku) ja "pyhä ei ole niin yksinkertainen", tarkoittaa, että tietyn tason saavuttamisen jälkeen parannetaan edelleen. Käyrä lähestyy hitaasti, mutta lähes koskaan saavuttaa 100% menestyksen tasosta.

Jotkut mallit ovat pikemminkin ristiriidassa intuitiivisen ymmärryksen kanssa. Ota sellainen esimerkki. Henkilö, jolla on mielivaltainen ominaisindeksi 1,5, on 60 prosentin todennäköisyys menestyksen suorittamisen aikana. Tämä on ristiriidassa tällaisen tilanteen intuitiivisen ymmärryksen kanssa, koska se voidaan joko menestyksekkäästi selviytyä tehtävästä tai selvittää se lainkaan. Ota tämä esimerkki: 100 kertaa henkilö yrittää ottaa korkeuden 1m 50 cm. Menestys mukana 60 kertaa, ts. Siinä on 60 prosentin todennäköisyys menestyksen.

Arvioida vakavuuden astetta ominaisuuksien on oltava vähintään kaksi tehtävää. Rasha-malli edellyttää ominaisuuksien vakavuuden määritelmän riippumatta tehtävän vaikeudesta. Se on myös ristiriidassa intuitiivisen ymmärryksen kanssa: Oletetaan, että henkilöllä on 80 prosentin todennäköisyys hypätä yli 1,30 m. Jos näin on, sitten tyypillisen tehtäväkäyrän mukaan sillä on 60 prosentin todennäköisyys hypätä yli 1,50 m ja 40 prosenttia todennäköisyydestä Hyppy edellä on 1,70 m. Näin ollen riippumatta riippumattoman muuttujan (korkeus) arvosta voit arvioida henkilön kyvyn hypätä korkeudessa.

On noin 50 mallia IRT (Goldstein & Wood, 1989). On monia epälineaarisia toimintoja, jotka kuvaavat (selittävät) todennäköisyyden menestyksen tehtävän tai tehtävien ryhmän suorittamisessa. Näiden mallien vaatimukset ja rajoitukset ovat erilaiset, ja nämä erot voidaan havaita vertaamalla kiireen mallia ja mocceren asteikon. Näiden mallien vaatimuksiin kuuluu:

1) tarve määrittää tutkitut ominaisuudet ja arviointi henkilön asemasta tämän ominaisuuden alueella;

2) tehtävien asettamisen arviointi;

3) Tarkista erityiset mallit. Psykometriassa on kehitetty monia menettelyjä, joilla vahvistetaan malli.

Joissakin käyttöohjeissa IRT-teoria pidetään testitehtävien analyysina (ks. Esimerkiksi,

Croker & Algina, J 986). On kuitenkin mahdollista puolustaa näkökulmaa, jonka mukaan IRT: n teoria on "mini-käyttäytyminen mini-teoria". IRT-teorian kannattajat huomaa, että jos epätäydelliset käsitteet (mallit) keskitason tasolla, mitä voidaan sanoa enemmän monimutkaisempia konstrukteja psykologiassa?

Klassinen ja moderni testiteoria. Ihmiset eivät voi verrata asioita, jotka näyttävät lähes samalta. (Ehkäpä jokapäiväinen ekvivalentti psykometria ja koostuu pääasiassa vertaamalla ihmisiä mielekkäitä ominaisuuksia ja valintoja niiden välillä). Jokainen esitetty teorioista - ja arviointivirheiden mittaamisen teoria ja testin tehtävien matemaattinen malli - on omat kannattajat (Goldstein & Wood, 1986).

IRT-mallit eivät aiheuta häiriöitä siinä, että se on "sääntöjen mukainen arviointi", toisin kuin testien klassisen teorian. IRT-malli keskittyy arvioitujen ominaisuuksien analyysiin. Yksittäisten ja tehtävien ominaisuudet arvioidaan asteikolla (peräkkäinen tai aikaväli). Lisäksi on mahdollista vertailla eri testien suorituskykyä, joilla pyritään oppimaan samankaltaisia \u200b\u200bominaisuuksia. Lopuksi, kunkin arvon epätasa-arvoinen luotettavuus mittakaavassa ja keskimääräiset indikaattorit ovat yleensä luotettavimpia kuin alussa ja asteikon lopussa sijaitsevat indikaattorit. Näin ollen IRT-mallit teoreettisissa suhteissa ovat ennakoitavissa. Testien ja klassisen teorian teorian käytännön käytössä on myös eroja (Sijstma, 1992, s. 127-130). Testien moderni teoria on monimutkaisempi verrattuna klassiseen, joten ei-asiantuntijat käyttävät sitä vähemmän yleisesti. Lisäksi IRT asettaa erityisvaatimukset tehtäville. Tämä tarkoittaa, että tehtävät on jätettävä testin ulkopuolelle, jos ne eivät täytä mallin vaatimuksia. Tämä sääntö koskee lisäksi näitä tehtäviä, jotka olivat osa laajalti käytettyjä testejä, jotka perustuvat klassisen teorian periaatteisiin. Testi lyhyemmäksi ja siksi luotettavuus vähenee.

IRT tarjoaa matemaattisia malleja tutkimaan todellisia ilmiöitä. Mallien pitäisi auttaa meitä ymmärtämään näiden ilmiöiden keskeisiä näkökohtia. Tärkein teoreettinen kysymys on kuitenkin täällä. Malleja voidaan harkita


watikak lähestymistapa monimutkaisen todellisuuden tutkimukseen, jossa elämme. Mutta malli ja todellisuus eivät ole sama asia. Pessimistisen ulkoasun mukaan on mahdollista simuloida vain yksittäinen (ja moraant ei mielenkiintoisin) käyttäytymistyyppejä. Voit myös täyttää lausunnon, että todellisuus ei ole lainkaan mallinnussa, koska Se ei ole yksi syy-oikeus. SISÄÄN paras tapaus On mahdollista mallintaa yksittäisiä (ihanteellisia) käyttäytymisilmiöitä. Toinen, optimistinen, katso mallinnusmahdollisuutta. Edellä mainittu asema estää ihmisen käyttäytymisen ilmiöiden syvän ymmärtämisen. Tietyn mallin käyttö herättää joitain perustavanlaatuisia kysymyksiä. Mielestämme ei ole epävarmaa, että IRT on teoreettisesti ja teknisesti parempi kuin testien klassisen teorian.

Testien käytännön tarkoitus, mitä teoreettista perustaa ei luoda, on tunnistaa merkittäviä kriteerejä ja tiettyjen psykologisten rakenteiden ominaisuuksien luominen niille. Onko IRT-mallilla etuja ja tässä suhteessa? On mahdollista, että tämän mallin perusteella luodut testit eivät anna tarkempaa ennustetta verrattuna klassisen teorian perusteella luotuihin testeihin, ja niiden osuus psykologisten rakenteiden kehittämiseen ei ole merkittävämpi. Diagnoosit suosivat tällaisia \u200b\u200bkriteerejä, jotka liittyvät suoraan erilliseen henkilöön, instituuttiin tai yhteisöön. Malli, joka sopii tieteellisessä suhteessa "ipso facto" * ei määritä sopivampaa kriteeriä ja on tietysti rajoitettu tieteellisten rakenteiden selittämisessä. On selvää, että klassiseen teoriaan perustuvien testien kehittäminen jatkuu, mutta samanaikaisesti luodaan uusia IRT-malleja, jotka ulottuvat suuremman määrän psykologisia ilmiöitä.

Klassisessa testiteoriassa erotetaan "luotettavuuden" ja "pätevyyden" käsitteet. Teszeshai-tulosten on oltava luotettavia, ts. Alkuperäisen ja uudelleen testauksen tulokset olisi koordinoitava. Lisäksi,

* ipso facto.(lakka) - itsessään (n. trans.).

tulokset on oltava vapaa (mahdollisimman pitkälle) arviointivirheistä. Voimassaolon läsnäolo on yksi vaatimuksista saaduista tuloksista. Tällöin luotettavuutta pidetään tarpeellisena, mutta ei vielä riittävänä edellytyksenä testin voimassaoloaikana.

Voimassaolon käsite olettaa, että saadut tulokset kuuluvat mihinkään käytännön tai teoreettisissa suhteissa. Testausennusteiden perusteella tehdyissä päätelmissä olisi oltava päteviä. Useimmiten puhua kahdesta pätevyydestä: Prognostinen (kriteerit) ja rakenteelliset. On myös muita voimassaoloja (ks. Ch. 3). Lisäksi pätevyys voidaan määritellä Quasi-kokeilun tapauksessa (Campbell, 1976, Cook & Shadish, 1994). Päätyyppi on kuitenkin edelleen prognostinen pätevyys, jonka mukaan sitä ymmärretään, kyky ennustaa jotain merkittävästä käyttäytymisestä tulevaisuudessa, sekä mahdollisuus syvempään ymmärrykseen yhdestä tai useammasta psykologisesta ominaisuuksesta tai laadusta.

Esitettyjä pätevyystyyppejä käsitellään kussakin hakemistossa ja niihin liittyy kuvaus testin voimassaolon analysointimenetelmistä. Factor-analyysi sopii paremmin rakenteellisen validoinnin määrittämiseen ja lineaarisia regressioyhtälöitä käytetään analysoimaan prognostisen pätevyyden. Niitä tai muita ominaisuuksia (suorituskyky, terapiatehokkuus) voidaan ennustaa yhden tai useamman indikaattorin perusteella, puoliksi tutkijat työskennellessään henkisen tai henkilökohtaisten testien kanssa. Tällaiset tietojenkäsittelymenetelmät, korrelaationa, regressiona, dispersioanalyysin, osittaisten korrelaatioiden ja dispersioiden analyysi, joka määrittää testin prognostisen pätevyyden.

Kuvaa myös mielekästä pätevyyttä. Oletetaan, että kaikki testin tehtävät ja tehtävät kuuluvat tiettyyn alueeseen (henkiset ominaisuudet, käyttäytyminen jne.). Sisällön pätevyyden käsite luonnehtii mitatun alueen kunkin testitehtävän vastaavuutta. Aineellista pätevyyttä pidetään joskus osana luotettavuutta tai "yleistettyä" (Cronbach, Gleser, Nanda & Rajaratnam, 1972). kuitenkin


tehtävien valinta saavuttaa testit tietyssä aihepiirissä on myös tärkeää kiinnittää huomiota testin tehtävän sääntöihin.

Klassisessa testiteoriassa luotettavuus ja voimassaolo katsotaan suhteellisen riippumattomiksi toisistaan. Mutta on toinen käsitys näiden käsitteiden suhde. Moderni testausteoria perustuu mallien käyttöön. Parametrit arvioidaan tiettyyn malliin. Jos tehtävä ei täytä mallin vaatimuksia, tämän mallin puitteissa se tunnustetaan pätemättömäksi. Rakenteellinen validointi on osa mallin tarkistamista. Tämä validointi viittaa lähinnä tarkistamaan yksiulotteisen piilevän linjan olemassaoloa tutkimalla tunnetuilla vaa'an ominaisuuksilla. Söpöjä käytetään epäilemättä vastaavien kriteerien määrittämiseen ja niiden korrelaatio on mahdollista muiden konstruktien indikaattoreiden kanssa tietojen keräämiseksi konstruktin konvergentin ja erilaiseen pätevyyteen.

Psykodiagnoosi on samanlainen kuin kieli, joka on kuvattu neljällä komponentilla, joka on esitetty kolmella tasolla. Ensimmäinen komponentti, testien teoria, samanlainen syntaksi, kielen kielioppi. Generaattori (generatiivinen) kielioppi on toisaalta nokkela malli, toisaalta järjestelmä, joka alentaa sääntöjä. Näiden sääntöjen käyttäminen monimutkainen rakennetaan yksinkertaisten vaikutusehdotusten perusteella. Samanaikaisesti kuitenkin tämä malli Lehdet sivuun kuvaus siitä, miten viestintäprosessi on järjestetty (joka lähetetään ja mitä havaitaan) ja jonka tavoitteet suoritetaan. Tämän ymmärtämiseksi edellyttää lisätietoa. Sama voidaan sanoa testien teoriasta: Psykodikaattorissa on välttämätöntä, mutta se ei pysty selittämään, että psykodiagnoste tekee ja mikä on hänen tavoitteensa.

1.3.2. Psykologiset teoriat ja psykologiset rakenteet

Psychodiagnostics on aina diagnoosi jotain erityistä: henkilökohtaisia \u200b\u200bominaisuuksia, käyttäytymistä, ajattelua, tunteita. Testit on tarkoitettu arvioimaan yksittäisiä eroja. On useita käsitteitä

yksittäiset erot, joista jokaisella on oma erottuvat ominaisuudet. Jos tunnustetaan, että psykodiagnostiikka ei rajoitu yksittäisten erojen arviointiin, muut teoriat ovat välttämättömiä psykodiagnostiikan kannalta. Esimerkkinä on arvioida mielenterveyden kehitysprosesseja ja eroja sosiaalisessa ympäristössä. Vaikka yksittäisten erojen arviointi ei ole välttämätön attribuutti Psykodiagnostiikka tiettyjen tutkimusten vieressä tällä alalla. Psychodiagnostics alkoi arvioimalla tiedustelueroja. Testien päätehtävänä "määritetään perinnöllinen siirto nero" (Gallon) tai lasten valikoiman koulutukseen (Binet, Simon). Inselfiteaktiivisuuden mittaaminen sai Teoreettisen ymmärryksen ja käytännön kehityksen SPirend (Yhdistynyt kuningaskunta) ja Terestone (USA). Raymond B.Qottel teki tämän samanlaisuuden henkilökohtaisten ominaisuuksien arvioinnista. Psychodiagnostics liittyy erottamattomasti teorioihin ja ideoihin yksittäisistä eroista saavutuksissa (rajoitusten arviointi) ja käyttäytymismuodot (tyypillinen toiminta). Tämä perinne pysyi edelleen tehokkaita tänään. SISÄÄN opetusohjelmat Psychodiagnosticsissa sosiaalisen ympäristön eroja ovat paljon harvemmin verrattuna itse kehitysprosessien erityispiirteet huomioon ottaen. Tätä varten ei ole kohtuullisia selityksiä. Toisaalta diagnoosi ei rajoitu tiettyihin teorioihin ja käsitteisiin. Toisaalta se tarvitsee teorioita, koska juuri niissä on diagnostinen sisältö (ts. "Tämä" on diagnosoitu). Joten esimerkiksi älykkyyttä voidaan pitää yleispiirteet, yleiset piirteetja pohjana monille kyvyille, jotka ovat riippumattomia toisistaan. Jos psykodiagnostiikka yrittää "lähteä" yhdestä tai toisesta teoriasta, ja psykodikagnostisen prosessin perustasta tulee tervettä järkeä. Tutkimuksissa käytetään erilaiset menetelmät Tietojen analysointi ja tutkimustutkimuksen yleinen logiikka määrittelee yhden tai muun matemaattisen mallin valinnan ja määrittää käytettyjen psykologisten käsitteiden rakenteen. Tällaiset matemaattiset tilastot


kI, dispersioanalyysi, regressioanalyysi, tekijäanalyysi, korrelaatioiden laskeminen liittyy lineaaristen riippuvuuksien olemassaoloon. Näiden menetelmien virheellisen käytön tapauksessa ne "tuo" rakenne saatuihin tietoihin ja käytettyihin konstruktiin.

Ideat sosiaaliympäristön eroista ja persoonallisuuden kehityksestä eivät vaikuttaneet melkein psykodiagnostiikkaan. Oppikirjoissa (ks. Esimerkiksi Murphy & Davidhofer, 1988), klassista testiteoriaa käsitellään ja asiaankuuluvat tilastollisen käsittelyn menetelmiä käsitellään, tunnetaan tunnettuja testejä, psykodikaattorit käytännössä kuvataan: Hallinnon psykologia, henkilöstön valinnassa, arvioitaessa henkilön psykologisia ominaisuuksia.

Yksittäisten erojen teoriat (sekä ideoita sosiaalisen ympäristön ja henkisen kehityksen eroista) ovat samankaltaisia \u200b\u200bkuin kielen semanttisen tutkimuksen. Tämä on tutkimus ja yhteisö sekä sisältö ja arvot. Arvot on jäsennetty tietyllä tavalla (kuten psykologiset rakenteet), esimerkiksi samankaltaisuudella tai kontrastissa (analogia, lähentyminen, eroavuus).

1.3.3. Psykologiset testit ja muut metodologiset keinot

Ehdotetun piirin kolmannen osaan - testit, menettelyt ja metodologiset keinot, joilla tiedot kerätään persoonallisuuden ominaisuuksista. Draza ja Seitsma (1990, s. 31) antavat seuraavat määritelmätestit: "Psykologista testiä pidetään luokituksena tietyn järjestelmän mukaan tai mittausmenettelyksi, jonka avulla voit tehdä tietyn tuomion yhdestä tai useammasta empiirisesti omistautuneesta tai Teoreettisesti kohtuulliset ominaisuudet tietyn ihmisen käyttäytymisestä (testitilanteen kehyksille). Samanaikaisesti vastaajien reaktio tarkastellaan tiettyyn huolellisesti valittuihin kannustimiin, ja vastaanotettuja vastauksia verrataan testausstandardeihin. "

Diagnostiikka vaatii testejä ja tekniikoita luotettavien, tarkkojen ja validon tietojen keräämiseksi ominaisuuksista.

ja ominaispiirteet Persoonallisuus, ajattelu, tunteet ja ihmisen käyttäytyminen. Testimenettelyn kehittämisen lisäksi tämä komponentti sisältää myös seuraavat kysymykset: miten testit luodaan, miten muotoilua ja tehtäviä on valittu, kun testausprosessi etenee, mitkä ovat testausolosuhteet, kuten mittausvirheet ovat Otettu huomioon testitulokset lasketaan ja tulkitaan.

Kehitettäessä testejä, järkevä ja empiiriset strategiat eroavat toisistaan. Rationaalisen strategian soveltaminen alkaa peruskonseptien määritelmästä (esimerkiksi älykkyyden, ekstroversion) käsite ja näiden ideoiden mukaisesti testin tehtävät muotoiltu. Esimerkki tällaisesta strategiasta voi olla erikoisanalyysin käsite (puute teoria) Guttman (1957, 1968, 1978). Ensin määritetään pääkonsernin eri osa-alueet, tehtävät ja tehtävät valitaan siten, että jokainen näistä näkökohdista otetaan huomioon. Toinen strategia on, että tehtävät valitaan empiirisellä perusteella. Esimerkiksi jos tutkija yrittää luoda ammatillisten etujen testin, mikä mahdollistaisi lääkäreiden eriyttämisen insinööreiltä, \u200b\u200bsitten menettelyn pitäisi olla näin. Molempien vastaajien ryhmien on vastattava kaikkiin testin tehtäviin ja näihin kohteisiin, joihin tilastollisesti merkittävät erot havaitaan, sisältyvät testin lopulliseen versioon. Jos esimerkiksi ryhmien välillä on eroja vastauksiin hyväksyntää "Rakastan kalaa", niin tämä lausunto tulee testin osaksi. Tämän kirjan tärkein asema on se, että testi liittyy käsitteelliseen tai taksonomiseen teoriaan, joka määrittää nämä ominaisuudet.

Testitehtävä määritellään yleensä sen käyttöohjeissa. Testi on standardoidaan, jotta voidaan arvioida ihmisten välisiä eroja eikä testausolosuhteiden välillä. On kuitenkin poikkeamat standardoinnista menettelyissä, joita kutsutaan "mahdollisuuksien rajojen testaus" (rajojen testaus) ja "testaus potentiaaliset testit" testit "(oppimisen potentiaaliset testit). Näissä olosuhteissa vastaaja on apua prosessissa.


testaus ja sitten tällaisen menettelyn vaikutus tulokseen arvioidaan. Tehtävien vastausten laskentapisteet ovat objektiivisia, ts. Se toteutetaan vakiomenettelyn mukaisesti. Saadun tulosten tulkinta on myös tiukasti määritelty ja toteutetaan testisormien perusteella.

Psykodikaattien kolmas osa on psykologisia testejä, työkaluja, menettelyjä - sisältää tiettyjä tehtäviä, jotka ovat psykostikin alimmat yksiköt ja tässä tehtävässä ovat samanlaisia \u200b\u200bkuin kielet. Puhelinpelien mahdollisten yhdistelmien määrä on rajallinen. Vain tietyt fonderaattiset rakenteet voivat muodostaa sanoja ja ehdotuksia kuuntelijan tietojen varmistamiseksi. Myös jatestitehtävät: Vain tietyssä yhdistyksessä toistensa kanssa ne voivat tulla tehokas työkalu Arvioita vastaavasta rakenteesta.

Raportti

opiskelija 137 g. Ivanova I.

koulutustekniikan tehokkuuden tarkistamisesta
Matemaattisten tilastomenetelmien käyttö

Raporttikohdat toteutetaan tässä käsikirjassa esitettyjen näytteiden mukaisesti pelin jokaisen vaiheen lopussa. Hyvitetyt raportit tallennetaan biomekaniikan laitoksella ennen konsultointia ennen tenttiä. Opiskelijat, jotka eivät ole ilmoittaneet työhön, eivätkä ole antaneet kannettavan tietokoneen opettajalle, ei saa antaa tenttiin urheilumahdollisuuteen.


I Stage Business Game
Valvonta ja mittaus urheilussa

Tarkoitus:

1. Tutustu urheilun ja mittauksen teoreettisiin perusteluihin liikunta.

2. Osta taitojen mittaus suurten nopeuksien suorituskyvyn urheilijoissa.

1. Ohjaus fyysisesti
Koulutus ja urheilu

Liikunta koulutus ei ole spontaani, vaan hallinnoitu prosessi. Jokaisen ajan kuluessa henkilö on tietyssä fyysisessä kunnossa, joka määrittää pääasiassa terveydenhuollon (elintärkeän toiminnan indikaattorien noudattaminen, organismin kestävyysaste haitata äkillisiä vaikutuksia), fysiikka ja tila fyysiset toiminnot.

On suositeltavaa hallita henkilön fyysistä tilaa muuttamalla sitä oikeaan suuntaan. Tämä johto toteutetaan liikunnan ja urheilun avulla, mikä erityisesti hoitaa liikuntaa.

Vain näyttää siltä, \u200b\u200bettä opettaja (tai valmentaja) hallinnoi fyysistä tilaa, joka vaikuttaa urheilijan käyttäytymiseen, ts. Tiettyjen harjoitusten tarjoaminen sekä niiden toteutuksen oikeellisuus ja saadut tulokset. Itse asiassa urheilijoiden käyttäytyminen ei hallinnoi valmentajaa, vaan urheilija itse. Urheilukoulutuksen aikana vaikuttaa itsehallintojärjestelmään (ihmiskehon). Yksilölliset erot urheilijoiden tilassa eivät anna luottamusta, että sama vaikutus aiheuttaa saman vastauksen. Siksi palautteen kysymys on merkityksellinen: Tietoa urheilijan tilasta, joka tulee valmentajalle koulutusprosessin valvonnan aikana.

Fyysisen koulutuksen ja urheilun valvonta perustuu indikaattoreiden mittauksiin, tärkeimpien ja niiden matemaattisen jalostuksen valinnasta.

Koulutusprosessin hallinta sisältää kolme vaihetta:

1) tietojen kerääminen;

2) sen analyysi;

3) päätöksenteko (suunnittelu).

Tietojen kerääminen toteutetaan yleensä kattavan valvonnan aikana, joiden esineet ovat:

1) kilpailukykyinen toiminta;

2) Koulutuskuormat;

3) Urheilijan tila.



Urheilijan tiloissa on kolmenlaisia \u200b\u200btiloja riippuen siitä, että aukon kesto, joka vaaditaan siirtymään valtiosta toiseen.

1. Phardi (pysyvä tila. Tallentaa suhteellisen pitkä -viikkoja tai kuukausia. Urheilijan askelvaltioiden kattava ominaisuus, joka heijastaa sen kykyjä urheilua saavutusten osoittamiseen, kutsutaan valmiusvalmiuksille ja optimaalinen tila (paras tämän koulutusjaksoon) urheilumahdollisuus. Ilmeisesti yhden tai useamman päivän kuluessa urheilumuodosta ei voida saavuttaa tai menettää sitä.

2. Nykyinen osavaltio. Vaihtelee yhden tai useamman vaikutuksen alaisena useat ammatit. Usein kilpailuihin osallistumisen seuraukset tai jotka suoritetaan jossakin luokissa koulutustyö Kiristä muutaman päivän ajan. Tällöin urheilija huomauttaa yleensä epäsuotuisan luonteen (esimerkiksi lihaskipu) ilmiöt ja positiiviset (esimerkiksi korkean suorituskyvyn tila). Tällaisia \u200b\u200bmuutoksia kutsutaan retraktivaikutus.

Urheilijan nykyinen tila määrittää lähimmän koulutustilaisuuksien luonteen ja niiden kuormien suuruuden. Kyseisen valtion erityinen tapa, jolle on tunnusomaista valmius toteuttaa tulevat päivät Kilpailukykyinen harjoitus, jonka tulos on lähellä suurinta, kutsutaan nykyinen valmius.

3. Operatiivinen osavaltio. Muutokset vaikuttavat kertaluonteinen toteutus harjoittele ja on tilapäinen (esimerkiksi yhden juoksevan etäisyyden aiheuttama väsymys; suorituskyvyn tilapäinen parantaminen lämpenemisen jälkeen). Urheilijan toimintatila muuttuu harjoittelun aikana, ja se olisi otettava huomioon, kun suunnittelet virkistysvälejä lähestymistapojen, toistuvien kilpailujen välillä samalla kun ratkaistaan \u200b\u200blisäkyselyn toteutettavuus jne. Erityinen tapaus operatiiviselle valtiolle, jolle on ominaista välitön valmius suorittaa kilpailukykyinen harjoitus, jonka tulos on lähellä enimmäismäärää toiminnallinen valmius.

Luokitetun luokituksen mukaisesti kolme päätyyppiä valvontatilaa:

1) vaiheenhallinta. Hänen tavoitteenaan on arvioida urheilijan vaihe (valmius);

2) nykyinen valvonta. Sen päätehtävänä on tunnistaa arkipäiväiset (nykyiset) vaihtelut urheilijasta;

3) operatiivinen valvonta . Hänen tavoitteensa on tällä hetkellä urheilijan tilasta nimenomaisesti.

Mittaus tai testaus suoritetaan urheilijan tilan tai kykyjen määrittämiseksi taikina. Mittaus- tai testausmenetelmää kutsutaan testaukseksi.

Mikä tahansa testi sisältää mittauksen. Mutta mikään mittaus ei toimi testi. Vain ne, jotka täyttävät seuraavat metrologiset, voidaan käyttää testeinä. vaatimukset:

2) standardointi;

3) Arviointijärjestelmän saatavuus;

4) Luotettavuus ja informatiivisuus (hyvyys) testit;

5) Ohjaustyyppi (vaihe, virta tai toiminta).

Moottorin tehtäviin perustuu testi, jota kutsutaan moottoriksi. Moottoritestien ryhmää on kolme:

1. Ohjausharjoitukset suorittamalla urheilija saa tehtävän näyttää maksimaalisen tuloksen. Testin tulos on moottorin saavutus. Esimerkiksi aika, jolle urheilija toimii 100 metrin etäisyydellä.

2. Vakiotoiminnalliset näytteet, joiden aikana tehtävä on sama kaikille, annetaan joko suoritetun työn suuruus tai fysiologisten siirtojen suuruus. Testin tulos on fysiologiset tai biokemialliset indikaattorit, joilla on vakiotyö tai moottori saavutukset fysiologisten siirtojen tavanomaisella suuruudella. Esimerkiksi sykkeen nousun prosenttiosuus 20 kyykkyn jälkeen tai nopeuden jälkeen, jolla urheilija toimii sykkeen kiinteällä arvolla 160 lyöntiä minuutissa.

3. Suurin toiminnalliset näytteet, joiden aikana urheilijan on osoitettava maksimitulos. Testin tulos on fysiologiset tai biokemialliset indikaattorit enimmäisoperaatiossa. Esimerkiksi suurin hapenkulutus tai hapen velan enimmäismäärä.

Korkealaatuinen testaus edellyttää mittausten teorian tuntemusta.

Mikä testaus

IEEE STD 829-1983: n mukaisesti Testaus - Tämä on prosessi ohjelmiston analysoimiseksi, jonka tarkoituksena on tunnistaa eroja todellisuudessa nykyisten ja vaadittujen ominaisuuksien (vika) ja arvioida ohjelmiston ominaisuuksia.

GOST R ISO IEC 12207-99 elinkaari Tarkastuksen, sertifioinnin, yhteisen analyysin ja tilintarkastuksen tukiprosesseja määritetään muun muassa ylimääräisissä prosesseissa. Vahvistusprosessi on prosessi, jossa määritetään, että ohjelmistotuotteet toimivat täysin edellisissä teoksissa toteutettujen vaatimusten tai edellytysten mukaisesti. Tämä prosessi voi sisältää analyysin, todentamisen ja testauksen (testaus). Sertifiointiprosessi on prosessi, jossa määritellään järjestelmän tai niiden ohjelmistotuotteiden luomat vakiintuneiden vaatimusten täyttämisen. toiminnallinen tarkoitus. Yhteisanalyysin prosessi on prosessi, jossa arvioidaan valtioita ja tarvittaessa työn tulokset (tuotteet) hankkeessa. Tarkastusprosessi on prosessi, jossa määritellään sopimuksen vaatimusten, suunnitelmien ja edellytysten noudattaminen. Näiden prosessien määrässä ja muodostavat, mitä yleisesti kutsutaan testaukseksi.

Testaus perustuu testimenetelmiin, joissa on erityisiä syöttötietoja, alkuperäisiä olosuhteita ja odotettua tuloksia, jotka on kehitetty tiettyyn tarkoitukseen, kuten erillisen ohjelman tarkistamisesta tai noudattamisen varmistamiseksi tietty kysyntä. Testimenettelyt voivat tarkistaa ohjelman toimivuuden erilaiset näkökohdat - alkaen oikea työ Erillinen tehtävä liiketoiminnan vaatimusten riittävään toteutukseen.

Hankkeen toteuttamisessa on tarpeen ottaa huomioon, millaisia \u200b\u200bstandardeja ja vaatimuksia testataan tuote. Mitä työkaluja (jos on) käytetään etsimään ja asiakirjan löytämiseen. Jos muistat testauksen projektin alusta, kehitettävän tuotteen testaus ei toimi epämiellyttäviä yllätyksiä. Joten tuotteen laatu on todennäköisesti melko korkea.

Tuotteen elinkaari ja testaus

Ajassa sitä käytetään erityisesti ohjelmistokehityksen prosesseissa, erityisesti teknologiassa Rup - järkevä yhtenäinen prosessi(Kuva 1). Kun käytät tätä lähestymistapaa, testaus lakkaa olemasta "ommeltuessa" prosessissa, joka toimii sen jälkeen, kun ohjelmoijat kirjoittivat kaikki tarvittavat koodit. Testien työskentely alkaa hyvin alkuvaiheessa tunnistaa tulevan tuotteen vaatimukset ja integroituu läheisesti nykyisten tehtävien kanssa. Ja se tekee uusia vaatimuksia testaajille. Heidän roolinsa ei vain vähennetä virheiden tunnistamiseen mahdollisimman täydellisesti ja mahdollisimman varhaisessa vaiheessa. Niiden olisi osallistuttava kokonaisprosessiin tunnistamaan ja poistamaan merkittävimmät hankkeen riskit. Tätä tarkoitusta varten määritetään kunkin iteroinnin testauksen ja menetelmien testauksen ja menetelmien tarkoitus. Jokaisen iteraation lopussa määritetään, kuinka paljon tämä tavoite saavutetaan, jos lisätestejä tarvitaan ja onko periaatteiden ja testaustyökalujen muuttaminen. Kaikiksi havaittujen vian on puolestaan \u200b\u200bkulkea oman elinkaarensa kautta.

Kuva. 1. Tuotteen elinkaari RUP

Testaus tehdään yleensä sykleillä, joista jokaisella on tietty luettelo tehtävistä ja tarkoituksista. Testisykli voi olla samanaikaisesti iteraation kanssa tai vastaa sen erityistä osaa. Tyypillisesti testisykli suoritetaan tiettyyn järjestelmäkokoonpanoon.

Ohjelmistotuotteen elinkaari koostuu suhteellisen lyhyistä iteroinnista (kuva 2). Iterointi on täydellinen kehittämisjakso, joka johtaa lopullisen tuotteen vapauttamiseen tai osa sen lyhennetystä versiosta, joka laajenee iteraatiosta iteraatioon niin, että lopulta tulet valmiiksi järjestelmään.

Jokainen iterointi sisältää pääsääntöisesti työn suunnittelun, analysointiin, suunnittelun, toteutuksen, testauksen ja arvioinnin tehtäviä. Näiden tehtävien suhteet voivat kuitenkin muuttua merkittävästi. Erilaisten tehtävien suhdettaessa ne on ryhmitelty vaiheittain. Ensimmäisessä vaiheessa - alku - Huomio kiinnitetään analyysin tehtäviin. Toisen vaiheen kannalta - Kehitys - painopiste on keskeisten projektipäätösten suunnittelussa ja testauksessa. Kolmannessa vaiheessa rakentaminen on suurin osa kehitys- ja testaustehtävistä. Ja viimeisessä vaiheessa - siirto - ratkaistaan \u200b\u200bkorkeimpien testauksen tehtäviin ja järjestelmän siirtämiseen asiakkaalle.

Kuva. 2. Ohjelmistotuotteen elinkaaren iteraatiot

Jokaisella vaiheella on omat erityiset tavoitteet tuotteen elinkaaressa ja sitä pidetään tehtävina, kun nämä tavoitteet saavutetaan. Kaikki iteraatiot, paitsi voi olla, vaiheen käynnistyksen iterationit valmistetaan luomalla kehitettävän järjestelmän toimiva versio.

Testikuljetukset

Testit eroavat merkittävästi tehtävistä, jotka on ratkaistu heidän avunsa kanssa ja käytetyn tekniikan mukaisesti.

Testikuljetukset Kuvaus Kategoriat Testaustyypit
Nykyinen testaus Joukko testejä, jotka suoritetaan järjestelmän uusien uusien ominaisuuksien suorituskyvyn määrittämiseksi.
  • stressitestaus;
  • testaus liiketoiminnan syklit;
  • stressitestaus.
Regressiotestaus Regressiotestauksen tarkoituksena on varmistaa, että järjestelmän lisäys ei ole vähentänyt kykyjä, ts. Testaus suoritetaan jo suoritettujen vaatimusten mukaisesti ennen uusien ominaisuuksien lisäämistä.
  • stressitestaus;
  • testaus liiketoiminnan syklit;
  • stressitestaus.

Alaluokan testaus

Alaluokan testaus Kuvaus testauksen tyypistä Alalaitokset testaus
Stressitestaus Sitä käytetään testaamaan kaikkia poikkeuksetta sovellustoiminnot. Tällöin toiminnon testaussekvenssi ei ole väliä.
  • toiminnallinen testaus;
  • liitäntäkokeilu;
  • testaustietokanta
Testaus liiketoimintajaksot Sitä käytetään testaamaan sovellustoiminnot käyttäjän puhelun järjestyksessä. Esimerkiksi kaikkien neljänneksen kaikkien kirjanpitäjien toimien jäljitelmä.
  • yksikkö testaus (modulaarinen testaus);
  • toiminnallinen testaus;
  • liitäntäkokeilu;
  • testaustietokanta.
Stressitestaus

Käytetään testaukseen

Sovelluksen suorituskyky. Tämän testin tarkoituksena on määrittää sovelluksen vakaan toiminnan kehys. Tällä testauksella kaikki käytettävissä olevat toiminnot kutsutaan.

  • yksikkö testaus (modulaarinen testaus);
  • toiminnallinen testaus;
  • liitäntäkokeilu;
  • testaustietokanta.

Testaustyypit

Yksikkö testaus (Modulaarinen testaus) - tämä laji Se merkitsee yksittäisten sovellusmoduulien testausta. Suurin tulosten saamiseksi testaus suoritetaan samanaikaisesti moduulien kehittämisen kanssa.

Toiminnallinen testaus - Tämän testin tarkoituksena on varmistaa testibjektin moitteeton toiminta. Se testataan oikein navigoimalla objektin sekä syötteen, käsittelyn ja tietojen tuoton.

Testaustietokanta - Tarkista tietokannan suorituskyky sovelluksen normaalilla toiminnoilla ylikuormituksen ja moninpelitilan hetkessä.

Yksikkö testaus

OOP: lle modulaarisen testauksen tavallinen organisaatio on testata kunkin luokan menetelmiä, sitten kunkin pakkauksen luokan I.t.d. Vähitellen käännymme koko projektin testaamiseen ja aikaisemmat testit ovat regressiotyyppi.

Lähtötehtävissä testitieto sisältää testausmenetelmät, syöttötiedot, koodin suorittaminen, lähtö. Seuraavassa on tuotosasiakirjojen tyyppi.

Toiminnallinen testaus

Testausobjektin toiminnallinen testaus on suunniteltu ja suoritetaan määritelmävaiheessa määriteltyjen testausvaatimusten perusteella. Vaatimukset ovat liiketoimintasäännöt, käyttökohtaiset kaaviot, liiketoiminnot sekä jos on olemassa toimintataulukkoja. Toiminnallisten testien tarkoituksena on tarkistaa kehittyneiden graafisten komponenttien vaatimustenmukaisuus.

Tällaista testausta ei voi täysin automatisoida. Näin ollen se on jaettu:

  • Automaattinen testaus (käytetään siinä tapauksessa, että voit tarkistaa tulostustiedot).

Tarkoitus: Testisyöttö, käsittely ja tietojen tuotos;

  • Manuaalinen testaus (muissa tapauksissa).

Tarkoitus: Testaa käyttäjän vaatimusten suorittamisen oikeellisuuden.

On tarpeen suorittaa (pelata) kukin käyttökotelo, käyttämällä sekä uskollisia arvoja että ilmeisesti virheellisiä, vahvistaaksesi oikean toiminnan seuraavien kriteerien mukaisesti:

  • tuote vastaa riittävästi kaikkiin syötettyihin tietoihin (odotetut tulokset näytetään vastauksena oikein syötetyille datalle);
  • tuote vastaa riittävästi virheellisesti syötettyihin tietoihin (sopivat virheilmoitukset näkyvät).

Testaustietokanta

Tämän testauksen tarkoituksena on varmistaa, että tietokantojen käyttämisen menetelmät ovat luotettavia, niiden asianmukaisessa toteutuksessa häiritsemättä tietojen eheyttä.

Sinun on jatkuvasti käytettävä tietokantaan mahdollisimman suurta mahdollisuutta. Käytetään lähestymistapaa, jossa testi kootaan siten, että "kuormitetaan" pohja sekvenssillä, sekä uskolliset arvot että ilmeisesti virheellinen. Tietokannan vastaus tietojen syöttämiseen määritetään, niiden käsittelyn aikavälejä arvioidaan.

Testiteorian perusteet 1. Testiteorian peruskäsitteet 2. Testien luotettavuus ja tapoja määrittää

Ohjauskysymykset 1. Mitä kutsutaan testi? 2. Mitä vaatimuksia on esitetty testiin? 3. Mitä testejä kutsutaan aitoiksi? 4. Mikä on testin luotettavuus? 5. luetellaan syyt, jotka aiheuttavat tulosten vaihtelua uudelleen testattaessa. 6. Mikä on ero luokan sisäisen vaihtelun välillä intercalses? 7. Kuinka käytännössä määritetään testin luotettavuus? 8. Mikä on ero vakauden testien johdonmukaisuuden välillä? 9. Mikä on testien vastaavuus? 10. Mikä on homogeeninen joukko testejä? 11. Mikä on heterogeeninen koe? 12. Testien luotettavuuden parantaminen.

Testi on mittaus tai testi, joka suoritetaan tilan tai ihmisen kyvyn määrittämiseksi. Kaikki mittaukset eivät voi käyttää testeinä, vaan vain ne, jotka täyttävät erityisvaatimukset. Näitä ovat: 1. Standardointi (menettely ja testausolosuhteet ovat samat kaikissa testauspaikoilla); 2. Luotettavuus; 3. Informatiivinen; 4. Luokitusjärjestelmän läsnäolo.

Testivaatimukset: n Informatiivisuus - tarkkuuden aste, jolla se mittaa kiinteistön (laatu, kyky, ominaisuus) arvioida, mitä käytetään. n Luotettavuus on tulosten sattumaa, kun se testaa samoja ihmisiä samoissa olosuhteissa. Johdonmukaisuus - (eri ihmiset, mutta samat laitteet ja samat olosuhteet). n N Standard-olosuhteet - (Kuinka toistuvat mittaukset). n Arviointijärjestelmän saatavuus - (käännös luokitusjärjestelmään. Kuten koulussa 5 -4 -3 ...).

Testit, jotka täyttävät luotettavuuden ja informaatiota koskevat vaatimukset, kutsutaan hyväksi tai aitoksi (kreikkaksi. Aito - luotettava)

Testiprosessia kutsutaan testaukseksi; Tuloksena oleva mittaus numeerinen arvo - testauksen (tai testin tulos). Esimerkiksi 100 m: n juokseminen on testi, tilanne ja ajoitus - testaus, kilpailun aika on testin tulos.

Moottorin tehtäviin perustuvat testit kutsutaan moottoriksi tai moottoriksi. Niiden tulokset voivat olla joko moottorin saavutuksia (etäisyyden kulkemisen ajan, etäisyyden kautta jne.) Tai fysiologiset ja biokemialliset indikaattorit.

Sitä käytetään joskus ei ole yhtä, mutta useita testejä, joilla on yksittäinen päätavoite (esimerkiksi urheilijan tilan arviointi kilpailujaksolla). Tällaista testiä kutsutaan monimutkaiseksi tai testiparistoksi.

Sama tutkimus, jota sovelletaan samaan tutkimukseen samoissa olosuhteissa (elleivät ne muuteta tutkittuja). Kuitenkin tiukimmalla standardoinnilla ja tarkalla laitteilla testitulokset ovat aina hieman vaihtelevia. Esimerkiksi tuloksena oleva dynamometria, joka on juuri osoittanut dynamometriatestissä, 215 k. G, toistuvalla toteutuksella näkyy vain 190 k. G.

Testien luotettavuus ja tapoja määrittää testin luotettavuutta, kutsutaan tulosten sattumalta, kun se testaa samoja ihmisiä (tai muita esineitä) samoissa olosuhteissa.

Tulosten vaihtelu, kun uudelleen testausta kutsutaan sisäpuolelta tai sisäpuolelta tai intrasklass. Neljä pääasiallista syytä aiheuttaa tämän vaihtelun: 1. Tutkittujen (väsymys, työ, "oppiminen", motivaation muutos, tarkennuspitoisuus jne.). 2. Ulkoisten olosuhteiden ja laitteiden hallitsematon muutos (lämpötila, tuuli, kosteus, jännite tehoverkossa, luvattomien henkilöiden läsnäolo jne.), Toisin sanoen kaikki, jotka yhdistyvät termi "satunnainen mittausvirhe".

Neljä pääasiallista syytä aiheuttaa tämän vaihtelun: 3. suoritettuun henkilöön tai arviointestin tila (ja tietenkin korvaa yksi kokeilija tai tuomari muille). 4. Taikinan epätäydellisyys (tällaisia \u200b\u200btestejä on tietoisesti hankalaa. Esimerkiksi jos testit suorittavat vapaat heitot koripallokori, niin jopa koripalloilija, jolla on suuri osuus osumasta, voi vahingossa olla väärässä ensimmäisessä heittoissa).

Testin todellisen tuloksen käsite on abstraktio (kokemuksella se on mahdotonta). Siksi sinun on käytettävä epäsuoria menetelmiä. Edullisin luotettavuusdispersioanalyysin arvioimiseksi, jota seuraa sisävesikorrelaatiokertoimien laskeminen. Dispersionanalyysin avulla voit hajottaa testituloksen vaihtelun komponentteihin yksittäisten tekijöiden vaikutuksen vuoksi.

Jos rekisteröit tulokset tutkittuihin tuloksiin jonkinlaisessa testissä, toistamalla tämä testi eri päivinäJa joka päivä tehdä useita yrityksiä, säännöllisesti muuttuvat kokeilijat, sitten on vaihtelu: a) aiheesta aiheesta; n b) päivittäin; n c) kokeilusta kokeilijalle; n d) yrittää kokeilla. Dispersionanalyysi mahdollistaa näiden muunnelmien jakamisen ja arvioinnin. N.

Siten on välttämätöntä arvioida testin käytännöllisesti luotettavuus, N dispersioanalyysin suorittamiseksi, toiseksi laskevat intralass-korrelaatiokerroin (luotettavuustekijä).

Testien luotettavuudesta puhuminen on välttämätöntä erottaa vakaus (toistettavuus), johdonmukaisuus, vastaavuus. N N Testaa vakautta ymmärtää tulosten toistettavuus, kun se toistettiin tiettyyn aikaan samoissa olosuhteissa. Toistuvaa testausta kutsutaan tavallisesti retaistiksi. Testin johdonmukaisuutta on ominaista riippumattomuudesta testauksen tuloksista, jotka johtavat henkilöllisyyden tai arviointitestin henkilökohtaisista ominaisuuksista.

Jos kaikki testit, jotka sisältyvät jonkinlaiseen testikompleksi, ovat erittäin vastaavia, sitä kutsutaan homogeeniseksi. Kaikki tämä kompleksi mittaa yhden asian, jonka henkilön motiliteetti ominaisuus (esimerkiksi monimutkainen, joka koostuu harppauksista avaruudesta, ylös ja kolminkertainen; arvioi nopeusvoimien ominaisuuksien kehittämisen tasoa). Jos kompleksissa ei ole vastaavia testejä, eli se mittaavat eri ominaisuuksia, sitten sitä kutsutaan heterogeeniseksi (esimerkiksi kompleksi, joka koostuu valikoimasta dynamometria, hypätä Acalac, joka juoksee 100 m).

Testivarmuutta voidaan lisätä tietyssä määrin: n n n n a) tiukemmin testauksen standardointi; b) lisätä yritysten määrää; c) lisätä arviointien määrää (tuomareita, kokeita) ja parantamaan mielipiteensä johdonmukaisuutta; d) lisäävät vastaavien testien määrää; e) tutkittujen parhaan motivaatiota.

Luku 3. Tilastollinen käsittely Testitulokset

Testitulosten tilastollinen käsittely mahdollistaa toisaalta objektiivisesti objektiivisesti aiheiden tulokset, toisella - arvioida itse testin laatua, testitehtävätErityisesti arvostaa luotettavuuttaan. Luotettavuuden ongelmasta kiinnitetään paljon huomiota testien klassisessa teoriassa. Tämä teoria ei ole menettänyt merkitystä ja nyt. Ulkonäköstä huolimatta nykyaikaisemmista teorioista klassinen teoria säilyttää edelleen asemansa.

3.1. Testien klassisen teorian tärkeimmät määräykset

3.2. Matrix testitulokset

3.3. Testipisteiden graafinen esitys

3.4. Keskeiset suuntaustoimenpiteet

3.5. NORMAALIJAKAUMA

3.6. Dispersion testipisteen testi

3.7. Korrelaatiomatriisi

3.8. Testin luotettavuus

3.9. Testin voimassaolo

KIRJALLISUUS

Testien klassisen teorian tärkeimmät määräykset

Testien klassisen teorian (klassisen teorian mielenterveyden teoria) on tunnettu brittiläinen psykologi, tekijäanalyysin tekijä Challes Edward Spearman (1863-1945) 1. Hän syntyi 10. syyskuuta 1863, ja neljännes elämästään palvellaan brittiläisessä armeijassa. Tästä syystä hän sai filosofian lääkärin tutkinnon vain 41 2-vuotiaana. OSSPIRMAN Väitöskirja suoritettiin kokeellisen psykologian Leipzigin laboratoriossa Wilhelm Wundtin (Wilhelm Wundt) ohjauksessa. Tänä aikana Francis Galton (Francis Galton) oli vahva vaikutus CH.Pirmaniin (Francis Galton) ihmisen älykkyyden testaamiseen. Oppilaat PartsPirman olivat R.Cattell ja D.Wecksler. Hänen seuraajiensa, A.Anansaasi, J. P. Guilford, P.vernon, C.Burt, A.Jensen voidaan kutsua.

Suuri panos testien klassisen teorian kehittämiseen Louis Guttman, 1916-1987) 3.

Kattavasti ja täynnä testien klassista teoriaa ensimmäistä kertaa on esitetty Harold Gullixenin perustavanlaatuisessa työssä (GULLIKSEN H., 1950) 4. Siitä lähtien teoria on jonkin verran muunnettu, erityisesti matemaattista laitetta paransi. Nykyaikaisen esityksen klassinen testiteoria annetaan kirjastokaska L., Aligna J. (1986) 5. Kotimaisten tutkijoiden ensimmäistä kertaa tämän teorian kuvaus sai V.Avanesis (1989) 6. Chelyowkova M.B: n työssä (2002) 7 antaa tietoa testin laadun tilastollisesta perustelusta.

Klassinen testausteoria perustuu seuraaviin viiden pääpaikkoihin.

1. Empiirisesti saatu mittaustulos (X) on todellinen mittaustulos (T) ja mittausvirheet (E) 8:

X \u003d T + E (3.1.1)

Arvot T ja E ovat yleensä tuntemattomia.

2. Todellinen mittaustulos voidaan ilmaista matemaattisena odotuksena E (x):

3. Todellisten ja virheellisten komponenttien korrelaatio koehenkilöiden mukaan on nolla, eli ρ te \u003d 0.

4. Kahden testin virheelliset komponentit eivät korreloi:

5. Yhden testin virheelliset komponentit eivät korreloi minkä tahansa muun testin todellisiin osiin:

Lisäksi testien klassisen teorian perusta on kaksi määritelmää - rinnakkaiset ja vastaavat testit.

Rinnakkaisten testien on oltava vaatimusten mukaisia \u200b\u200b(1-5), yhden testin (T1) todelliset komponentit ovat yhtä suuria kuin toisen testin (T2) todelliset komponentit kussakin näytteessä, jotka vastaavat molempiin testeihin. Oletetaan, että T 1 \u003d T2 ja lisäksi ovat yhtä suuria kuin dispersio S 1 2 \u003d S 2 2.

Vastaavilla testillä on oltava koko rinnakkaisten testien koko vaatimus, lukuun ottamatta yhtä: yhden testin todelliset komponentit eivät tarvitse olla yhtä suuria kuin toisen rinnakkaisen testin todelliset komponentit, mutta niiden pitäisi poiketa samasta vakiosta. peräkkäin.

Kahden testin vastaavuustila kirjataan seuraavaan lomakkeeseen:

jossa C 12 on vakio eroja ensimmäisten ja toisen testien tuloksissa.

Edellä mainittujen säännösten perusteella testin luotettavuuden teoria on 9,10.

toisin sanoen saadun testipisteen dispersio on yhtä suuri kuin todellisten ja virheellisten komponenttien dispersioiden summa.

Kirjoitan tämän lausekkeen uudelleen seuraavasti:

(3.1.3)

Oikea osa Tämä tasa-arvo on testin luotettavuus ( r.). Täten testin luotettavuus voidaan kirjoittaa lomakkeessa:

Tämän kaavan perusteella oli myöhempiä ilmaisuja testin luotettavuustekijän löytämiseksi. Testin luotettavuus on se tärkein ominaisuus. Jos luotettavuus ei ole tiedossa, testituloksia ei voi tulkita. Testin luotettavuus luonnehtii sen tarkkuutta mittauslaitteeksi. Suuri luotettavuus tarkoittaa suurta toistettavuutta testituloksista samoissa olosuhteissa.

Klassisessa testiteoriassa tärkein ongelma on määrittää kohteen todellinen testipiste (t). Empiirinen testipiste (X) riippuu monista olosuhteista - tehtävien vaikeusaste, aiheiden valmiuden taso, tehtävien määrä, testauksen suorittamisen edellytykset jne. Vahva, hyvin koulutettujen aiheiden ryhmä testitulokset ovat yleensä parempia. kuin konsernin heikosti valmistetut aiheet. Tältä osin aiheen yleisen väestön tehtävien vaikeuksien suuruus on edelleen avoin. Ongelma on se, että todelliset empiiriset tiedot saadaan ei lainkaan satunnaisiin näytteisiin. Nämä ovat pääsääntöisesti oppilaita, jotka ovat monia opiskelijoita melko voimakkaasti vuorovaikutuksessa opetusten ja opiskelijoiden kesken olosuhteissa, joita usein ei toisteta muille ryhmille.

löytö s E. Yhtälöstä (3.1.4)

Tässä nimenomaisesti osoittaa mittaustarkkuuden riippuvuuden standardipoikkeamasta. s X. ja testin luotettavuudesta r..