Matematické základy teorie testovacích testů. Teoretický základ testování


První složka, teorie testů obsahuje popis statistických modelů diagnostických dat zpracování dat. Zde jsou modely analýzy odpovědí v testovacích úkolech a výpočtu modelu celkových výsledků testů. Mellenberg (1980, 1990) to nazval "psychometrie". The Classical Test Teorie, Moderní teorie testů (nebo modelová analýza odpovědí na testování úkolů - IRT) a modelu


vzorky úloh tvoří tři nejdůležitější typy modelů teorie testu. Předmětem psychodiagnostiky je první dva modely.

Teorie klasické testu. Na základě této teorie byly vyvinuty většina intelektuálních a osobních testů. Centrální koncept této teorie je pojetí "spolehlivosti". V rámci spolehlivosti je chápána jako soudržnost výsledků při přehodnocení. V referenčních knihách je tento koncept obvykle velmi stručný a pak dal detailní popis Přístroje matematické statistiky. V tomto, úvodní kapitole představíme komprimovaný popis hlavní hodnoty poznamenatého konceptu. V klasické teorii testů je spolehlivým opakováním výsledků několika postupů měření (zejména měření s testy). Koncepce spolehlivosti zahrnuje výpočet chyb měření. Výsledky získané během testovacího procesu mohou být reprezentovány jako součet skutečného výsledku a změny měření:

Xi \u003d ti.+ EJ.

kde Xi.- Hodnocení získaných výsledků, TI je skutečným výsledkem a EJ.- Chyba měření.

Vyhodnocení získaných výsledků je zpravidla počet správných odpovědí na úkoly zkoušky. Skutečný výsledek lze považovat za skutečné posouzení v platonském smyslu (Guliksen, 1950). Koncepce očekávaných výsledků je rozšířen, tj. Zastoupení bodů, které lze získat v důsledku velkého počtu opakování postupů měření (Pán) & Novich, 1968). Ale implementace stejného postupu posuzování s jednou osobou není možné. Proto musíte hledat další řešení problému (Witlman, 1988).

V rámci tohoto konceptu jsou některé předpoklady provedeny v souvislosti s opravnými výsledky a chyby měření. Ten jsou přijímáni jako nezávislý faktor, který je samozřejmě dobře založený předpoklad, protože náhodné výkyvy ve výsledcích nedávají Covarians: r it \u003d 0.

Předpokládá se, že korelace mezi opravdovými skóre a chyby měření neexistuje: r ee \u003d 0.


Celková chyba je 0, protože Jako skutečný odhad je vzat aritmetický význam:

Tyto předpoklady nás vedou v důsledku určité definice spolehlivosti jako poměr pravého výsledku s běžnou disperzí nebo exprese: 1 mínus vztah, ve kterém číslo chyby měření a v denominátoru - celková disperze:


Or.

Z tohoto vzorce Definice spolehlivosti získáme tuto chybu disperze S 2 (e)rovnou obecné disperzi mezi případy (1 - r xx "); tedy standardní chyba Měření stanoví vzorec:

Po teoretickém odůvodnění spolehlivosti a jeho derivátů je nutné určit index spolehlivosti zkoušky. Existují praktické postupy pro hodnocení testovací spolehlivosti, jako jsou používání zaměnitelných forem (paralelních testů), rozdělovacích úkolů do dvou částí, re-testování a měření vnitřní konzistence. Každý adresář obsahuje indexy konstantních výsledků testů:

r xx '\u003d r (x 1, x 2)

kde r xx ' - koeficient stability a x 1. a x 2. - výsledky dvou dimenzí.

Koncepce spolehlivosti zaměnitelných forem byl zaveden a vyvinutý Gullixen (1950). Tento postup je poměrně pracný, protože souvisí s potřebou vytvořit paralelní sérii úkolů.

r xx '\u003d r (x 1, x 2)

kde r xx ' - koeficient ekvivalence a x 1. a x 2. - Dva paralelní testy.

Následující postup je rozdělení hlavního testu do dvou částí A a B je snadnější. Indikátory získané na obou částech zkoušky jsou korelovány. S pomocí spearmman-hnědého vzorce se odhaduje spolehlivost testu jako celku:

kde a b - dvě paralelní části zkoušky.

Následující metoda je definice vnitřní konzistence testovacích úkolů. Tato metoda je založena na definici Covariants jednotlivých úkolů. SG - disperze libovolně vybrané úlohy a SGH - Covariance dvou libovolně vybraných úkolů. Nejčastěji používaným koeficientem definovat vnitřní konzistenci je "alfa koeficient" Kronbach. Používá se také vzorec Kr20 a λ-2(Lambda-2).

V klasickém pojetí spolehlivosti se stanoví chyby měření vznikajících jak v procesu zkoušení, tak v procesu pozorování. Zdroje těchto chyb se liší: Mohou to být také osobní rysy a funkce testovacích podmínek a samotné zkušební úkoly. Existují specifické metody výpočtu chyb. Víme, že naše pozorování mohou být chybné, naše metodické nástroje jsou nedokonalé stejně jako samotní lidé jsou nedokonalí. (Jak si pamatovat Shakespeare: "Jste nespolehlivý, jehož jméno je osoba"). Skutečnost, že v klasickém měřítku testů chyb měření je vysvětlitelná a vysvětlena je důležitý pozitivní bod.

The Classic Test Teorie má řadu základních znaků, které lze považovat za své nevýhody. Některé z těchto vlastností jsou uvedeny v referenčních knihách, ale jejich význam (z každodenního hlediska) je zdůrazněn zřídka, protože ne a skutečnost, že by měly být považovány za nedostatky z teoretického nebo metodického hlediska.

První. The Classical Test Teorie a koncepce spolehlivosti jsou zaměřeny na výpočet celkových testovacích ukazatelů, které jsou výsledkem přidání odhadů získaných v samostatných úkolech. Takže při práci


Druhý. Faktor spolehlivosti znamená posouzení rozptylu měřených ukazatelů. Z toho vyplývá, že faktor spolehlivosti bude nižší, pokud (s rovností ostatních ukazatelů) vzorek je homogennější. Neexistuje žádný jediný koeficient vnitřní soudržnosti testovacích úkolů, tento koeficient je vždy "kontextový". Crocker a Aldjina (1986), například nabízejí speciální vzorec "korekce homogenního vzorku" určeného pro nejvyšší a nejnižší výsledky získané testováním. Pro diagnostiku je důležité znát vlastnosti změn ve vzorkové sadě, jinak nebude moci používat koeficienty vnitřní konzistence uvedené v příručce pro tento test.

Třetí. Fenomén informací o průměrném aritmetickém indikátoru je logickým důsledkem klasického pojetí spolehlivosti. Pokud ocenění ve zkoušce kolísá (tj. Není dostatečně spolehlivý), je docela možné, že když opakování postupu budou subjekty s nízkými ukazateli dostávat vyšší body a naopak, subjekty s vysokými ukazateli jsou nízké. Tento artefakt postupů měření nelze mýlit za skutečnou změnu nebo projev vývoje procesů. Ale zároveň je vymezuje, není snadné, protože Nikdy nemůžete eliminovat možnost změny během vývoje. Pro úplnou důvěru je nezbytné "porovnání s kontrolní skupinou.

Čtvrtá charakteristika testů vyvinutých v souladu s principy klasické teorie je přítomnost regulačních údajů. Znalost testovacích pravidel umožňuje výzkumníkovi dostatečně interpretovat výsledky zkoušky. Mimo normu jsou odhady testu zbaveny významu. Vývoj testovacích norem je poměrně drahý podnik, protože psycholog by měl dostávat výsledky testu na reprezentativní vzorek.

2 J. Ter Laak

Pokud hovoříme o nedostatcích klasického pojetí spolehlivosti, pak je prohlášení Siy TSMA vhodné (1992, r. 123-125). Konstatuje, že první a nejdůležitější předpoklad klasické teorie testů je, že výsledky testu podléhají zásadě intervalu. Žádný výzkum potvrzující tento předpoklad však není. Ve skutečnosti je to "měření pro libovolně zavedené pravidlo" Tato funkce položí klasickou teorii testů v méně příznivé poloze ve srovnání s měřicími stupnicí a samozřejmě ve srovnání s moderní teorií testu. Mnoho metod analýzy dat (disperzní analýza. regresní analýzaAnalýza korelace a faktorů) jsou založeny na předpokladu existence intervalu stupnice. Nemá však pevné ospravedlnění. Zvažte rozsah pravých výsledků jako rozsah hodnot psychologické charakteristiky (Například aritmetické schopnosti, inteligence, neurotismus) mohou být pravděpodobně pravděpodobně.

Druhá poznámka se týká výsledků testu testu - nejedná se o absolutní ukazatele jedné nebo jiné psychologické charakteristiky testovaného, \u200b\u200bmusí být považovány pouze za výsledky realizace testu. Pro studium stejných psychologických charakteristik mohou požádat o dva testy (například inteligence, verbální schopnosti, extroverze), ale to neznamená, že tyto dva testy jsou rovnocenné a mají stejné schopnosti. Porovnání ukazatelů dvou lidí, kteří byli testováni různými testy, nesprávně. Totéž platí pro vyplnění dvou různých testů s jedním subjektem. Třetí poznámka se týká předpokladu, že standardní chyba měření je stejná ve vztahu k libovolné úrovni měřených individuálních schopností. Neexistuje však empirické ověření tohoto předpokladu. Takže například neexistuje žádná záruka, která testována s dobrými matematickými schopnostmi při práci s relativně jednoduchým aritmetickým testem obdrží vysoké body. V tomto případě bude osoba s nízkými nebo středními schopnostmi vysoce ceněna.

V rámci současné teorie testu nebo teorie analýzy odpovědí v testovacích úkolech je popis popsán ve velkém


počet modelů možných odpovědí respondentů. Tyto modely se liší podle předpokladů nadace, jakož i požadavky získaných dat. Model Rasha je často považován za synonymum teorií analýzy reakce v testovacích úkolech (1RT). Ve skutečnosti to je jen jeden z modelů. Vzorec reprezentovaný v něm popisoval charakteristickou křivku úkolu G je následující:

kde g.- samostatný úkol testu; eJR.- funkce exponenciálů (nelineární závislost); δ (Delta) - úroveň obtížnosti těsta.

Ostatní úkoly testu, například h,také získat vlastní charakteristické křivky. Podmínky stavu Δ h\u003e δ g (gznamená, že h.- obtížnější úkol. V důsledku toho pro každou hodnotu ukazatele Θ ("Theta" - latentní vlastnosti schopností testu) pravděpodobnost úspěšného úkolu h.méně. Tento model se nazývá přísná, protože je zřejmé, že s nízkou mírou závažnosti je pravděpodobnost úkolu blízko nule. V tomto modelu není místo pro hádání a předpoklady. Pro úkoly s možností není třeba provést předpoklady o pravděpodobnosti úspěchu. Kromě toho je tento model přísný v tom smyslu, že všechny úkoly testu musí mít stejnou diskriminační schopnost (vysoký diskriminační odraz v strmosti křivky; zde je možné postavit stupnici Gut-Tman, podle kterého v každém Charakteristická křivka, pravděpodobnost úkolu se mění z až 1). Z tohoto důvodu podmínky nejsou všechny úkoly mohou být zahrnuty do testů vytvořených na základě modelu Rasha.

Existuje několik možností tohoto modelu (například Birnbaura, 1968, viz Lord & Novik). To dělá existenci úkolů s různou diskriminací

schopnost.

Dutch Explorer Mokken (1971) vyvinul dva modely pro analýzu odpovědí v úkolech testu, jejichž požadavky nejsou tak přísné jako v modelu spěchu, a proto mohou být realističtější. Jako hlavní stav

viya Mokken staví postoj, že charakteristická křivka úkolu musí následovat monotónně, bez přestávek. Všechny úkoly testu zároveň jsou zaměřeny na studium stejných psychologických charakteristik, které by měly být měřeny v.Jakákoliv forma této závislosti je povolena, dokud nepřerušená. V důsledku toho není tvar charakteristické křivky určeno žádnou specifickou funkcí. Taková "svoboda" vám umožňuje použít více testovacích úkolů a úroveň odhadu není vyšší než obvyklá.

Metodika modelů odpovědí na úkoly testu (IRT) se liší od metodiky většiny experimentálních a korelačních studií. Matematický model je určen ke studiu behaviorální, kognitivních, emocionálních charakteristik, jakož i rozvojových jevů. Tyto jevy v úvahu jsou často omezeny na reakce na úkoly, které umožnily Mel-Lenberg (1990) zavolat teorii IRT "mini-teorie o mini-chování." Výsledky studie mohou být prezentovány do určité míry jako křivky konzistence, zejména v případech, kdy teoretické myšlenky týkající se studovaných charakteristik chybí. Dosud má naše likvidace pouze jednotky inteligenčních testů, schopností a osobních testů vytvořených na základě mnoha modelů teorie IRT. Varianty modelu Rasha jsou častěji používány ve vývoji testů úspěšnosti (Verhelst, 1993) a model makotu je vhodnější pro vývojové jevy (viz také Ch. 6).

Odpověď je testována na úkolu testu je hlavní jednotka modelů IRT. Typ odezvy je stanoven stupně závažnosti u lidí studoval vlastnosti. Taková charakteristika může být například aritmetické nebo prostorové schopnosti. Ve většině případů to je jeden nebo jiný aspekt inteligence, charakteristika úspěchů nebo osobních rysů. Předpokládá se, že mezi pozicí této konkrétní osoby v určitém rozsahu charakteristiky a pravděpodobnosti úspěšné realizace jednoho nebo jiného úkolu, existuje nelineární závislost. Nelinearita této závislosti v určitém smyslu je intuitivní. Slavné fráze "Každý začátek je obtížné" (pomalé


lineární start) a "Stát se posvátný není tak jednoduchý," znamená to, že další zlepšení po dosažení určité úrovně je obtížné. Křivka se pomalu přiblíží, ale téměř nikdy nedosáhne 100% úrovně úspěchu.

Některé modely spíše odporují naše intuitivní porozumění. Takový příklad. Osoba s libovolným charakteristickým indexem 1,5 má při výkonu úkolu 60% pravděpodobnost úspěchu. To odporuje našeho intuitivního porozumění takové situaci, protože může být buď úspěšně vyrovnat se s úkolem, nebo se s ním vůbec nevyrovnat. Vezměte tento příklad: 100 krát osoby se snaží vzít výšku 1m 50 cm. Úspěch mu doprovází 60 krát, tj. Má 60% pravděpodobnost úspěchu.

Pro posouzení stupně závažnosti musí charakteristiky nejméně dvě úkoly. Model Rasha předpokládá definici závažnosti vlastností bez ohledu na obtížnost úkolu. To také odporuje našeho intuitivního porozumění: Předpokládejme, že osoba má pravděpodobnost 80% skákat nad 1,30 m. Pokud ano, pak v souladu s charakteristickým křivkou úkolu má 60% pravděpodobnost skákat nad 1,50 m a 40% pravděpodobnost Skok nahoře je 1,70 m. V důsledku toho, bez ohledu na hodnotu nezávislé proměnné (výška), můžete odhadnout schopnost člověka skočit na výšku.

Existuje asi 50 modelů IRT (Goldstein & Wood, 1989). Existuje mnoho nelineárních funkcí popisujících (vysvětluje) pravděpodobnost úspěchu při provádění úkolu nebo skupiny úkolů. Požadavky a omezení těchto modelů jsou odlišné a tyto rozdíly mohou být detekovány při porovnání modelu spěchu a měřítko mokcaenu. Požadavky těchto modelů zahrnují:

1) Je třeba určit studované vlastnosti a posouzení pozice osoby v rozsahu této funkce;

2) Posouzení stanovení úkolů;

3) Check. specifické modely. V psychometrii bylo vyvinuto mnoho postupů pro ověření modelu.

V některých referenčních příručkách je IRT teorie považována za formu analýzy testovacích úkolů (viz například

Crcer & Algina, J 986). Je však možné bránit názor, že teorie IRT je mini-chování mini-teorie ". Příznivci teorie IRT Všimněte si, že pokud jsou nedokonalé koncepty (modely) střední úrovně, pak to, co lze říci o složitějších konstruktech v psychologii?

Klasická a moderní teorie testů. Lidé nemohou porovnat věci, které vypadají téměř stejně. (Snad každodenní ekvivalent psychometrie a spočívá především na porovnání lidí pro smysluplné vlastnosti a volby mezi nimi). Každý z předložených teorií - a teorie měření chybových chyb a matematický model odpovědí na úkoly testu - má své vlastní příznivce (Goldstein & Wood, 1986).

Modely IRT nezpůsobují výčitky v tom, že je "hodnocení podle pravidel", na rozdíl od klasické teorie testů. Model IRT je zaměřen na analýzu hodnocených vlastností. Charakteristika jednotlivce a charakteristik úkolů odhadují stupnice (ordinální nebo interval). Kromě toho je možné porovnat výkonnost různých testů zaměřených na učení podobných charakteristik. Konečně spolehlivost nerovných pro každou hodnotu na stupnici a průměrné ukazatele jsou obvykle spolehlivější než ukazatele umístěné na začátku a na konci stupnice. Takové modely IRT v teoretických vztazích jsou tedy předvozeny. Existují také rozdíly v praktickém využití moderní teorie testů a klasické teorie (Sijstma, 1992, s. 127-130). Moderní teorie testů je složitější ve srovnání s klasickými, takže je méně běžně používaná non-odborníci. Navíc IRT umístí speciální požadavky na úkoly. To znamená, že úkoly musí být vyloučeny z testu, pokud nesplňují požadavky modelu. Toto pravidlo se dále týká těchto úkolů, které byly součástí široce používaných testů postavených na principech klasické teorie. Zkouška se stává kratším, a proto se sníží spolehlivost.

IRT nabízí matematické modely ke studiu skutečných jevů. Modely by nám měly pomoci pochopit klíčové aspekty těchto jevů. Hlavní teoretická otázka je však zde. Modely lze zvážit


watikak přístup ke studiu komplexní reality, ve které žijeme. Ale model a realita není to samé. Podle pesimistického vzhledu je možné simulovat pouze jeden (a moreant nejzajímavější) typy chování. Můžete také splnit prohlášení, že realita nepodléhá modelování vůbec, protože Subeys ne jeden kauzální právo. V nejlepší případ Je možné modelovat jednotlivé (ideální) behaviorální jevy. Je tu další, optimističtější, podívejte se na možnost modelování. Výše uvedená pozice blokuje možnost hlubokého porozumění povaze jevů lidského chování. Použití určitého modelu vyvolává některé z nejzákladnějších otázek. Podle našeho názoru není pochybné, že IRT je koncept teoreticky a technicky lepší než klasické teorie testů.

Praktický účel testů z jakéhokoli teoretického základu nejsou vytvořeny, je identifikovat významná kritéria a zřízení charakteristik některých psychologických konstruktů na nich. Má model IRT výhody a v tomto ohledu? Je možné, že testy vytvořené na základě tohoto modelu nedávají přesnější prognózu ve srovnání s testy vytvořenými na základě klasické teorie, a je možné, že jejich příspěvek k rozvoji psychologických konstruktů není významnější. Diagnostiky preferují taková kritéria, která se přímo týkají samostatné osoby, Ústavu nebo komunity. Model, perfektnější ve vědeckém vztahu, "IPSO facto" * nedefinuje vhodnější kritérium a je určitým rozsahem omezeným při vysvětlování vědeckých konstruktů. Je zřejmé, že vývoj testů založených na klasické teorii bude pokračovat, ale zároveň budou vytvořeny nové modely IRT, rozšiřující se ke studiu většího počtu psychologických jevů.

V klasické teorii testů se rozlišují pojmy "spolehlivost" a "platnost". Výsledky TESZESHAI musí být spolehlivé, tj. Výsledky počátečního a re-testování by měly být koordinovány. Navíc,

* iPSO facto.(lak) - sám (cca. trans.).

výsledky musí být volné (pokud je to možné) z chybových chyb. Přítomnost platnosti je jedním z požadavků na získané výsledky. V tomto případě je spolehlivost považována za nezbytnou, ale ještě není dostatečná podmínka pro platnost zkoušky.

Koncepce platnosti předpokládá, že získané výsledky patří k čemu důležité v praktických nebo teoretických vztazích. Závěry provedené na základě odhadů testů by měly být platné. Nejčastěji hovoří o dvou typech platnosti: prognostické (kritéria) a strukturální. Existují také jiné typy platnosti (viz CH 3). Kromě toho může být platnost definována v případě kvazi experimentu (Campbell, 1976, Cook & Shadish, 1994). Hlavním typem platnosti je však stále prognostickou platností, pod kterou je chápán jako schopnost předvídat něco významného chování v budoucnu, stejně jako možnost hlubšího pochopení jednoho nebo jiných psychologických vlastností nebo kvality.

Předkládaná typy platnosti jsou diskutovány v každém adresáři a jsou doplněny popisem metod analýzy testu. Analýza faktorů je vhodnější pro stanovení strukturální validace a lineární regresní rovnice se používají k analýze prognostické platnosti. Tyto nebo jiné vlastnosti (výkon, účinnost terapie) mohou být předpovězeny na základě jednoho nebo více ukazatelů, napůl vědců při práci s intelektuálními nebo osobními testy. Tyto techniky zpracování dat jako korelace, regrese, disperzní analýza, analýza částečných korelací a disperzí slouží k určení prognostické platnosti zkoušky.

Také popisuje smysluplnou platnost. Předpokládá se, že všechny úkoly a úkoly zkoušky by měly patřit do určité oblasti (mentální vlastnosti, chování atd.). Koncept podstatné platnosti charakterizuje korespondenci každého testovacího úkolu měřené oblasti. Hmotná platnost je někdy považována za součást spolehlivosti nebo "generalized" (Cronbach, Glaeser, Nanda & Rajaratnam, 1972). nicméně


volba úkolů pro úspěchy testů v určité oblasti předmětu je také důležitá věnovat pozornost pravidlům pro úkol v testu.

V klasické teorii testu jsou spolehlivost a platnost považovány za relativně nezávislé na sobě. Ale je tu další pochopení poměru těchto pojmů. Moderní teorie testů je založena na použití modelů. Parametry se odhadují uvnitř určitého modelu. Pokud úkol nesplňuje požadavky modelu, pak v rámci tohoto modelu je uznáván jako neplatný. Strukturální validizace je součástí samotného modelu. Tato validizace se týká především ke kontrole existence jednorozměrné latentní linky ve studiu se známými charakteristikami váhy. Scatches budou nepochybně použity k určení odpovídajících kritérií a jejich korelace je možné s ukazateli jiných konstruktů shromažďovat informace o konvergentní a odlišné platnosti konstruktu.

Psychodiagnóza je podobná jazyku popsaném jako jednota čtyř složek uvedených na třech úrovních. První složka, teorie testů, podobná syntaxi, gramatice jazyka. Generování (generativní) gramatika je na jedné straně vtipný model, na druhé straně systém podřízený pravidla. Použití těchto pravidel, komplikované jsou postaveny na základě jednoduchých afektivních návrhů. Zároveň však tento model Odpustí stranu, jak je organizován komunikační proces (který je přenášen a co je vnímáno), a s jakými cíli je prováděna. Pro pochopení to vyžaduje další znalosti. Totéž lze říci o teorii testů: je nutné v psychodiagnostiky, ale není schopen vysvětlit, že psychodiagnoste dělá a jaký je jeho cíl.

1.3.2. Psychologické teorie a psychologické konstrukty

Psychodiagnostika je vždy diagnózou něčeho specifického: Osobní charakteristiky, chování, myšlení, emoce. Zkoušky jsou určeny k vyhodnocení jednotlivých rozdílů. Existuje několik pojmů

jednotlivé rozdíly, z nichž každá má vlastní charakteristické rysy. Pokud je uznáno, že psychodiagnostiks není omezen na posouzení jednotlivých rozdílů, pak jsou pro psychodiagnostik nezbytné další teorie. Příkladem je posoudit rozdíly v procesech duševního rozvoje a rozdílů v sociálním prostředí. Ačkoli hodnocení jednotlivých rozdílů není nepostradatelný atribut Psychodiagnostiky vedle určitých tradic výzkumu v této oblasti. Psychodiagnostics začal s hodnocením inteligenčních rozdílů. Hlavním úkolem testů byl "určení dědičného přenosu geniálního" (galon) nebo výběr dětí pro školení (binet, Simon). Měření koeficientu intelektivity obdržel teoretické porozumění a praktický vývoj v dílech spirmendu (Spojeného království) a terestone (USA). Raymond B.qottel to udělal podobný posouzení osobních charakteristik. Psychodiagnostika se stává neoddělitelně spojený s teoriemi a nápady o individuálních rozdílech v úspěchech (hodnocení omezení) a formy chování (úroveň typického fungování). Tato tradice stále zůstává v současné době účinná. V tutorials. Na psychodiagnostikách jsou rozdíly v sociálním prostředí mnohem méně často ve srovnání s ohledem na zvláštnosti o rozvojových procesech. Za tímto účelem nejsou žádné rozumné vysvětlení. Na jedné straně není diagnóza omezena na určité teorie a koncepty. Na druhou stranu potřebuje teorie, protože to je právě v nich diagnostický obsah (tj. ", Který" je diagnostikován). Například inteligence lze považovat za obecné charakteristikya jako základ pro mnoho schopností nezávislé na sobě. Pokud se psychodiagnostika snaží "odjet" z jedné nebo jiné teorie, pak se základem psychodiagnostického procesu stává myšlenkami zdravého rozumu. Ve studiích se používají různé metody Analýza dat a obecná logika výzkumu určuje výběr jednoho nebo jiného matematického modelu a určuje strukturu používaných psychologických pojmů. Takové metody matematické statistiky


kI, jako disperze analýza, regresní analýza, analýza faktorů, počítání korelací zahrnuje existenci lineárních závislostí. V případě nesprávného použití těchto metod, oni "přinášejí" strukturu na získané daty a použité konstrukce.

Myšlenky o rozdílech v sociálním prostředí a rozvoj osobnosti téměř neovlivnily psyšodiagnostik. V učebnicích (viz například Murphy & Davidshofer, 1988) je považována za klasickou teorii testu a jsou popsány příslušné metody statistického zpracování, jsou popsány známé testy, jsou popsány používání psychodiagnostik v praxi: v Psychologie managementu, při výběru personálu, při posuzování psychologických charakteristik osoby.

Teorie jednotlivých rozdílů (stejně jako myšlenky o rozdílech mezi sociálním prostředím a mentálním rozvojem) jsou podobné studiu sémantiky jazyka. Toto je studie a entita a obsah a hodnoty. Hodnoty jsou strukturovány určitým způsobem (jako psychologické konstrukty), například v podobnosti nebo kontrastu (analogie, konvergence, divergence).

1.3.3. Psychologické testy a jiné metodické prostředky

Třetí složkou navrhovaného obvodu, postupů a metodologických prostředků, se kterými se shromažďují informace o vlastnostech osobnosti. Draza a Seitma (1990, s. 31) Uveďte následující definiční testy: "Psychologický test je považován za klasifikaci podle určitého systému nebo jako postup měření, který vám umožní učinit určitý úsudek o jednom nebo více empiricky vyhrazených nebo Teoreticky přiměřené vlastnosti určité osoby lidského chování (pro rámce zkušební situace). Současně se reakce respondentů považuje za určitý počet pečlivě vybraných pobídek a přijaté odpovědi jsou porovnány s testovacími standardy. "

Diagnostika vyžaduje testy a techniky pro shromažďování spolehlivých, přesných a validálních informací o funkcích.

a charakteristické vlastnosti Osobnost, myšlení, emoce a lidské chování. Kromě vývoje zkušebních postupů zahrnuje tato složka také následující otázky: Jak jsou vytvořeny testy, jak formulovat a úkoly jsou vybrány, protože proces testování probíhá, jaké jsou požadavky na testovací podmínky, protože chyby měření jsou Zohlednění výsledků testů se počítají a interpretují.

V procesu rozvojových testů se liší racionální a empirické strategie. Aplikace racionální strategie začíná definováním základních pojmů (například koncept inteligence, extroverze) a v souladu s těmito myšlenkami jsou formulovány úkoly zkoušky. Příkladem takové strategie může být koncept analýzy aspektů (teorie aspektu) Guttman (1957, 1968, 1978). Za prvé, různé aspekty hlavního konstruktu jsou určeny, pak jsou vybrány úkoly a úkoly takovým způsobem, že každý z těchto aspektů je zohledněn. Druhou strategií je, že úkoly jsou vybrány na empirickém základě. Pokud se například výzkumník snaží vytvořit test odborných zájmů, což by umožnilo diferenciaci lékařů u inženýrů, pak by měl být tento postup takový. Obě skupiny respondentů musí reagovat na všechny úkoly testu, a tyto položky, v odpovědích, na které jsou zjištěny statisticky významné rozdíly, jsou zahrnuty do konečné verze testu. Pokud například existují rozdíly mezi skupinami v reakci na schválení "I rád chytit ryby", pak se toto prohlášení stává prvkem testu. Hlavní pozici této knihy je, že test je spojen s koncepční nebo taxonomickou teorií, která tyto vlastnosti definuje.

Zadání testu je obvykle definováno v pokynech pro jeho použití. Zkouška musí být standardizována, aby bylo možné odhadnout rozdíly mezi lidmi, a ne mezi zkušebními podmínkami. Existují však odchylky od standardizace v postupech nazvané "Testování hranic možností" (testování limitů) a "testování potenciálních testů" testů "(testy učení potenciálu). Za těchto podmínek je respondent pomoci v procesu.


testování a pak se odhaduje vliv takového postupu pro výsledek. Počítání bodů pro odpovědi na úkoly jsou objektivní, tj. Provádí se v souladu se standardním postupem. Interpretace získaných výsledků je také přísně definován a provádí se na základě zkušebních norem.

Třetí složkou psychodiagnostiků je psychologické testy, nástroje, procedury - obsahuje určité úkoly, které jsou nejnižšími jednotkami psychodiagnostiky a v tomto smyslu úkolu jsou podobné jazykům. Počet možných kombinací telefonní hry je omezený. Pouze určité fonderatické struktury mohou tvořit slova a návrhy, které zajistí informace posluchači. Taky atestovací úkoly: Pouze v určité kombinaci se vzájemně mohou stát efektivní nástroj Odhady odpovídajícího konstruktu.

Matematické základy teorie testovacích testů

Typy testovacích úkolů

Existují dva podstatně odlišné formuláře úkolů: zavřeno (pokud jsou možnosti testu nabízeny) a otevřené (subjekty musí obdržet odpověď nezávisle). Otevřené úkoly mohou být rozděleny do dvou skupin:

    Úkoly s krátkou regulační reakcí, z nichž formulace by mělo generovat pouze jeden plánovaný vývojářem, odpověď;

    Úkoly s volně postavenou reakcí, která nemají žádná omezení formy obsahu a prezentace.

Přidělte pět základních typů úkolů. Všechny ostatní typy jsou variace nebo kombinace těchto pěti typů.

    Úkol s volbou. Znění úkolu se skládá z otázky. Pro výběr je nabízeno několik odpovědí, z nichž jeden nebo více je správný.

    Úkolu. Ve formulaci úkolu, nějaký fragment textu, který označuje podtržené (nebo několika podtržítkami stejné délky, pokud jsou zmeškaná slova poněkud). Skip může být v jakékoli části textu, ale doporučuje se to udělat na konci. V reakci musí subjekt napsat zmeškané slova.

    Nastavení správné sekvence.

    Úkol pro shodu.Znění úlohy obsahuje dva seznam. Vlevo, zpravidla, prvky sady obsahující formulaci problému jsou uvedeny vpravo - prvky, které mají být vybrány. Prvky levé sady jsou číslovány, vpravo - označeny písmeny. Je žádoucí, aby druhá sada obsahuje více Prvky ve srovnání s první sadou. V tomto případě každý prvek první sady odpovídá jedné nebo více prvků druhé sady.

    Úkol s podrobnou odpověď.

Fáze rozvojového testu

    Formulace účelu a předmětu studie.

Kdo je to, co a proč podléhá testování

    Vývoj testování.

Studium požadavků vzdělávací norma, Obsahové učebnice.

Specifikace testu kreslení:

    Výběrové sekce (témata) a jejich procento obsahu v testu

    Výběr typů úkolů

    Určení úrovně zvládnutí znalostí a dovedností:

    Úroveň 1

    Znalost definic základních pojmů disciplíny, jakož i základní obvinění z disciplínových metod

    2 úroveň

    Znalost základních vzorců a algoritmů; Schopnost je aplikovat při řešení standardních úkolů

    3 úroveň

    Aplikace znalostí získaných k řešení atypických úkolů

  1. Určení přibližného počtu úkolů v testu a distribuci tohoto čísla podle typu úkolů.

    Rozvoj úkolů.

Vzhledem k tomu, že první verze testu by měla identifikovat nedostatky úkolů (včetně navrhovaných distraktorů), pak v každém úkolu to bylo možné největší číslo Distraktory, takže když je vyberete, zůstává dostatečná částka.

    Vyšetření surového těsta.

Účelem zkoušky je identifikovat a opravit nesprávné a nepochopitelné znění. V důsledku toho mohou být všechny úkoly odstraněny z testu (proto se doporučují úkoly).

    Schválení.

    Výpočet charakteristik úkolů a testů.

Podle výsledků testování se vypočítá následující statistické charakteristiky Úkoly a test.

Prostor jednotlivých bodů Měří vzdálenost, ve které jsou všechny hodnoty indikátoru změněny v distribuci (jednotlivé body).

Z rychle selektivní(průměrný) Pro kombinaci jednotlivých bodů H. 1 , H. 2 , …, H. K. Skupiny K. Předměty se počítají vzorcem

.

Počet disperze Na základě výpočtu odchylek každé hodnoty indikátoru od průměrné aritmetiky v distribuci:

.

Nízká disperze označuje nízká kvalita Testa, protože slabá variace výsledků ukazuje slabou diferenciaci testů přípravku. Příliš vysoká disperze je charakteristická pro případ, kdy se všichni studenti liší v počtu provedených úkolů, což také vyžaduje testování.

Vypočítejte výpočet testovacích charakteristik vyhodnocení spolehlivosti těsta. Chcete-li vypočítat koeficient spolehlivosti, můžete použít vzorec koeficient Cauder Richardson. (Pouze v případě, kdy jsou všechny závaží úkolů rovny jeden):

.

Chcete-li poskytnout kvalitativní hodnocení testovací spolehlivosti, použijte následující tabulku:

Hodnota koeficientu spolehlivosti

Vyhodnocení spolehlivosti

neuspokojivý

uspokojivý

vynikající

Posouzení obtížnosti pravého úkolu J Vypočteno vzorcem

.

Všimněte si, že čím více je snazší, tím více je podíl správných odpovědí ( p. j.) Proto by bylo přirozené interpretovat tento podíl jako snadnost úkolu. V dobře vyváženém testu musí mít test několik obtížných úkolů, několik plic, ale většina úkolů by měla mít potíže od 0,3 do 0,7; Zároveň je žádoucí, aby bylo možné umístit v řádu WA výsledek jejich obtíží.

Test platnosti úlohy Stanovena mírou dodržování úkolu diferenciace subjektů. Pro toto se stanoví koeficienty korelačního hodnocení úkolu se skóre v průběhu testu. To se provádí pomocí korelačního koeficientu podle vzorce

,

kde X. i. I.  Skóre testu i. I.-HO test Y. i. I.  míč i. I.- Testováno pro úkol. Všimněte si, že v případě dichotomního odhadu úkolu je výpočet koeficientu poněkud zjednodušen. Pokud r.< 0, то задание следует удалить из теста, т. к. в нем побеждают слабые ученики, а сильные выбирают неверный ответ либо пропускают задание при выполнении теста. Pozitivní významy, ale v blízkosti nuly (zanedbatelné), označte nízkou prognostickou schopnost zkoušky; Tyto úkoly vyžadují zdokonalení obsahu.

Schopnost rozlišit subjekty na nejlepší a nejhorších výstavách koeficient diferenciačních schopností (nebo index diskriminace) Úkoly. Nejjednodušší způsob, jak vypočítat takový index se nazývá metoda kontrastních skupin a je následující. Z celé skupiny subjektů jsou některé z nejlepších testů přiděleny testovacímu testu (bude jim říkat silný podskupinu) a to samé nejhorší (slabá podskupina). Poté se pro každou z těchto podskupin vypočítá část správných odpovědí v podskupině. Označte By p. 1 j. podíl správných odpovědí j.-E-úkol v silné podskupině a přes p. 0 j. - podíl správných odpovědí ve slabé podskupině. Pak index diskriminace i. I.Úkol je určen vzorcem:

(r. dis) j. \u003d P. p. 1 j.p. 0 j. .

Pro úkol, se kterým se všechny silné varlaty zvládnou a ne slabé, index diskriminace nevyrovnal r. Disk bude 1; V tomto případě má úkol maximální rozdílný efekt. Pro úkol, se kterým se všechny slabé varlat vyrovnávají, ne jediný silný, index diskriminace bude roven -1. V ostatních případech bude index vezme hodnoty mezi -1 a 1. Úkoly s nulovou a zápornou hodnotou diskriminačního indexu jsou špatně diferencované studenty, takže musí být odstraněny ze zkoušky. Pokud je index pozitivní, ale méně než 0,2, pak takový úkol vyžaduje pečlivou analýzu obsahu.

Podle těchto vlastností mohou být některé úkoly odstraněny z testu, které podléhají korekci. Poté se musí opakovat kroky 5, 6.

Vzorce pro výpočet pravděpodobnosti hádání

Při vypracování testu je nutné určit, kolik odpovědí by mělo být nabídnuto každou otázkou, aby pravděpodobnost úspěšného absolvování testování jednoduše hádala správné odpovědi, bylo méně než 0,05 (tj. Méně než 5%). Testování bude považováno za úspěšně uplynulo, pokud je test pravdivý v ne méně než Q.otázky. Pokud test obsahuje N. Otázky, pak se následující vzorec používá k výpočtu pravděpodobnosti "úspěšného hádání":

,

kde m. - Počet odpovědí nabízených každou otázkou.

V případě, že počet odpovědí nabízených na otázky v různých úkolech je jiný, vzorec má složitější pohled:

,

kde - pravděpodobnost hádání odpovědí j. problémy, které jsou vypočteny následovně. Nechte všechny otázky v testu rozdělit do r. Skupiny tak, aby stejná skupina v kombinaci se stejnou pravděpodobností hádání. Označen p. i. I. , 0< p. i. I. <1 - вероятность угадывания и k. i. I. - počet otázek i. I.- tato skupina (
), a

.

Pak For j. z
na n:

,

kde t. r. = j.  (t. 1 + t. 2 +…+ t. r. -1), a pokud t. r. > k. r. Pak zvážíme
= 0 .

Příklady.

N \u003d 10, q \u003d 2/3: m \u003d 2, p<0,2; m=3, P<0,02; m=4, P<0,004

Literatura

    Chelyskova M. B. Teorie a praxe navrhování pedagogických testů: tutoriál. - M.: Loga, 2002. - 432 p.

    Malygin A.a., Svettsov V. I., Gsynicina S. V. Praktická doporučení pro přípravu kontrolních a měřicích materiálů: Metoda. Manuál / Ivan. Stát Ho.-tehnol. un-t. - Ivanovo, 2005. - 30 s.

    Jak udělat test // Slemyer K. Matematická fantazie. - M.: Mir, 1993. - str.116-118.

Měření nebo testování provedené za účelem stanovení stavu nebo schopnosti sportovce se nazývá těsto. Ne všechna měření mohou být použity jako testy, ale pouze ty, které splňují zvláštní požadavky: standard, dostupnost ratingového systému, spolehlivosti, informativnosti, objektivity. Testy, které splňují požadavky spolehlivosti, informativity a objektivity, se nazývají sobota.

Testovací proces se nazývá testovánía číselné hodnoty získané na konci - výsledek testování.

Testy založené na motorických problémech se nazývají motor nebo motor. V závislosti na úkolu, který stojí před studiem, existují tři skupiny motorových testů.

Odrůdy motorových testů

Testovací název

Task Athlete

Výsledek testu

Kontrolní cvičení

Motorové úspěchy

Běží na 1500 m, běh

Standardní funkční testy

Totéž pro všechny, Dosens: 1) velikostí provedené práce; 2) největší fyziologické posuny

Fyziologické nebo biochemické ukazatele pro standardní ovládání motorových ukazatelů se standardní velikostí fyziologických posunů

Check-in CSS se standardní prací 1000 kgm / min. Rychlost běhu při srdeční frekvenci 160 UD / min

Maximální funkční testy

Zobrazit maximální výsledek

Fyziologické nebo biochemické ukazatele

Stanovení maximálního dluhu kyslíku nebo maximální spotřeby kyslíku

Někdy se nikdo není používán, ale několik testů, které mají jeden cílový cíl. Taková skupina testů se nazývá zkušební baterie.

Je známo, že i s nejvíce přísnější standardizací a přesným vybavením, výsledky testu jsou vždy poněkud pestré. Jednou z důležitých podmínek pro výběr dobrých zkušebních testů je proto jejich spolehlivost.

Spolehlivost těsta Stupeň náhody výsledků, když se nazývá re-testování stejných lidí ve stejných podmínkách. Existují čtyři hlavní důvody pro vnitřní a intragroup variace výsledků testu:

    změna stavu předmětu (únava, změna motivace atd.); nekontrolovatelné změny v externích podmínkách a zařízení;

    změny ve stavu osoby vodivé nebo vyhodnocující test (pohoda, nahrazení experimentátora atd.);

    nedokonalost testu (například vědomě nedokonalé a nízko-tech testy - volné hodí do košíkového koše k první mishai atd.).

Kritérium spolehlivosti těsta může sloužit regál spolehlivosti vypočteno jako poměr skutečné disperze na disperze zaregistrovanou v experimentu: R \u003d True S 2 / Registrováno S 2, kde se pod skutečnou hodnotou, je znázorněna disperze získaná s nekonečně velkým počtem pozorování ve stejných podmínkách; Registrovaná rozptyl je odvozena ze zkušených studií. Jinými slovy, faktor spolehlivosti je jednoduše podíl skutečných variací ve variaci, která je registrována ve zkušenostech.

Kromě toho se používá koeficient index spolehlivostiVzhledem k teoretickému korelačnímu koeficientu nebo spojení mezi registrovanými a pravdivými hodnotami stejného testu. Tato metoda je nejčastější jako kritérium hodnocení kvality (spolehlivost).

Jednou z vlastností spolehlivosti testu je jeho rovnocennostOdráží stupeň shody shody s výsledky testu stejné kvality (například fyzické) s různými testy. Postoj k rovnocennosti testů závisí na konkrétním úkolu. Na jedné straně, pokud jsou dvě nebo více testů ekvivalentní, jejich sdílení zlepšuje spolehlivost odhadů; Na druhé straně se zdá být možné aplikovat pouze jeden ekvivalentní test, který zjednoduší testování.

Pokud jsou všechny testy obsažené v každé zkušební baterii vysoce dodávány, nazývali se homogenní(Například, abych posoudil kvalitu skákání homogenní, je nutné uvěřit, tam budou skoky z místa na délku, nahoru, trojité). Naopak, pokud nejsou v komplexu žádné ekvivalentní testy (např. Pro vyhodnocování všeobecné fyzické zdatnosti), pak všechny testy obsažené v něm jsou měřeny různé vlastnosti, tj. v podstatě komplex je heterogenní.

Spolehlivost testu může být zvýšena do určité míry:

    přísnější standardizace testování;

    zvyšování počtu pokusů;

    zvýšení počtu hodnotitelů a posílení soudržnosti jejich stanovisek;

    zvyšování počtu ekvivalentních testů;

    nejlepší motivace subjektů.

Objektivita Test Existuje zvláštní případ spolehlivosti, tj Nezávislost výsledků testů na testování chování.

Informativní test - To je stupeň přesnosti, se kterou měří majetek (kvalita sportovce), který je využíván. V různých případech mohou mít stejné testy odlišnou informativnost. Otázka informativnosti zkoušky spadá do dvou soukromých otázek:

Co se tato zkouška změní? Jak přesně měří?

Například je možné, aby takový indikátor jako IPC posoudil připravenost styers, a pokud je to možné, pak s jakou mírou přesnosti? Může být tento test použit v procesu řízení?

Pokud se test používá k určení stavu sportovce v době zkoušky, o nichž se mluví diagnostický Zkouška informativnosti. Pokud na základě výsledků testu chtějí uzavřít možný výkon sportovce, říkají prognostickýinformativita. Test může být diagnosticky informativní a prognóza není předpokládána.

Stupeň informativního může být kvantifikován - na základě experimentálních dat (tzv. empirický informativita) a kvalitativně - na základě smysluplné analýzy situace ( logický informativní). Ačkoli v praktické práci je logická nebo smysluplná analýza by měla být vždy předcházet matematickými. Indikátor testu Informativity je korelační koeficient, vypočtený pro závislost - kritérium z výsledku v testu a naopak (jako kritérium vezme indikátor, vědomě odrážející vlastnost, která se shromažďuje s použitím testu).

V případech insuficience je informativita jakékoliv testy uchýlena k použití bateriových testů. Nicméně, tím i s přítomností vysokých samostatných kritérií pro informativní (posuzování korelačních koeficientů), však neumožňuje získat jediné číslo. Komplexnější metoda matematické statistiky může přijít na záchranu - analýza faktorů. Který umožňuje určit, kolik a jakých testů společně působí na samostatný faktor a jaký je stupeň jejich příspěvku k každému faktoru. A pak snadno zvolit testy (nebo jejich kombinace), které přesně přesně hodnotí jednotlivé faktory.

1 Co se nazývá těsto?

2 Co se nazývá testování?

Kvantitativní hodnocení jakékoli kvality nebo stavu sportovce. Měření nebo testování prováděné za účelem stanovení stavu nebo schopností sportovců zkoušky zkoušky, během něhož není kvalita nebo stav definice sportovce kvantifikována.

3 Co se nazývá výsledek testu?

Kvantitativní hodnocení jakékoli kvality nebo stavu sportovce. Měření nebo testování prováděné za účelem stanovení stavu nebo schopností sportovců zkoušky zkoušky, během něhož není kvalita nebo stav definice sportovce kvantifikována.

4, na které se vztahuje druhy testů běh 100 m.?

5 Na které druhy testů platí kartáčová dynamometrie?

Cvičení Cvičení Funkční Probamaximální funkční test

6, na které druhy testů patří vzorku IPC.?

Cvičení Cvičení Funkční Probamaximální funkční test

7, ke kterému patří druhy testů tři minuty pod metronomem?

Cvičení Cvičení Funkční Probamaximální funkční test

8, na které se vztahuje druhy testů maximální počet pull-up na příčky?

Cvičení Cvičení Funkční Probamaximální funkční test

9 V takovém případě se považuje za informativní test?

10 V takovém případě je test spolehlivý?

Schopnost zkoušky reprodukovat výsledky při re-testování schopnosti testu měřit kvalitu nezávislosti sportovců výsledků testů testu od osoby vodivé zkoušky

11 V takovém případě je testovací cíl?

Schopnost zkoušky reprodukovat výsledky při re-testování schopnosti testu měřit kvalitu nezávislosti sportovců výsledků testů testu od osoby vodivé zkoušky

12 Jaké kritérium je nutná při hodnocení testovacího testu?

13 Jaké kritérium je nutná při hodnocení testu spolehlivosti?

Kritérium kritéria T-SatyOdenta F-FishecoEffeefistent CorrelationCEfficient deterkovánídispersia

14 Jaké kritérium je nutná při hodnocení testu pro objektivitu?

Kritérium kritéria T-SatyOdenta F-FishecoEffeefistent CorrelationCEfficient deterkovánídispersia

15 Jak nazýváváte informativnost testu, pokud je hodnocen stupeň školení sportovce?

16 Jaký informativnost kontrolních cvičení je vedena trenérem, výběrem dětí do své sportovní sekce?

Logický prognosticemyrikdiagnostic.

17 Musí analýza korelace hodnotit informativnost testů?

18 Má faktor analýza vyhodnotit testovací informativnost?

19 Je možné vyhodnotit spolehlivost zkoušky pomocí korelační analýzy?

20 Je možné vyhodnotit objektivitu testu pomocí korelační analýzy?

21 Bude existovat ekvivalentní testy určené pro hodnocení všeobecné fyzické zdatnosti?

22 Při měření stejné kvality, různé testy používají testy ...

Určené pro měření stejné kvality s vysokou korelační vazbou mezi s nízkou korelací

Základy teorie hodnocení

Pro posuzování sportovních výsledků se často uchýlí k speciálním bodům brýlí. Účelem těchto tabulek je transformace ukázaného sportovního výsledku (vyjádřená v objektivních opatřeních) do podmíněných sklenic. Zákon přeměny sportovních výsledků v brýlích se nazývá odhady měřítka. Měřítko lze nastavit jako matematický výraz, tabulka nebo grafiku. Existují 4 hlavní typy stupnic používaných ve sportu a tělesné výchově.

Proporcionální váhy

Regresní váhy

Progresivní váhy.

Proporcionální váhy Předpokládá se, že akruálním počtu bodů za stejný nárůst výsledků (například pro každou 0,1 se zlepšeným výsledkem, 20 bodů je účtováno v útěku 100 m). Takové váhy se používají v moderním pentathlonu, rychlé bruslení, lyžování, lyžařské chlapce, biatlon a další sporty.

Regresní váhyzajistěte akruální, pro stejné zvýšení výsledku jako sportovní úspěchy zvyšují, zvyšující se počet bodů (například pro zlepšení výsledku v provozu 100 m od 15, 0 až 14,9 s 20 body, a pro 0,1 s v rozmezí 10,0 -9,9 s - pouze 15 bodů).

Progresivní váhy.Čím vyšší je sportovní výsledek, tím větší je zvýšení bodů, které se odhaduje na zlepšení jejího zlepšení (například 10 bodů od 15,0 bodu 15,0 až 14,9 s, a přidá se 10 bodů, a od 10,0 do 9,9 s - 100 bodů) . Progresivní stupnice jsou aplikovány v plavání, jednotlivé typy atletiky, vzpírání.

Sigmoidní váhy Je zřídka používáno ve sportu, ale jsou široce používány při posuzování fyzické zdatnosti (například měřítko amerických fyzických zdatných standardů standardů). V těchto šupinách se zlepšení výsledků v zóně velmi nízkých a velmi vysokých úspěchů podporuje SCOOP; Většina všech bodů přináší zvýšení výsledků ve střední zóně úspěchů.

Hlavní úkoly odhadu jsou:

    porovnat různé úspěchy ve stejném úkolu;

    porovnejte úspěchy v různých úkolech;

    určovat normy.

Normave sportovním metrologii slouží hraniční hodnota výsledku jako základ pro přisuzování sportovce na jednu z klasifikačních skupin. Existují tři typy norem: srovnatelný, individuální, splatný.

Srovnávací normy Jsou založeny na srovnání lidí, které patří ke stejnému souhrnu. Například rozdělení lidí do podskupin podle stupně rezistence (vysoké, střední, nízké) nebo reaktivity (hyperreaktivní, normoreaktivní, hyporeaktivní) k hypoxii.

Různé gradace odhadů a norem

Procento testů

Normy v měřítcích

Báječné

v balistech

Procenta

Velmi nízký

Pod m - 2

Od m - 2 až m - 1

Podprůměrný

Od M-1 až M-0,5

Od m-0,5 do m + 0,5

Nadprůměrný

Z m + 0,5 do m + 1

Od m + 1 do m + 2

Velmi vysoko

Nad m + 2

Tyto normy charakterizují pouze srovnávací úspěchy subjektů v tomto agregátu, ale nic mluví o celku jako celku (nebo v průměru). Proto musí být srovnávací normy porovnány s údaji získanými na jiných agregátech, a používané ve spojení s individuálními a řádnými předpisy.

Jednotlivé normy Na základě porovnání ukazatelů stejného sportovce v různých státech. Například v mnoha sportech neexistuje žádný vztah mezi vlastní tělesnou hmotností a sportovními výsledky. Každý sportovec má individuálně optimální hmotnost odpovídající stavu sportovní formy. Tato míra může být sledována v různých fázích sportovního tréninku.

Správné normy Na základě analýzy toho, co by člověk měl být schopen úspěšně vyrovnat se s úkoly, kterým je život před ním. Příkladem toho může sloužit jako standardy jednotlivých komplexů ve fyzickém výcviku, řádné velikosti, hlavní výměnu, hmotnost a růst těla a podobně.

1 Je možné měřit kvalitu vytrvalosti přímo?

2 Je možné měřit kvalitu rychlosti přímo?

3 Je možné měřit kvalitu obratnosti přímo?

4 Je možné měřit kvalitu flexibility přímo?

5 Je možné měřit sílu jednotlivých svalů přímo?

6 může být posouzení vyjádřeno ve vysoce kvalitní charakteristice (dobře, uspokojivé, špatné, posunutí atd.)?

7 Existuje rozdíl mezi měřítkem měření a skóre?

8 Co se nazývá odhady měřítka?

Systém měření sportovního výsledku Zákon přeměny sportovních výsledků v míře odhadu norem

9 stupnice znamená akruální ze stejných bodů za stejný nárůst výsledků. To …

10 pro stejný nárůst, výsledek je účtován jako sportovní úspěchy zvyšují rostoucí počet bodů. To …

Progresivní měřítko měření Scaleporegitalic Scale Scale

11 Čím vyšší je sportovní výsledek, tím větší je přírůstek bodů odhadován ke zlepšení jeho sklenic. To …

Progresivní měřítko měření Scaleporegitalic Scale Scale

12 Zlepšení výsledků v zónách velmi nízkých a velmi vysokých úspěchů je podporováno skóre; Většina všech bodů přináší zvýšení výsledků ve střední zóně úspěchů. To …

Progresivní měřítko měření Scaleporegitalic Scale Scale

13 Normy, které jsou založeny na srovnání lidí, které patří ke stejnému agregátu, zvaných ...

14 Normy na základě porovnání ukazatelů stejného sportovce v různých státech se nazývá ...

Jednotlivých norem v důsledku normálních standardů

15 Standardy založené na analýze toho, co by člověk měl být schopen udělat, aby se vyrovnal s úkoly, které se před ním nazývají ...

Jednotlivých norem v důsledku normálních standardů

Základní pojmy kvalitry

Qualetry.(Lat. Qualitas - kvalita, metron - opatření) Studie a vyvíjí kvantitativní metody hodnocení vysoce kvalitních značek.

Základem kvalitry leží několik zdrojových ustanovení:

Jakákoliv kvalita může být měřena;

Kvalita závisí na řadě vlastností tvořících "Strom kvality" (například typ kvality cvičení v krasobruslení se skládá ze tří úrovní - vyšší, střední, nižší);

Každá nemovitost je určena dvěma čísly: relativní indikátor a váhy; Součet vlastností vlastností na každé úrovni se rovná jedné (nebo 100%).

Metodické metody fualetry jsou rozděleny do dvou skupin:

Heuristické (intuitivní) založené na odborných posouzeních a průzkumu;

Instrumentální.

Expertodhad získaný tím, že zjistí názory specialistů. Charakteristické příklady odborných znalostí: rozhodující v gymnastiku a krasobruslení, soutěž o nejlepší vědeckou práci atd.

Zkouška zahrnuje následující hlavní fáze: tvorba svého cíle, výběr odborníků, výběr metod, provádění průzkumu a zpracování přijatých informací, včetně posuzování konzistence jednotlivých odborných posouzení. Během vyšetření se stupeň konzistence odborných posudků odhaduje v rozsahu koeficient korelace hodnosti (v případě několika odborníků). Je třeba poznamenat, že korelace žebříčku je základem řešení mnoha kvalifikačních úkolů, protože umožňuje matematické výpočty s vysoce kvalitními značkami.

V praxi se indikátor odborných kvalifikací často slouží k odmítnutí svých odhadů od průměrných odhadů skupiny odborníků.

Dotazovánízpůsob shromažďování názorů se nazývá vyplněním dotazníku. Dotazování spolu s rozhovory a konverzací odkazuje na metody průzkumu. Na rozdíl od rozhovorů a rozhovorů, průzkum zahrnuje písemné odpovědi osoby vyplňující dotazník - respondenta - do systému standardizovaných otázek. To vám umožní studovat motivy chování, záměrem, názorů atd.

S pomocí průzkumu lze vyřešit mnoho praktických úkolů: posouzení psychického postavení sportovce; jeho postoj k povaze a směru vzdělávacích aktivit; Interpersonální vztahy v týmu; vlastní posouzení technické a taktické připravenosti; Vyhodnocení diety a mnoho dalších.

1 Co studuje kvalitní?

Pochopení kvality testů studuje značky vysoce kvalitních vlastností a vyvíjí kvantitativní metody hodnocení kvality.

2 Matematické metody používané v kvalitě?

Párování korelace Ranking CorrelationSpersion analýza

3 S jakými metodami se odhaduje úroveň výkonu?

4 S jakými metodami odhadují různými technickými prvky?

Identifikační metoda metody expertního odhadu

5 S jakými metodami je hodnocena složitost technických prvků?

Identifikační metoda metody expertního odhadu

6 S jakými metodami je vyhodnocen psychologický stav sportovce?

Identifikační metoda metody expertního odhadu

Popis prezentace na jednotlivých diapozitivech:

1 skluzavka

Popis snímku:

2 snímek

Popis snímku:

Je obvyklé zavolat kongenitální (geneticky zděděné) morfunkční vlastnosti, díky kterým je možná fyzická (finančně vyslovovaná) činnost osoby, která přijímá úplný projev při výhodném motorické činnosti. Hlavní fyzikální vlastnosti zahrnují sílu, rychlost, vytrvalost, flexibilitu, obratnost.

3 snímek

Popis snímku:

Schopnosti motoru jsou individuální prvky, které určují úroveň schopností lidských motorů (V. I. Lyakh, 1996). Základem schopností lidských motorů je fyzické vlastnosti a forma projevu je motorické dovednosti a dovednosti. Mezi schopnosti motoru patří výkon, vysokorychlostní, rychlostní výkon, schopnosti koordinace motorů, obecná a specifická vytrvalost

4 Slide.

Popis snímku:

Systematizační schéma fyzikálních (motorových) schopností fyzikálních (motorových) schopností podmíněných (energetických) kombinací výkonu kondicionačních schopností vytrvalostní rychlosti koordinaci (informace) CS, související s jednotlivými skupinami motorických akcí, speciální kombinace koordinačních schopností policajti Podmíněné a koordinační schopnosti

5 Slide.

Popis snímku:

Získejte přesné informace o úrovni schopností motoru / vysoké, střední, nízké / mohou používat testy / nebo kontrolní cvičení.

6 Slide.

Popis snímku:

S pomocí testovacích testů (testů) můžete odhalit absolutní (explicitní) a relativní (skryté, latentní) ukazatele těchto schopností. Absolutní ukazatele charakterizují úroveň rozvoje určitých motorických schopností bez zohlednění jejich vlivu na sebe. Relativní ukazatele umožňují posoudit projev schopností motoru s tímto vlivem.

7 Slide.

Popis snímku:

Výše uvedené fyzické schopnosti mohou být reprezentovány jako stávající potenciálně, tj. Před zahájením provádění jakékoli činnosti motoristiky nebo činností (mohou být nazývány potenciální schopnosti) a jak se projevují ve skutečnosti na začátku (včetně při provádění motorových testů) a v procesu provádění těchto činností (skutečné fyzické schopnosti).

8 Slide.

Popis snímku:

S určitou částí úmluvy můžete hovořit o elementárních a fyzických schopnostech složitých fyzických schopností

9 Slide.

Popis snímku:

Výsledky výzkumu umožňují rozlišit následující fyzické schopnosti speciálně specifického generála

10 Slide.

Popis snímku:

Zvláštní fyzické schopnosti se týkají homogenních skupin holistických motorických činností nebo činností: běh, akrobatické a gymnastické cvičení na projektilech, házení motorových akcí, sportovních her (basketbal, volejbal).

11 Slide.

Popis snímku:

Při specifických projevech fyzických schopností lze říci jako složky, které tvoří svou vnitřní strukturu.

12 Slide.

Popis snímku:

Hlavní složky schopností koordinace lidmi jsou tedy: schopnost orientace, rovnováha, odezva, diferenciace pohybových parametrů; Schopnosti pro rytmus, přestavba motorických činností, vestibulární stabilita, libovolná svalová relaxace. Tyto schopnosti jsou specifické.

13 Slide.

Popis snímku:

Hlavní složky vysokorychlostní struktury jsou rychlost odezvy, rychlost jednoho pohybu, frekvence pohybů a rychlost se projevuje v holistických činnostech motoru.

14 Slide.

Popis snímku:

Mezi projevy silových schopností patří: statická (izometrická) síla, dynamická (isotonická) moc - výbušná, odpisy.

15 Slide.

Popis snímku:

Struktura vytrvalosti je odlišná: aerobní, vyžadující zdroje kyslíku zdrojů energie pro jeho projev; anaerobní (glycethic, kreatin fosfátové zdroje energie - bez účasti kyslíku); Vytrvalost různých svalových skupin ve statických představách je statická vytrvalost; Vytrvalost v dynamických cvičeních prováděných rychlostí 20-90% maxima.

16 Slide.

Popis snímku:

Méně složité jsou projevy (formy) flexibility, kde jsou izolovány aktivní a pasivní flexibilita.

17 Slide.

Popis snímku:

Podle obecných fyzických schopností by měly být potenciální a realizované lidské schopnosti chápány, stanovení jeho připravenosti pro úspěšnou implementaci různých pohybových akcí o původu a významu. Zvláštní fyzické schopnosti jsou lidské schopnosti, které určují svou připravenost pro úspěšnou implementaci motorických akcí podobných původem a významem. Proto testy poskytují informace především o stupni tvorby speciálních a specifických fyzikálních (vysokorychlostních, koordinačních, síly, vytrvalosti, flexibility) schopností.

18 Slide.

Popis snímku:

Zvláštní fyzické schopnosti jsou lidské schopnosti, které určují svou připravenost pro úspěšnou implementaci motorických akcí podobných původem a významem. Proto testy poskytují informace především o stupni tvorby speciálních a specifických fyzikálních (vysokorychlostních, koordinačních, síly, vytrvalosti, flexibility) schopností.

19 Slide.

Popis snímku:

Testování úkolů pro identifikaci úrovně kondicionačních a koordinačních schopností, vyhodnotit kvalitu technické a taktické připravenosti. Na základě výsledků testů můžete: porovnat připravenost jednotlivých studentů i celých skupin žijících v různých regionech a zemích; Proveďte sportovní výběr pro to, aby tento nebo jiný sport podílel na soutěžích; do značné míry objektivní kontroly školení (školení) školáků a mladých sportovců; Identifikovat výhodu a nevýhody aplikovaných fondů, vzdělávacích metod a formování formulářů; Nakonec ospravedlnit normy (věk, individuální) fyzickou kondici dětí a mladistvých.

20 Slide.

Popis snímku:

Spolu s výše uvedenými úkoly v praxi různých zemí se testovací úkoly sníží na následující: Učíme se školní školy, aby určili úroveň jejich fyzické zdatnosti a naplánovali potřebné komplexy fyzických cvičení; stimulovat studenty, aby dále zvýšili jejich fyzickou kondici (formy); neví ne tolik počáteční úrovně rozvoje motoru, kolik mění po určitou dobu; Stimulovat studenty, kteří dosáhli vysokých výsledků, ale ne tolik na vysokou úroveň, pokud jde o plánované zvýšení osobních výsledků.

21 snímků

Popis snímku:

Zkouška je měření nebo zkouška provedená pro určení schopností nebo stavu osoby.

22 Slide.

Popis snímku:

Jako testy mohou být použity pouze ty testy (vzorky), které splňují zvláštní požadavky, mohou být použity jako testy: Účel použití jakéhokoliv testu (testů); Měly by být vyvinuty standardizované metody pro měření výsledků testů a zkušebního postupu; Je nutné stanovit spolehlivost a informativnost testů; Výsledky testů mohou být prezentovány v příslušném systému hodnocení.

23 Slide.

Popis snímku:

Test. Testování. Systém testování Výsledný systém pro použití testů v souladu s úkolem, organizace podmínek, testovací zkoušky v testu, hodnocení a analýze výsledků se nazývají testování. Číselná hodnota získaná při měření je výsledkem testování (test).

24 Slide.

Popis snímku:

Zkoušky používané ve fyzické kultuře jsou založeny na činnostech motoru (cvičení, úlohy motoru). Takové testy se nazývají motor nebo motor.

25 Slide.

Popis snímku:

Známá klasifikace testů podle jejich struktury a podle jejich preferenční svědectví odlišuje jediné a složité testy. Jediný test se používá k měření a vyhodnocení stejné funkce (koordinace nebo podmíněná schopnost).

26 SLIDE

Popis snímku:

27 Slide.

Popis snímku:

S pomocí složitého testu se odhaduje několik znaků nebo složek různých nebo jeden a stejná schopnost. Například vyskočte z místa (s vlnou rukou, aniž by foughing ruce, v dané výšce).

28 Slide.

Popis snímku:

29 Slide.

Popis snímku:

Testy mohou být podmíněné testy pro odhadování schopností výkonu vyhodnotit vytrvalost; zhodnotit vysokorychlostní schopnosti; Odhad flexibility koordinačních testů pro posouzení koordinačních schopností souvisejících s jednotlivými nezávislými skupinami činností motorů, které měří zvláštní koordinační schopnosti; Pro posouzení konkrétních koordinačních schopností - schopnost rovnováhy, orientace ve vesmíru, odezvu, diferenciace parametrů pohybu, rytmus, přestavba motorických akcí, koordinace (komunikace), vestibulární udržitelnost, libovolná svalová relaxace).

30 Slide.

Popis snímku:

Každá klasifikace je zvláštní pokyny pro výběr (nebo vytvoření) typu testů, které jsou více v souladu s testovacími úkoly.

31 Slide.

Popis snímku:

Kritéria kvality zvuku testů motorových testů konceptu "motivního testu" splňuje svůj účel, kdy test splňuje příslušná základní kritéria: spolehlivost, stabilita, ekvivalence, objektivita, informativita (platnost), jakož i dodatečná kritéria: přídělatelství a efektivita . Testy, které splňují požadavky spolehlivosti a informativnosti, se nazývají dobré nebo autentické (spolehlivé).

32 Slide.

Popis snímku:

Pod spolehlivostí zkoušky se stupeň přesnosti, se kterou odhaduje určité schopnosti motoru bez ohledu na požadavky toho, kdo to vyhodnocuje. Spolehlivost se projevuje jako stupeň náhody výsledků, když znovu testuje stejné lidi za stejných podmínek; Je to stabilita nebo stabilita výsledku zkoušky jednotlivce při re-vedení kontrolního cvičení. Jinými slovy, dítě ve Skupině zkoumané podle výsledků opakovaného testování (například skákání indikátory, doba běhu, házení vzdálenost) neustále šetří své místo. Spolehlivost zkoušky se stanoví s použitím korelace a statistické analýzy výpočtem faktoru spolehlivosti. Současně se používají různé způsoby, na jejichž základě posuzují spolehlivost zkoušky.

33 Slide.

Popis snímku:

Stabilita testu je založena na vztahu mezi prvním a druhým pokusy opakovaným po určité době za stejných podmínek ve stejném experimentátoru. Způsob re-testování na definici spolehlivosti se nazývá retaist. Stabilita testu závisí na typu testu, věku a pohlaví subjektů, časového intervalu mezi zkouškou a prodejem. Například ukazatele podmíněných testů nebo morfologických znaků v malých časových intervalech jsou stabilnější než výsledky koordinačních testů; Více starších dětí - výsledky jsou stabilnější než ty mladší. Retest se obvykle koná nejpozději do týdne. V delších intervalech (například měsíce) stabilita i takových testů, jako je běh na 1000 m nebo délku času, se již naznačuje níže.

34 Slide.

Popis snímku:

Ekvivalence testu je ekvivalence zkoušky spočívá v korelaci výsledku zkoušky s výsledky ostatních testů jednotlivých typů. Například, když je třeba zvolit, který test je dostatečně odráží rychlostní schopnosti: běží na 30, 50, 60 nebo 100 m. Postoj k ekvivalentním (homogennímu) testům závisí na mnoha důvodech. Pokud potřebujete zvýšit spolehlivost odhadů nebo zjištění studie, pak je vhodné použít dvě a ekvivalentní testy. A pokud je úkolem vytvořit minimální testy obsahující baterii, pak by mělo být použito pouze jeden z ekvivalentních testů. Tato baterie, jak je uvedeno, je heterogenní, protože testy obsažené v měření různých schopností motoru. Příkladem heterogenní zkušební baterie je 30 m běží, táhne se na příčky, nakláněcí dopředu, běží na 1000 m.

35 skluzavka

Popis snímku:

Spolehlivost testů také určují k porovnání průměrných odhadů dokonce a lichých pokusů zahrnutých do testu. Například průměrná přesnost hodí do cíle od 1, 3, 5, 7 a 9 pokusů se porovnává s průměrnou přesností házení od 2, 4, 6, 8 a 10 pokusů. Takový způsob posuzování spolehlivosti se nazývá způsob zdvojnásobení nebo štěpení. Používá se především při hodnocení koordinačních schopností a pokud počet pokusů o výsledek testu, ne méně než šest.

36 Slide.

Popis snímku:

Pod objektivitou (konzistentností) zkoušky podle objektivity (konzistence) zkoušky se rozumí stupeň soudržnosti výsledků získaných stejných zkoušek v rámci různých experimentátorů (učitelé, soudci, odborníci). Pro zvýšení objektivity testování je nutné dodržovat standardní zkušební podmínky: testovací čas, místo, povětrnostní podmínky; Jediný materiál a hardware; Psychofyziologické faktory (objem a intenzita zatížení, motivace); Předložení informací (přesná slovní formulace úkolu testu, vysvětlení a demonstrace). Toto je tzv. Zkušební objektivita. Mluví také o interpretační objektivitě týkající se míry nezávislosti interpretace výsledků testů různými experimenty.

37 Slide.

Popis snímku:

Obecně, podle odborníků, spolehlivost testů může být zvýšena různými způsoby: přísnější standardizace testování, zvýšení počtu pokusů, nejlepší motivace subjektů, zvýšení počtu hodnotitelů (soudci, odborníci), Zvýšení konzistence jejich stanovisek, zvýšení počtu ekvivalentních testů. Pevné hodnoty indikátorů testů testů nejsou k dispozici. Ve většině případů si užijte následující doporučení: 0,95 - 0,99 - Vynikající spolehlivost; 0,90 - 0,94 - dobrý; 0,80 - 0,89 - přijatelný; 0,70 - 0,79 - špatný; 0,60 - 0,69 - Pro jednotlivé odhady, pochybné, test je vhodný pouze pro charakteristiky subjektové skupiny.

38 Slide.

Popis snímku:

Informativita testu je stupeň přesnosti, kterou měří odhadovaná schopnost nebo dovednost. V cizí (a domácí) literatuře namísto slova "Informativita" se používá termín "platnost" (z angličtiny validity, realita, legalita). Ve skutečnosti hovoří o informativním výzkumníkovi na dvě otázky: který měří tento konkrétní test (zkušební baterie) a jaký je stupeň přesnosti měření. Existuje několik typů platnosti: logické (věcné), empirické (založené na zkušených datech) a prediktivní.

39 Slide.

Popis snímku:

Důležitá dodatečná zkušební kritéria, jak je uvedeno, jsou příděly, srovnávací spotřeba a účinnost. Podstatou přídělů je, že založená na výsledcích zkoušek je možné vytvořit normy, které mají zvláštní význam pro praxi. Zkušební srovnávání spočívá ve schopnosti porovnat výsledky získané v jednom nebo několika formách paralelních (homogenních) testů. V praktických termínech se použití kompalovaných motorových testů snižuje pravděpodobnost, že v důsledku pravidelného užívání stejného testu, nejen a ne tolik úrovně schopností, jak moc se odhaduje stupeň dovedností. Současně se porovnávají výsledky testu správnost závěrů. Podstatou ekonomiky jako kritéria kvality testu je, že test nevyžaduje dlouhou dobu, velké materiálové náklady a účast mnoha asistentů.

40 Slide.

Popis snímku:

Organizace testování připravenosti dětí školního věku s druhým důležitým problémem testovacích motorických schopností (připomínáme, že první - výběr informativních testů je organizace jejich aplikace. Učitel fyzické kultury musí určit: v jakých časových rámcích je Lepší uspořádat testování, jak jej provádět v lekci a jak často by mělo být provedeno testování. Čas testu je v souladu se školními osnovami, která stanoví povinné dvoučasové testování tréninku tělesného zdatnosti.

41 Slide.

Popis snímku:

Vědět roční změny ve vývoji motorických schopností dětí umožňuje, aby učitel učinily vhodné úpravy procesu fyzického kultury pro další akademický rok. Učitel musí a může provádět častější testování, vést tzv. Provozní kontrolu. Doporučuje se to provést, aby se zjistilo, například změnu úrovně vysokorychlostních, výkonových schopností a vytrvalosti ovlivněných lekcí atletiky během prvního čtvrtletí. Za tímto účelem může učitel aplikovat testy, aby vyhodnotili koordinační schopnosti dětí na začátku a na konci vývoje programu, například ve sportovních hrách, identifikovat změny ve vývoji těchto schopností.

42 Slide.

Popis snímku:

Je třeba mít na paměti, že rozmanitost vyřešených pedagogických problémů neumožňuje poskytnout učitele sjednocenou metodiku testování, identická pravidla pro provádění testů a vyhodnocování výsledků zkoušek. To vyžaduje experimenty (učitele) nezávislosti při řešení teoretických a metodických a organizačních testovacích otázek. Testování v lekci musí být spojeno s jeho obsahem. Jinými slovy, aplikovaný test nebo testy podléhající příslušným požadavkům (pokud jde o metodu výzkumu) by měly být organicky součástí plánovaných fyzických cvičení. Jestliže, řekněme, děti potřebují určit úroveň rozvoje vysokorychlostních schopností nebo vytrvalosti, měly by být naplánovány nezbytné testy na část lekce, ve které budou řešeny úkoly rozvoje relevantních fyzických schopností .

43 Slide.

Popis snímku:

Frekvence testování je do značné míry určována tempem vývoje specifických fyzických schopností, věku-pohlaví a individuálních charakteristik jejich vývoje. Chcete-li například dosáhnout výrazného zvýšení rychlosti, vytrvalosti nebo sil, je vyžadováno několik měsíců pravidelného školení (školení). Zároveň za účelem získání spolehlivého zvýšení flexibility nebo jednotlivých koordinačních schopností je vyžadováno pouze 4-12 tréninku. Pro dosažení zlepšení fyzické kvality, pokud začnete "od nuly", je možné pro kratší dobu. A za účelem zlepšení stejné kvality, když má dítě na vysoké úrovni, trvá více času. V tomto ohledu musí učitel hlubší rysy vývoje a zlepšení různých motorických schopností u dětí v jiném věku-pohlaví.

44 Slide.

Popis snímku:

Při posuzování všeobecné fyzické zdatnosti dětí můžete využít širokou škálu zkušebních baterií, z nichž volba závisí na specifických úkolech testování a přítomnosti nezbytných podmínek. Vzhledem ke skutečnosti, že získané výsledky testu lze odhadnout pouze ve srovnání, je vhodné zvolit testy, které jsou široce reprezentovány teoreticky a postupy tělesné výchovy dětí. Například se spoléhají na ty, které jsou doporučeny v programu FC. Porovnávat obecnou úroveň fyzické zdatnosti studenta nebo skupiny studentů s pomocí zkušebního komplexu, uchýlit se k překladu výsledků testů v brýlích nebo bodech. Změna množství bodů během opětovného testování vám umožní posoudit pokrok jak odděleného dítěte, tak skupiny dětí.

49 Slide.

Popis snímku:

Důležitou stránkou testování je problém výběru testu pro posouzení specifických fyzických schopností a všeobecné fyzické zdatnosti.

50 Slide.

Popis snímku:

Praktická doporučení a tipy. DŮLEŽITÉ: Určete (vyberte) baterii (nebo celku) potřebných testů s podrobnou prezentací všech částí; Nastavit testovací termíny (lepší - 2-3 týdny od září - 1. testování, 2-3 týdny květen - 2. testování); V souladu s doporučením přesně určit věk dětí v den testování a jejich pohlaví; Rozvíjet sjednocené protokoly pro protokolování dat (možná na základě využití ICT); Určete kruh asistentů a implementujte samotný zkušební postup; Neprodleně provádět matematické zpracování testovacích dat - výpočet hlavních statistických parametrů (průměrná aritmetika, průměrná aritmetická chyba, standardní odchylka, koeficient změn a vyhodnocení spolehlivosti rozdílů mezi průměrnými aritmetickými ukazateli, například paralelní třídy stejných a různých škol dětí takového věku a pohlaví); Jedním z významných fází práce může být překlad výsledků testů v brýlích nebo bodech. S pravidelným testováním (2krát ročně po dobu několika let) to umožní učitele mít představu o pokroku výsledků.

51 snímků

Popis snímku:

Moskva "osvícení" 2007 Kniha obsahuje nejčastější motorové testy na posuzování podmíněných a koordinačních schopností studentů. Příručka stanoví individuální přístup učitele fyzické kultury každému konkrétním žákovi, s přihlédnutím ke svému věku a osobnosti.


Základní otázky: Zkouška jako nástroj měření. Hlavní teorie testování. Funkce, schopnosti a omezení testování. Využití testů v hodnocení zaměstnanců. Výhody a nevýhody použití testů. Formuláře a typy testovacích úkolů. Technologie pro budování úkolu. Posouzení kvality testu. Spolehlivost a platnost. Software pro testování testů. 2.




Zkouška jako měřicí nástroj Základní pojmy v testologii: měření, test, obsah a forma úkolů, spolehlivosti a platnosti výsledků měření. Kromě toho, testologie využívá takové pojmy statistické vědy jako selektivní a všeobecné agregáty, průměrné ukazatele, variace, korelace, regrese atd. 4




Testovací úloha je didakticky a technologicky účinná jednotka řídicího materiálu, část zkoušky, která splňuje požadavky hmotné čistoty obsahu (nebo jeden dimenze), obsahu a logické správnosti, správnost formuláře, Přípustnost geometrického obrazu obrazu. 6.




Tradiční test je standardizovaná metoda pro diagnostiku úrovně a struktury připravenosti. V takovém testu všechny subjekty reagují na stejné úkoly současně za stejných podmínek a se stejnými pravidly pro hodnocení odpovědí. Pro dosažení testovacího cíle můžete vytvořit nespočet testů a mohou všechny odpovídat úspěchu úkolu. osm


Profesionální (od Lat. Professio Specialty + Gramma rekord) Systém funkcí popisujících tuto nebo tuto profesi, stejně jako zahrnuje seznam pravidel a požadavků uložených touto profesí nebo specialitou na zaměstnance. Profesionál může zejména obsahovat seznam psychologických charakteristik, které musí být nakonfigurovány zástupci konkrétních profesních skupin. devět


Hlavním testem testování první vědecké práce na teorii testů se objevil na počátku dvacátého století na křižovatce psychologie, sociologie, pedagogiky a dalších, tzv. Behavioral Sciences. Zahraniční psychologové nazývají tuto vědu s psychometrickou (psychostikou) a učitelé - pedagogické měření (měření vzdělávání). Bezprostřední ideologie a politika, interpretace názvu názvu "Testologie" je jednoduchý a transparentní: věda o zkouškách. 10.


První etapa je pozadí - od starověku až do konce XIX století, kdy byly distribuovány seghting forem kontroly znalostí a schopností; Druhé období, klasické, pokračovalo od počátku 20. až do konce 60. let, během kterých byla vytvořena klasická teorie testů; Třetí lhůta je technologický, který začal od 70. let - rozvoj adaptivních testovacích a vzdělávacích metodik, metodika efektivního vývoje testů a testovacích úkolů pro parametrické posouzení subjektů pro měřenou latentní kvalitu. jedenáct


Funkce, schopnost a omezení testování používaných při výběru testů jsou určeny k získání psychického portrétu kandidáta, hodnotit své schopnosti, stejně jako odborné znalosti a dovednosti. Testy umožňují porovnat kandidáty mezi sebou nebo s odkazy, to znamená, že je ideálním kandidátem. Testy se používají k měření vlastností osoby nezbytné pro efektivní výkonnost práce. Některé testy jsou uspořádány tak, že zaměstnavatel sám spravuje testování a vypočítá výsledky. Jiní vyžadují, aby služby zkušených konzultantů zajistili jejich řádné použití. 12.


Omezení používání testů souvisejí - s jejich drahou správou; - s fitness pro hodnocení lidských schopností; - Zkoušky jsou úspěšnější pro předvídání úspěchu v práci, která obsahuje krátkodobé profesionální úkoly, a nejsou příliš vhodné v případech, kdy úkoly řešené v práci zabírají několik dní nebo týdnů. 13.








2. Použitá terminologie musí být vybrána na konkrétní cílové publikum. Je také nutné vyloučit zbytečné články nebo články, které obsahují dva nebo více otázek, protože někdy se zaměňují respondenta a je obtížné interpretovat. 17.


3. Pro splnění všech těchto požadavků byste měli zobrazit celý problém článku podle článku a analyzovat, jaký účel se každý z nich slouží. Pokud je například test vyvíjen pro měření analytických schopností stážistů - účetní, stojí za to myslet, že v tomto případě znamená koncept "analytických schopností". osmnáct




5. Pokud jsou vybrány otázky a formáty výsledků počítání, musí být převedeny na uživatelsky přívětivý formát, s jasně písemnými pokyny a otázkami - příklady; Takže zkušební kandidáti plně pochopili, že jsou požadovány. dvacet


6. Velmi často v této fázi, vývoj v testu zahrnuje více otázek, než je nutné. Podle některých odhadů, třikrát více než zůstávají v závěrečném testu nebo měřicím systému. Poté bude počáteční opatření testem testu vyvíjen na relativně širokém vzorku od počtu stávajících pracovníků, aby se ujistil, že všechny otázky jsou snadno pochopitelné. 21.


7. Zkoušky na definici znalostí obvykle začínají jednoduchými otázkami postupně komplikujícím ke konci. Když jsou testy určeny k měření sociálních postojů a osobních charakteristik, může být užitečné alternativní alternativní a pozitivně formulované články, aby se zabránilo špatně koncipovaným odpovědím. 22.


8. Posledním krokem je použití testu na širokém reprezentativním vzorku pro stanovení pravidel provedení, spolehlivosti a platnosti ještě před jeho použitím jako výběrový nástroj. Kromě toho je nutné určit spravedlnost zkoušky, aby se ujistil, že nediskriminuje žádné podskupiny obyvatelstva (například etnické rozdíly). 23.


Posouzení kvality testu tak, aby výběrové metody byly poměrně účinné, měly by být spolehlivé, platné a spolehlivé. Přesnost výběru metody je charakterizována svým nekonzistentností systematických chyb v měření, tj. Její konzistence za různých podmínek. 24.


V praxi se spolehlivost při vydávání rozsudků dosáhne porovnáním výsledků dvou nebo více podobných testů prováděných v různých dnech. Dalším způsobem, jak zvýšit spolehlivost, je porovnání výsledků několika alternativních výběrových metod (například test a konverzace). Pokud jsou výsledky podobné nebo stejné, lze je považovat za správné. 25.


Spolehlivost znamená, že provedená měření poskytne stejný výsledek jako předchozí, tj. Faktory třetích stran nemají vliv na výsledky. Platnost znamená, že tato metoda měří přesně to, co je určeno. Maximální možná přesnost informací získaných speciálně vyvinutými technikami ve vědeckém výzkumu je omezena technickými faktory a nepřesahuje 0,8. 26.


V praxi výběr personálu konstatuje, že spolehlivost různých metod hodnocení je umístěna v intervalech: 0,1 - 0,2 - tradiční pohovor; 0,2 - 0,3 - doporučení; 0,3 - 0,5 - profesionální testy; 0,5 - 0,6 - Strukturovaný rozhovor, rozhovor v kompetencích; 0,5 - 0,7 - Kognitivní a osobní testy; 0,6 - 0,7 - Přístup kompetencí (hodnocení - Center). 27.


V rámci rozumnosti je míněna, s jakým stupněm přesnosti, tento výsledek, metoda nebo kritérium "předpovídá" budoucí účinnost lidského testovaného. Platnost metod se týká závěrů provedených na základě postupu nebo jiného, \u200b\u200ba nikoli na samotný postup. To znamená, že výběrová metoda může být sama o sobě spolehlivá, ale nesplňuje specifický úkol: není měřeno, co je v tomto případě vyžadováno. 28.


Software pro rozvoj testů v domácí praxi představil různé integrované programy s psyodiagnostickým modulem, například program "1 C: mzda a personální management 8,0" s psyšodiagnostickým modulem, který se vyvinul společně se skupinou učitelů oddělení osobnosti Psychologie a obecná psychologie Psychologie fakulty Moskevské státní univerzity M. V. Lomonosov pod vedením vesnice psych. Sciences, prof. A. N. Guseva. Školící simulátor pro rozvoj systémů hodnocení personálu a přizpůsobení zkušebních technik Psychologické fakulty TSU, vyvinuté i na základě "1 C: Enterprise 8.2" Softwarovou společností společnosti. 29.


Literatura: Výběr a najímání zaměstnanců: Testování a hodnocení technologie / Dominic Cooper, Ivan T. Robertson, Gordon Tinline. - M., Ed - na "vrcholu, - 156 p. Psychologická podpora odborné činnosti: teorie a praxe / ed. Prof. G. S. Nikiforova. - SPB.: Řeč, - 816 p. třicet