Sunteți pe pagina 1din 18

Evaluarea formativa

Dar de ce este important definiia, n primul rnd?


Definiia este important, deoarece dac nu putem defini n mod clar o inovaie, nu
putem documenta semnificativ eficiena sa. O parte din aceast documentaie trebuie s fie o
analiza a faptului ca Evaluarea formativa a fost implementata corespunztor, ceea ce nu putem
realiza dac tim ce trebuia s fie pus n aplicare. n mod similar , n cazul n care nu se poate
defini n mod clar o inovaie , nu putem rezuma semnificativ rezultatele obinute n urma
studiilor , deoarece nu vom ti ce situaii s includem n raportul nostru. n cele din urm nu vom
putea sa le adaptam la contextul nostru pentru ca nu vom sti ce informatii sa extragem. Pentru o
definiie semnificativ a evalurii formative , avem nevoie de cel puin dou lucruri: o teorie a
aciunii i un instanierea beton. Printre altele, teoria ac iunii: ( 1 ) identific caracteristicile i
componentele evaluarii formative, mpreun cu motivele pentru fiecare dintre acestea i ( 2 )
postuleaz modul n care aceste caracteristici i componente lucreaza mpreun pentru a crea un
anumit set dorit de rezultate ( Bennett 2010 ). Promptitudinea beton ilustreaz modul cum arata
evaluarea formativa la construirea teoriei i cum ar putea s funcioneze ntr-un cadru real.
n acest sens , Programul Keeping Learning on Track este un exemplu provocator
deoarece conine o teorie rudimentar de aciune i un exemplu concret pentru a ilustra cel puin
un tip de "evaluare formativ " . Teoria de aciune se nvrte n jurul " unei idei mari si cinci
strategii -cheie" , bazata pe munca substaniala a lui Black and Wiliam ( 1998c , 2009) . Ideea
de ansamblu este "studenii i profesorii care folosesc dovezi ... pentru a adapta predarea i
nvarea pentru a rspunde nevoilor nvarii imediate- minut cu minut si de zi cu zi" ( ETS
2010) .
Cele cinci strategii-cheie sunt: mprtirea ateptrilor de nvare (adic,
clarificarea i schimbul de intenii i criteriile de succes), Chestionarea (discuiile eficiente din
clas, ntrebri i sarcini de nvare care provoac o dovad a nvare), feedback,

Autoevaluarea (adic, activarea elevilor ca pe proprietarii propriei nvatari), i evaluarea n


perechi (adic, elevii care se activeaza ca resurse de instruire unii fa de al ii). Aceste strategii
sunt utilizate pentru a orienta procesele de instruire pentru stabilirea nivelului la care se afla
cursantii (de exemplu, prin chestionare), a celui n care vor ajunge (departajarea a teptrilor de
nvare), si a modului in care sa ii faci sa obtina asta (prin feedback).
Strategiile KLT sunt puse n aplicare prin intermediul profesor-elev, folosind o larg palet de
tehnici, inclusiv cele, "Trei stele i un doresc ", i "Semafoare. n "Trei stele ...", studen ii fac
schimb de lucru i fiecare student este ateptat s indice trei lucruri care i-au plcut la munca
colegului i un lucru pe care i l-ar fi dorit s fie fcut mai bine. n "Semafoare ...", fiecarui
student ii este dat un cartonas rou, galben i verde, i I se cere s afi eze la punctele cheie din
lecie, cartonasul care indic nivelul sau de intelegere (de exemplu, rou " nu nelege " , galben
pentru ' nesigur " i verde pentru " v rugm s continuai ") .
Anticipnd un aspect care trebuie discutat mai trziu, este important s subliniem faptul
c cele cinci puncte strategice sunt destinate a fi generale, independente de un domeniu.
Strategiile au corespondene la teoria cognitiv-tiinific, n special acel segment al domeniului
care privete nvarea prin interaciune social (de exemplu , Vygotsky 1978 , citat n Shepard
2006). Teoriile "socio-culturale" postuleaz c elevii nva cel mai eficient prin schimb cu al ii.
mprtirea ateptrilor, ntrebrile, feedback-ul, autoevaluarea, precum i evaluarea n perechi
sunt destinate, printre altele, s i ajute pe elevi s dezvolte standarde interne de lucru, s
reflecteze asupra lor i s preia friele propriei nvri.
Componentele KLT sunt concentrate pe formarea profesorilor n evaluarea formativ.
Componentele include att materialele ct i evenimentele facilitate. Unul dintre evenimente este
un atelier pentru membrii personalului colii, care, la rndul lor, vor trebui s sprijine cadrele
didactice locale, ajutndu-I s stabileasc o "comunitate de nvare" pentru ei nii. Rolul
comunitii de nvare este s ncurajeze reflecia, schimb de date i de sprijin pentru
mbuntirea practicii la clas ntr-un mod care este suficient de flexibil pentru a ine seama de
diferenele dintre profesori (Harrison 2005; Lee si Wiliam 2005). Materialele includ 16 module
care formeaza un curriculum de doi ani pentru comunitile de nvare pentru profesori, registre
de lucru pentru participanti i un ghid pentru lideri TLC.
Pn acum, programul KLT nu dispune de date puternice eficacitatea i este imperfect
n alte modaliti de a fi discutate n seciunile de mai trziu. foarte crearea sa, cu toate acestea, s-

ar putea s fie privit ca o ncercare de Dylan Wiliam si colegii sai pentru a da definiie concret i
direcia concret a evalurii formative, pe care unii observatori s-au simit a avut poten ialul de a
deveni un moft gol. Ce prevzut potenialul de ceea ce face un moft fost o cre tere a interesului
n rndul educatorilor, valorificate rapid de ctre editori de testare (Popham 2006; Shepard
2008), i, probabil, de consultanii "proces" la fel de bine. Acela creterea n interesul a fost, la
rndul ei, provocat de pretenii foarte puternice pentru eficien
Problema eficienei
Sursa cea mai citat pentru aceste cereri puternice este aproape sigur perechea de
articole publicate de Paul Neagr i Dylan Wiliam. " n cutia neagr " este un scurt fragment care
a aprut n Phi Delta Kappan (Negru i Wiliam 1998a ) i de asemenea, ca un pamflet intens
distribuit. Acest articol rezum un articol meticulos, " Evaluare i nvarea n clas " , publicat n
acelai an n acest jurnal, Evaluare n Educaie (Negru i Wiliam 1998c ). Dup cum sa
menionat, unul sau altul dintre aceste articole au fost utilizate in mod curent pentru a strange
cererile de eficacitatea asupra evalurii formative. elevii de clase primare din sua, in care s a
folosit evaluarea formativa au obtinut un punctaj dublu la testele standard. Si Wiliam a publicat
rezultatele unei meta- analize cuprinztoare i sinteza a mai mult de 40 de studii controlate cu
privire la impactul unei evaluari imbunatatite la clas asupra succesului elevilor ... conform lui,
rezultatele erau si mai favorabile. ntr-un articol mai trziu, acelai autor pare s extind ideia,
att n termeni de amploare a efectelor observate ct i mrimea bazei de dovezi.
Indiferent de metrica folosit, argumentul esenial propus de aceste studii este c
cercetarea empiric demonstreaz c evaluarea formativ provoac rezultate peste medie i
foarte mari si acestea vin din surse demne de ncredere.
Aceste afirmaii merit o privire mai atent. Ideea de meta-analiza este un loc sensibil
pentru a ncepe, deoarece acesta a fost att de frecvent citate n eficacitatea pretinde sa denote
rigoarea metodologic. Meta-analiza a fost iniial conceput ca o metod de descrie rezultatele
empirice observate ntr-o literatura de cercetare, dei are de atunci fost prelungit pentru deducere
a parametrilor populaiei care stau la baza (Hunter i Schmidt2004, 512). In forma sa cea mai
simpl, metoda este, n esen, o punere n comun a rezultatelor de la un set de studii
comparabile, care produce una sau mai multe statistici sumare, inclusiv ce se nume te n mod
obinuit un "mrimea efectului". (A se vedea, de exemplu, sticla, McGaw, i Smith

1981, pentru o introducere clasic de detaliate pentru aceast metod.) Pentru studiile
experimentale, The mrimea efectului este de obicei calculat ca diferen ntre tratament grup i
Controlul grup mijloace, mprit la deviaia standard (din grupul de control sau n mod
corespunztor reunite n toate grupurile) 0.5
Cu toate acestea, meta-analiza ca orice alt metod, poate produce rezultate fr sens,
care trebuie considerate suspecte cnd, de exemplu: studiile sunt prea diferite n subiect pentru a
oferi o rezumare semnificativ; efecte multiple provin de prea multe ori din acelai studiu sau din
studii ale acelorai persoane , nedovedindu-se independen, caracteristicile studiului, cum ar fi
calitatea tehnic sau actualitatea, nu sunt luate n considerare sau Meta-analiza n sine nu a fost
publicata astfel nct metodele implicate s fie disponibile pentru analiza critic.
n acest sens , o preocupare major a lui Blake i Wiliam ( 1998c ) revizuire este faptul
c cercetarea a acoperit este prea disparate pentru a fi rezumate semnificativ prin meta- analiz .
Care de cercetare include studii referitoare la feedback-ul, elev orientare obiectiv, autopercepia , evaluarea ntre , de auto-evaluare , alegerea profesor de evaluare Sarcina , profesor de
comportament sub semnul ntrebrii , folosirea profesor de teste , i de nvare stpnirea
sisteme. Care de colectare este pur i simplu prea diverse pentru a fi combinate n mod raional i
rezumate printr-un singur , valoarea medie a statistic efect de dimensiune ( sau intervalul de
statistici medii ) .
Acest fapt ar putea fi mai bine apreciat dac mai muli susintori ai evalurii formative
citii cu atenie articolul original . ntr-o seciune intitulat "Nu meta-analiz " , Negru i Wiliam
( 1998c ) stipuleaz urmtoarele :
In articolul lor de revizuire, apoi, Negru i Wiliam nu raporteaz meta-analiz a acestora
face propriile, i nici rezultatele cantitative de propria voin. pot s apar confuzia deoarece, pe
scurt pamflet i document de poziie Phi Delta Kappan, Negru i Wiliam (1998a, 1998b) face, de
fapt, s se atribuie o gam de dimensiuni de efect asupra evalurii formative.
Cu toate acestea, nici o surs pentru acele valori este dat vreodat. Ca atare, aceste
mrimi de efect nu sunt "rezultatul cantitativ", meta-analitic sau n alt mod, a evalurii 1998 n
curs de examinare Educaie, ci, mai degrab, o proast caracterizare care a devenit, n esen ,
echivalent de educaie al legend.6 urbane Chiar i aa, revizuirea ofer o foarte valoroas sinteza
calitativ, dei, o gam larg de literaturi, i nu dintr-o singur, bine definite clasa de tratamente

care ar putea fi numit, "Evaluarea formativ". n timp ce articolele negre i Wiliam sunt,
probabil, cele mai frecvente derivarea pentru impactul mare a pretins a evalurii formative, aa
cum se sugereaz mai devreme, exist o numr de alte surse frecvent referire. Dar fiecare surs
ridica probleme care s-ar putea numi dimensiunea efectele pretinse n discuie. Vom discuta aici
mai multe frecvent citate exemple pentru a ilustra natura preocuprilor reprezentate. S ncepem
cu studiile Bloom, care a gasit reputaia de efectele ntre 1 i 2 devia iile standard, undeva ntre
"mare" i "foarte mare". Aceast afirmaie provine dintr-o articol de sintez (Bloom 1984),
fondat n principal pe (acum destul de datat) dizertaii realizat de elevii lui Bloom.
O a doua surs frecvent referire, de Nyquist (2003), este mult mai recent. relevan a
acestei surse de context coal poate fi pus la ndoial imediat, deoarece, dei rareori men ionat
n invocrile avocailor, se concentreaz asupra populaiei la nivel de colegiu (19). n al doilea
rnd, studiul este teza de un maestru nepublicate i, ca atare, nu este n general disponibile
(inclusiv pe internet). Faptul c este diminueaza nepublicate valoarea sa ca suport pentru
eficacitatea general a evalurii formative, deoarece acesta nu are fost supus unei peer review un semn distinctiv al procesului tiinific - nici nu a fost uor accesibile n scopuri de provocare
i n duplic. n cele din urm, dup cum s-ar putea s fie ateptat pentru o tez de master, are
limitations.7 semnificativ Doua studii individuale, la Meisels et al. (2003) i prin Rodriguez
(2004), de asemenea, s-au dat printre sursele de probe avocailor (de exemplu, arter 2006, 42;
Davies n.d .; Glasson 2008; Kahl 2007; Iubi 2009, 15; Stiggins 2006). De notat este faptul c att
Studiile au fost de observatie, astfel nct nu este posibil s se exclud explica ii alternative
pentru efectele de tratament. Designul Meisels et al. studiu este de interes special din moment ce
se pare c a folosit un grup de tratament de voluntariat (aparent mai motiva i dect grupul de
comparatie), i pentru c alte inovaii curriculare au fost implementat n perioada de studiu. Nu
contabilitate a fost aparent fcut pentru fie prejudecata potentialul de selecie sau confunda cu
alte inovaii, aa aprat afirmaii cu privire la impactul evalurii formative sunt foarte dificil de
face
n funcie de natura unei anchete observaional, Rodriguez (2004) este modest n mod
corespunztor n preteniile sale. Analiza studiului este complicat, care ncorporeaz multe
variabile, cu nici o interpretare clar n ceea ce privete posibilele o rela ie cauz-efect ntre
evaluarea formativ i rezultatele elevilor. Studiul a face raport

Efectele de realizare referitoare la "clas de auto-eficacitate" i la "atribuiile


incontrolabile", construciile care ar putea fi legate teoretic formative practica de evaluare (De
exemplu, Stiggins 2006). Dar modul n care aceste variabile sunt conectate direct in studiu pentru
a clas (formativ) Evaluarea nu este evident, i nici nu este direc ia de rela ia de cauzalitate la
realizare. Singura variabil care ar putea fi considerate a reprezenta n mod direct practica de
evaluare la clas este utilizarea de teste realizate pe profesor, pentru care efectul asupra
rezultatelor (control pentru toate celelalte variabile modelului) a fost negativ (adic, cu ct
utilizarea de testare n clas, cu att mai mic realizare). Avnd n vedere aceste fapte, este foarte
dificil pentru a vedea cum acest studiu sustine n mod legitim revendicrile de eficacitate
avocailor.
Ultima surs care urmeaz s fie menionat este cel al Kluger i Denisi ( 1996) . Acest
articol include o ( real) meta- analiza unui numr mare de studii . Articolul este publicat ntr-un
jurnal de foarte mare calitate - Psychological Bulletin - i este axat pe un subiect relevante de
evaluare la formative ( feedback) . n acest sens , analiza este mult mai concentrat dect
intervalul foarte larg de ( 1998c ) revizuirea Neagr i Wiliam . Toate acelai , analiza Kluger i
Denisi include o varietate larg de msuri criteriuse ntinde contexte academice i de munc (de
exemplu , erori de citire , calcul aritmetic , testul de performan , reten ie de memorie , timpul
de reacie , performan puzzle ) .
n ceea ce privete rezultatele , de nota aparte este faptul c Kluger i Denisi gsit o
medie mrimea efectului pentru impactul feedback-ul asupra performanelor 0.41 , mai pu in
dect mult mai mare Efecte de multe ori obiectul unei cereri de evaluare formativ . Acesti
cercetatori au descoperit ca 38 % dintre reaciile au fost negative , ceea ce nseamn c starea de
control a fost mai eficace dect oricare constituit interven ia feedback mai bine de o treime din
cazuri.
n cele din urm , feedback-ul a aparut pentru a mbunti performana mult mai
dramatic asupra simplu vs sarcini complexe i a avut nici un impact asupra transferului , ceea ce
duce Kluger i Denisi la ajung la concluzia ca , " ... dovada pentru orice efect de nv are aici a
fost minim n cel mai bun ' Cercetarea feedback-ul este, uneori, interpretat de ctre avocaii n
sensul c Rezultatele pozitive sunt atribuite exclusiv unor practici compatibile cu evaluarea

formativ (de exemplu,Caracterizrile calitative care atrag atenia asupra performanei sarcin) i
negativ
Rezultatele de la practicile antitetice (clasele de exemplu, numerice sau mesaj care s
atrag atenia de sine). Cu toate c exist cu siguran unele de sprijin pentru aceast pozi ie n
KLUGER i Denisi (1996) constatri, se pare a fi o simplificare. De exemplu, Kluger i Denisi
s reinei c efecte de feedback "... sunt moderate de natura Sarcina ... [i] proprietile exacte de
sarcini care modereaz [aceste] efecte sunt inca destul de rau neleas "(275). ntr-o analiz mai
recent, Shute (2008) scrie: "In cadrul acestui mare organism de cercetare feedback-ul, exist
multe descoperiri conflictuale i nici consecvent model de rezultate "(153). Cu toate c ea nu
ofer o varietate de recomandri bazate pe de cercetare, aceste recomandri variaz de multe ori
n funcie de caracteristicile de student. Shute constat c "... mecanismele specifice referitoare la
feedback-ul de nvare sunt nc concluzii generale cea mai mare parte tulburi, cu pu ine (dac
este cazul) Pe scurt , atunci , cercetarea nu pare s fie la fel de fr echivoc de sus inere a
practica evalurii formative aa cum se face uneori s sune . Avnd n vedere acest fapt , ct de
am putea mbunti calitatea revendicrilor facem pentru eficacitatea formative evaluare? Un
prim pas ar trebui s fie evident exercitarea unei grij n evaluarea a surselor de prob i n
atribuiile facem despre ele . n al doilea rnd , o mai clar definiie a ceea ce noi nelegem prin
evaluare formativ - inclusiv o teorie a aciunii i un instan ierea beton - este esen ial pentru a
ajuta la abstract o clas de lucruri de studia i de a face afirmatii despre . n acest sens , teoria
aciunii este deosebit de important deoarece , fr ea , nu putem evalua semnificativ mecanismele
care stau la baza care ar trebui s cauzeze efecte scontate. Dac nu nelegem mecanismele
responsabil pentru schimbare , nu vom ti dac efectele sunt datorate aceste mecanisme sau la
factorii irelevante . De asemenea, nu va fi capabil s prezic condiiile , sau la popula ia grupuri ,
pentru care este probabil s lucreze la evaluarea formativ
Teoria aciunii postulat pentru KLT este deosebit de instructiv , deoarece , probabil
neintenionat, ascunde dou mecanisme principale . Top cutia n " nvtorul Rezultate "
poriune din figura 1 indic faptul c " Profesorii obtine dovezi de elev
Minute pentru a - minut i de zi cu zi de nv are " . Ceea ce face ceva o "evaluare" , cu
toate acestea , nu este doar c probele sunt obtina . Analiz presupune proiectarea atenie situa ii
(sau a pune ntrebri ), astfel nct probele provocat pot fi conectate la critic componente ale
domeniului nelegere , o problem la care vom reveni n scurt timp .

n al doilea rnd , presupunnd c probele rezultat este relevant, evaluarea implic luarea
concluzii din aceste probe ( Pellegrino , Chudowsky i Glaser 2001 , 42 ) . In acestcaz , aceste
deducii privesc ceea ce elevii tiu i ce pot face , i sunt folosite pentru adaptarea instruc iuni.
Aceast distincie , ntre a face deducii bazate pe dovezi i adaptarea ulterior instruire, este
crucial .
Distincia este crucial , deoarece un eec n oricare etap poate reduce eficacitatea evalurii
formative . n cazul n care consecinele legate de studeni care rezult din formativ Evaluarea
se greit , baza pentru ajustarea instruciuni este slbit . n mod similar, n cazul n care
consecinele sunt corecte dar instruciune este ajustat n mod necorespunztor, de nvare este,
de asemenea mai puin probabil s apar .
Concentrndu-se pe aceste mecanisme sugereaz c , pentru a fi considerate eficiente ,
formativ Evaluarea necesit cel puin dou tipuri de argumente , ca parte a teoriei de aciune: o
Valabilitate argument pentru susinerea calitii inferene i ajustri de instruire ,i o
demonstraie Eficacitatea pentru a sprijini impactul rezultat asupra nvrii i instruciuni.
Fie argument pe cont propriu , nu este suficient
Fiecare argument necesit suport, att logic i empiric . Argumentul valabilitate face
pretenii cu privire la sensul de prob eviden prin formative Evaluarea (de exemplu , c un
student are nevoie de formare ntr-o anumit component de citire de calificare i c o anumit
intervenie ar fi un pas urmtor sensibil ) . Copierea de a sprijini aceste afirma ii ar putea include
date care arata ca observatori diferii trage concluzii cu similare despre abilitile unui elev din
aceeai prob ; c consecinele trase sunt n concordan cu alte metode , de caracterizare ceea ce
cunoate un student mai n profunzime i poate face (de exemplu , cu o evaluare construite cu
grij , orientate la un anumit abilitate component sau cu informa ii de la o varietate de alte surse
) ; i c diferite Observatorii face ajustri n mod substan ial similare cu instruc iuni de la aceea i
dovad
Spre deosebire de argumentul de valabilitate, argumentul eficacitate face afirmatii
despre schimbri n calificare elev asociate cu utilizarea evalurii formative . aceasta eficacitate
pretenie este nu numai c nvarea va avea ca rezultat , dar , bazndu-se pe teoria ac iunii , care
mecanisme specifice va determina ca urmare, n special aciunile profesor ( sau elev ) ia bazat pe
deducii evaluare . Astfel , n mod logic , argumentul eficacitate pentru evalurii formative
trebuie s includ argumentul valabilitate

n afar de suportul pentru a sprijini argumentul valabilitate , suport pentru eficacitatea


argument ar putea include date referitoare la mai multe domenii . n primul rnd , faptul c ar
trebui s includ suport date care arat c evaluarea formativ a fost implementat n conformitate
cu destinaia KLT , c profesorii au participat la ntlnirile TLC i au petrecut timp de partajare i
critica lor practicilor de evaluare formative ). n al doilea rnd , faptul c sprijinul ar trebui s
includ date care sugereaz c alte rezultate intermediare prevzute de teoria ac iunii au fost
atinse
(De exemplu, faptul c profesorii comun de fapt inteniile de nvare , oportunit i
structurate pentru a activa studenilor ca resurse de instruire pentru un altul) . In cele din urma ,
suportul trebuie
Date le presupun indic faptul c elevii care particip la evaluarea formativ schimbat
mai mult ntr-o direcie pozitiv asupra rezultatelor de interes dect cele care particip la o
anumit practic alternativ (de exemplu, c studenii nu , de fapt , s acioneze pe feedback-ul ,
s devin mai angajat , i aflai mai multe )
Ar trebui s fie evident, deci, c datele sunt necesare pentru a sus ine teoria ac iunii care
stau la baza orice abordare specific pentru evalurii formative. Ar trebui s fie la fel de evident
pe care fiecare utilizator al evalurii formative nu trebuie s colecteze astfel de date. Pentru a
evalua Teoretic, datele trebuie s fie colectate numai de la un subset rezonabil reprezentative
pentru cele utiliznd abordarea n cauz. Scopul este de a obine date suficiente de a fi suficiente
contexte pentru a face valabilitate i eficacitate argumentele credibil, permind astfel
generalizat cererile de sensul rezultatelor evalurii formative i pentru impactul asupra nvare
de a utiliza aceste rezultate instrucional. Standardul de rigoare a fi susinut este una tiin ific,
similar cu cea necesar pentru cererile de eficacitate din spatele orice intervenie educaional.
Dac acceptm c programele de evaluare formative fac, de fapt, au nevoie de o
eficacitate argument i un argument valabilitate ncapsulat, legate de un preocupri ntrebarea
dac sau nu aceste argumente trebuie s aib un accent de fond specific, subiectul urmtorului
nostru seciune.
Problema domeniu de dependen
Acest element se refer dac evalurii formative pot fi eficiente n cazul maxim

Teoria i dezvoltare sunt concentrate la un nivel - domeniu independent . Pentru a plasa


problema n context, tim din cercetare cognitiv- tiinifice care generale i specializate
Funcia de cunotine n strns colaborare ( Perkins i Salomon 1989) . De ei nii,
Strategiile de domeniu independente , cum ar fi spargerea unei probleme complexe n
mai mici piese de schimb, sunt n mare parte utile, dar slab, servind mai ales n manipularea
problemelor de rutin .
n mod similar , cunotine specifice domeniului este puternic, dar fragil . Pe cont
propriu astfel de cunotine , este eficient n condiii foarte limitate. Cnd natura problemei
modificri astfel nct limitele domeniului sunt nclcate , aceast cunoatere, prin ea nsi , este
nu mai este suficient .
Ca urmare a acestei raionament , s fie ct mai eficient , evaluarea formativ necesit
interaciunea de principii generale , strategii i tehnici cu rezonabil adnc n elegere cognitivdomeniu . C adnc nelegere cognitiv- domeniu include procesele , strategiile i cuno tin ele
importante pentru competen ntr-o de domeniu, obiceiurile de spirit care caracterizeaz
comunitatea de practic n acest domeniu , i caracteristicile de sarcini care implica aceste
elemente . De asemenea, include cele specialitate
Aspecte ale cunoaterii domeniului centrale pentru a ajuta elevii s nvee
Aceast afirmaie are cel puin dou implicaii . Prima implicaie este c un profesor
care are slab nelegere cognitiv- domeniu este mai puin probabil s tie ce ntrebri s cear de
studeni, ceea ce s caute ntr- performana lor , ceea ce concluzii pentru a face din aceast
spectacol despre cunotinele elevilor , i ce aciuni s le ia pentru a ajusta instruirea .
A doua implicaie este c instrumentele intelectuale i instrumentele dm la cadrele
didactice pot diferi n mod semnificativ de la un domeniu la altul , deoarece acestea ar trebui s fi
reglate n mod specific pentru domeniul n discuie ( HODGEN i Marshall 2005) .
O abordare posibil rezolvarea problemei domeniului de dependen este de a
conceptualiza i instantia evalurii formative n contextul domenii specifice. Orice cum ar
instaniere ar include un model cognitiv -domeniu pentru a ghida substan a evalurii formative ,
progresii de nvare pentru a indica pai spre stpnirea pe cheie componente ale modelului
cognitiv -domeniu , sarcini de a furniza dovezi despre studentul n picioare, cu privire la acele
progresii de nvare , tehnici de a se potrivi cu cea de fond domeniu, i un procedeu pentru
profesori pentru a pune n aplicare , care este strns legat de cea precedent materiale i , prin

urmare, la domeniul n cauz . La citire, de exemplu, modelul cognitiv-domeniu creat de O'Reilly


i Sheehan (2009) sugereaz c o component cheie de competen este abilitatea de a folosi i
de a nelege conveniile de text pentru diverse genuri - convingtor, literar, informativ.
Pentru genul literar, o astfel de convenie ar fi capacitatea de a folosi i de a nelege
Structura complot ca un ajutor nelegere. O progresie de nv are ipoteza pentru care
capacitatea ar include urmtoarele etape: (1) determina ideea de baz a parcelei; (2)identifica
elemente cheie de complot (de exemplu, punctul culminant, rezolu ie); i (3) s n eleag modul
n care evenimentele n legtur cu parcela avansa obiectivele autorului. O ntrebare legat de
primul pas poate cere elevilor s rezume complot pentru un anumit text, si o tehnica specifice
domeniului de colectare a probelor suplimentare ar putea fi de a avea elevilor s completeze un
organizator grafic solicitnd identificarea elementelor de complot pentru textul de alegerea
profesorului. Aceast abordare implic faptul c evaluarea formativ ar trebui s fie, n esen ,
curriculumncorporat, o poziie care Shepard (2006, 2008), a mbriat i Shavelson (2008) a
ilustrat. Dar evalurii formative ct de strns legat trebuie s fie la orice datcurriculum este
nerezolvat. Poate fi viabil, de exemplu, pentru a furniza formare
Materiale de evaluare pentru ideile cheie sau nelegerile de baz ntr-un domeniu, care
ar trebui s fie comun n ntreaga programa. Care ar lsa pe profesori s fie aplice poten ial
strategii mai slab, domenii-generale la subiectele rmase sau, care lucreaz prin comunit ile de
nvare profesor, de a crea propriile lor materiale formative, folosind cele furnizate ca modele.

Problema de msurare
O definiie de baz de msurare de nvmnt este c implic patru activit i :
proiectarea oportuniti de a aduna probe , colectarea probelor, interpretnd-o , i care ac ioneaz
asupra interpretri . Dei programele care vizeaz dezvoltarea de evaluare a cadrelor didactice
Capac alfabetizare o mare parte din acest teritoriu (de exemplu , Stiggins et al . 2006) ,
formative
Literatura de evaluare acord prea puin atenie c a treia activitate , n special la
Principiile fundamentale care nconjoar conexiunea de probe - sau ceea ce observm
- Cu interpretrile vom face din el . Aceast problem a fost abordat mai devreme n

Contextul problemei eficienei , atunci cnd a fost menionat faptul c evaluarea


formativ nu este pur i simplu provocrii prob, ci , de asemenea, faptul de a face concluzii din
care probe. Pentru c aceast idee este att de fundamental , i doar la nceput s se integreze n
definiii ale evalurii formative (de exemplu , negru i Wiliam 2009 , 9 ) , ne-am reveni la ea
acum Evaluarea formativ , la fel ca toate msurarea educa ional , este un proces inferen ial
deoarece nu putem ti cu certitudine ce nelegere exist n interiorul unui student cap
( Pellegrino , Chudowsky i Glaser 2001 , 42; Glasersfeld , citat n negru i Wiliam 2009 , 1718 ) . Putem face doar presupuneri bazate pe ceea ce observm de la lucruri , cum ar fi
participarea clas, lucru de clas , temele , i testul de performan .
De suport a validitii ipotezelor noastre este mai puternic n msura n care se constat
rezonabil consecven n comportamentul elevilor n mai multe surse , ocazii i contexte . Astfel,
fiecare interaciune profesor- elev devine o oportunitate pentru care prezint i rafinarea
presupuneri noastre , sau ipoteze , despre ceea ce un student tie i poate face, n cazul n care el
sau ea trebuie s se mbunteasc , iar ceea ce se poate face pentru a realiza aceast schimbare.
In capitolul de " clas de evaluare " din a patra ediie a Educaional Msurare, Shepard ( 2006)
atinge pe ceea ce ar putea fi numit " ipoteza de formare "( Bennett i Gitomer 2009) .
Centralitatea inferen n evaluarea formativ devine destul de clar atunci cnd ne ia n
considerare diferenele dintre erori, aluneca, concepiile greite i a lipsei de nelegere.
O eroare este ceea ce observm elevii s fac - unele diferene ntre un dorit rspuns i
ce un student prevede. Eroarea observm poate avea una din mai multe Cauzele care stau la baza.
Printre alte lucruri, aceasta ar putea fi o alunecare - care este, un neglijent procedural greeal;
sau o concepie greit, o anumit confuzie conceptual sau de procedur persistent
(Sau de vedere naiv); sau o lips de nelegere n form de un pic lips de conceptual
sau cunotine procedurale, fr nici o concepie greit persistente. Fiecare dintre aceste cauze
implic o aciune de instruire diferit, de la feedback-ul minim (de alunecare), pentru a reteaching
(Pentru lipsa de nelegere), pentru a investiiilor semnificative necesare pentru a inginer o
schimbare cognitiv mai profund (pentru greit) .11 Punctul cheie, cu toate acestea, este faptul
c orice atribuirea unei cauze care stau la baza este o deducie, o "ipotez formativ", adic poate
fi testat prin evaluarea ulterioar. C evaluarea ulterioar ar putea, de exemplu, implica cere

explicaii studentului cu privire la motivul care el sau ea a ales s rspund ntr-un mod special
(fcnd astfel studentul partener n evaluare formativ); administrare mai multe sarcini i n
cutarea unui model de rspunsuri n concordan cu ipoteza; sau referitoare la eroarea alte
exemple de performan studentului.
Este de remarcat faptul c generarea i testarea ipotezelor despre elev nelegerea se face
mai puternic n msura n care profesorul are un bine dezvoltat,
Modelul cognitiv -domeniu . Un astfel de model poate ajuta directiona un ciclu iterativ ,
n care profesor observ comportamentul , formuleaz ipoteze cu privire la cauzele incorecte
rspunde, sonde suplimentare, i revizuiete ipotezele iniiale . n plus , n cazul n care activul
suport
Modelul este teoretic de sunet, acesta poate ajuta pe elev reducere profesor rspunde
care poate fi nu mai mult zgomot potenial neltoare (de exemplu , fi ele de care nu au nici
adnc semnificaie formativ) . deducii formative nu sunt supuse numai la incertitudine , ele
sunt , de asemenea, supuse, influene irelevante sistematice care pot fi asociate cu sexul , rasa ,
etnie , dizabilitate, competen n limba englez , sau alte caracteristici de student . Pune simplu,
aciuni de formare a profesorilor poate fi prtinitoare n mod neinten ionat . Un profesor poate
mai mult sau mai mai judeca efficaciously calificare elev pentru unii, spre deosebire de alte
grupuri , ( Bennett i colab . 1993) , cu consecine pentru modul corespunztor este modificat de
instruire i nvare facilitat. Un astfel de rezultat este uor de imaginat atunci cnd profesorul
doar limba este engleza i student este un elev limba englez . Pentru aceti studen i , erori n
rezolvarea problemelor de matematic poate fi uneori nrdcinat n elevului lingvistic , mai
degrab dect conceptual , nenelegere a problemei prezentate sau lecie ( Martiniello 2008) , o
subtilitate profesorul poate dor cu uurin .
Putem, deci, face evaluarea formativ mai principial, de la o msurare perspectiv, prin
recunoaterea faptului c caracterizari noastre de studeni sunt inferen e i c, prin ns i natura
lor, deducii sunt incerte i, de asemenea, obiectul unor neinten ionat prejudec i. Putem tolera
incertitudine mai mult, i chiar prtinitoare, n deducii noastre, cnd consecine ale eroare de
judecat sunt sczute, iar deciziile bazate pe el sunt reversibile.
Astfel de condiii sunt cu siguran adevrat de contexte formative. Acestea fiind spuse,
mai siguri i imparial suntem, cu att mai eficient, putem ajusta instruirea - ce- i petreac timpul
ncercarea de a corecta o concepie greit atunci cnd eroarea a fost doar din cauza unei

alunecare procedural sau la o nenelegere lingvistic? Avnd n vedere acest fapt, ar trebui s
ncercm tot posibilul s scad incertitudine i prejudecat prin luarea n considerare a datelor
din mai multe surse, ocazii, si contexte; de mpmntare aciune ntr-un model cognitiv-domeniu
de sunet, n mod ideal una care reprezint diferente intre grupuri de studeni; i, acolo unde este
posibil, prin obtinerea de intrare de la alii ceea ce privete semnificaia rspunsurilor la grupurile
de studeni despre care am sunt mai puin informat.

Problema dezvoltare profesional


O mare parte din literatura de specialitate privind evalurii formative ea conceptualises
ca o activitate n mod esenial nrdcinat n cunoatere pedagogic (de exemplu , negru i
Wiliam 1998c ) - adic, n calitate de pur i simplu procesul de predare bun . Am sus inut c o
astfel de nevoi conceptualizare
De asemenea, pentru a include nelegerea profund n mod rezonabil cognitiv -domeniu
i cunoaterea fundamentale de msurare . cererea mea , n esen, este faptul c un subset al
acestor trei competene este puin probabil s lucreze .
n cazul n care aceast afirmaie este adevrat , cum putem dezvolta cele mai bune
practici de evaluare formativ profesorilor ?
O ntrebare cheie n acest sens este dac componentele pot fi efectiv adresat semi independent . De exemplu , KLT se concentreaz n principal pe pedagogical-aspect cunoatere a
practicii . Formativ -evaluare cunotinelor pedagogice este conectat la domeniul nelegere, prin
profesorul centrat pe disciplina comuniti de nvare ( a se vedea , de asemenea, Harrison
2005) . Cu toate acestea , domeniul profund nelegere Este puin probabil s duc , dac nu este
deja prezent , deoarece o astfel de nelegere nu este formal ncorporat n programul . Mai
degrab , dezvoltarea domeniului nelegere este vzut ca un " bonus " , spre deosebire de un
obiectiv vizat de program ( Wiliam i Thompson 2008 , 74 ) . fundamentele de masurare , de
asemenea, nu sunt direct abordate n mod sistematic .
Abordarea pedagogic - cunoatere poate fi foarte bine sensibil din punct de vedere
practic perspectiv. n mod intenionat ncearc s dezvolte cunotinele pedagogice , domeniu
profund nelegere , i de msurare fundamentele simultan poate fi mai mult dect orice un
program profesional - dezvoltare poate livra n mod rezonabil . La cel mai mic , preservice

formarea cadrelor didactice are un rol central n dezvoltarea unei fundaii mai ferm pe care
programele de formare continu pot construi ulterior .
O problem conex este timpul. Chiar dac putem gsi o modalitate practic de a ajuta
profesorii construirea calificare pedagogic , nelegere aprofundat a domeniului , i un
sentiment de fundamentele de msurare , profesorii au nevoie de timp semnificativ . Ei au nevoie
de timp pentru a pune aceast cunoatere, aptitudini, i nelegerea de a practica , de exemplu , s
nvee s foloseasc sau adaptarea intenionat construite, materiale de formare de evaluare pe
baza de domeniu . Astfel de materiale ar putea includ elemente , seturi de sarcini integrate ,
proiecte, teste de diagnosticare , precum i de observatie si ghiduri de interpretare . Profesorii au
nevoie de asemenea, de timp pentru a reflecta asupra experienelor lor cu aceste materiale . Daca
vom putea obtine profesori s se angajeze n cicluri iterative de utilizare , de reflec ie , adaptare ,
i eventuala creare - toate nrdcinat ferm n sens cognitiv -domeniu
Modelele - am putea avea un mecanism potenial pentru a ajuta cadrele didactice s
integreze mai bine Procesul i metodologia evalurii formative cu domeniul nelegere profund

Problema sistemului
Acest ultim aspect poate fi cea mai mare provocare din toate. "Problema de sistem" se
refer la faptul exista, ca evaluarea formativ ntr-un context educaional mai larg. n cazul n
care acest context este de a funciona eficient n educarea elevilor, componentele sale trebuie s
fie coerent (Pellegrino, Chudowsky i Glaser 2001, 255). Gitomer i Duschl (2007) descriu dou
tipuri de coeren, interne i externe. Componentele de evaluare pot fi considerate coerent pe
plan intern, atunci cnd acestea se susin reciproc; cu alte cuvinte, formative iar evalurile
sumative trebuie aliniate una cu cealalt. aceste componente trebuie s fie, de asemenea, pe plan
extern coerent, n sensul c formative i evalurile sumative sunt n concordan cu teoriile
acceptate de nvare, precum i cu prim punct de vedere social rezultatele nvrii. coeren
extern, desigur, de asemenea, se aplic i altor componente ale sistemului, inclusiv instituiile de
formare pre-service, care trebuie s le ofere cadrelor fundamentale abilit i de care au nevoie

pentru a sprijini i de a folosi evaluare n mod eficient. n orice caz, n cazul n care aceste dou
tipuri de coeren nu sunt prezente, componente ale sistemului fie va locul de munc mpotriva
una de alta sau locul de munc mpotriva obiective sociale mai mari. O realitate comun n
sistemele de nvmnt de astzi este faptul c, din motive practice, Testele de sintez sunt
relativ scurte i, n principal, cu mai multe variante sau formate cu rspunsuri scurte. Aproape
inevitabil, aceste teste va masura un subset al curriculum destinate, omi nd procese importante,
strategii i cunotine care nu poate fi evaluat n mod eficient n acest mod (Shepard 2008).
Integrarea calificare i coordonare strategic, de exemplu, sunt susceptibile de a fi dat shrift
scurt. De asemenea, aproape n mod inevitabil, instruire clas i evalurii formative vor fi
aliniate la subset i, n consecin, potenialul evalurii formative a genera schimbare profund
vor fi reduse.
Astfel, eficiena evalurii formative va fi limitat de natura sistem mai mare n care este
ncorporat i, n special, de coninutul, formatul i de proiectare a testului responsabilitate
(Bennett i Gitomer 2009). n cele din urm, trebuie s schimba sistemul, nu doar abordarea
lum la formative de evaluare, dac dorim pentru a avea un impact maxim asupra nv rii i
instruciuni. Schimbarea mijloacele de sistem refacerea testele noastre de responsabilitate i c
este ntr-adevr o provocare foarte mare.

Concluzie
Termenul , "Evaluarea formativ " , nu reprezint nc un set bine definit de artefacte
sau practici . O definiie semnificativ necesit o teorie a ac iunii i unul sau mai mul i
instantiations beton. Atunci cnd avem aceste componente n loc, avem ceva utile pentru a pune
n aplicare i pentru a studia. Programul de KLT (ETS 2010) ofer o astfel de defini ie pentru o
categorie a evalurii formative. Este nevoie de mai mult de lucru de genul asta pentru a mpinge
campul.
n al doilea rnd, o interpretare mai circumspect al cercetrii eficienei ar fi c practicile
generale asociate cu evaluarea formativ poate, n conformitate cu dreptul Condiiile, pentru a
facilita nvarea. Cu toate acestea, beneficiile pot varia foarte mult n natur i mrime de la
unul implementarea specific a evalurii formative la alta i de la un subpopulaie de elevi la
altul. (Ca un exemplu, s ia n considerare variaia extinse n eficacitatea feedback.) De

asemenea, mrimea frecvent realizate cantitativ cererile de eficacitatea evalurii formative este
suspect, pentru a spune cel mai puin. Cel mai citate frecvent revendicare efect de mrime a 0.4
- .7 abateri standard nu este nici semnificativ ca o reprezentare a impactului unei singure clase
definite de bine de tratamente, nici uor urmrite la orice sursa inspectible, empiric. Alte surse
empirice sunt datat, nepublicate, metodologic eronate, populaiile int mai n vrst, sau o
emisiune Efecte mai mici dect susintori cita. n cele din urm, argumentul de valabilitate,
precum i probele care sprijini aceasta - ambele din care ar trebui s fie n mod logic cheie pentru
orice teorie a aciunii de formare
Evaluarea - sunt, n general absente. Avnd n vedere aceste fapte, ca cercettori avem
nevoie pentru a fi mai responsabil n cererile noastre de eficacitate i, n calitate de educatori,
mai puin imediat acceptarea dintre cei care mpinge prea auto-siguran pentru adoptarea rapid.
n al treilea rnd, nrdcinare evalurii formative n competene pedagogice singur este,
probabil, insuficient.
Mai degrab, evaluarea formativ ar fi conceptualizat mai profitabil i instaniat n
diverse domenii specifice. De exemplu, ntr-un numr special al Aplicat Msurare n Educa ie,
Shavelson si colegii sai descriu ncorporarea de formare Evaluarea ntr-un curriculum utilizat pe
scar larg, inovator Abordri n tiin Predare (Shavelson 2008). ETS "CBAL (evaluare bazat
cognitiv de, de, si ca de nvare iniiativ), care este construirea evaluri din cognitivedomain
cross-curriculare Modelele, ofer un al doilea exemplu (Bennett 2010). Evaluarea al patrulea
rnd, formativ presupune s deducii despre ce tiu elevii i poate face. Prin urmare, evaluarea
formativ este evaluarea, cel puin n parte. Acest lucru implic faptul c principiile de msurare
relevante ar trebui s dau central n conceptualizarea sa i instanierea. ncorporeaz principii de
msurare nu nseamn c valabilitate trebuie sacrificat pentru fiabilitate, ca unii pledeaza tem,
sau c inadecvat concepte psihometrice, metode, sau standardele de rigoare destinate pentru alte
evaluri trebuie aplicate scopuri. Dar aceasta nu nseamn c ar trebui s includ, mai degrab
dect ignora, principiile fundamentale relevante
n al cincilea rnd , profesorii nevoie de cunotine n mod substanial la punerea n
aplicare a evalurii formative n mod eficient n slile de clas . Este ndoielnic faptul c
profesorul are in medie aceste cunotine , astfel nct cei mai muli profesori vor avea nevoie de

perioada considerabila de timp si de sprijin pentru a -l dezvolte. In plus , profesori vor avea
nevoie de materiale de clas utile care modeleaz integrarea pedagogic , domeniu , i msurarea
cunotinelor ( de exemplu , sarcini n dezvoltare ordonate c poate ajuta sa faca deductii despre
ce tiu elevii cu privire la domeniul cheie competene , i aproximativ ce urmeaza a viza pentru
instruciuni) .
n cele din urm , trebuie s ne explica faptul c exist evalurii formative ntr-un
educaional context. n cele din urm , trebuie s regndim evaluare de la zero ca un sistem
coerent , n care evaluarea formativ este o parte critica , dar nu singurul critic parte.
O nchidere potrivit pentru aceast lucrare vine de la Shavelson ( 2008) . Referindu-se la
sa experien n crearea , implementarea i studierea efectelor evalurii formative , el scrie:
Cu alte cuvinte , "Evaluarea formativ " este n acelai timp conceptual i practic nc
un lucreaz n curs de execuie . Acest fapt nseamn c trebuie s fie mai sensibil la
revendicrile noastre despre ea ,precum i n ateptrile noastre pentru el . Acest fapt , de
asemenea, nseamn c trebuie s continue greu de lucru necesare pentru realizarea promisiunea
considerabile .