Sunteți pe pagina 1din 22

Unaintroduccinala ESTADSTICAINFERENCIAL

JosChacn
EstaobraestbajounalicenciaReconocimientoNocomercialCompartirbajolamismalicencia2.5de CreativeCommons.Paraverunacopiadeestalicencia,visite http://creativecommons.org/licenses/byncsa/2.5/ oenvieunacartaaCreativeCommons,559NathanAbbottWay,Stanford,California94305,USA.

Tema1. Introduccin
Estaasignaturahasidoorientadaaentenderlosprincipiosenlosquesebasa laestadsticainferencial.Entendersignificaqueesposiblesaber,enprimerlugar,qu razoneshanllevadoaelegirundeterminadoclculoy,nomenosimportante,larele vanciarealdelosresultadosdeeseclculo. La estadstica inferencial no es ms que un argumento. Un buen argumento hacecrebleunaafirmacin.Ennuestrocaso,cualquierestudionecesitar,almenos dosargumentosslidos:elestadsticoyelrelativoaldiseodeinvestigacin(loque sepuedeaprenderenMtodosIyII).Desdeestepuntodevista,nuestratareaespo der entender (y calibrar) los argumentos estadsticos y tambin poder construirlos nosotrosmismos. Laestadstica inferencial es necesariacuandoqueremoshaceralgunaafirmacin sobremselementosdelosquevamosamedir.Laestadsticainferencialhacequeesesal todelapartealtodosehagadeunamaneracontrolada.Aunquenuncanosofrecer seguridadabsoluta,snosofrecerunarespuestaprobabilstica.Estoesimportante: laestadsticanodecide;sloofreceelementosparaqueelinvestigadoroellectordeci dan. En muchos casos, distintas personas perciben diferentes conclusiones de los mismosdatos. Elprocesosersiempresimilar.Laestadsticadisponedemultituddemodelos que estn a nuestra disposicin. Para poder usarlos hemos de formular, en primer lugar,unapreguntaentrminosestadsticos.Luegohemosdecomprobarquenues trasituacinseajustaaalgnmodelo(sinoseajustanotendrasentidousarlo).Pero siseajusta,elmodelonosofrecerunarespuestaestadsticaanuestrapreguntaesta dstica.Estareanuestradevolveralapsicologaesarespuesta,llenndoladeconte nidopsicolgico. 1. Definicioneseideasprevias Enelmbitocientfico,laestadstica,engeneral,ylaestadsticainferencial,en particular, es el camino que hay que recorrer para llegar de una pregunta a la res puesta adecuada. As, la estadstica no es ms que un argumento para defender nuestrasideas. Cundo es necesaria la estadstica inferencial? Cuando queremos hacer alguna afirmacinsobremselementosdelosquevamosamedir. Laestadsticadescriptiva,comoindicasunombre,tieneporfinalidaddescri bir.As,siqueremosestudiardiferentesaspectosde,porejemplo,ungrupodeper sonas,laestadsticadescriptivanospuedeayudar.Loprimerosertomarmedidas, entodoslosmiembrosdelgrupo,deesosaspectosovariablespara,posteriormente, indagarenloquenosinterese.Porejemplo,parasaberculeslaedaddelgrupo, podemos resumir el conjunto de todas las edades mediante la media. Eso nos dice, aproximadamente, alrededor de qu edad se sitan todos. Ya sabemos, pongamos, quelaedadmediaes40aos.Peroademspodemosutilizarladesviacintpica,si

1.Introduccin,2

queremossabersielgrupotieneedadesmuydispares(porejemplo,unadesviacin tpicade12aos)osi,porelcontrario,tienenedadesparecidas(unadesviacintpi ca de 2 aos). Slo con esos indicadores ya podemos hacernos una idea, podemos describiraeseconjuntodepersonas,almenosenreferenciaasuedad. Peroeltamaodelosgruposquesueleninteresaresdemasiadogrande,ave cestangrandecomotodoelmundo.Yesto,msqueserunarareza,esenmuchos camposlanorma.Porejemplo,cuandoseafirmaquelaspersonastenemosunaagu dezavisualmenorqueladeloshalcones,podemosestarsegurosdequeno hemos medidolaagudezavisualdetodosloshumanosniladetodosloshalcones. Puesbien,laestadsticainferencialeslaquevaapermitirdaresesaltodelos resultadosobtenidosparaungrupoalatotalidad. Planteemos una cuestin concreta: Un profesor de estadstica afirma que se aprendemejorestadsticainferencialutilizandolosordenadoresparamostrarloque se estudia. Cmo podemos decidir si esta afirmacin es cierta? Una posible forma sera seleccionando dos grupos de alumnos (equivalentes) que estudien estadstica inferencial, y dar las mismas clases a ambos, incluido el mismo profesor, idnticos ejercicios,etc.,exceptoqueunodeellosutilizanlosordenadoresensuaprendizajey otrono. Veamos las definiciones en relacin a este ejemplo, suponiendo que realiza moselestudioconlosalumnosdelosgruposF(conordenador)yG(sinordenador): GrupoF(conordenador) GrupoG(sinordenador) Poblacin:unconjuntodeelementos(generalmentepersonas,enpsicologa)que compartenalmenosunacaractersticabiendefinida. Estudiantesdeprimerodepsicologaque cursanestadsticainferencialconordenador Estudiantesdeprimerodepsicologaquecur sanestadsticainferencialsinordenador

Muestra:esunsubconjuntodeelementosextradosdeunapoblacin. Losestudiantesdeprimerodepsicologadela Losestudiantesdeprimerodepsicologadela UCM,grupoF UCM,grupoG Variable:Caractersticadeloselementosdeunapoblacinquepuedetomardiversos valores(almenos,dos). NiveldeconocimientosenestadsticaII,me didosatravsdeunexamen. Conjuntodenotasobtenidasenelexamende estadsticaparalosalumnosdelgrupoF NiveldeconocimientosenestadsticaII,me didosatravsdeunexamen. Conjuntodenotasobtenidasenelexamende estadsticaparalosalumnosdelgrupoG

Datos:Valoresobtenidosalmedirunavariableenunamuestra.

Estadstico:Esunvalornumricoqueexpresaunacaractersticadeunamuestra. Formalmente,unestadsticoesunafuncindefinidasobreunavariable. Media( X )delasnotasobtenidasenelexa mendeestadsticaparaalumnosdelgrupoF Media( X )delasnotasobtenidasenelexa mendeestadsticaparaalumnosdelgrupoG

1.Introduccin,3

Parmetro:Esunvalornumricoqueexpresaunacaractersticadeunapoblacin. Media()delasnotasobtenidasenelexa Media()delasnotasobtenidasenelexamen mendeestadsticaparatodoslosestudiantes deestadsticaparatodoslosestudiantesde deprimerodepsicologaquecursanestads primerodepsicologaquecursanestadstica ticainferencialconordenador. inferencialsinordenador. 2. Elazarylaprobabilidad La estadstica inferencial resulta de aplicar la probabilidad a los estadsticos que ya conocemos por la estadstica descriptiva. Los resultados de esa aplicacin vendrnexpresados,pues,enlenguajeprobabilstico. Yestonoayudaprecisamenteasentirsecmodoconlaestadsticainferencial. Adems de ser matemtica, tiene la fea costumbre de no decir s o no. En lugar de ello,susrespuestassuenanavecesaexcusas,esos,muydiplomticas,comonohay suficiente evidencia o esa afirmacin es altamente improbable. Pero en lenguaje matemtico.Elresultadoesquizsextrao,difusoperopreciso; nosedecantapero nosdacuatrodecimales:apartirdelosdatosquemeofrece,laprobabilidaddeque ocurraesoqueustedafirmaes0.23811. Peroaunasnospermiteincrementarnuestroconocimiento.Lasafirmaciones anteriores pretenden ilustrar algo fundamental: las afirmaciones que nos permite hacer la estadstica inferencial tienen un riesgo, y quien la usa debe saberlo. No es difcil, de todas maneras, porque todas estas afirmaciones estn formuladas en tr minosderiesgo,deseguridadeinseguridad:deprobabilidad. Elazares,pordefinicin,loimpredecible.Cmoesposibleentoncesutilizar loimpredecibleparaobtenerinformacin?Laclaveestenqueinclusoloimpredeci ble,parapoderserlo,hadecumpliralgunasnormas.Elconjuntodeesasnormas,y lastcnicasparaextraerinformacindelazar,esloquellamamosprobabilidad. Nohaynadamgicoenelazar;resultadeunasucesindecircunstanciasno controlablesquellevaanopoderpredecirelresultado.Fijmonosenlamonedade todalavida.Loquehacequelanzarlaseaunexperimentoaleatorioesqueesimposible controlarlafuerzaconlaqueselanza,losgirosquedaylosngulosconquegolpea elsuelounayotravezhastadetenerse2.Bastasituarlamonedadecantoenunamesa yempujarladeliberadamenteenunadireccinparaquedesaparezcaelazar.Perosi estando de canto la hacemos girar rpidamente volvemos a disponer de un experi mentoaleatorio. Pero,podemosrealmenteutilizarestainformacinparadecidirsobrealgore al?Supongamosquelanzamoslamonedaalaire.Culessonesasnormasquepo
Las respuestas que obtendremos sern ligeramente diferentes, pero esa frase sirve para ilustrar el estilo.
1

Estonoescompletamentecierto:hayprestidigitadoresqueseentrenanhastacontrolarellanzamien todelasmonedas.Controlanlafuerza,losgirosyelmomentojustodedetenerelmovimientopara conseguirciertoresultado.Eltrucoconsiste,portanto,enquenohayazar.


2

1.Introduccin,4

demosutilizar?Enestecaso,quelamonedatienedoscaras,yquenohaypreferencia porunauotraalahoradeposarse.Esdecir:lasdosnicasposibilidadessereparten porigualelderechoaserelresultadofinal.Siaplicamoslosconceptosbsicosde laprobabilidad,yrecordandoquelaprobabilidadtotales1,tenemosquelasproba bilidadesdequesalgacaraocruzson: P(cara) = 0.5 P(cruz ) = 0.5

Lo quesueleser difcildedigerir para nuestro entendimientosoncuestiones como,porejemplo,queaunqueundeterminadosucesotengaunaprobabilidadnfi ma,como0.01(un1porciento),tambinpuedeocurrir. Aunque todo el que lea esto est realmente convencido de que es verdad, la experienciademuestraquenoaplicamosesteconocimiento. 3. Elmuestreo Para extraer conclusiones de una poblacin a partir de una muestra, es vital quelamuestrasearepresentativa. Hay dos tipos de muestreo: probabilstico (se conoce, o puede calcularse, la probabilidaddecadaelemento,portanto,decadamuestraposible)ynoprobabilsti co(sedesconoceonointeresalaprobabilidaddecadaelemento;elinvestigadorse leccionaaquellamuestraqueconsideramsrepresentativaoqueleresultamsfcil). Cuidado:noesqueelmuestreonoprobabilsticonopermitagenerarmuestras representativas;loqueocurreesquenotenemosningunainformacinsobreelgrado derepresentatividaddelamuestraelegida. El muestreo probabilstico puede darse de diferentes formas, segn estemos considerandopoblacionesfinitas (losvotantes delaComunidaddeMadrid,lospa cientesconinsomnio)oinfinitas(losposiblestiemposdereaccinanteunatareade bsquedavisual),ysegnconsideremos(enlasfinitas)unmuestreoconosinreposi cin. Elmuestreoaleatoriosimplesedacuandosecumplelaigualdaddedistribuciones (cualquier valor tiene la misma probabilidad de salir en cada extraccin) e indepen dencia(laprobabilidaddeobtenerundeterminadovalornosemodificaporlosvalo resyaobtenidos). Otrostiposdemuestreoprobabilsticosonelm.a.sistemtico,elm.a.estrati ficadoyelm.a.porconglomerados.

Tema2. Estimacindeparmetros
Cuando queremos estimar el valor de un parmetro, disponemos de dos aproximaciones:Laestimacinpuntualylaestimacinporintervalos. 1. Estimacinpuntual Laestimacinpuntualasignadirectamentealparmetroelvalorobtenidopa raelestadstico. [La estimacin por intervalos, en cambio, proporciona un intervalo, un rango de valoresentrelosqueestarsituadoelparmetroconunaciertaprobabilidad.Parapoderco noceresaprobabilidaddebemosconocerpreviamenteladistribucindeprobabilidaddelesta dsticoqueestemosusandocomoestimador:ladistribucinmuestraldelestadstico.En lospuntos2y3veremosestasdoscuestionesconmsdetalle.] Laestimacinpuntualconstituyelainferenciamssimplequepodemosreali zar:asignaralparmetroelvalordelestadsticoquemejorsirvaparaestimarlo.Pero para que un estadstico sea considerado un buen estimador ha de cumplir ciertas condiciones. Si usamos los smbolos para un parmetro cualquiera, y , para un posibleestimadorde ,podemosenunciarlaspropiedadesdelasiguienteforma: Carenciadesesgo:Unestimador, ,serinsesgadosisuvaloresperadocoinci deconeldelparmetroaestimar, . E ( ) =
Consistencia:Unestimador, ,serconsistentesi,conformeaumentaeltamao muestral,n,suvalorsevaaproximandoa .Expresadomsformalmente,in dicaquedadaunacantidadarbitrariamentepequea, ,cuandontiendeain finito, P (| |< ) 1
Eficiencia:Dadosdosposiblesestimadores 1 y 2 ,diremosque 1 esunesti madormseficienteque sisecumpleque
2

2 < 2
1 2

Suficiencia:Unestimador, ,sersuficientesiutilizatodalainformacinmues traldisponible.

Latablaacontinuacinmuestralosestimadoresdealgunosparmetros: Estimadores Insesgados X


2 Sn1

Consistentes X
2 Sn

Eficientes X
2 2 Sn1 , Sn

Parmetros

2.Estimacindeparmetros,6

Yelsiguientegrficopuedeilustrarelsignificadodeesaspropiedades:

2. Distribucinmuestraldelamedia Ladistribucinmuestral(delamediaodecualquierotroestadstico)esfun damental: si la conocemos podemos saber con qu probabilidad puede adoptar de terminados valores. Eso nos permitir responder a ciertas cuestiones, por ejemplo, obtenerelintervalodeconfianzaparalamedia,haceruncontrastedehiptesisocal cularlapotenciadeuncontrastedehiptesis. Conocer la distribucin muestral de un estadstico (de aqu en adelante, la media)implicaconocersuformaysusparmetros.Porejemplo,sabersisuformaes ladeladistribucinnormal,ysaberquelosparmetrosson:media,30ydesviacin tpica,6.5.Afindecuentas,loquenosinteresaesqueladistribucinmuestralcoin cidaconalgunaconocida,delaquedispongamosdetablas. La forma en que la estadstica nos permitir conocer la DMM es a travs de condiciones o supuestos: Si nuestros datos cumplen lo que pide un procedimiento estadstico, entonces ese procedimiento estadstico nos da alguna informacin til. Porejemplo, Si tenemosunmuestreoaleatorio, 1 ylasobservacionessonindepen dientes, yeltamaodelamuestraesn, tenemosunmuestreoaleatorio, ylasobservacionessonindepen 2 dientes, yladistribucindelavariableX esnormal, entonces losparmetrosdelaDMMson X = X X =X n laDMMesnormal,conindepen denciadeltamaodelamuestra,n yconparmetros X = X

X =X

tenemosunmuestreoaleatorio, ylasobservacionessonindepen 3 dientes, ynoconocemosladistribucinde lavariableX,

2.Estimacindeparmetros,7
laDMMseaproximaralanormal, conformeaumentaeltamaodela muestra,n yconparmetros X = X

X =X

estamosencualquieradelosca sosanteriores, ydesconocemos,

laDMMseaproximaraladistri bucintconn1gradosdelibertad, yconparmetros X = X

X Sn1

De(1)obtenemoslosparmetrosdelaDMM:lamediayladesviacintpica, quesueledenominarseerrortpicodelamedia. De(2)podemosdeducirque,sinuestravariabledeintersesnormalenlapo blacin,tambinlosernuestraDMM. De(3)extraemosque,aunqueladistribucindelavariable Xenlapoblacin noseanormalo,lomsfrecuente,sinosabemossiesononormal,laDMMsser normalsieltamaodelamuestra, n,eslosuficientementegrande(aproximadamen temayorque30). Graciasa(4)solucionamosunproblemabastantecomn:elnoconocerlades viacintpicapoblacionaldelavariable X.Enestecasousamoscomoestimador Sn1, peroentonceslaDMMsiguelaformadeladistribucin t.Lasdistribucionesnormal y tsediferencianvisiblementeslocuandolosgradosdelibertadsonpequeos,co mo se observa en las grficas siguientes. Cuando aumenta n, y Sn1 se van pare ciendomsyms,ylasdistribucionesnormalyttambin.Esporestoque,aunnivel prctico,apartirdeunnmayorque30suelenusarseindistintamente.Enlasdosgr ficas que siguen se pueden ver las distribuciones normal (azul) y t (rojo) para dos tamaosdemuestradistinto: niguala5(arriba)y niguala30(debajo).Paraambas secalculaloslmitesqueabarcanun95%delreatotaldecadacurva.Lasdiscrepan ciassonevidentesconniguala5,peroinapreciablesparan=30.

2.Estimacindeparmetros,8

conn=5.

conn=30. A efectos prcticos, todo lo visto supone lo que detallamos a continuacin. Considresesiemprequeelmuestreoesaleatorio(losdatosprocedendeelementos representativos)eindependiente(esdecir,queelhaberelegidounelementonoafec taalaprobabilidaddeelegirotros).Enestascondiciones,puedeocurrirlosiguiente:

Comoesdifcilconocer ,consideraremossiempredepartidaquelaDMMse distribuir segn tn1, ya sea cuando sepamos que la variable X se distribuye normalmenteocuando nseaigualomayorque30oambascosas.Comolasta blasdeladistribucintaparecentipificadas(conmedia=0ydesviacintpica= 1),parahacercualquierusodeelladeberemostipificarelvalordeinters,X:

temp =

X t n 1 Sn1 n

Si,enelcasoanterior,conocemosademsladesviacintpicapoblacional,en tonceslaDMMsedistribuirsegnla distribucinnormal:Porlamismarazn deantes,parausarlastablaspreviamentedebemostipificar: X zemp = N (0,1) n PerosinoconocemoslaformadeladistribucindelavariableX,nielneslo suficientemente grande como para hacer uso del punto (3), entonces no pode

2.Estimacindeparmetros,9

mos utilizar esta informacin. [Pero no todo est perdido: En ese caso habra queestudiarlaformadeladistribucindelavariableX,transformarlaspun tuaciones hasta que adopten una forma normal o, en ltima instancia, usar pruebasnoparamtricas,quenoimponensupuestossobrelaformadeladis tribucin.Todoestosonconceptosquesevernmsadelante.] Comoreglageneralutilizaremossiempreladistribucint(raravezconocere mos ),aunquepodremosusarlatabladeladistribucinnormal(siemprequensea suficientementegrande)paralocalizarvaloresquenoaparezcanenlatabladeladis tribucint. Quobtenemosdetodoesto? Lo que afirmbamos anteriormente: que conociendo cmo se comportan las medias(sudistribucinmuestralodistribucindeprobabilidad),podemosusarestas probabilidadessiemprequeseanecesario.Unadeellas,queveremosahora,eslaob tencindeintervalosdeconfianza.Otraaplicacin,msadelante,serutilizadaenel contrastedehiptesis.
3. Estimacinporintervalos

Supongamosqueconocisemoslapoblacin.PodramosobtenerlaDMMpara undeterminadotamaodelamuestra,n.UnavezcaracterizadalaDMM,seramos capacesdedecir,conunadeterminadaseguridad,dndeestarnlasmediasquepo dremosobtenersimuestreamos. Invirtiendoelrazonamiento(yyendoalarealidad),dadaunamuestra,pode moscalcularlaDMMdonde,conunaciertaseguridad,estarlamediapoblacional quebuscamos.Esterazonamientosemuestraenlafigurasiguiente.

2.Estimacindeparmetros,10

Observandovemosqueapartirdelamuestra(recurdesequelapoblaciny susparmetrossondesconocidos)elIC,al95%,paralamediapoblacionales[54.03, 65.90].Esoquieredecirquelaprobabilidaddehaberatrapadolamediapoblacio nales0.95,laprobabilidaddehaberacertado.Odichodeotromodo:laprobabilidad dehabernosequivocado,denohaberatrapadolamediapoblacionales0.05,el5%. Enelcasodelafiguraanterior,lamediapoblacional(64.31)caedentrodelin tervalo, pero esto no siempre es as: si repetimos el proceso, un 5% de las veces la mediapoblacionalquedarfueradelintervalopropuesto,comoseobservaenlafi gurasiguiente:

La obtencin de un determinado intervalo es fcil, dado que conocemos la DMM.Bastacon: 1. Localizarenladistribucindeprobabilidad(normalot)losvaloresquecontie nenelniveldeconfianza. 2. Traduciresosdosvaloresalaescaladenuestravariable,X. Enlaprctica,deberemosdefinirunniveldeconfianza(NC),quedeterminar unnivelderiesgo, =1NC.Apartirdeah,yasumiendoquesesigueladistribu cint: 1. Obtenerloslmitesinferiorysuperior,esdecir,losvaloresparatn1quedejana laizquierdayaladerecha/2(lamitaddelnivelderiesgo).Estosvaloressern tn1, 2 y tn1,1 2 . 2. Traduciresosdosvaloresalaescaladenuestravariable, X.As,yteniendoen cuentaque tn1,1 2 = tn1, 2 loslmitesseran:

2.Estimacindeparmetros,11

Sn1 l = X t n 1, 2 i n ls = X + tn1, 2 Sn1 n


Al trmino que es sumado y restado de la media suele denominrsele error mximo, y se denota por Emax. En estos trminos, los lmites de un intervalo de con fianzasuelenexpresarsegenricamentecomo
li = X Emax ls = X + Emax

En resumen, una vez obtenido el intervalo de confianza se puede afirmar lo siguiente: P(li < < ls ) = 1 Quesignificaquelaprobabilidaddequelamediapoblacionalestsituadade ntrodelintervaloobtenidoesigualalniveldeconfianzaespecificado(1).

Tema3. Contrastedehiptesis

1. Contrastedehiptesis

Un contraste de hiptesis es un proceso de decisin en el que una hiptesis formuladaentrminosestadsticosespuestaenrelacinconlosdatosempricospara determinarsiesonocompatibleconellos. Losdatosempricossiempreprovendrndeun muestra,unsubconjuntolimi tadodelapoblacindereferencia.Lashiptesis,porelcontrario,siemprepregunta rnacercadela poblacin. Pinsesequeesabsurdopreguntarsiunamediaobtenida en una muestra, por ejemplo, 58, es mayor que 5. Por supuesto que lo es, y nadie (exceptuando los que estudian estadstica) puede hacerse semejante pregunta seria mente. Loquesesrelevantepreguntaressila mediapoblacional,quenoconocemos, esmayorque5.Entantonolaconocemos,usaremoslamedia muestralcomounes timador(unaaproximacin)deesamediapoblacional.
1.1 Lashiptesisestadsticas(lapregunta,formalizada)

Unahiptesisestadsticaesunaafirmacinsobreunaomsdistribucionesde probabilidad;msconcretamente,sobrelaformadeunadistribucindeprobabilidad o sobre el valor de un parmetro de esa distribucin de probabilidad. En cuanto a nuestroejemplo,noscentraremosenunadistribucindeprobabilidadconel parme tro mediapoblacionaliguala5.Elcontrastedehiptesisnosdirsiesmsomenos probable, bajo esa distribucin de probabilidad, obtener en una muestra aleatoria unamediaiguala58. Todo contraste necesita dos hiptesis: H0 y H1, que sern exhaustivas y mu tuamenteexclusivas. H0eslahiptesisnula,yeslaquesesometeacontraste. H1eslahiptesisalternativaaH0,yeslanegacindeH0.MientrasqueH0es exacta,H1sueleserinexacta. Undetalleimportante:elsigno=siemprevaenlaH0,seaexactaoinexacta. Essobreestesigno=sobreelqueseconstruirelmodeloprobabilstico,comoya hemosvisto.
1.2 Lossupuestos(nuestrasituacinseparecealadelmodelo?)

Son un conjunto de afirmaciones que necesitamos establecer (sobre la pobla cindepartidaylamuestrautilizada)paraconseguirdeterminarladistribucinde probabilidadenlaquesebasarnuestradecisinsobreH0.Sinuestrasituacinnose ajustaaestascondiciones, necesarias,entoncesnodebemosusarelmodelo.Larazn es obvia: el modelo no nos sirve, luego cualquier cosa que deduzcamos de l ser inexactay/oerrnea.


1.3

3.Contrastedehiptesis,13

Elestadsticodecontrasteysudistribucindeprobabilidad

Unestadsticodecontrastenoesmsqueunclculoofuncinquecumplelo siguiente:(1)expresadeformaadecuadanuestrapreguntapsicolgica,(2)tieneuna distribucinmuestral(deprobabilidad)conocida,y(3)vienetraducido(oexpresado) enlaescaladeesadistribucindeprobabilidad.


1.4 Ladecisin(H0soH0no?)

La decisin requiere, en primer lugar, trazar un punto de corte (o dos, en el contrastebilateral),quedefinirdoszonas,unade rechazo (o crtica)yotrade acepta cin.Esepuntodecortevendrdadaporelniveldeconfianzayelnivelderiesgo,. LadecisinconsisteenrechazarlaH0sielestadsticodecontrastecaeenlare ginderechazo,ymantenerlasicaeenlaregindeaceptacin. MantenerlaH0significaquelahiptesisescompatibleconlosdatos. Rechazarla implica que ambos son incompatibles, luego consideramos la H0 falsa. Casogeneral 1.Hiptesis
H0 : = 0 Contr.Bilateral: H1 : 0 H0 : 0 Contr.Unil.Der.: H1 : > 0 H0 : 0 Contr.Unil.Izq.: H1 : < 0

Ejemploespecfico Hay un nivel de aciertos mayor que el esperado por azar, en 20 ensayos? NC = 0.95;n=48. H 0 : 10 H1 : > 10

2.Supuestos

Tenemosun nsuficientementegrandepa ragarantizarunaDMMnormal.


temp =

Poblacindepartidanormal Muestraaleatoriadetamaon.
X t n 1 Sn1 n

3.Estadsticodecontraste

temp =

10.44 10 0.44 = = 1.2558 2.41 48 0.3484

4.Ladecisin Primero,lazonaderechazosegn

tteor_inf = tn1, 2 Contr.Bilateral: tteor_sup = tn1,1 2

=1NC=10.95=0.05;
Contrasteunilateralderecho,luego tteor = tn1,1 = t47 ,0.95 = 1.676 Elestadsticodecontrastecaeenlare gindeaceptacin: temp < tteor

Contr.Unil.Der.: tteor

= tn1,1

3.Contrastedehiptesis,14

Contr.Unil.Izq.: tteor = tn1,

Laregladedecisin

Luego mantenemos la H0: los resulta dos son compatibles con una media igual a 10, es decir, son compatibles conlosaciertosesperadosporazar.

Se rechaza H0 si temp cae en la zona derechazodeterminadaportteor.

Enlasgrficassiguientesseobservalarepresentacindelaspuntuacionesob tenidasy,superpuesta,laDMMconlareginderechazodefinidaporun=0.05.En lagrficainferiorapareceampliadalaDMM.Obsrvesequelosvaloresestnenla escaladelavariableX,ynotipificada.

3.Contrastedehiptesis,15

2. Estimacinporintervalosycontrastedehiptesis

Esfcildarsecuentadelarelacinqueexisteentreuncontrastedehiptesisy elintervalodeconfianza. Porejemplo,calculamosunintervalodeconfianza,al95%,paralamediaespe rada. Como resultado, si la media obtenida est dentro de ese intervalo, considera remosquenosealejalosuficientecomoparaconsiderarladistinta. Esoesjustamenteloquehacemosenuncontrastedehiptesisbilateral:esta blecemos dos puntos de corte y comprobamos si la media obtenida est dentro del intervalodefinidoono.Sobreestehechorealizamosladecisin. Esdiferentesiconsideramosuncontrasteunilateral.Enesecaso,todoelnivel de riesgo se sita en un lado. En tanto todos los intervalos estn construidos de formabilateral,laequivalencianoesperfecta.Habraquemultiplicarelalfapordos paraquefueraequivalente.
3. ErrorestipoIyII.Potenciadeuncontraste.

Hemosaprendidoarealizaruncontratedehiptesis,yahorasabemostomar unadecisinacercadesirechazamosonolaH0.Adems,conocemoslasprobabili dadesasociadasacualquieradelasdecisionestomadas.Podemosrepresentargrfi camenteestasituacin(verfiguraanterior).Perotodasestasdecisionessebasanen queH0seacierta.Quocurre,entonces,siH0esfalsa?Estopuederesumirseenla siguientetabla: MantenerH0 Decisin RechazarH0 Cmopodemosrepresentargrficamenteestanuevaperspectiva?Loprimero serconsiderarque,siH0seconsiderafalsa,adoptaremoscomovalordeH1elobte nido en nuestra muestra. A partir de ah, podemos plantear una nueva DMM, cen tradaprecisamenteenH1(donde=10.44): SituacindeH0 H0Verdadera Decisincorrecta P=1
Niveldeconfianza

H0Falsa ErrortipoII P= Decisincorrecta P=1


Potencia

ErrortipoI P=

3.Contrastedehiptesis,16

Ahora podemos ver que ese punto de corte determina otras dos reas en la DMMparaH1.SianalizamoslaDMMparaH1esfcilsaberloqueindicanesasdos reas:ladelaizquierda(enverde),laprobabilidaddeque,siendoH0falsa(esdecir, adoptandoH1comoverdadera),consideremosqueH0escierta(oH1esfalsa),esde cir,elerrortipoII. Elreadeladerecha(sinrelleno),porelcontrario,nosindicalaprobabilidad derechazarH0(y,portanto,considerarciertaH1),1. Tenemos,portanto,dosreas(probabilidades)deerror: y ,ydosreasde acierto,1y1.Puesbien,si y sonloserrorestipoIytipoII,respectivamen te,suscomplementariossonelniveldeconfianza(1 )ylapotencia(1 ). Hastahacepoco,sloseprestabaatencinalnivelderiesgooerrortipoI, . Peroahoraescadavezmshabitual(ysiemprerecomendable)verincluidalapoten ciaenlosestudiospublicados. Paraqusirve,despusdetodo?Puesparavariascosas: 1. Primero, su valor siempre es informativo. Dmonos cuenta de que tambin es importanteque,siH1escierta,laprobabilidaddeelegirla(lapotencia)seaalta. 2. Permite,dadounalfa,aumentarlapotenciaatravsdeuntruco.Cul?Au mentandoeln. Eshabitualobtenerlapotenciaapartirdeltamaodelefecto(verpuntosiguien te)utilizandolastablasapropiadas.
4. Nivelcrticoytamaodelefecto

Haydosinformacionesmsquepodemosextraeryquepuedenserextrema damentetiles. Por un lado, el nivel crtico, p: es la probabilidad asociada al estadstico de contrasteo,dichodeotromodo,elniveldesignificacinmspequeoalqueunaH0 puedeserrechazadaconnuestroestadsticodecontraste, temp.As,yenelcasodeun contraste unilateral derecho, p puede definirse como la probabilidad de encontrar valoresmayoresquenuestroestadsticodecontraste: p = P(t > temp )

3.Contrastedehiptesis,17

Conelnivelcrticosepretendesalirdeladecisinbinaria(s/no)yproporcio narallectorlaprobabilidadasociadaalestadsticodecontrasteobtenido.As,puede observarselacompatibilidadodiscrepanciaentrelaH0ylaevidenciaobtenidadela muestra(atravsdelestadsticodecontraste). El siguiente cuadro muestra cuatro resultados y las diferentes decisiones se gnseuse(deformamecnica)uncriteriobasadoenun tomadoapriorioaten diendoalestadsticodecontrasteysunivelcrticoopasociada:
t

SerechazalaH0?(=0.05) Contr.Hiptesis Decisinenfuncindep

0.1517 1.6658 1.6861 3.0177

0.560 0.051 0.049 0.002

No No S S

No Repetirelcontrasteconotramuestra Repetirelcontrasteconotramuestra S

Eltamaodelefectoesotrainformacininteresante.Suutilidadseapreciaan telasiguientepregunta:Unadiferenciasignificativaimplicaunadiferenciagrande? Larespuestaesno. Supongamos el siguiente ejemplo: se pone a prueba si un nuevo mtodo de enseanzadelinglsesmejorqueelanterior.Trasmedira500alumnosalosquese leshaaplicadoelnuevomtodoycompararlamediaobtenidaconlaanterior,vemos que existen diferencias significativas (t500 = 2.02; p < 0.022). Efectivamente, la media anteriorsesituabaen6.35puntosy,conelmtodoactualsehaalcanzadounamedia de6.42.Ladiferenciaessignificativapero,esgrande?Oloqueesmsimportante, esrelevante?Cmoparacambiartodounsistemaeducativo?Parecequeno. Enestoscasos,eltamaodelefectonosinformadeladiferenciaentreelvalor propuesto(enlaH0)yelvalorobtenido.Yparaevitardiferenciasaparentesenfun cindelaescaladelavariablemedida,esadiferenciasedivideporladesviacintpi cadelosdatosobtenidos:

d=

X 0 Sn1

De esta forma, el tamao del efecto viene expresado en unidades de desvia cin tpica: un valor de 0.5 significa que la diferencia entre la media obtenida y la propuestaenlaH0representa0.5veceseltamaodeladesviacintpica. Cmo interpretar el tamao del efecto? Cohen (1977) propone unos valores orientativos: Pequeo:d=0.2; Moderado:d=0.5; Grande:d=0.8.

3.Contrastedehiptesis,18

Paraobtenerlapotenciaapartirdeltamaodelefectodebemoscalcularpri mero:

=d n
Yluegoutilizamoslatabladepotencias,dondeapartirde y podemosob tener la potencia del contraste. Y de igual forma podramos calcular el n necesario paraalcanzarunadeterminadapotencia:
n= 2 d2

As,dado dyel delcontraste,podemosbuscarenlatabladepotenciascul eslaquedesearamosalcanzarylocalizarelvalorDcorrespondiente.Sustituyendo enlafrmulaanteriorobtendramoseltamaodela muestranecesarioparaconse guirlo. Resumiendotodoestoenunatablacomolaanterior: 5.Nivelcrtico

Contr.Bilateral: p = 2 P(t > temp ) Contr.Unil.Der.: p = P(t > temp ) Contr.Unil.Izq.: p = P(t < temp )

pasociadaaltemp= 1.2558 p = P(t > 1.2558) = 1 0.8944 = 0.1056


Loqueindicaquehayun10.56%deprob.de obtenerresultadosigualesomayoresquelos nuestros.Muysuperioral5%establecido comopararechazarH0. ICalniveldeconfianzade0.95
li = 10.44 ( 1.96 ( 2.41/ 48 ) ) = 9.76 ls = 10.44 + ( 1.96 ( 2.41/ 48 ) ) = 11.12 P(9.76 < < 11.12) = 0.95

6.Intervalodeconfianza

li = X tn1, / 2 Sn1 / n IC= ls = X + tn1, / 2 Sn1 / n

7.Tamaodelefecto

d=

X 0 Sn1

d=

10.44 10 = 0.18 2.41

(valorpequeo,segnCohen,1977) 8.Potencia =d n MirarentablaL,paray


d2
2

= 0.18 48 = 1.25 1 = 0.35 Paraunapotenciade0.75,=2.35


n=

Clculodenparaunapotenciadada
n=

2.352 5.52 = = 170.45 171 2 0.18 0.032

Apndice:SolucinmedianteelSPSS

SiutilizramoselSPSS,loprimeroseraintroducirlosdatos(osiyaestnin troducidos, cargarlos abriendo el fichero correspondiente). El aspecto sera el si guiente:

3.Contrastedehiptesis,19

RealizamoselcontrasteelcontrastemedianteelmenAnalizar:

Especificamoslavariableaanalizar(lanicapresente)yelvalordecompara cin (el definido en la H0) para realizar el contraste. Obsrvese que en ningn mo mentoseindicaelniveldeconfianzao ,elnivelderiesgootambinllamadonivel designificacindelcontraste.

3.Contrastedehiptesis,20

Damosaaceptaryobtenemoslossiguientesresultados:

Prueba T
Estadsticos para una muestra N Aciertos 48 Media 10.44 Desviacin tp. 2.414 Error tp. de la media .348

Prueba para una muestra Valor de prueba = 10 95% Intervalo de confianza para la diferencia Inferior Superior -.26 1.14

Aciertos

t 1.256

gl 47

Sig. (bilateral) .215

Diferencia de medias .438

Inicialmente, el procedimiento ofrece unos descriptivos bsicos en el primer recuadro,ylosresultadosdelcontrasteenelsegundo.Enesteltimo,siatendemos alrecuadroSig.(bilateral)vemoscmoSPSSnosofreceelnivelcrtico,p,deforma bilateral por defecto. Como nuestro contraste es unilateral, deberemos dividirlo por dos(p=0.1075)paraconocernuestroverdaderonivelcrtico(tambinllamadoproba bilidadasociadaalestadsticodecontraste,osignificacindelestadsticodecontraste). Como se observa, la salida del SPSS no proporciona informacin sobre el ta maodelefectonilapotencia,peropodemoscalcularlotalcomohemosvisto. Encuantoalainterpretacindeestosresultados,esidnticaalaquehicimos: EsteresultadonosllevaraamantenerlaH0aunnivel (tambinllamadonivelde riesgooniveldesignificacin)de0.05,yaquepessuperior(0.1075;lasignificacin bilateral,0.215,divididapor2). Entrminosestadsticos,elnivelcrtico,p,obtenidonosindicaquelaprobabi lidad de obtener unos resultados como los nuestros, supuesta cierta la H0, es de 0.1075, es decir, algo ms de un 10% de las veces (si repitiramos indefinidamente esteexperimentosobreunaH0cierta).Portanto,esrazonableconsideraresteresul tadodemasiadoprobablecomoparallevarnosapensarquelaH0esfalsa.

S-ar putea să vă placă și