Sunteți pe pagina 1din 5

Significacin Estadstica.

El trmino "nivel de significacin" suele generar confusiones y no muchos investigadores lo comprenden bien. Este artculo aclara el concepto de significacin estadstica y el significado de los valores generados por el Survey System. Este artculo se presenta en dos secciones. La primera seccin simplifica al mximo el concepto de significacin estadstica, de manera que los lectores sin conocimientos tcnicos puedan utilizar el concepto para tomar decisiones en funcin de sus datos. La segunda seccin proporciona a los lectores con mayor conocimiento tcnico una explicacin ms detallada sobre el significado exacto de los valores de significacin estadstica. Cuando se habla de "significativo" en trminos generales, se suele implicar que algo es importante, mientras que en estadstica el concepto se refiere a algo probablemente cierto (no por azar). Es posible que el hallazgo de una investigacin sea cierto sin que sea importante. Cuando los estadsticos dicen que un resultado es "altamente significativo" quieren decir que es muy probable que sea cierto. No (necesariamente) quieren decir que es altamente importante. Observe el cuadro que aparece ms abajo. Los ji cuadrados que aparecen abajo de todo presentan dos filas de nmeros. Los nmeros de la fila superior (0.07 y 24.4) representan, en s mismos, estadsticas de ji cuadrado. A los fines de este artculo, se puede no tener en cuenta el significado de dichas estadsticas. La segunda fila contiene los valores .795 y .001. stos son los niveles de significacin y se explican a continuacin de la tabla.

Compra el combustible de marca X? Zona Total Base 713 S "o 428 60 285 40 361 215 60 146 40 352 213 61 13! 40 247 131 53 116 47 24%4 %001 150 74 4! 76 51 Clase de vehculo 44 2! 66 15 34 180 131 73 4! 27 Ciudad Suburbio Auto Camin mnibus Camioneta

#i 0%07 $uadrado %7!5

Los niveles de significacin indican la probabilidad de que un resultado se deba al azar. El nivel ms frecuente, que se utiliza para indicar que algo es digno de credibilidad, es .95. Esto significa que el hallazgo tiene un 95% de probabilidades de ser cierto. Sin embargo, este valor tambin se utiliza de manera confusa. Ningn paquete de estadsticas mostrar "95%" o ".95" para indicar este nivel. En su lugar, aparecer ".05", para indicar que el hallazgo tiene un cinco por ciento (.05) de probabilidades de no ser cierto, que es lo inverso a un 95% de probabilidades de ser cierto. Para obtener el nivel de significacin, se debe restar el nmero que aparece a uno. Por ejemplo, un valor de ".01" significa que existe un 99% (1-.01= .99) de probabilidades de que sea cierto. En este cuadro, es probable que no exista diferencia alguna en la compra de combustible de marca X efectuada por personas del centro y de los suburbios, porque la probabilidad es .795 (es decir, existe slo un 20.5% de probabilidades de que la diferencia sea cierta). Por otro lado, el alto nivel de significacin para las clases de vehculo (.001 o 99.9%) seala que es muy probable que exista una verdadera diferencia en la compra de combustible de marca X efectuada por personas que poseen distintos vehculos en la poblacin sobre la que se realiza la muestra. El Survey System utiliza los niveles de significacin con diversas estadsticas. En todos los casos, el valor p indica la probabilidad de que algo no sea cierto. Si una prueba de ji cuadrado muestra una probabilidad de .04, significa que existe un 96% (1-.04=.96) de probabilidades de que las respuestas proporcionadas por los distintos grupos de un cruce sean diferentes. Si una prueba de la T muestra una probabilidad de .07, significa que existe un 93% de probabilidades de que, si se observara la poblacin entera, los dos promedios comparados seran verdaderamente distintos. Cuando se analizan niveles de significacin, se suele pensar que un nivel del 95% es sagrado. Si una prueba revela una probabilidad de .06, significa que tiene un 94% de probabilidades de ser cierta. No se puede tener la misma seguridad si presenta una probabilidad del 95% de ser cierta, pero lo ms posible es que lo sea. El nivel del 95% proviene de publicaciones acadmicas, en donde, por lo general, una teora debe tener al menos un 95% de probabilidades de ser cierta para que sea lo suficientemente confiable como para comunicarla. En el mundo de los negocios, si algo tiene un 90% de probabilidades de ser cierto (probabilidad = .1), no se puede considerar comprobado, pero es muy probable que sea mejor actuar como si fuera cierto que como si fuera falso.

Si se realizan muchas pruebas, los resultados falsamente significativos representan un problema. Esto se debe a que un 95% de probabilidades de que algo sea cierto significa que existe un 5% de probabilidades de que sea falso. Es decir: de cada 100 pruebas que presentan resultados significativos al nivel del 95%, las probabilidades son que cinco arrojen resultados falsamente significativos. Si se tomara un conjunto aleatorio de datos sin sentido y se efectuaran 100 pruebas de significacin, las probabilidades seran que cinco de ellas arrojaran resultados falsamente negativos. Como se puede observar, cuantas ms pruebas se efectan, mayor problema implican los positivos falsos. No hay manera de saber cules son los resultados falsos: simplemente se sabe que estn presentes. Una manera de atenuar el problema consiste en restringir la cantidad de pruebas a un grupo pequeo escogido antes de recopilar los datos Si esto no resulta prctico, existen otras maneras de resolver este problema. El mejor mtodo desde un punto de vista estadstico consiste en repetir el estudio y observar si se obtienen los mismos resultados. Si algo resulta estadsticamente significativo en dos estudios distintos, es probable que sea cierto. En la vida real, no suele resultar prctico repetir un estudio, pero se puede recurrir a la tcnica de "mitades partidas", que implica dividir la muestra aleatoriamente en dos mitades y efectuar las pruebas en cada una. Si algo resulta significativo en ambas mitades, es probable que sea cierto. El problema esencial de esta tcnica es que cuando se parte el tamao de una muestra, la diferencia tiene que ser ms grande para ser estadsticamente significativa. El ltimo error frecuente tambin es importante. La mayora de las pruebas de significacin presuponen que se dispone de una muestra completamente aleatoria. Si la muestra no lo es, una prueba de significacin puede exagerar la precisin de los resultados, porque slo tiene en cuenta el error aleatorio. La prueba no puede tener en cuenta mrgenes de error que provengan de errores no aleatorios (por ejemplo, una muestra mal seleccionada). En resumen: En cuestiones de estadstica, "significativo" no necesariamente significa importante. Los valores de probabilidad se deben leer de manera inversa (1 - p). Demasiadas pruebas de significacin pueden dar lugar a relaciones falsamente significativas. Para que no exista margen de error, se deber verificar el procedimiento de seleccin de muestras.

Seccin dos: el significado exacto de los valores de significacin estadstica


En la explicacin anterior, se recomienda leer los valores de probabilidades de manera inversa (1 - p). Por lo general, esto llevar a tomar una decisin correcta; pero, desde el punto de vista tcnico, es una simplificacin excesiva. A continuacin, se presenta una explicacin ms compleja y ms correcta desde el campo tcnico. Desafortunadamente, los valores de significacin estadstica no revelan directamente lo que se desea saber. Indican las probabilidades de obtener diferencias entre los grupos de nuestra muestra, que son tan o ms grandes que los que observamos, si no existieran diferencias entre los grupos correspondientes en la poblacin representada por nuestra muestra. En otras palabras, estos valores nos indican las probabilidades de nuestros datos, bajo la presuncin de que no existen diferencias en la poblacin. Lo que se desea saber son las probabilidades de que existan diferencias en la poblacin, de acuerdo con nuestros datos. Lgicamente, si existen suficientes probabilidades como para no encontrar una diferencia en nuestra muestra, en caso de que no hubiera diferencia en la poblacin, entonces es probable que exista una diferencia en la poblacin. Se utiliz esta lgica en la primera seccin de este artculo cuando se seal que se pueden interpretar los valores de significacin al considerar 1-p como la probabilidad de que exista una diferencia en la poblacin (donde p es el nmero de significacin generado por el programa). Por ejemplo, si el nivel de significacin es .05, entonces se puede considerar que es posible una diferencia en la poblacin del 95% (1-.05). Si bien esta lgica resulta obvia para el sentido comn, las matemticas detrs de esta significacin estadstica no garantizan que 1-p arroje la probabilidad exacta de que exista una diferencia en la poblacin. De todos modos, muchos investigadores toman 1-p como esa probabilidad por dos motivos. Por un lado, porque no se ha inventado una medida mejor para fines generales. Por otro lado, porque al utilizar este clculo se obtendr, por lo general, una interpretacin til

de los valores de significacin estadstica. En algunos campos de investigacin que no implican encuestas, la posibilidad de que 1-p no sea la probabilidad exacta de que exista una diferencia en la poblacin puede ser ms importante. En estos campos, el uso de los valores de significacin estadstica puede resultar controversial.

S-ar putea să vă placă și