Documente Academic
Documente Profesional
Documente Cultură
Selección de lecturas
Didáctica de la Estocástica – 577 3
Selección de lecturas
Didáctica de la Estocástica – 577 4
mediante leyes probabilísticas. Las leyes que se utilizan para explicar estos fenómenos serían
mucho más complicadas si, en lugar de emplear la hipótesis de que las partículas se mueven
aleatoriamente, se supusiera que siguen una cierta ecuación de tipo determinista. Por ello, en-
tre los fenómenos de los cuales ignoramos sus leyes, Poincaré diferencia los aleatorios o for-
tuitos, sobre los cuales el cálculo de probabilidades nos informará provisionalmente y los que
no lo son, sobre los cuales no hay esta posibilidad de predicción hasta que hayamos encontra-
do las leyes que los rigen.
Para los primeros, incluso el día que encontremos sus reglas, el cálculo de probabilidades no
perderá su validez. Así, el director de una compañía de seguros de vida ignora cuándo morirá
un asegurado particular. Sin embargo, sus beneficios seguirán siendo los mismos, incluso
cuando conociese el tiempo de vida que queda a cada uno de estos asegurados, porque la dis-
tribución estadística de esta población sería la misma, independientemente de este conoci-
miento; por tanto, estos beneficios no son fruto de su ignorancia. Como indica Ayer (1974) un
fenómeno se considera aleatorio si se comporta de acuerdo al cálculo de probabilidades. Una
causa muy pequeña determina, a veces, un efecto considerable y decimos que el resultado es
aleatorio porque la predicción resulta imposible. Es el caso de la meteorología o del juego de
la ruleta. En otros casos, como en la teoría cinética de los gases, al barajar las cartas o en la
teoría de errores, es la complejidad o multitud de las causas lo que determina un resultado
aleatorio.
ALEATORIEDAD Y PROBABILIDAD
Al surgir el cálculo de probabilidades se relaciona la aleatoriedad con la equiprobabilidad, que
se basa en el principio de indiferencia. Esto es debido a la relación de los primeros desarrollos
teóricos con los juegos de azar, en los que el número de posibilidades era finito y el principio
de indiferencia podía considerarse razonable. Esta interpretación se encuentra, por ejemplo, en
el Liber de Ludo Aleae de Cardano. Bennett (l993) indica que, hacia el final del siglo XVIII y
principios del XIX, hay un desplazamiento de las situaciones consideradas aleatorias, desde el
mundo de los juegos de azar al de los fenómenos naturales. Paralelamente, se produce un
cambio en el concepto de aleatoriedad, que se hace progresivamente más formalizado. Se in-
troduce el concepto de "independencia", que se considera un requisito imprescindible para
asegurar la aleatoriedad de un suceso en sucesivos experimentos repetidos. Sin embargo, el
resultado de un experimento aleatorio es para estos autores determinado pero desconocido,
dependiente de la ignorancia del hombre.
También actualmente la noción de aleatoriedad se explica, a veces, en términos de probabili-
dades y esta explicación dependerá de la concepción subyacente respecto a la probabilidad. En
un concepto clásico de probabilidad decimos que un objeto (o un suceso) es un miembro alea-
torio de una cierta clase, si la probabilidad de este objeto es igual que la de cualquier otro
miembro de su clase. Aunque esta definición, en principio, es suficiente para los juegos de
azar basados en dados, monedas, cartas, extracción de bolas en urnas, etc., podemos aplicarle
las mismas críticas que se atribuyen a la concepción laplaciana de la probabilidad. Es difícil, a
partir de esta definición, discriminar un miembro aleatorio o no aleatorio en una clase dada.
Por ejemplo, ¿cómo sabemos que una moneda dada o un dado, no están ligeramente sesgados?
Kyburg (1975) sugiere que este método de definir la aleatoriedad impone restricciones severas
y no naturales a la aplicación de esta idea. Sólo podríamos decir que un objeto es un miembro
aleatorio de una clase, si la clase es finita. Si fuese infinita, entonces la probabilidad de cada
Selección de lecturas
Didáctica de la Estocástica – 577 5
miembro de la clase siempre sería nula (por tanto idéntica), aunque el método de selección
fuese sesgado. ¿Qué ocurriría, además, en el caso de sucesos elementales no equiprobables?
Sin embargo, la idea de equiprobabilidad es muy atrayente para definir la aleatoriedad, como
se ve, por ejemplo, al definir las muestras aleatorias -todos los elementos tienen la misma pro-
babilidad de ser elegidos- o la asignación aleatoria de sujetos a los experimentos -cada sujeto
tiene la misma probabilidad de ser asignado al grupo experimental o al control-.
Cuando desplazamos la aplicación de la idea de probabilidad a situaciones del mundo físico o
natural, como por ejemplo, el grupo sanguíneo de un recién nacido o cualquier o otra carac-
terística hereditaria, nos encontramos con que no podemos aplicar el principio de equiprobabi-
lidad. Podríamos decir, en estos casos, que un objeto es un miembro aleatorio de una clase si
pudiéramos elegirlo mediante un método que proporcionase a cada miembro de la clase una
cierta frecuencia relativa "a priori" a la larga. Usaríamos, en estos casos, la concepción fre-
cuencial, que es especialmente adecuada cuando disponemos de estadísticas registradas sobre
un gran número de casos, como en los ejemplos citados. Tendríamos, sin embargo, el proble-
ma teórico de decidir el número necesario de experimentos para considerar que, a partir de
este número, habríamos probado suficientemente el carácter aleatorio del objeto.
En estas dos acepciones la aleatoriedad es una propiedad "objetiva" que se asigna al suceso o
elemento de una clase, como podría asignársele un color o un sexo, si se trata de una persona.
Kyburg (1 974) crítica esta visión y propone una interpretación de la aleatoriedad compuesta
de cuatro términos, que son los siguientes:
• el objeto que se supone es miembro aleatorio de una clase;
• el conjunto del cual el objeto es un miembro aleatorio (población o colectivo);
• la propiedad con respecto a la cual el objeto es un miembro aleatorio de la clase dada;
• el conocimiento de la persona que emite el juicio de aleatoriedad.
Si un objeto es o no considerado como miembro aleatorio de una clase, depende, en esta inter-
pretación, de nuestro conocimiento sobre el mismo. Lo que puede ser aleatorio para una per-
sona puede no serlo para otra. La aleatoriedad no es una propiedad física "objetiva", sino que
tiene un carácter subjetivo. Reconocemos en esta definición el paralelismo con la concepción
subjetiva de la probabilidad, por la que todas las probabilidades serían condicionales. Esta
visión sería más adecuada en las situaciones en que poseemos cierta información que puede
cambiar nuestro juicio sobre la aleatoriedad o la probabilidad de un suceso.
Para Kyburg hay cierta clase de situaciones que todo el mundo consideraría aleatorias y donde
el uso de la idea de equiprobabilidad para definir un suceso aleatorio parece claro y no contro-
vertido. Por ejemplo, en el caso de un dado equilibrado, cualquier lanzamiento es simplemente
un ejemplo de cualquier otro posible lanzamiento. No hay nada nuevo que podamos conocer
acerca del dado que nos permita predecir otra probabilidad diferente de l/6 para un resultado
particular del dado.
En otros casos la situación no es tan clara. Consideremos, por ejemplo, la probabilidad de que
un individuo particular viva más de 35 años. Es verdad que poseemos información estadística
sobre sus posibilidades de supervivencia a esta edad, pero hay muchas consideraciones que
podrían influenciar un cambio en esta probabilidad, si tuviésemos que estimarla. Por ejemplo,
el hecho de que el sujeto sufriera cierta enfermedad, como cáncer o ~ sida, o que fuese piloto
de carreras.
Selección de lecturas
Didáctica de la Estocástica – 577 6
Selección de lecturas
Didáctica de la Estocástica – 577 7
tados aleatorios. Es el método que también empleamos en clase con nuestros alumnos, aprove-
chando el interés que muestran por los juegos de azar. Sin embargo, es muy difícil conseguir
construir dispositivos que aseguren la aleatoriedad física perfecta, por ejemplo, asegurar que
un dado asigne exactamente una probabilidad 1/6 a cada una de sus caras. Además, es un pro-
cedimiento lento si queremos obtener una serie larga de resultados aleatorios.
Debido a la dificultad de disponer con suficiente rapidez de secuencias aleatorias largas con
dispositivos físicos, se crean las tablas de números aleatorios. Lord Kelvin y Típpet se encuen-
tran entre los pioneros en la construcción de las mismas. Otras tablas notables son las de Fis-
her y Yates publicadas en 1 938, o las de Kendall y Babbington- Smith, en 1 939, culminando
en la publicación de la corporación RAND "Un millón de dígitos aleatorios" en 1955. Este
tipo de tablas puede también ser usado en clase con los alumnos de educación secundaria.
El tercer método importante para generar números aleatorios consiste en el uso de una fórmu-
la, es decir, mediante los llamados "números pseudoaleatorios". Con ayuda de un algoritmo de
ordenador, se produce una secuencia numérica que puede ser empleada como aleatoria para
los propósitos prácticos. La mayor parte de los ordenadores traen incorporadas este tipo de
órdenes, con lo que podemos cómodamente obtener sucesiones aleatorias dentro de una mag-
nitud numérica y longitud deseada. Asimismo, podemos obtener sucesiones aleatorias extraí-
das de distintos tipos de distribución teórica, como la distribución normal con una cierta media
y varianza.
FORMALIZACIÓN DE LA IDEA DE ALEATORIEDAD
Con las tablas de números aleatorios surgió la preocupación de asegurar la "calidad" de los
mismos. La obtención de números pseudoaleatorios con ayuda de algoritmos deterministas
sugirió también que debía examinarse la sucesión producida, independientemente del proceso
por el cual había sido generada. En el siglo XX se llevan a cabo estas discusiones, que llevar-
ían a la formalización del concepto.
Fine (1973) discute algunas de las aproximaciones que se han usado para definir lo que sería
una sucesión aleatoria. La reflexión sobre este tema partió de la idea intuitiva de que una suce-
sión debería ser considerada como aleatoria si nos llevara al convencimiento de que es impo-
sible inventar un método que nos permita ganar en un juego de azar cuyos resultados fuesen
los de la sucesión dada; o bien de la visión de la sucesión aleatoria como altamente irregular o
compleja. A continuación presentamos estos dos enfoques:
Enfoque de los algoritmos de selección
Von Mises introdujo la idea de colectivo, como fenómeno de masas, suceso repetitivo o larga
serie de observaciones, para las cuales hay razones suficientes para creer en la hipótesis de que
la frecuencia relativa de un suceso tiende a un límite fijo. A partir de esta idea, definió la alea-
toriedad en una secuencia de observaciones proponiendo una propiedad para todas sus posi-
bles subsucesiones. Esta propiedad consiste en exigir que la frecuencia relativa de cada posible
suceso en la sucesión aleatoria sea invariante en todas sus posibles subsucesiones. Dicho de
otra forma, en una secuencia aleatoria no puedo encontrar un algoritmo por el cual seleccionar
una subsecuencia en la cual la frecuencia relativa de uno de los resultados se vea afectada.
Supongamos, por ejemplo, que al elegir todos los elementos pares, o cada diez elementos, o
todos los elementos primos en una sucesión de caras y cruces obtenidas al lanzar una moneda
obtuviese una secuencia en la que la probabilidad de cara fuese 2/3. Consideraría, entonces,
Selección de lecturas
Didáctica de la Estocástica – 577 8
que la secuencia dada no era realmente aleatoria, ya que podría obtener ventaja en un juego de
azar apostando a favor de la cara cada dos, diez jugadas o en las jugadas número primo.
Esta definición de aleatoriedad es la base de los contrastes por los cuales se prueban las tablas
de números aleatorios, antes de ponerlas en uso en la comunidad científica. Los algoritmos
que se usan tratan de detectar las posibles regularidades de la sucesión; (propiedades que pu-
diesen emplearse para obtener ventajas por parte de un jugador en un juego de azar). Sin em-
bargo, puesto que todo contraste de hipótesis siempre lleva asociado una posible probabilidad
de error, nunca podríamos tener total seguridad de que una sucesión dada, a pesar de haber
pasado todas las pruebas, tuviese algún tipo de patrón que nos hubiera pasado desapercibido y,
por tanto, no fuese totalmente aleatoria.
Enfoque de la complejidad absoluta
Otro intento, debido a Kolmogorov, de definir la aleatoriedad de una sucesión se basa en su
complejidad computacional, que puede definirse a partir de la teoría de autómatas y conmuta-
bilidad. La complejidad de una sucesión es la dificultad de describirla (o almacenarla en un
ordenador) mediante un código que nos permita reconstruirla más tarde. El mínimo número de
signos necesarios para codificar esta sucesión proporciona una escala para medir la dificultad
de almacenarla, o, lo que es lo mismo, su complejidad. En general, puede haber más de un
programa para la misma sucesión. La complejidad debe ser juzgada a partir de la forma más
simple de almacenar la sucesión. Por ejemplo, si comparamos las secuencias:
CC++C+CC++
C+C+C+C+C+
vemos que puedo codificar más abreviadamente la primera como CC+2+CC++, mientras que
la segunda la podríamos codificar como 4C+. Por lo tanto la primera sucesión es más compleja
que la segunda, ya que precisa más signos para codificarse. Bajo este enfoque, una secuencia
sería aleatoria si no se puede codificar en forma más abreviada, por lo que la ausencia de pa-
trones periódicos sería su característica esencial. Es decir, una secuencia sería aleatoria si sólo
podemos describirla listando uno tras otros todos sus componentes, Chaitin sugirió que esta
definición establece una jerarquía en los grados de aleatoriedad de diferentes sucesiones y que
la aleatoriedad perfecta sería vista como un concepto teórico o límite.
Como resumen, y siguiendo a Steinbring (1991), podríamos señalar que el concepto de aleato-
riedad se refiere a dos dominios diferentes; formal e informal. Desde el punto de vista infor-
mal, hablamos del azar, como patrón que explica aquellos efectos para los que no conocemos
la causa o que no son predecibles. Se ha usado para tratar relaciones causa efecto que parecen
demasiado complejas para ser analizadas o en las que no hay una relación determinista entre
causa y efecto. Esta interpretación refleja muchos aspectos filosóficos epistemológicos socia-
les y personales, y es una importante fuente de confrontación entre las probabilidades subjeti-
vas y objetivas.
Desde el punto de vista formal (Harten y Steinbring, 1983) el concepto se ha especializado,
siendo la idea central de esta especialización la de sucesión aleatoria o sucesión de resultados
de un mismo experimento realizado repetida e independientemente, cuya matematización
hemos descrito.
Selección de lecturas
Didáctica de la Estocástica – 577 9
Selección de lecturas
Didáctica de la Estocástica – 577 10
Green (1991) describe un estudio longitudinal sobre conceptos de aleatoriedad con escolares
de 7 a 11 años en el que pide a los niños escribir una sucesión aleatoria de caras y cruces que
represente los resultados de lanzar 50 veces una moneda. Identifica tres aspectos básicos en las
sucesiones generadas por los niños: la frecuencia relativa, la independencia y la consistencia.
En primer lugar, se preguntó si los alumnos, en promedio, producen aproximadamente el
mismo número de caras que de cruces. El estudio probó que son muy exactos al reflejar la
equiprobabilidad. Además producen sucesiones cuya primera y última mitad son altamente
consistentes; quizás demasiado consistentes para reflejar la variabilidad aleatoria, sin embargo,
los aspectos de independencia de ensayos no son captados por los niños, quienes producen
series con rachas demasiado cortas de un mismo resultado, respecto a lo que cabe esperar en
un proceso aleatorio.
En Green (1983) incluye, como parte de su test sobre intuición probabilística, una pregunta en
la cual los niños deben discriminar una sucesión cuyo patrón es aleatorio de otra que no cum-
ple esta condición. Las dos sucesiones propuestas simulan el resultado de lanzar 150 veces una
moneda equilibrada. Como resultado descubre que la mayoría de los niños elige precisamente
la secuencia no aleatoria y que no mejora la apreciación de la aleatoriedad con la edad. Entre
las razones aducidas por los niños y niñas para su decisión encontró las siguientes:
a. Razones correctas:
1. El patrón de la sucesión es demasiado regular para ser aleatorio.
2. Demasiadas rachas o rachas demasiado cortas.
b, Razones incorrectas:
1. El patrón de la sucesión aleatoria es demasiado irregular; no se apreciaba suficiente-
mente la irregularidad de una sucesión aleatoria.
2. Se espera que la frecuencia relativa sea exactamente el 50% de caras y cruces o un va-
lor muy próximo; no se admiten fluctuaciones lógicas en esta proporción, es decir, se
aplicaría la heurística de la representatividad (Kahneman y cols., 1 982).
3. Rachas demasiado largas; no se admite la posibilidad de este tipo de rachas en una su-
cesión aleatoria.
Resultados similares se han obtenido en las investigaciones con sujetos adultos en los que se
observa, en general, que no se reconoce suficientemente la irregularidad propia de las sucesio-
nes aleatorias. Respecto a los experimentos aleatorios Konold y cols. (1991) caracterizan las
concepciones de los sujetos en la siguientes categorías:
• Sujetos para los que un experimento es aleatorio sólo si los posibles resultados son
igualmente probables; si las probabilidades de los sucesos implicados son muy diferen-
tes -como el caso de que llueva un día para el que se predice un 80% de posibilidades
de lluvia- no sería considerado aleatorio.
• Aleatoriedad como contrapuesta a la causalidad, o como un tipo especial de causa.
• Aleatoriedad como incertidumbre; existencia de múltiples posibilidades en las mismas
condiciones.
• Aleatoriedad como modelo para representar ciertos fenómenos, dependiente de nuestra
información sobre el mismo.
Selección de lecturas
Didáctica de la Estocástica – 577 11
Selección de lecturas
Didáctica de la Estocástica – 577 12
Esperamos que, a partir de estas experiencias, los alumnos adquieran las siguientes caracterís-
ticas esenciales de los fenómenos aleatorios:
1. En condiciones fijadas de antemano hay más de un resultado posible.
2. Con los conocimientos que posee el sujeto que emite el juicio, el resultado concreto
que ocurrirá es impredecible.
3. Hay posibilidad- al menos imaginada- de repetir indefinidamente la observación o pro-
ducción del fenómeno.
4. Las secuencias de resultados obtenidas en esta repetición carecen de un patrón que el
sujeto pueda controlar o predecir.
5. En este aparente desorden, pueden descubrirse una multitud de regularidades globales,
comenzando por la estabilización de las frecuencias relativas de cada uno de los resul-
tados posibles. Esta regularidad global es el fundamento que nos permite estudio de es-
tos fenómenos aleatorios mediante el cálculo de probabilidades.
Como argumentan Konold y cols. (1991), de hecho, es preferible ver el término "aleatoriedad"
como una etiqueta a la que van asociados muchos conceptos, como 1os de experimento, suce-
so, espacio muestral, probabilidad, etc. En este sentido, la palabra aleatoriedad nos remite a
una colección de conceptos y procedimientos matemáticos que podemos aplicar en muchas
situaciones. Por ello, deberíamos pensar en una orientación que tomamos hacia el fenómeno
que calificamos de "aleatorio" más que en una cualidad del mismo. Aplicamos un modelo ma-
temático a la situación, porque nos resulta útil para describirla y comprenderla pero no cree-
mos que la situación sea idéntica al modelo. Decidir cuándo el cálculo de probabilidades es
más conveniente o adecuado a la situación que otros modelos matemáticos es una parte del
trabajo de modelización que debiera fomentar en nuestros alumnos y alumnas.
Nota: Este trabajo ha sido realizado en el marco del Proyecto PS93-0196 de la DGICYT
(MEC, Madrid).
Referencias bibliográficas
AYER, A J. (1974). El Azar. En Kline, M. (Ed.), Matemáticas en el mundo moderno. Barcelona: Blu-
me,172-181.
BENNETT, D. (1993). The development of the mathematical concept of randomness; educational im-
plications. Tesis doctoral. New York University. (DAI n. 931 7657).
FALK, R. (1981) The perception of randomness. En Proceedings of the V PME Conference. Grenoble,
222-229.
FINE, T. L (1973). Theories of Probabiliry: An examinarion of foundations. New York: Academic
Press.
FISCHBEIN, E. y GAZIT, A (1984). Does the teaching of probability improve probabilistic intuitions?
Educational Studies in Mathematics, 15 (1), 1 -24.
FISCHBEIN, E., SAINATI NELLO, M. y SCIOLIS MARINO, M. (1991). Factors affecting probabi-
listic judgements in children and adolescents. En Educational Studies in Mathematics, 22, 523-249.
GODINO, J.D., BATANERO, C. y CAÑIZARES, M. J. (1987). Azar y probabilidad Fundamentos
didácticos y propuestas curriculares. Madrid: Síntesis.
GODINO, J. D. y BATANERO, C. (1994). Significado institucional y personal de los objetos matemá-
ticos. Recherches en Didactique des Mathematiques, 14 (3), 325-355.
Selección de lecturas
Didáctica de la Estocástica – 577 13
GREEN, D. R (1983). A Survey of probabilistic concepts in 3.000 pupils aged 11 -16 years. En D. R.
Grey et al. (Eds.), Proceedings of the ICOTS 1 University of Sheffield, 2, 766-783.
GREEN, D. R. (1989) Schools pupils’s understanding of randomness. En R Morris (Ed.), Studies in
Mathematics Education. Unesco, 7, 27-39.
GREEN, D. R. (1991) A longitudinal study of pupil’s probabilty concepts. Universidad de Loughbo-
rough.
HARTEN, G. y STEINBRING, H. (1983). Randomness and stochastic independence. On the rela-
tionship between intuitive and mathematical definition. En R W. Scholz (Ed.), Decision making un-
der uncertainty. Amsterdam, 363-373.
HOEMANN, H. y ROSS, B. M. (1982) Children’s concepts of chance and probability. En Brainerd
(Ed.), Children's logical and mathematical cognition. Springer.
KAHNEMAN, D., SLOVIC, P. y TVERSKY, A (1982). Judgement under uncertainty: heuristics and
biases. Cambridge University Press.
KONOLD, C., LOHMEIER, J., POLLATSEK, A. y WELL, A. (1991). Novices views on randomness.
Comunicación presentada en el XIII PME Conference.
MATALÓN, B. (1979) Epistemología de las Probabilidades. En J. Piaget (Ed.), Epistemología de la
Matemática. Buenos Aires: Paidós, 121 -145.
KYBURG, H. (1974) The logical foundations of statistical inference. Boston: Reidel.
PIAGET, J. e INHELDER, B. (1974) La genése de l’idée de hasard chez l’enfant Paris: Presses Uni-
versitaires de France.
POINCARE, H. (1936) El Azar. Artículo publicado originalmente en lengua inglesa en Journal of the
Atnerican Statistical Association, 31, 10-30. Recogido en J. Newman (Ed.), Sigma. El mundo de las
Matemáticas, 3, 68-82.
SCHOLZ, R. W. (1991). Psychological research in probabilistic understanding. En R. Kapadia y M.
Borovníck (Eds.), Chance Encounters: Probability in Education. Dordrecht: Kluwer Academic Pu-
blishers, 213-249.
SHAUGHNESSY, J. M. (1992) Research ín Probabílity and Statistics: reflections and directions. En D.
A. Grows (Ed.), Handbook of research en mathematics teaching and learning New York: Mac Mi-
llan, 465-494.
SHAUGHNESSY, J.M. y ARCIDIACONO, M. (1 993) Visual encounters with chance. Math and the
Mind’s Eye Volume VIII. The Math Learning Center.
STEINBRING, H. (1991) The concept of chance in everyday teaching. Aspects of a social epistemolo-
gy of mathematical knowledge. En Educational Studies in Mathematics 22, 503-522.
ZABELL, S. L (1 992) Randomness and statistical applications. En F. Gordon and S. Gordon (Eds,),
Statistics for the XX1 Century. The Mathematical Association of America.
Selección de lecturas
SIGNIFICADO Y COMPRENSIÓN DE LAS MEDIDAS DE
POSICIÓN CENTRAL
Carmen Batanero
UNO, 2000, 25, 41-58
Resumen
Los nuevos diseños curriculares incorporan la enseñanza de la estadística en la escuela pri-
maria y secundaria enfatizando el enfoque exploratorio y el trabajo de los alumnos con pro-
yectos interdisciplinares abiertos. Para afrontar con éxito esta propuesta, el profesor debe ser
consciente de la complejidad de los conceptos estadísticos, incluso los "elementales" cuyo
significado debe construirse progresivamente. Como ejemplo, analizamos los componentes
del significado de las medidas de posición central y describimos las dificultades en su com-
prensión, que, respecto a estos componentes se han puesto de manifiesto en las investigacio-
nes en educación estadística.
1 Introducción
En la actualidad la estadística se ha incorporado, de forma generalizada, al currículo de ma-
temáticas de la enseñanza primaria y secundaria, debido al uso frecuente de datos y conceptos
estadísticos en la vida cotidiana, así como en otras disciplinas que debe cursar el alumno, a la
necesidad de un conocimiento básico de estadística en muchas profesiones y a su papel en el
desarrollo de un razonamiento crítico. El reconocimiento de estas razones y la consecuente
incorporación de la estadística al currículo escolar se debe, en gran medida, al trabajo desarro-
llado desde el ISI (International Statistical Institute), primero por el Comité de Educación y
desde 1991 por IASE, la International Association for Statistical Education, que a lo largo de
tres décadas han promovido congresos y publicaciones específicas orientadas a la introducción
de la estadística en la escuela (Batanero, 2000).
Ayudar a los niños y jóvenes a comprender progresivamente las ideas estocásticas fundamen-
tales no es una tarea sencilla, puesto que es necesario adaptar estas ideas a sus capacidades
cognitivas y diseñar situaciones didácticas que propicien el aprendizaje significativo. La es-
tadística es enseñada, tradicionalmente, como parte de la asignatura de matemáticas por el
profesor de esta materia. Nos encontramos con la paradoja de pedir a estos profesores que im-
partan un nuevo contenido, para el que no todos han tenido una formación didáctica específi-
ca, porque la didáctica de la estadística no está aún suficientemente desarrollada. Mientras que
la estadística como ciencia, está en un periodo de notable expansión, el número de investiga-
ciones sobre la enseñanza de la estadística es aún escaso, y sólo estamos comenzando a cono-
cer las principales dificultades de los alumnos en los conceptos más importantes. Es también
preciso experimentar y evaluar métodos de enseñanza adaptados a la naturaleza específica de
la estadística, a la que no siempre se pueden transferir los principios generales de la enseñanza
de las matemáticas.
Un problema particular es que la investigación sobre educación estadística se está llevando a
cabo en áreas muy diversas (estadística, psicología, educación matemática y profesores de
estadística en diferentes áreas de conocimiento), con diferentes tipos de alumnos, metodología
y marcos teóricos. Es preciso, por tanto, realizar una labor de síntesis de estos trabajos, y de
posterior difusión entre los profesores, que son los que tienen finalmente la posibilidad y res-
Didáctica de la Estocástica – 577 2
Selección de lecturas
Didáctica de la Estocástica – 577 3
Selección de lecturas
Didáctica de la Estocástica – 577 4
Selección de lecturas
Didáctica de la Estocástica – 577 5
e. El valor obtenido de la media de números enteros puede ser una fracción, que
no tenga sentido en el contexto de los datos;
f. Hay que tener en cuenta los valores nulos en el cálculo de la media;
g. El valor medio es representativo de los valores promediados.
• Elementos validativos: Las demostraciones que empleamos para probar las propieda-
des del concepto y que llegan a formar parte de su significado y los argumentos que
empleamos para mostrar a otras personas la solución de los problemas.
3. Dimensiones institucional y personal del conocimiento
En general los problemas no aparecen de forma aislada, sino que los mismos problemas son
compartidos dentro de cada institución, y las soluciones encontradas dependen de los instru-
mentos y prácticas sociales disponibles. Así, problemas similares a P1 de estimación de una
cantidad desconocida son compartidos en instituciones de investigación experimental, como la
astronomía o la agronomía y también en las instituciones escolares, pero los instrumentos dis-
ponibles son muy diferentes en uno y otro caso, de modo que el significado de un concepto
matemático, entendido de una forma sistémica, como hemos descrito, varía según la institu-
ción considerada.
Los matemáticos y estadísticos profesionales constituyen una institución interesada en resolver
problemas de promedios, pero existen otras instituciones diferentes que también podrían estar
interesadas en la media, aunque podría atribuirle un significado más restringido al que recibe
dentro de la matemática, por ejemplo:
(I1) En la escuela primaria los curricula proponen que se enseñe a los alumnos:
- la definición de la media, mediana y moda en el caso más simple, empleando una no-
tación sencilla (se evita el sumatorio y la ponderación);
- algunos ejemplos de aplicación, limitando el cálculo de las medidas de tendencia cen-
tral a conjuntos sencillos de datos, y haciéndolo manualmente o con calculadora.
- discriminación respecto de otras medidas de tendencia central (mediana, moda).
(I2) En la escuela secundaria (y en la universidad) se amplia la definición de la media, tra-
bajándose primero con medias ponderadas y luego con medias de variables aleatorias discretas
y continuas. Se enuncian y demuestran algunas propiedades de los promedios y se presentan
aplicaciones a situaciones problemáticas más realistas y complejas. Por ejemplo, en la univer-
sidad se introduce la noción de media o esperanza matemática de una distribución de probabi-
lidad y se muestra que la media es un parámetro que define algunas distribuciones de probabi-
lidad, como la normal; al iniciar el estudio de la inferencia, distinguimos varias medias: media
de la muestra, media de la población, media de la media muestral en todas las muestras de
tamaño dado.
(I3) En la "vida diaria" encontramos la media en los medios de comunicación y el trabajo pro-
fesional, por ejemplo, cuando analizamos los números índices de la evolución de la bolsa, pre-
cios, producción, empleo y otros indicadores económicos.
Por otro lado, el conocimiento sobre cada objeto matemático (como la media) no ha sido
siempre igual al actual, sino que se ha desarrollado lentamente a lo largo del tiempo, ya que a
medida que se han ido resolviendo problemas progresivamente diferentes y más complejos, el
Selección de lecturas
Didáctica de la Estocástica – 577 6
Selección de lecturas
Didáctica de la Estocástica – 577 7
y palabras con que lo denotamos y en general todas sus representaciones (elementos ostensi-
vos), habilidad operatoria en los diferentes algoritmos y procedimientos relacionados con el
concepto (elementos actuativos) y capacidad de argumentar y justificar propiedades, relacio-
nes y soluciones de problemas (elementos validativos). A continuación describimos los resul-
tados de investigaciones que han resaltado dificultades en cada unos de estos puntos en rela-
ción a las medidas de tendencia central.
Elementos actuativos
El cálculo de la media parece sencillo. Sin embargo Pollatsek, Lima y Well (1981) encontra-
ron que incluso alumnos universitarios no ponderan adecuadamente los valores al resolver el
problema P5 y en ocasiones usan la media simple, en lugar de la media ponderada. Li y Shen
(1992) indican que cuando se pide a los estudiantes calcular la media a partir de una tabla de
frecuencias donde los datos se agrupan en intervalos, los estudiantes olvidan con frecuencia
que cada uno de estos grupos debe ponderarse de modo distinto al calcular la media.
En otros casos el algoritmo se aplica de forma mecánica sin comprender su significado. Cai
(1995) encontró que mientras la mayoría de alumnos de 12-13 años en su investigación eran
capaces de aplicar adecuadamente el algoritmo para calcular la media, sólo algunos alumnos
eran capaces de determinar un valor desconocido en un conjunto pequeño de datos para obte-
ner un valor medio dado. Incluso encontrando el valor desconocido, fueron pocos los que lo
hicieron a partir de un uso comprensivo del algoritmo, multiplicando el valor medio por el
número de valores para hallar la suma total y de ahí el valor faltante, sino que la mayoría sim-
plemente usó el ensayo y error.
Otros errores de cálculo en media, mediana y moda descritos por Carvalho (1998) al analizar
las producciones escritas de los alumnos al resolver tareas estadísticas son los siguientes:
• Moda: Tomar la mayor frecuencia absoluta;
• Mediana: No ordenar los datos, para calcular la mediana; calcular el dato central de las
frecuencias absolutas ordenadas de forma creciente; calcular la moda en vez de la me-
diana; equivocarse al calcular el valor central;
• Media: Hallar la media de los valores de las frecuencias; no tener en cuenta la frecuen-
cia absoluta de cada valor en el cálculo de la media.
En realidad, el cálculo de la mediana es complejo, porque el algoritmo de cálculo es diferente,
según tengamos un número par o impar de datos, y según los datos se presenten en tablas de
valores agrupados o sin agrupar (Cobo y Batanero, en prensa) y también el valor obtenido es
diferente, según se aplique uno u otro algoritmo. Esto puede resultar difícil para los alumnos
que están acostumbrados a un único método de cálculo y una única solución para los proble-
mas matemáticos.
Gattuso y Mary (1998) analizan la evolución de la comprensión del algoritmo de cálculo de la
media ponderada de los alumnos durante la enseñanza secundaria, usando problemas con dife-
rentes contextos y forma de representación. Las tareas presentadas fueron: cálculo de medias
ponderadas, efecto que el cambio de un dato produce sobre la media y hallar un valor faltante
en un conjunto de datos para obtener un promedio dado. Identifican las siguientes variables
didácticas que afectan a la dificultad de las tareas: formato (tabla, serie de números, gráfico),
si los valores de las variables son o no mucho mayores que los de las frecuencias (lo que in-
fluye en que el niño discrimine los dos conceptos); si una de las frecuencias es mucho mayor
Selección de lecturas
Didáctica de la Estocástica – 577 8
que las otras (de modo que se fuerce al niño a tener en cuenta las frecuencias). Observaron el
efecto de estas variables y también la mejora con la instrucción, aunque no fue muy persistente
en el tiempo.
Elementos intensivos
Cuando los alumnos comienzan a estudiar la media, mediana y moda por primera vez ya co-
nocen ciertas operaciones aritméticas como la suma y multiplicación, e inconscientemente
aplican a la operación de "promediar" algunas propiedades de las anteriores operaciones que
no se cumplen en el caso de los promedios. Mevarech (1983) observa que incluso los estudian-
tes universitarios piensan que la media tiene la propiedad asociativa y cuando tienen que hallar
la media de un conjunto grande de números, lo dividen en partes hallando primero la media de
cada parte y luego promediando el resultado obtenido. Podemos comprobar que esta propie-
dad, en general, no es cierta, si hallamos primero la media de tres números diferentes y luego
promediamos los dos primeros y hacemos la media del valor obtenido con el último elemento.
En otros casos no se tiene en cuenta el cero en el cálculo de la media, como si fuese un ele-
mento neutro o bien se piensa que la media debe ser un elemento del mismo conjunto numéri-
co del que se toman los datos.
Strauss y Bichler (1988) analizan la comprensión de los niños de 8 a 14 años de las propieda-
des a) a e) que hemos listado al describir los elementos intensivos en el punto 2. Aunque una
proporción importante de niños parecieron usar espontáneamente estas propiedades, algunos
niños no tenían en cuenta el cero para calcular la media, o bien suponían que la media podría
estar fuera del rango de variación de la variable, o que debería coincidir con uno de los valores
de los datos.
León y Zawojeski (1991) realizan entrevistas a niños entre 8 y 14 años y analizan el efecto de
la edad sobre la comprensión de estas propiedades. Además de encontrar una importante in-
fluencia de la edad sobre la comprensión de la media, también observaron que la contextuali-
zación de las tareas facilita mucho su resolución. Sin embargo, propiedades tales como que la
suma de desviaciones respecto a la media es cero, que la media es un valor representativo de
los valores promediados o que hay que tener en cuenta los valores nulos en el cálculo de la
media continuaron siendo demasiado abstractas para una proporción importante de alumnos de
14 años.
La idea de representante de un conjunto de datos es importante en las aplicaciones prácticas,
por ejemplo, al comparar dos conjuntos de datos respecto a una misma variable de interés.
Como indican Mokros y Russell (1995) hasta que los niños no conciben el conjunto de datos
como un todo, y no como un agregado de valores, no podrán comprender las ideas de resumen
de los datos o representante de los datos, que se refiere al conjunto global y no a ninguno de
sus valores aislados.
Por otro lado, se tiende a situar la media en el centro del recorrido de la distribución, propie-
dad que es cierta para distribuciones simétricas. Pero cuando la distribución es muy asimétrica
la media se desplaza hacia uno de los extremos y la moda o la mediana serían un valor más
representativo del conjunto de datos. Esto no es siempre comprendido por algunos alumnos
quienes invariablemente eligen la media como mejor representante de los datos sin tener en
cuenta la simetría de la distribución o la existencia de valores atípicos, como hemos observado
en nuestra propia experiencia.
Selección de lecturas
Didáctica de la Estocástica – 577 9
Respecto a la comprensión de la mediana Barr, (1980) indica que los alumnos entienden que la
mediana es el centro de "algo" pero no siempre comprenden a que se refiere ese "algo" porque
no comprenden realmente que una tabla de frecuencia es sólo un resumen de los datos y no
son capaces de pasar de la tabla a la lista de valores que es una representación alternativa de
los datos. Incluso si se les da los datos en forma de lista no entienden por qué hay que ordenar-
los para calcular la mediana, porque no entienden que la mediana es un estadístico que se re-
fiere al conjunto ordenado de datos.
Elementos extensivos
No sirve de nada conocer las definiciones de las medidas de posición central y saber calcular-
las si luego no se reconocen los problemas relacionados con estos conceptos. Pollasek y cols.
(1981) propusieron a sus alumnos el siguiente problema, que es semejante al P4 descrito ante-
riormente:
La media en fluidez verbal de una clase de un colegio es de 400. Si extraemos una muestra aleatoria de 5
estudiantes y resulta que la puntuación de los 4 primeros es de 380, 420, 600, 400. ¿Cuál sería aproxima-
damente la puntuación esperada para el quinto estudiante?
La respuesta correcta a este ítem es 400, el valor esperado en la población. Sin embargo, son
pocos los alumnos que dieron una respuesta correcta al problema, en la investigación citada,
sino que, generalmente se busca un valor de la puntuación del quinto sujeto tal que, sumada a
las cuatro anteriores, dé una media de 400.
Respecto al problema P3 (usar la media como representante de un conjunto de datos), resulta
aún más difícil para los alumnos construir un conjunto de datos que tenga un promedio dado.
Goodchild (1988) proporcionó a los estudiantes cajas de cerillas en las que se había impreso la
frase "contenido medio 35 cerillas" y pidió a sus alumnos construir una distribución hipotética
del contenido de 100 cajas. Lo que más le sorprendió fue que las distribuciones construidas
por los alumnos, no tenían forma acampanada como la distribución normal. Goodchild sugirió
que ello se debe a la falta de comprensión de la media como medida de posición central de la
distribución.
En nuestra investigación (Estepa y Batanero, 1994) con alumnos del curso preuniversitario
hemos observado casos de alumnos que basan la comparación de dos conjuntos de datos en
valores aislados, por ejemplo, en la comparación de los máximos o los mínimos, o bien en la
comparación de totales, o la inspección visual de la distribución global.
Elementos ostensivos y validativos
Los términos matemáticos con que designamos los conceptos tiene un significado preciso,
pero éste no siempre coincide con el asignado al término en el lenguaje coloquial. Russell y
Mokros (1991) clasificaron en cuatro categorías los significados incorrectos atribuidos por los
estudiantes a la palabra "media": valor más frecuente (en realidad esto sería una confusión son
la palabra "moda"), "valor razonable" ( significado coloquial del término), "punto medio"
(confusión con la mediana) y "algoritmo" (es un significado restringido, donde la media se ve
sólo como el algoritmo de cálculo). Watson y Moritz (en prensa), analizan el significado intui-
tivo dado por los niños al término "promedio" y hallan un gran número de niños para los cua-
les el promedio es simplemente un valor en el centro de la distribución (es una idea próxima al
concepto de mediana). Pocas veces se relaciona la palabra "promedio" con la moda y menos
aún con la media aritmética. Las siguientes definiciones de "promedio" fueron obtenidas en
Selección de lecturas
Didáctica de la Estocástica – 577 10
entrevistas a niños realizadas por Watson y Moritz (en prensa): "Significa igual", "que es nor-
mal", "no eres realmente bueno, pero tampoco malo".
Al preguntar que quiere decir que el número medio de niños por familia es 2'3, obtienen res-
puestas correctas y otras como las siguientes: "Que tienen dos niños grandes y otro que no ha
crecido todavía", "que en las familias australianas el número más frecuente de niños es 2'3",
"el '3 es un niño que tiene que crecer para hacerse mayor. Por ejemplo, tiene 3 años ahora y
cuando cumpla 10, contará como 1 y entonces el número promedio de niños será 3". Para el
profesor los enunciados sobre los promedios pueden parecer muy claros, pero estas respuestas
indican la necesidad de poner atención al significado que las palabras y valores numéricos
tienen para los estudiantes en relación a contextos específicos.
Eisenbach (1994) plantea a estudiantes universitarios en un curso introductorio de estadística
el significado de la frase: "¿Qué quiere decir que el salario medio de un empleado es 3.600
dólares?" obteniendo respuestas como "que la mayoría de los empleados gana alrededor de
3.600 dólares", o que "es el salario central; los otros trabajadores ganan más o menos de
3600 dólares", que muestran la confusión terminológica entre las palabras "media", "mediana"
y "moda".
Ya hemos indicado que la idea de promedio no se puede comprender hasta tanto se visualice el
conjunto de datos como un todo y también que la forma de presentación de los datos (tabla,
gráfico, datos sin tabular) incide en la dificultad de las tareas. Reading y Pegg (1996) estu-
diando la forma en que los niños de grados 7 a 12 reducen los conjuntos de datos observaron
que algunos alumnos que eran capaces de dar un resumen de datos presentado en forma numé-
rica, fracasaron en la tarea cuando los datos se presentaban por medio de un gráfico estadísti-
co. También observaron que los niños mostraban dificultad a la hora de dar un argumento o
justificar su respuesta de por qué se elegía un cierto promedio, al plantearles el siguiente pro-
blema, que es, esencialmente una versión simplificada del problema P3.
Como parte de un proyecto los estudiantes de una clase miden cada uno su número de calzado, obtenién-
dose los siguientes datos:
26 26 26 27 27 27 27 28 28 28 28 28 28 29 33
29 29 29 29 30 30 30 30 30 30 30 31 32 32
Si te preguntan cuál sería el mejor número para representar este conjunto de datos, ¿Qué número o
números elegirías? Explícanos por qué has elegido ese(esos) número(s).
En su investigación clasifica a los alumnos en 8 niveles diferentes de respuesta, pero, incluso
los estudiantes de nivel 6 y 7 que son capaces de proporcionar un resumen como la media, son
incapaces de argumentar el por qué de su decisión, más allá de dar la definición del concepto.
Solo una pequeña parte de los estudiantes de su investigación (nivel 8) fueron capaces de justi-
ficar la elección de las medidas de valor central y dispersión relacionándolas con característi-
cas del conjunto de datos.
Por nuestra parte en Estepa y Batanero (1999) hemos encontrado algunos alumnos del curso
preuniversitario que basan sus argumentos en sus teorías previas, en lugar de en los datos al
plantearles problemas similares al P3.
5. Algunas implicaciones para la enseñanza
Este trabajo pone de manifiesto que los conceptos estadísticos, incluso los más sencillos como
la media, mediana y moda tienen un significado complejo y por tanto será necesario un perio-
Selección de lecturas
Didáctica de la Estocástica – 577 11
Selección de lecturas
Didáctica de la Estocástica – 577 12
Selección de lecturas
INTERPRETACIÓN DE ENUNCIADOS DE PROBA-
BILIDAD, EN SU ACEPCIÓN FRECUENCIAL, POR
ESTUDIANTES ESPAÑOLES Y VENEZOLANOS
Audy Salcedo, Universidad Nacional Abierta
tener debido a su intuición probabilísti- lidad. Todo parece indicar que en situa-
ca. ciones probabilísticas, las personas usan
Se podría suponer, que si los do- las mismas estrategias o heurísticas que
centes venezolanos atienden las suge- aplican para situaciones no probabilísti-
rencias presentes en los programas de cas. La dificultad es que en ciertas cir-
matemáticas, en relación con la ense- cunstancias esas mismas estrategias
ñanza de la probabilidad, esto ayudará a logran sesgar la aplicación de los con-
los estudiantes venezolanos a depurar ceptos y reglas de la probabilidad.
sus “presunciones” respecto a la proba- Tversky y Kahneman (1973) pre-
bilidad. Ellos estudian conceptos ele- sentan la heurística de la disponibilidad.
mentales de probabilidad durante su Según estos autores las personas esti-
tránsito por la escuela básica (educación man la probabilidad de un evento por la
obligatoria). Esta formación es com- facilidad de recuerdo de ejemplos de
plementada en la educación media, dicho evento. Tversky y Kahneman
cuando se trata nuevamente la probabi- (1974) también presentan la heurística
lidad, esta vez con un nivel matemático de la representatividad, según la cual las
mayor. personas tienen la tendencia a estimar la
Se plantea entonces estudiar la probabilidad de un evento o suceso,
interpretación que le dan los estudiantes basado en la “representatividad” del
venezolanos a enunciados de probabili- mismo respecto a la población de la que
dad al finalizar la Educación Básica y proviene. El trabajo de Lecoutre (1992)
luego de culminar la Educación Media señala que el concepto de equiprobabi-
Diversificada y Profesional. Esto per- lidad, presente en la definición clásica
mitirá explorar si las interpretaciones de probabilidad, es un posible obstáculo
que hacen de esos enunciados tienen didáctico importante para el aprendizaje
alguna relación con el nivel académico de este concepto. Konold (1989) por su
alcanzado por ellos. Adicionalmente, a parte ha investigado sobre lo que él de-
partir de los datos presentes en el traba- nomina el “enfoque en el resultado ais-
jo de Serrano, Batanero y Ortiz de Haro lado”.
(1996), se compararan las respuestas Este trabajo sigue la línea de in-
dadas por los estudiantes venezolanos vestigación de Konold. Este autor
con las ofrecidas por un grupo de estu- centró sus trabajos en la información
diantes españoles de edades similares. probabilística que extraen los sujetos de
Esta comparación se realizará sin consi- situaciones que involucren la probabili-
derar el nivel educativo o contenidos dad, por ejemplo de un boletín meteo-
trabajados en cada nivel. rológico. En un estudio por medio de
En la literatura especializada se entrevistas, Konold solicitó a varios
encuentra una amplia gama de sesgos estudiantes universitarios que interpre-
que manifiestan las personas al ser en- taran el pronóstico "para hoy se tiene un
frentadas a situaciones probabilísticas 70% oportunidad de lluvia". La mayor-
donde se le exige un juicio o decisión. ía de los estudiantes entendieron la pre-
Trabajos como los de Tversky y Kah- dicción como "hoy va a llover". Al
neman (1973, 1974), Konold (1989), presentar una probabilidad cercana al
Lecoutre (1992), muestran diferentes 50% como pronóstico de lluvia, los es-
fuentes de obstáculos para el aprendiza- tudiantes se encontraban desorientados.
je de la probabilidad. Estos autores Konold afirma que cuando el pronóstico
indican que las decisiones o juicios de de lluvia se encuentra suficientemente
las personas sobre la base de una infor- por encima de 50% los estudiantes lo
mación probabilística no se corresponde calificaran como “sí lloverá”, mientras
con los conceptos y leyes de la probabi- si el pronóstico se encuentra suficien-
Selección de lecturas
Didáctica de la Estocástica – 577 3
Selección de lecturas
Didáctica de la Estocástica – 577 4
Egresados de Total
Respuesta Educación Básica Educación Media
Fi % Fi % Fi %
a 20 15,75 14 12,73 34 14,35
b 17 13,39 24 21,82 41 17,30
c 19 14,96 11 10,00 30 12,66
d 55 43,30 59 53,64 114 48,10
e 16 12,60 2 1,81 18 7,59
Total 127 100 110 100 237 100
Tabla 1. Frecuencias y porcentajes de respuesta a la pregunta 1.
Selección de lecturas
Didáctica de la Estocástica – 577 5
Egresados de Total
Respuesta Educación Básica Educación Media
Selección de lecturas
Didáctica de la Estocástica – 577 6
diantes del grupo EM que se ubicaron la presencia del sesgo del “enfoque en
en la categoría c (38,18%), que los que el resultado aislado”.
se ubicaron en la misma categoría del
grupo EB (45,67%). Este resultado es La comparación: estudiantes venezo-
importante, ya que en esta categoría lanos – estudiantes españoles
están los argumentos que señalan que
hubo un error de parte del meteorólogo, Los resultados encontrados con
respuesta clásica encontrada por Konold los estudiantes venezolanos serán com-
y Serrano et al, en sus investigaciones. parados con sus similares etarios espa-
Se presume que este grupo de sujetos ñoles basados en el trabajo de Serrano
presenta el sesgo del enfoque en el re- et al (1996). El primer grupo español
sultado aislado. La significación es- esta conformado por estudiantes de
tadística de estas diferencias se proba- aproximadamente 14 años de edad que
ron mediante el contraste Chi cuadrado, no han estudiado formalmente aspectos
encontrándose que la misma es signifi- de probabilidad. En el segundo grupo
cativa con un χ2=12,363 con 3 g.l. (p < se encuentran estudiantes con edades
0,01). alrededor de los 18 años, que durante el
Por la combinación de los resul- año escolar anterior estudiaron conteni-
tados anteriores se puede presumir que dos de probabilidad. Los grupos conta-
la variable nivel académico tiene una ban con un número similar de varones y
relación positiva con la interpretación hembras.
correcta del enunciado de probabilidad Resultados pregunta 1. La si-
presentado. Así mismo, estos resulta- guiente tabla muestra los resultados de
dos hacen pensar que la formación en la pregunta 1 para el grupo con edades
probabilidad ayuda a la disminución de comprendidas entre 14 – 15 años.
Selección de lecturas
Didáctica de la Estocástica – 577 7
Selección de lecturas
Didáctica de la Estocástica – 577 8
Selección de lecturas
Didáctica de la Estocástica – 577 9
A manera de conclusión
Selección de lecturas
Didáctica de la Estocástica – 577 10
Referencias Bibliográficas
Selección de lecturas
ENSAYO Scotto MG, Tobías A
Resumen Abstract
El presente ensayo trata de aclarar algunos conceptos utili- This essay reviews some statistical concepts frequently used
zados habitualmente en el campo de investigación de la sa- in public health research that are commonly misinterpreted.
lud pública, que en numerosas situaciones son interpretados These include point estimates, confidence intervals, and
de manera incorrecta. Entre ellos encontramos la estima- hypothesis tests. By comparing them using the classical and
ción puntual, los intervalos de confianza, y los contrastes de the Bayesian perspectives, their interpretation becomes
hipótesis. Estableciendo un paralelismo entre estos tres clearer.The English version of this paper is available at: http:/
conceptos, podemos observar cuáles son sus diferencias /www.insp.mx/salud/index.html
más importantes a la hora de ser interpretados, tanto des-
de el punto de vista del enfoque clásico como desde la óp-
tica bayesiana. El texto completo en inglés de este artículo
está disponible en: http://www.insp.mx/salud/index.html
Palabras clave: estimación puntual; prueba de hipótesis; in- Key words: point estimate; hypothesis test; on the up and
tervalo de confianza; inferencia clásica; inferencia bayesiana up interval; classic inference; Bayesian inference
95% de que el verdadero valor de la razón de momios de tamaño 16 de una población N(µ,l) lo que podemos
está contenido en ese intervalo, lo que es incorrecto decir es que el intervalo (X±0.49) contiene µ con pro-
considerando la definición de intervalo de confianza babilidad 0.95, es decir que en 95% de las muestras, µ
descrita previamente. está contenido en (x±0.49). Esto no significa que
(16.8±0.49) contenga µ, ya que podríamos haber obte-
Contrastes de hipótesis nido una de 5% de las muestras para las cuales µ no
está contenido en dicho intervalo. De este modo, no se
Por lo que se refiere a los contrastes de hipótesis, cuan- consigue tener una idea de la mayor o menor plausi-
do queremos contrastar una hipótesis nula simple H0 bilidad de µ estar contenido en (16.8±0.49), es decir, de
contra una alternativa H1 también simple, diciendo que la probabilidad posterior del proceso de estimación por
una región crítica provoca un error de tipo I con pro- intervalo.
babilidad 0.05 y un error de tipo II con probabilidad El siguiente ejemplo14 muestra los problemas que
0.1, utilizando la interpretación frecuentista de la pueden aparecer cuando se hace un uso indiscriminado
probabilidad, lo que se pretende decir es que si repi- de la probabilidad previa. Consideremos que la varia-
tiésemos el contraste más veces, éste nos conduciría a ble X~N(µ,σ2) es observada con el objetivo de contras-
rechazar incorrectamente H0 en 5% de los casos y a tar H0:µ=0 contra H1:µ=10. La observación de X se
aceptar de forma incorrecta H1 en 10% de los casos. puede hacer con dos instrumentos de medida: el pri-
Todas las probabilidades mencionadas hasta el mero, I1 es poco preciso (σ=10) y el segundo, I2, es más
momento (0.99, 0.1, y 0.05) hacen referencia a la preciso (σ=1). El observador usa I1 o I2 con probabili-
probabilidad previa del estimador considerado. La pro- dades conocidas p y 1-p, respectivamente, sabiendo
babilidad previa también recibe el nombre de pre-ex- siempre cuál instrumento utiliza. Para realizar el con-
perimental, ya que se refiere a una situación anterior a traste H0 contra H1 podemos utilizar, entre otros, las
la observación de los datos. La probabilidad previa es siguientes pruebas, ambas de tamaño α:
un importante criterio de evaluación de los proce-
dimientos clásicos y no plantea problemas cuando se Prueba 1. Utilizando el instrumento I1 rechazamos H0
utilizan procedimientos que se repiten un gran núme- cuando X>k0k0=10φ-1(1-α) y utilizando el instrumento
ro de veces. Lo que ciertamente es discutible es el em- I2 rechazamos H0 cuando X>k1 k1=φ-1(1-α) donde φ(x)
pleo de la probabilidad previa en aquellas situaciones es la función de distribución de la normal estándar. Es
que sólo ocurren una vez y no se repiten. fácil verificar que la prueba 1 tiene tamaño α.
Para ilustrar esta última situación, consideremos Ptueba 2. Con el instrumento I1 rechazamos siempre
el siguiente ejemplo.13 Supongamos que a partir de H 0 y con el instrumento I2 rechazamos H 0 cuando
una muestra queremos inferir sobre el parámetro λ X>k 2k 2=φ -1( 1-α ), α>p. El tamaño de la prueba 2
1-p
de una distribución de Poisson. Para ello, utilizaremos también es α.
el valor medio de los datos muestrales, X, como esti-
mador, sabiendo que bajo ciertas condiciones sigue Se puede demostrar que para varios valores de α
una distribución normal, de valor medio λ y varianza y de p, la prueba 2 es más potente que la prueba 1. Por
λ/n. Con base en esta distribución, podemos decir lo tanto, la doctrina clásica diría que la prueba 2 es
que X∈(λ±1.96√λ/n) con una probabilidad a doble mejor de las dos, si se tiene en cuenta la probabilidad
cola de 95%. Cualquiera de estas afirmaciones se re- previa. Si el observador se propone realizar una larga
fiere a la probabilidad previa, ya que está en juego el serie de ensayos no tiene ningún motivo que lleve a
conjunto de valores posibles de X. Lo que ahora nos rechazar la recomendación de la doctrina clásica. El
preguntamos es ¿qué podemos decir de x como esti- problema es que si el observador puede realizar una
mación de λ? Por ejemplo, si en una muestra de ta- sola vez la experiencia (utilizando la prueba 2) a uno
maño 16 obtenemos que x=16.8, ¿qué podemos decir le extraña la idea de ignorar el resultado de no consi-
sobre la proximidad de este valor en relación a λ? La derar la observación cuando utilizamos el instrumento
respuesta que un estadístico clásico dará es que puesto I1. De hecho, es natural que al observador no le inte-
que x es un valor típico de X, éste hereda las propie- rese utilizar la probabilidad previa sino la precisión
dades de la distribución muestral de X. Esto nos re- que obtendrá cuando se utilice cualquiera de los dos
vela que la metodología clásica no consigue medir la instrumentos de medida.
precisión efectivamente realizada, conocida como pro- El papel central de la probabilidad previa en los
babilidad posterior, o sea la proximidad entre x y λ una procedimientos clásicos es consecuencia directa del
vez observados los datos. Ejemplificando una vez principio de muestreo repetido. Este principio implica
más, si x=16.8 es una media de una muestra concreta la transferencia, para los procedimientos estadísticos,
mismo cuando se tenga la intención de aplicarlos sólo no que normalmente se utiliza para obtener una esti-
una vez, de las propiedades que los mismos revelan mación puntual es la moda de la distribución a poste-
en un conjunto ilimitado de repeticiones. Este es uno riori, ya que es el valor más probable que puede tomar
de los puntos de discordia entre clásicos y bayesianos, θ. En algunas situaciones, las estimaciones de máxima
ya que puede haber ambigüedad a la hora de conside- verosimilitud del modelo clásico y bayesiano son prác-
rar este conjunto hipotético de repeticiones ilimitadas, ticamente idénticas. Esto ocurre, por ejemplo, cuando
pues uno puede imaginarse diferentes formas de repe- se elige una distribución a priori poco informativa, lo
tir las experiencias y, en tal caso, no está claro cuál de que implicará que la distribución a posteriori estará
las formas es la más adecuada para realizar inferen- basada en la información obtenida por muestreo y en
cias sobre el parámetro. este caso las estimaciones para los dos modelos coinci-
dirán. A pesar de esta circunstancia, la interpretación
Principios de la inferencia bayesiana de los resultados, dependiendo de la metodología uti-
lizada, es completamente diferente.
La inferencia bayesiana se fundamenta en el Teorema
de Bayes sobre el cálculo de probabilidades condicio- Intervalos de credibilidad
nadas. La divergencia fundamental entre el modelo
clásico y el modelo bayesiano es que el parámetro θ∈Θ, Con relación a los intervalos de confianza clásicos, en
que en el modelo clásico es un escalar o vector desco- el modelo bayesiano se utilizan los llamados interva-
nocido pero fijo, pasa en la metodología bayesiana a los de credibilidad. Estos intervalos se construyen de
ser considerado aleatorio. Para los bayesianos, todo lo la siguiente manera. Observado x, se quiere encontrar
que es desconocido es incierto y toda incertidumbre dos valores [a1,a2] de tal manera que θ ∈[a1,a2] con una
tiene que ser cuantificada en términos probabilísticos. probabilidad elevada, o sea P(a1<θ<a2)|x)≥1–α, sien-
Al mismo tiempo, admiten que la información inicial do 1–α el nivel de credibilidad. Esta definición de in-
o a priori (anterior a la experiencia pero demasiado im- tervalos de credibilidad presenta un inconveniente:
portante para ser ignorada) puede traducirse for- hay muchos valores de a1 y a2 que cumplen esta pro-
malmente en una distribución de probabilidad para θ, piedad. Se plantea entonces el problema de cómo ele-
que se conoce como distribución a priori que desig- gir estos dos valores. Una buena solución es considerar
naremos como p(θ). Por lo tanto, p(θ) proporciona el el intervalo C={θ:p(θ|x)>γ} donde γ es el mayor núme-
grado de credibilidad que una persona atribuye a los ro real que satisface p(θ∈C|x)≥1–α. Esta regla da ori-
posibles valores de θ. Este aspecto de la distribución a gen a un intervalo de amplitud mínima, de modo que
priori es el más controvertido del método bayesiano, cualquier punto excluido del intervalo no tenga ma-
ya que mucha gente rechaza que la información ini- yor credibilidad que cualquier punto incluido en él.
cial, que puede incluir los prejuicios del investigador, Estos intervalos se conocen como intervalos HPD (hig-
se incluya en un proceso de inferencia estadística. No hest posterior density).
obstante, este problema se soluciona por los bayesia-
nos utilizando distribuciones a priori que no aporten Diferencias entre la inferencia clásica y la
información relevante sobre el parámetro. bayesiana
Una vez cuantificada esta información inicial acer-
ca del parámetro, las observaciones obtenidas por Como ya vimos, la diferencia fundamental entre el
muestreo servirán para actualizar la información ya modelo clásico y el bayesiano es que en este último los
existente sobre el parámetro. De este modo, combi- parámetros son considerados aleatorios, por lo que
nando la información inicial y la información mues- pueden ser cuantificados en términos probabilísticos.
tral, utilizando el Teorema de Bayes se atribuyen Por otro lado, es importante resaltar que la inferencia
nuevos grados de credibilidad a los valores del pará- bayesiana se basa en probabilidades asociadas con di-
metro θ , que dan lugar a la distribución a posteriori ferentes valores del parámetro θ que podrían haber
p(θ|x). De aquí se deduce que todos los procedimien- dado lugar a la muestra x que se observó. Por el con-
tos de inferencia bayesiana se basan en la distribución trario, la inferencia clásica se basa en probabilidades
a posteriori. asociadas con las diferentes muestras x que se podrían
observar para algún valor fijo, pero desconocido, del
Estimación puntual bayesiana parámetro θ . En relación con la obtención de esti-
maciones puntuales para los parámetros poblaciona-
Veamos ahora cómo resuelven los bayesianos el pro- les, en el caso del modelo clásico, la estimación se
blema de la estimación puntual. El estimador bayesia- interpreta como el valor de θ, que hace más plausible
haber obtenido la muestra observada, mientras en el cuando es falsa). Estas probabilidades reflejan la pro-
modelo bayesiano, la estimación será el valor de θ que, babilidad previa. Desde el punto de vista bayesiano el
puesto que se ha observado x, sea más verosímil o más problema del contraste de hipótesis es encarado de
creíble. manera más directa, calculando las probabilidades a
Veamos cuáles son las diferencias que existen en- posteriori, P(Θ0|x) e P(Θ1|x) decidiendo después de
tre los intervalos de confianza clásicos y los intervalos compararlas. Por ejemplo, se puede optar por la hi-
de credibilidad bayesianos. En relación con la elección pótesis nula si P(Θ0|x)>P(Θ1|x). Estas probabilidades
del α, no hay ninguna diferencia, elegimos siempre un reflejan la probabilidad posterior del procedimiento.
valor pequeño. En los restantes aspectos no hay nin- Por lo tanto, en el contexto de los contrastes de hipóte-
guna coincidencia. Visto que la distribución a posterio- sis, se puede afirmar que el resultado de la inferencia
ri es la distribución del parámetro, en el caso bayesiano, bayesiana no es la aceptación o rechazo de las hipó-
podemos hablar de la probabilidad de que el paráme- tesis, pero sí la alteración de la credibilidad que es
tro esté contenido en el intervalo de credibilidad. Esto atribuida a cada una de ellas.
contrasta con los intervalos de confianza clásicos, los
cuales sólo pueden ser interpretados en relación con Conclusiones
su probabilidad de cobertura, o sea, la probabilidad
de obtener una muestra de manera que la región de En el presente ensayo se ha ofrecido una visión global
confianza resultante contenga θ. Como se dijo, los in- de los conceptos básicos para hacer inferencia, estima-
tervalos clásicos son una medida de la probabilidad ciones puntuales, intervalos de confianza, y pruebas
previa, mientras que los intervalos de credibilidad ba- de hipótesis, bajo el prisma de la metodología clásica
yesianos son una medida de la probabilidad posterior. y de la metodología bayesiana. Aunque es importante
Esto se traduce en que una vez que se observa x, los recalcar que ni el método inferencial clásico ni el baye-
bayesianos saben que con probabilidad como mínimo siano prescinden de un abordaje general que incluya
de 1–α, el verdadero valor del parámetro está conte- los criterios de causalidad, el método adecuado, la ca-
nido en el intervalo de credibilidad. Por lo tanto, y de lidad de los datos, y el contexto del problema de salud
manera contraria a lo que cabría esperar, la interpre- bajo investigación.
tación de los intervalos de confianza como se usa co- Las inferencias generadas a partir de la metodolo-
múnmente es propia del método bayesiano y no del gía bayesiana son más informativas y fáciles de inter-
clásico, independientemente de la metodología utili- pretar que las realizadas a partir de la metodología
zada para su cálculo. clásica, proporcionando respuestas más directas a
Veamos un ejemplo. Supongamos que construi- muchas de las cuestiones planteadas por los investi-
mos el intervalo de manera que para las dos metodo- gadores en el campo de la epidemiología y de la salud
logías se obtenga x±1.96σ/√n. Mientras que para un pública.4,8-10 Pero encontramos que todavía es bastante
bayesiano P(x–1.96σ/√n<θ<x+1.96σ/√n|x) tiene una habitual que, tanto epidemiólogos como clínicos inter-
interpretación directa como probabilidad, represen- preten los intervalos de confianza calculados por mé-
tando por lo tanto la probabilidad posterior, para un todos clásicos utilizando el concepto bayesiano de la
clásico, antes de obtener una muestra dicho intervalo probabilidad subjetiva.7 Este hecho es debido principal-
representa la probabilidad de cobertura de θ por un mente a dos motivos: en primer lugar, la escasa reper-
intervalo aleatorio (probabilidad previa). Después de cusión que los métodos bayesianos han tenido, tanto
recoger la información por muestreo lo único que un en los libros de texto más populares en el ámbito de la
clásico podrá decir es que, o efectivamente el verda- bioestadística,15-18 como en la formación de los investi-
dero valor del parámetro está en ese intervalo, o bien, gadores. Por otro lado, la total inviabilidad de los pro-
que ocurrió un suceso de probabilidad 0.05. gramas estadísticos de carácter general de mayor
Finalmente, veamos cuáles son las diferencias difusión en el ámbito de la investigación médica (como
fundamentales con relación a los contrastes de hipó- Stata, SAS, o SPSS) respecto de la aplicación de técni-
tesis. Supongamos que se quiere contrastar si H0:θ∈Θ0 cas estadísticas bayesianas.
respecto H1:θ∈Θ1. Como ya se explicó anteriormente, En este sentido, sería deseable un cambio mucho
siguiendo la metodología clásica este contraste se lle- más progresivo en la manera de concebir y analizar
varía a cabo delimitando una región de rechazo V en los estudios epidemiológicos actuales, de tal manera
el espacio muestral, que sería evaluada a través de las que la metodología bayesiana se convierta en el modo
probabilidades de los errores de tipo I (probabilidad natural de concebir los análisis estadísticos con fines
de rechazar la hipótesis nula cuando es cierta) y de inferenciales. Este cambio de pensamiento ha coin-
tipo II (probabilidad de no rechazar la hipótesis nula cidido con el desarrollo de los métodos avanzados
de simulación (Monte Carlo –MC– o Markov Chain 5. Silva LC, Muñoz A. Debate sobre métodos frecuentistas vs métodos
Monte Carlo –MCMC–)19 y su implantación en el soft- bayesianos. Gac Sanit 2000;14:482-494.
6. Rothman KJ. A show of confidence. N Engl J Med 1978;299:
ware estadístico para análisis bayesiano, principalmente 1362-1363.
WinBugs,20 haciendo posible que la aplicación de la 7. Burton PR. Helping doctors to draw appropiate inferences from the
metodología bayesiana sea cada vez más habitual en analysis of medical studies. Stat Med 1994;13:1699-1713.
el campo de la salud pública.21,22 Pero mientras un pro- 8. Goodman SN. Of p-values and Bayes: A modest proposal. Epidemiol
gresivo cambio de mentalidad se va produciendo, co- 2001; 12: 295-297.
9. Silva LC, Benavides A. El enfoque bayesiano: otra manera de inferir.
incidimos en que conceptos de la metodología clásica, Gac Sanit 2001;15:341-346.
tal como el valor de p, no deben ser descartados radi- 10. Bayarri JM, Cobo E. Una oportunidad para Bayes. Med Clin
calmente.22,23 Por ello compartimos con Bacallao2 la re- 2002;119:252-253.
comendación de que mientras el pensamiento 11. Alamo F, Vázquez FJ, Rodríguez JC. Herramientas para la
bayesiano va desplazando al clásico, conviene utilizar investigación biomédica: la perspectiva bayesiana (I). Med Clin
2002;119:265-268.
las pruebas estadísticas habituales únicamente cuan- 12. Alamo F, Vázquez FJ, Rodríguez JC. Herramientas para la
do se pueda garantizar un alto grado de plausibilidad investigación biomédica: la perspectiva bayesiana (II). Med Clin
de la hipótesis nula a contrastar. 2002;119:269-272.
13. Murteira JF. Estatística: Inferência e decisão. Lisboa: Imprensa
Agradecimientos Nacional, Casa da Moeda, 1988.
14. Cox DR. Some problems connected with statistical inference. Ann
Math Stat 1958;29:357-372.
Agradecemos a los dos revisores anónimos sus valio- 15. Colton T. Statistics in medicine. Boston: Little Brown, 1974.
sos comentarios a versiones previas del manuscrito, 16. Armitage P, Berry G. Statistical methods in medical research. Oxford:
así como a los editores por su gentileza a la hora de Blackwell, 1987.
considerar este manuscrito en formato de ensayo para 17. Bland M. An introduction to medical statistics. Oxford: Oxford
University Press, 1987.
su publicación. 18. Campbell MJ, Machin D. Medical statistics: A commonsense approach.
Chichester: John Wiley, 1993.
19. Casella G, George EL. Explaining the Gibbs sampling. Am Stat
Referencias 1992;46:167-174.
20. Spiegelhalter D, Thomas A, Best N, Gilks W. BUGS Bayesian inference
1. Etzioni RD, Kadane JB. Bayesian statistical methods in public health using Gibbs sampling version 0.50. Cambridge: MRC Biostatistics Unit,
1995.
and medicine. Annu Rev Public Health 1995;16:23-41.
2. Bacallao J. La perspectiva exploratorio-confirmatoria en las 21. Spiegelhalter DJ, Myles JP, Jones DR, Abrams KR. Methods in health
aplicaciones biomédicas de la estadistica: dos diálogos (I). Bayesianismo service research. An introduction to Bayesian methods in health
technology assessment. Br Med J 1999;319:508-512.
frente a frecuencialismo: sus respectivas implicaciones prácticas en
relación con el análisis de datos. Med Clin 1996;107:467-471. 22. Spiegelhalter DJ, Myles JP, Jones DR, Abrams KR. Bayesian methods in
3. Bacallao J. La perspectiva exploratorio-confirmatoria en las health technology assessment: A review. Health Technol Assess 2000;
4:1-130.
aplicaciones biomédicas de la estadística: dos diálogos (II).
Consideraciones críticas acerca de las pruebas de significación. Med 23. Cobo E, Campbell MJ. Interpreting results of observational research.
Clin 1996;107:539-543. P values are still useful. Br Med J 1994;309:1439.
24. Weinberg CR. It’s time to rehabilitate the p-value. Epidemiol
4. Burton PR, Gurrin LC, Campbell MJ. Clinical significance not statistical
significance: A simple Bayesian alternative to p values. J Epidemiol 2001;12:288-290.
Community Health 1998;52:318-323.
RESUMEN
1. Introducción
La Estadística es, a nuestro juicio, un elemento imprescindible en la formación
elemental de los ciudadanos de nuestra sociedad. Forma parte de aquello que, llamado
en otros tiempos “cultura general”, se podría caracterizar como el conjunto de todos los
conocimientos que los individuos de nuestro entorno sería deseable que poseyeran. No
parece que sea excesivamente complicada la tarea de encontrar justificaciones a las
consideraciones anteriores:
1
2. El pensamiento estadístico facilita y enriquece el desarrollo integral de la persona,
pues a la par que orienta hacia la introspección crítica y reflexiva, potencia también
una componente actitudinal muy a tener en cuenta: “El pensamiento estadístico es
una actitud mental para el enfoque de los datos” Paulos (1992). En este sentido,
sería deseable que nuestros ciudadanos fueran poseedores de una actitud previa
analíticamente crítica ante las informaciones estadísticas. En nuestra opinión, la
Educación Estadística puede y debe intentar ayudar a la estructuración de dicha
disposición.
3. La Estadística posee un evidente valor funcional, al ser muchas las Áreas que
necesariamente han de hacer uso de la misma, debiendo apoyarse en ella para su
adecuado desarrollo. Nuestra disciplina constituye un potentísimo instrumento,
base del método científico experimental, que un gran número de profesionales de
nuestra Comunidad va a tener que usar. Hemos de formarles para ello.
4. La Estadística afecta a nuestras vidas. El Índice de la Bolsa, el EURIBOR o el IPC
son indicadores estadísticos que gobiernan gran cantidad de aspectos de nuestra
cotidianeidad; la presentación de los resultados de determinadas encuestas de
opinión puede ser capaz de condicionar, sesgar y orientar nuestros propios
pensamientos o creencias; en nuestra vida diaria tomamos continuamente decisiones
acerca del consumo, el ocio, la sanidad o la higiene que se apoyan en potentes
estudios estadísticos...la Estadística está continuamente presente, directa o
indirectamente, en nuestra vida cotidiana.
3. Una actitud crítica manifestada al analizar el rigor con el que puedan estar
formulados los argumentos o las reflexiones estadísticas anteriores.
2
2. El porcentaje
3. Para que las conclusiones que se formulen a partir del estudio en cuestión resulten
admisibles, es preciso ser absolutamente escrupulosos en la estructuración
sintáctica de aquéllas, ya que la proyección semántica de las mismas presenta muy
frecuentemente ambigüedades que no siempre resulta sencillo detectar.
Hemos de hacer notar que, en nuestra opinión, los tantos por ciento constituyen el
contenido matemático que con más frecuencia aparece, no solo en la mayoría de los
estudios, informes o trabajos de investigación, sino también en las noticias, en la
publicidad y, en general, en todos los medios de comunicación de masas.
Pero esa convivencia prácticamente diaria con los porcentajes no implica en los
ciudadanos una especial destreza en el manejo de los mismos. Así:
Cockcroft (1985) reflejó la existencia de una manifiesta incapacidad de los encuestados
para entender los porcentajes. Muchos de aquellos confesaron ser incapaces tanto de
usarlos como de interpretarlos, lo cual muy frecuentemente les producía un acusado
rechazo al manejo de los mismos.
Udina (1989) afirma que individuos que entienden y saben resolver situaciones
planteadas en términos de proporcionalidad, tropiezan cuando se encuentran con frases
que tratan de porcentajes. Apunta que el problema podría tener un carácter
fundamentalmente semántico, es decir, de significado de las palabras empleadas.
Añade además que las dificultades en el manejo de los tantos por ciento se podrían
concretar fundamentalmente en el hecho de que, quizás con demasiada frecuencia, se
suele omitir el total respecto del que se han calculado, lo cual puede permitir una cierta
ambigüedad en la interpretación de los mismos.
Corbalán (1995) constata la poca soltura con la que se suelen manejar, y como posible
causa apunta entre otros factores al hecho de que en el aula se dedica muy poco tiempo
a los porcentajes, mucho menos que a las fracciones o a los decimales: “Hay algo así
como una relación inversa entre el tiempo que se dedica en la escuela a cada una de
estas tres formas de representar cantidades no enteras y la importancia (medida por su
utilización en la vida diaria) que la sociedad le concede fuera de ella”.
3
Hann (1999), realizó una evaluación de las competencias de los estudiantes manejando
porcentajes, para lo cual trabajó con tres grupos: estudiantes noveles, estudiantes
expertos y estudiantes graduados. Observó una tendencia a la estabilización de los
procedimientos empleados, de manera que, conforme los individuos iban siendo más
expertos, sus procedimientos tendían a ser menos erráticos; pero si bien los métodos que
utilizaban eran más estables, ello no suponía que fueran más correctos. Es decir, que el
estudio mostró cómo los estudiantes graduados no dominaban mejor la noción de
porcentaje que los otros dos grupos.
Su diagnóstico acerca de la causa de tales resultados conecta con el apuntado
anteriormente por Udina, si bien lo amplía y enriquece: lo atribuye al hecho de que en
los porcentajes se conjugan dificultades de tipo operatorio con otras de tipo semántico.
La conclusión de su trabajo es contundente: "Me parece inquietante que tantos futuros
ciudadanos no sean capaces de dominar la noción matemática más utilizada en la vida
cotidiana".
Parker et al. (1995), constatan que el porcentaje es uno de los temas más difíciles de las
matemáticas elementales; ambiguo y sutil a la vez, se nos presenta como un concepto
dinámico y cambiante. Añaden que, mientras que los tantos por ciento pueden tener
muchos significados diferentes, tal multiplicidad no puede ser abarcada en su totalidad
por el sistema natural del idioma, llegando a señalar varios aspectos del mismo muy a
tener en cuenta:
a) Su concisión enmascara muy frecuentemente al total de referencia.
4
1. Los estudiantes de Matemáticas
Son alumnos de Matemáticas que han realizado con nosotros la asignatura
“Didáctica de las matemáticas en la ESO”. Es sabido que en una licenciatura como
la de Matemáticas el concepto de “Curso que se está realizando” es difuso, ya que
los alumnos pueden llegar a estar simultáneamente en asignaturas de los cuatro
cursos de la carrera. De todas formas, podemos señalar que los alumnos de este
grupo pertenecían mayoritariamente a los cursos intermedios: 2º y 3º.
Respecto de su Especialidad, eran indistintamente de Matemática Aplicada o de
Estadística. Trabajamos con 16 individuos, que formarán el grupo 1.
2. Los estudiantes de Estadística.
Se trata de alumnos básicamente del último curso de Ciencias Matemáticas, de la
Especialidad de Estadística. Lo que hicimos fue acudir a una clase correspondiente
a una asignatura, Análisis Multivariante, que es cursada habitualmente por alumnos
que están a punto de finalizar sus estudios. Podíamos suponer, por tanto, que la
formación de los mismos era ciertamente sólida. Encuestamos a 18 sujetos. Van a
ser el grupo 2.
3. Los profesores en ejercicio
4. Resultados de la investigación
Se presentaron 4 ítems restringidos, en los que se solicitaba justificación de las
respuestas dadas, más un ítem abierto, de respuesta libre. Este último, evidentemente
más difícil de interpretar y tabular, lo hemos resumido a la dicotomía respuesta válida -
respuesta errónea. A continuación vamos a detallar los ítems en cuestión, junto con los
resultados obtenidos. Aparte de los grupos 1 (estudiantes de estadística), 2 (estudiantes
de matemáticas) y 3 (maestros en ejercicio), vamos a considerar como grupo 4 al grupo
total, es decir, al formado por el conjunto de los 3 grupos anteriores.
5
Ítem 1. “Un comerciante, tras realizar un cursillo de Marketing, y decidido a
incrementar sus ventas a la vez que mantenía el margen de beneficio, aumentó los
precios de sus productos un 25%, ofreciendo posteriormente a sus clientes un descuento
del 25%. ¿Es correcta esa estrategia comercial, en cuanto a dicho margen de
beneficio?”
Esta cuestión, que aparece en Udina (1989), ha sido incorporada por alguna Editorial de
Textos de Matemáticas para la E. S. O. (Anaya, 2º), de manera que, a priori, nuestras
previsiones apuntaron a suponer que a una cierta parte de los encuestados podría no
resultarles del todo extraña. Se puede observar que la clave está en darse cuenta de que
el descuento posterior se realiza sobre una cantidad mayor que la inicial, de manera que
tal descuento es superior al incremento habido en el precio. En este ítem, lo mismo que
en todos los restantes, hemos considerado la respuesta acertada cuando se nos ha
justificado debidamente.
Nºde respuestas
correctas 5 9 0 14
% respuestas
correctas 36% 50% 0% 19%
100%
80%
50%
60% 36%
40% 19%
20% 0%
0%
1 2 3 4
6
ocasiones la “lógica cotidiana”, o el “sentido común”, nos engañan. Llaman la atención
los resultados del grupo 3, de maestros en ejercicio.
Ítem 2. “En declaraciones a un medio informativo, un Ministro ha dicho: «Como en su
momento el PSOE subió la electricidad un 18%, y nosotros la hemos bajado un 6%,
estamos favoreciendo la economía de los españoles en un 24%». ¿Qué opinas acerca
de la veracidad de esta afirmación?”
Este ítem nos parece de gran interés, ya que ha sido tomado de un medio de
comunicación de masas. Se trata de una frase pronunciada por el Ilmo. Sr. Ministro de
Hacienda del Gobierno de España el día 4 de Mayo de 1999, en declaraciones a Radio
Nacional de España. La interpretación numérica que se realiza en la misma es, en los
términos en los que se formuló, claramente errónea. Nuestro interés era saber cómo
reaccionarían los sujetos de nuestra Investigación ante esta manipulación, un tanto
primitiva, de los porcentajes.
Nºde respuestas
correctas 7 14 12 33
% respuestas
correctas 50% 77% 30% 46%
100% 77%
80%
50% 46%
60%
30%
40%
20%
0%
1 2 3 4
7
Ítem 3. “El Gobierno propone subir un determinado tipo de impuesto del 4% al 5%, y
afirma que la subida es pequeña, de tan solo el 1%. La Oposición, por su parte, dice
que se trata de una subida enorme, del 25%. ¿Pueden tener razón ambos, Oposición y
Gobierno?”
Se trata de una cuestión tomada de Krause (1987), en la que se puede comprobar cómo
es posible que, considerando los totales apropiados, pueden tener razón los dos a la vez:
el Gobierno está calculando el incremento porcentual en términos absolutos, y la
Oposición en términos relativos. Como vemos, lo que se hace aquí es jugar con el total
al que se refieren los porcentajes.
Nºde respuestas
correctas 2 12 15 29
% respuestas
correctas 14% 66% 37% 40%
100%
80% 66%
60% 37% 40%
40%
14%
20%
0%
1 2 3 4
Si bien, como ya hemos comentado, estamos ante una cuestión no extraída directamente
del medio, ya que procede de un texto de Matemáticas para formación de Profesores de
Educación Primaria en los Estados Unidos, pensamos que nos permite modelizar gran
número de situaciones que se presentan bastante habitualmente en sociología y en
política, por razones que quizás sean fáciles de comprender. Pensamos que nuestros
ciudadanos han de tener instrumentos para interpretar adecuadamente porcentajes como
los que se han presentado en el ítem que nos ocupa.
8
Ítem 4. “En un paquete de cereales, que se encuentra a la venta en la actualidad en las
grandes superficies, se puede leer lo siguiente: «Premiamos tu fidelidad con un paquete
más grande en el que encontrarás un 20% más de cereales por el mismo precio: de
cada cinco desayunos, uno es gratis...¿no dejes pasar esta oportunidad!». ¿Qué opinas
acerca de la veracidad de lo afirmado en el texto?”
Se trata ésta de una cuestión que consideramos también especialmente relevante, ya que
como se indica procede de un artículo de consumo, estando por tanto ante un ítem
proporcionado directamente por el medio. Nuestro interés estaba situado en ver si, al
igual que los publicistas de Kellog’s, tampoco nuestros sujetos se percataban de que en
realidad era gratis un desayuno de cada seis, no uno de cada cinco.
Nºde respuestas
correctas 2 4 1 7
% respuestas
correctas 14% 22% 3% 10%
100%
80%
60%
40% 22%
14% 10%
20% 3%
0%
1 2 3 4
Los resultados obtenidos en esta cuestión son ciertamente bajos. Pero queremos señalar
que no era fácil darse cuenta de que, para que fuera gratis un desayuno de cada cinco,
nos tendrían que dar gratis un 20% de los cereales, o un 25% más de cereales; si
afirman que nos dan un 20% más de cereales, eso se traduce en un desayuno gratis de
cada seis, no en uno de cada cinco. La verdad es que los razonamientos que hay que
poner en juego pueden resultar un tanto sutiles, y posiblemente se deban a ello los
resultados obtenidos.
9
Ítem 5. “Indica brevemente lo que crees que significan las siglas I. P. C., y señala
algunos posibles usos del mismo en la vida cotidiana”
Estamos ante una cuestión de cultura básica. Como mínimo una vez al mes se nos
muestra la evolución mensual del índice, junto con las variaciones anual e interanual, ya
que es un indicador estadístico que se toma como referencia en gran cantidad de hechos
económicos. Nuestros alumnos, o nuestros maestros en ejercicio, tendrían que estar
capacitados para responder adecuadamente a esta cuestión.
Veremos en primer lugar los resultados a la pregunta sobre reconocimiento de las siglas:
Nºde respuestas
correctas 4 12 24 40
% respuestas
correctas 29% 66% 60% 56%
100%
80% 66% 60% 56%
60%
40% 29%
20%
0%
1 2 3 4
En esta pregunta el grupo total ha obenido el porcentaje más alto de aciertos de todas las
del cuestionario, y ello se debe muy posiblemente a la influencia que sobre dicho grupo
ejercen los resultados del conjunto de los maestros en ejercicio: ellos solos son más de
la mitad del total de individuos con los que estamos trabajando, y como aquí ha
respondido correctamente un 60% de aquellos, no nos ha bajado el porcentaje total,
como nos había venido ocurriendo hasta ahora. Los resultados de la segunda cuestión de
este ítem 5, como es lógico, están condicionados por los de la primera: el
desconocimiento del significado de las siglas conlleva la práctica imposibilidad para
citar algún uso del IPC en la vida cotidiana:
10
GRUPO MATEMÁT. 4º DE ESTAD. PROFESORES TOTAL
Nºde respuestas
correctas 1 7 10 18
% respuestas
correctas 7% 39% 25% 25%
100%
80%
60% 39%
40% 25% 25%
20% 7%
0%
1 2 3 4
Dada la importancia que, en nuestra opinión, tienen las preguntas que nos ocupan,
pensamos que los resultados de este último ítem no requieren de más análisis, sino de
actuaciones concretas.
5. Conclusiones
En Zurbano (2002) se puede ver un adelanto, un tanto restringido y en un contexto no
exactamente igual al del estudio que estamos exponiendo en la presente comunicación.
Ya entonces apuntamos una serie de recomendaciones didácticas de diversos autores
(Cockcroft, 1985; Hann, 1999; Goffree, 2000), que coincidían básicamente en la
necesidad de tratar de modo claramente diferenciado el tópico que nos ocupa. Tenemos
que decir a ese respecto que en la actualidad algunas Editoriales de libros de texto de
nuestro país ya muestran en sus propuestas una mayor sensibilidad ante los porcentajes
(Aritmos, SM; Anaya).
11
Por nuestra parte, nosotros ya hemos incorporado a un Curso de Verano de la
Universidad de Oviedo, que se celebra bajo la Dirección de dos de los firmantes de la
presente Comunicación, una sesión dedicada exclusivamente a los porcentajes.
Tenemos que profundizar en el tema, pues su importancia pensamos que lo exige. A tal
fin, este Equipo Investigador tiene previsto realizar un estudio más amplio en el que
trataremos de llegar a la caracterización de los conocimientos, las concepciones y las
creencias de los profesores de matemáticas de Educación Secundaria Obligatoria de
Asturias, relativos a los porcentajes y a su enseñanza y aprendizaje.
Ello, entre otras cosas, nos habrá de proporcionar una información valiosa a la hora de
diseñar planes de formación, permanente e inicial, del profesorado de matemáticas de
los Centros de Educación Secundaria del Principado de Asturias. En este sentido hemos
de recalcar que nuestra intención final es poder llegar a un conocimiento que sea
utilizable para la acción en el aula: "¿Produciría el estudio del problema alguna
solución en lo que se refiere a la teoría y práctica de la educación?. Si no es así, existen
indudablemente problemas más importantes que esperan ser investigados". (Best, 1982)
Por otra parte, hemos de señalar que un factor esencial de nuestro trabajo va a radicar en
el estudio de la interpretación del tópico, esto es, del significado del mismo: “El punto
crucial en los procesos de instrucción matemática no está en el dominio de la sintaxis
del lenguaje simbólico matemático, incluso aunque éste sea también importante, sino en
su semántica, es decir, en la naturaleza de los propios conceptos y proposiciones
matemáticas y su relación con los contextos y situaciones problema de cuya resolución
provienen” Godino et al. (1998). A este respecto, es nuestro interés profundizar en el
modelo semiótico-antropológico propuesto por Godino (1999), adaptándolo, si nos
resultara posible y pertinente, a nuestro particular contexto.
5. Agradecimientos.
Este trabajo ha sido realizado en el marco del Proyecto de Investigación MB-02-513
5. Referencias Bibliográficas.
Batanero, C. (2002): Los retos de la cultura estadística, Conferencia inaugural de las
Jornadas Interamericanas de Enseñanza de la Estadística, Buenos Aires, accesible en
Internet: http://www.ugr.es/~batanero/
Best, J. W. (1982): Cómo investigar en educación, Ediciones Morata, Madrid.
Cockcroft, Comisión (1985): Las matemáticas sí cuentan, MEC, Madrid.
Corbalán, F. (1995): La matemática aplicada a la vida cotidiana, Graó, Barcelona.
Godino, J. D. et al. (1998): “A semiotic model for analysing the relationship between
thought, language and context in mathematics education”, en A. Olivier y K. Newsatead
(Eds.), Proceedings of the 22 Conference of the International Group for the Psychology
of Mathematics Education, Vol. 3: pp.1-8, University of Stellenbosch, South Africa,
accesible en Internet: http://www.ugr.es/~batanero/
12
Godino, J. D. (1999): Implicaciones metodológicas de un enfoque semiótico-
antropológico para la investigación en Didáctica de las Matemáticas, en Actas del III
SEIEM, pp 196-212, Universidad de Valladolid.
Goffree, F. (2000): Principios y paradigmas de una “educación matemática realista”, en
Gorgorió y otros (coords.): Matemáticas y educación, pp. 151-167, Graó, Barcelona.
Hann, C.(1999): Relacionar la enseñanza de las matemáticas con el mundo extraescolar,
en Uno, nº 19, pp. 105-113, Graó, Barcelona.
Keitel, C. (1997): Matemáticas y realidad en la clase, en UNO, nº 12, pp. 49-66, Graó,
Barcelona.
Krause, E. (1987): Mathematics for Elementary Teachers, D. C. Heat and Company,
Lexington, Massachussets
Parker, M. et al (1995): Percent, a privileged proportion, Review of Educational
Research, v 95, n 4, pp. 421-481
Udina, F. (1989): Aritmética y calculadoras, Síntesis, Madrid.
Watson, J. (2002): Doing research in statistics education: More just than data, en B.
Phillips (Ed.) ICOTS-6 papers for school teachers, pp. 13-18, Cape, Town: IASE, citado
por Batanero (2002)
Zurbano, E. (2002): “Los porcentajes y su interpretación”, en Penalva, C. et al.
(Coords.): “Aportaciones de la Didáctica de la Matemática a diferentes perfiles
profesionales”, pp 265-276, Universidad de Alicante.
13
El Papel de los Proyectos en la Enseñanza y Aprendizaje de la Estadística 1
Carmen Batanero y Carmen Díaz
Universidad de Granada
Introducción
En una sociedad en continuo cambio, como la que nos ha tocado vivir, hemos dejado de
asombrarnos por los avances de la ciencia y la tecnología. La estadística ha jugado un papel
primordial en este desarrollo, al proporcionar herramientas metodológicas generales para ana-
lizar la variabilidad, determinar relaciones entre variables, diseñar de forma óptima experi-
mentos, mejorar las predicciones y la toma de decisiones en situaciones de incertidumbre.
Esta relevancia ha producido un interés creciente por la enseñanza de la estadística, co-
mo se refleja en diferentes documentos curriculares, donde se insiste en la necesidad de co-
menzarla lo antes posible, y, al menos, en la educación secundaria obligatoria. Se habla de
proporcionar una cultura estadística,
“que se refiere a dos componentes interrelacionados: a) capacidad para interpretar y
evaluar críticamente la información estadística, los argumentos apoyados en datos o
los fenómenos estocásticos que las personas pueden encontrar en diversos contextos,
incluyendo los medios de comunicación, pero no limitándose a ellos, y b) capacidad pa-
ra discutir o comunicar sus opiniones respecto a tales informaciones estadísticas cuan-
do sea relevante” (Gal, 2002, p. 2-3).
Por ejemplo, en los recientes Principios y Estándares Curriculares del National Council of
Teachers of Mathematic (NCTM, 2000) se recogen los siguientes objetivos para los niños de
los niveles de 3º a 5º de primaria:
• Diseñar investigaciones para contestar una pregunta y considerar cómo los métodos de
recogida de datos afectan al conjunto de datos.
• Recoger datos de observación, encuestas y experimentos.
• Representar datos en tablas, gráficos de línea, puntos y barras.
• Reconocer las diferencias al representar datos numéricos y categóricos.
• Usar las medidas de posición central, particularmente la mediana y comprender qué es lo que
cada una indica sobre el conjunto de datos.
• Comparar distintas representaciones de los mismos datos y evaluar qué aspectos importantes
del conjunto de datos se muestran mejor con cada una de ellas.
• Proporcionar y justificar conclusiones y predicciones basadas en los datos y diseñar estudios
para mejorar las conclusiones y predicciones.
Objetivos semejantes, aunque a nivel más avanzado, se incluyen para el resto de la educa-
ción primaria y educación secundaria obligatoria, en que no sólo se hace referencia a los con-
ceptos y procedimientos, sino que se enfatiza todo el proceso de razonamiento estadístico, y el
sentido de los datos.
Sin duda esta es una propuesta curricular avanzada. A una mayor variedad y cantidad de
contenidos estadísticos se une también la recomendación sobre un cambio en el enfoque: Se
trata de presentar el análisis exploratorio de datos, centrar la estadística sobre las aplicaciones
y mostrar su utilidad a partir de áreas diversas.
1
En J. Patricio Royo (Ed.),(2 004) Aspectos didácticos de las matemáticas (125 – 164). Zaragoza: Instituto de
Ciencias de la Educación. Colección educación abierta, nº 165.
Didáctica de la Estocástica – 577 2
Pensamos que la mejor forma de seguir estas recomendaciones es introducir en las clases
de estadística el trabajo con proyectos, algunos de los cuales son planteados por el profesor y
otros escogidos libremente por los alumnos. En lugar de introducir los conceptos y técnicas
descontextualizadas, o aplicadas únicamente a problemas tipo, difíciles de encontrar en la
vida real, se trata de presentar las diferentes fases de una investigación estadística: plantea-
miento de un problema, decisión sobre los datos a recoger, recogida y análisis de datos y ob-
tención de conclusiones sobre el problema planteado.
Este recurso es ya habitual en algunos países, que incluso organizan competiciones de
proyectos estadísticos en las escuelas y universidades, semejantes a lo que nosotros conoce-
mos como Olimpiadas Matemáticas (Hawkins, 1991; Holmes, 1997). Por ejemplo, Connor,
Davies y Payne (2002) indican que cada vez es más frecuente la realización de estos proyec-
tos por los alumnos de secundaria de entre 14 y 16 años en Inglaterra y el País de Gales, debi-
do a que en su currículo de matemáticas se contempla la realización obligatoria de proyectos.
Los proyectos varían desde problemas sencillos de representación de datos, hasta la compro-
bación de hipótesis o el uso de la simulación.
Nosotros hemos aplicado esta filosofía de enseñanza desde hace algunos años, preparando
algunos materiales (Batanero y Godino, 2001) para asignaturas de estadística aplicada que
hemos impartido a alumnos de primer curso de Universidad.
Comenzaremos este capítulo presentando un ejemplo, que puede ser reproducido por los
profesores de secundaria o bachillerato en sus clases de estadística. Describiremos sus objeti-
vos, los datos y la forma en que han sido recogido, sugiriendo algunas posibles actividades
que propicien la reflexión sobre los conceptos estadísticos y permitan la ejercitación de las
diversas representaciones, técnicas y tipos de argumentación. Dependiendo de la edad y cono-
cimientos previos de los alumnos, de sus intereses, tiempo disponible, el profesor puede su-
primir o añadir otras actividades. Otros ejemplos pueden encontrarse en Anderson y Loynes
(1987) y en Batanero (2001), en donde presentamos un curso de estadística para secundaria
basado en cinco proyectos.
Seguidamente, justificaremos la importancia de contextualizar la enseñanza de la estadís-
tica alrededor de una o varias investigaciones al alcance de los alumnos, y reflexionaremos
sobre las características de un buen proyecto, abordando también el problema de la evalua-
ción. Analizaremos a continuación uno de los proyectos realizados dentro de una asignatura
de introducción a la estadística por una de nuestras estudiantes, reflexionando sobre los obje-
tivos de aprendizaje que la elaboración de este tipo de trabajos –frente a tareas específicas o
rutinarias- supone para el alumno. Finalizamos con algunas implicaciones para la labor docen-
te.
Una de las primeras actividades que proponemos a nuestros alumnos, cuando estamos co-
menzando un curso de estadística, consiste en realizar un experimento para decidir si tienen
buenas intuiciones respecto a los experimentos aleatorios.
El experimento consiste en averiguar si son capaces de engañar a un compañero, inven-
tando una secuencia de caras y cruces que pueda pasar por aleatoria. El profesor reflexionará
con los alumnos que el experimento aleatorio más sencillo posible es justamente lanzar una
moneda equilibrada. Se propone comparar los resultados obtenidos al lanzar realmente una
moneda con los inventados.
La finalidad principal es hacer reflexionar al alumno sobre el hecho de que nuestras intui-
ciones sobre el azar nos engañan con frecuencia. También se les quiere mostrar la utilidad de
la estadística en la prueba de nuestras hipótesis o teorías (en este caso la hipótesis de que
nuestras intuiciones sobre los fenómenos estocásticos son correctas).
Puesto que las variables a tratar son discretas y las actividades no introducen conceptos es-
tadísticos complejos, el proyecto podría ser adecuado para alumnos a partir de 13-14 años, es
Selección de lecturas
Didáctica de la Estocástica – 577 3
1. ¿Cómo piensas que deberían ser los resultados de lanzar una moneda 20 veces seguidas? ¿Ser-
ías capaz de escribir 20 resultados de lanzar una moneda (sin lanzarla realmente, sino como tú
pienses que debieran salir) de forma que otras personas piensen que has lanzado la moneda en
realidad. O, ¿podría otra persona adivinar que estás haciendo trampa?
Los datos
Los datos son producidos como resultados del experimento que será realizado por cada
uno de los alumnos de la clase. Se le proporciona a cada alumno una pauta cuadriculada,
dándole la siguiente consigna:
2. Vamos a comprobar qué tal son tus intuiciones respecto a los resultados aleatorios. Abajo tie-
nes dos cuadrículas. En la primera de ellas escribe 20 resultados sin realizar realmente el expe-
rimento. En la segunda mitad lanza la moneda 20 veces y escribe los resultados obtenidos. Pon C
para cara y + para cruz.
Una vez que los alumnos han realizado el experimento tendrán diferentes resultados. Un
ejemplo (obtenido realmente por uno de los alumnos) es el siguiente:
C C + C + + + C C + C + C + + C C C + +
+ C + C + + C + C C C C + + + + + C + +
3. ¿Cómo podremos distinguir una secuencia realmente aleatoria de otra que hemos inventado?
Se dejará algún tiempo para pensar y a continuación se organiza una discusión colectiva.
Es frecuente que algún alumno sugiera contar el número de caras y cruces que debe ser
aproximadamente igual, ya que hay las mismas posibilidades para la cara que para la cruz.
4. Pero, ¿hemos de obtener exactamente 10 caras y 10 cruces? ¿Qué pasa si obtenemos 11 caras
y 9 cruces? ¿Y si obtenemos 18 y 2? ¿Que os parece si comparamos el número de caras en las se-
cuencias real e inventada de todos los alumnos de la clase?
Para realizar esta comparación se recogen los datos de todos los alumnos de la clase, tanto
del número de caras en las secuencias inventadas como en las reales, para proceder, primero
al análisis de cada una de estas dos variables, y luego a la comparación de las principales dife-
rencias en su distribución. Para ejemplificar la realización de la actividad utilizaremos los
resultados obtenidos en una clase de 27 alumnos, quienes obtuvieron los siguientes números
de caras en las secuencias inventadas.
10, 12, 11,10, 11, 9, 10, 11, 9, 10, 10, 10, 7, 10, 10, 10, 10, 12, 11, 10, 9, 10, 10, 9, 10, 12, 11
4. Hemos recogido el número de caras en las secuencias inventadas por cada alumno de la clase
¿Como podríamos organizar y resumir estos datos? ¿Cuáles son el valor mínimo y máximo obte-
nido? ¿Cómo representar los datos de modo que sepamos cuántas veces aparece cada valor?
Selección de lecturas
Didáctica de la Estocástica – 577 4
14 1 0
15 3 7
10 4 8
4 5
5 3 9
1 0 5 10
0
7 8 9 10 11 12 11
14 12
N ú m e ro d e c a ra s
El gráfico de puntos (Figura 1) es muy sencillo de construir con ayuda de un papel cuadri-
culado y puede ser un paso previo a la introducción del gráfico de barras (Figura 2) y gráfico
de sectores (Figura 3), que en este ejemplo se han elaborado con la hoja Excel, aunque podr-
ían también realizarse a mano con ayuda de instrumentos de dibujo adecuados.
Mientras en los dos primeros gráficos se visualiza mejor el carácter numérico de la varia-
ble, la moda, la dispersión y la forma de la distribución, en el gráfico de sectores se percibe
mejor la importancia relativa de cada valor respecto al conjunto de datos. Puede mostrarse
Selección de lecturas
Didáctica de la Estocástica – 577 5
también como una aplicación en el tema de las fracciones y servir para introducir o repasar los
conceptos de sector circular y amplitud del mismo, así como de aplicación en el tema de la
proporcionalidad. Si no se dispone de ordenadores, el profesor podría dividir la clase en equi-
pos, de modo que cada uno de ellos elaborase uno de los gráficos. Posteriormente se fotoco-
piarían para todos los equipos para que se pudieran utilizar en la obtención de conclusiones.
De igual manera se realizaría el estudio del número de caras en las secuencias reales, para
finalmente comparar las dos distribuciones y analizar si existen algunas diferencias importan-
tes que indiquen que nuestra intuición respecto a la aleatoriedad nos engaña. En nuestra clase
hemos obtenido los siguientes valores:
11, 11, 11, 8, 7, 8, 9, 11, 10, 9, 9, 9, 9, 14, 7, 10, 9, 10, 11, 13, 11, 8, 8, 11, 12, 9, 8
5. Compara ahora los gráficos del número de caras en las secuencias reales e inventadas. ¿En
qué se parecen? ¿En que se diferencian? ¿Es el valor más frecuente el mismo? ¿Hay el mismo
rango de variación de valores? ¿Cuál de las dos variables tiene mayor variabilidad? ¿Piensas
que nuestras intuiciones sobre el número de caras que se obtienen al lanzar 20 veces una moneda
equilibrada son totalmente correctas? ¿Podrías idear algún tipo de gráfico en que se viesen más
claramente las diferencias?
Una característica del número de caras en una secuencia real es que, en general, es más va-
riable de lo que nuestra intuición nos sugiere, mientras que los valores medios coinciden,
aproximadamente, en ambas distribuciones, ya que somos muy exactos al reflejar la equipro-
babilidad de resultados, incluso más exactos de lo debido, puesto que la secuencia inventada
tiene menos dispersión que la real.
En el ejemplo de nuestra clase, hemos obtenido una distribución bimodal (Figura 4) lo
cual sugiere la necesidad de introducir aquí las ideas de media (x=10,14 para las secuencias
inventadas, x=9,74 para las reales en nuestro ejemplo).
También surge en esta actividad la idea de dispersión de una forma sencilla. Bien a través
del recorrido, o del 50 % de casos centrales, se observa mayor dispersión en la secuencia real,
donde el 50% de los casos centrales se presentan en el intervalo (9-11) y el recorrido es 7,
mientras que en la secuencia simulada el 50% de casos centrales se reduce al valor 10 y el
recorrido es 5. Es conveniente llevar a los alumnos a realizar gráficos simultáneos para las dos
distribuciones, como el presentado en la Figura 4 o el gráfico de barras adosado (Figura 5).
El número de caras es sólo una de las variables que podemos analizar en una secuencia de
resultados aleatorios, en la que aparecen otros muchos modelos probabilísticos. Uno de ellos
es la longitud de las rachas que, intuitivamente esperamos que sean cortas. Es bien conocida
la falacia del jugador por la que esperamos que, tras una corta racha de, por ejemplo, caras, la
probabilidad de que aparezca una cruz aumente. En otro plano, si un matrimonio tiene ya dos
hijos varones, tendrá una gran seguridad en que el siguiente sea una niña, sin darse cuenta que
no es demasiado raro (1 caso de cada ocho) los matrimonios con tres varones ni de que, de los
Selección de lecturas
Didáctica de la Estocástica – 577 6
matrimonios que ya tienen dos varones, aproximadamente la mitad de los que tengan un nue-
vo hijo, deben esperar que sea varón, exactamente lo mismo que cuando esperaban a su hijo
mayor.
Figura 5. Gráficos de barras adosados del número de caras en secuencias reales y simula-
das
15 14
10
7 7 Simulada
5 5 real
5 4 3
2 3
1 1 1 1
0 0 0
0
7 8 9 10 11 12 13 14
En este proyecto proponemos analizar dos nuevas variables en las secuencias producidas
por los alumnos: el número de rachas y la longitud de la racha más larga. Para aclarar el len-
guaje, llamaremos racha a una secuencia de resultados iguales, de modo que, si después de
una cara aparece una cruz (o viceversa) la racha tiene longitud 1. Para clarificar la idea de
racha volvemos al ejemplo inicial y coloreamos las rachas que aparecen. Vemos que en la
secuencia simulada, la racha más larga es de longitud 3 (3 caras) y que el número de rachas es
12, mientras que en la secuencia real hay una racha de 5 cruces y el número de rachas es 11.
C C + C + + + C C + C + C + + C C C + +
+ C + C + + C C + C C C + + + + + C + +
Para motivar el estudio de estas variables, el profesor puede preguntar si el resultado obte-
nido arriba, donde aparecen 5 cruces seguidas, parece razonable. Probablemente algún alum-
no sugiera que la moneda utilizada no está bien construida y se plantee el estudio de las rachas
en las secuencias.
El profesor explicará cómo identificar las rachas y sugerirá a los alumnos que busquen
cuál es la racha más larga en cada una de sus dos secuencias, así como que cuenten el número
de rachas, procediendo de nuevo al estudio y comparación de estas variables en las dos se-
cuencias, tal y como se ha hecho con el número de caras y finalizando con una discusión so-
bre sus diferencias y si nuestras intuiciones sobre las rachas son o no correctas.
El profesor puede usar una hoja de registro como la que reproducimos a continuación (Fi-
gura 6) donde cada alumno anota sus resultados. Luego la hoja se fotocopia y se reparte a los
chicos. Si hay poco tiempo, la clase puede dividirse en grupos para que cada uno de ellos se
encargue de analizar una de las variables y posteriormente, una vez disponibles los gráficos se
realiza la discusión conjunta.
Selección de lecturas
Didáctica de la Estocástica – 577 7
11 14 3 11 4 7
9 13 3 10 12 3
10 8 5 9 9 5
10 12 3 9 10 5
10 12 3 9 10 5
7 10 6 9 10 5
10 11 3 14 11 5
10 13 4 7 7 5
10 11 3 10 10 3
10 12 4 9 12 3
12 10 4 10 11 4
11 12 4 11 14 3
10 13 3 13 12 4
9 7 3 11 5 4
10 13 3 8 11 5
10 11 4 8 10 7
9 14 3 11 11 4
10 7 2 12 4 4
12 13 3 9 10 5
11 14 3 8 8 5
Número de rachas
secuencia inventada
Número de rachas
secuencia real
4 6 8 10 12 14 16
Hay 10 personas en un ascensor, 4 mujeres y 6 hombres. El peso medio de las mujeres es de 60 kilos
y el de los hombres de 80. ¿Cuál es el peso medio de las 10 personas del ascensor?
Además, el razonamiento estadístico es una componente esencial del desarrollo del pro-
yecto. Este tipo de razonamiento, incluye según (Wild & Pfannkuch, 1999) cinco compomen-
tes fundamentales:
• Reconocer la necesidad de los datos: La base de la investigación estadística es la hipótesis
de que muchas situaciones de la vida real sólo pueden ser comprendidas a partir del análi-
sis de datos que han sido recogidos en forma adecuada. La experiencia personal o la evi-
dencia de tipo anecdótico no es fiable y puede llevar a confusión en los juicios o toma de
decisiones.
• Transnumeración: Los autores usan esta palabra para indicar la comprensión que puede
surgir al cambiar la representación de los datos. Al contemplar un sistema real desde la
perspectiva de modelización, puede haber tres tipos de transnumeración: (1) a partir de la
medida que “captura” las cualidades o características del mundo real, (2) al pasar de los
datos brutos a una representación tabular o gráfica que permita extraer sentido de los
Selección de lecturas
Didáctica de la Estocástica – 577 9
mismos; (3) al comunicar este significado que surge de los datos, en forma que sea com-
prensible a otros.
• Percepción de la variabilidad. La recogida adecuada de datos y los juicios correctos a par-
tir de los mismos requieren la comprensión de la variabilidad que hay y se transmite en los
datos, así como de la incertidumbre originada por la variabilidad no explicada. El razo-
namiento estadístico comienza al percibir la variabilidad de la situación y permite adoptar
estrategias en cada paso de la investigación. La estadística permite hacer predicciones,
buscar explicaciones, hallar causas y aprender del contexto. Se buscan y caracterizan los
patrones en los datos para comprenderlos.
• Razonamiento con modelos estadísticos. Cualquier útil estadístico, incluso un gráfico
simple, una línea de regresión o un resumen puede contemplarse como modelo, puesto
que es una forma de representar la realidad. Lo importante es diferenciar el modelo de los
datos y al mismo tiempo relacionar el modelo con los datos.
• Integración de la estadística y el contexto: Es también un componente esencial del razo-
namiento estadístico.
Los proyectos estadísticos aumentan la motivación de los estudiantes. No hay nada que
haga más odiosa la estadística que la resolución de ejercicios descontextualizados, donde se
pida al alumno calcular la media o ajustar una recta de regresión a un conjunto de números.
No hay que olvidar que la estadística es la ciencia de los datos y los datos no son números,
sino números en un contexto. La principal característica de un curso basado en proyectos es
que el énfasis se da a las tareas, que, al menos aproximadamente, deben ser realistas. Como
sugiere Holmes (1997) si los estudiantes trabajan la estadística por medio de proyectos se
consiguen varios puntos positivos:
• Los proyectos permiten contextualizar la estadística y hacerla más relevante. Si los datos
surgen de un problema, son datos con significado y tienen que ser interpretados.
• Los proyectos refuerzan el interés, sobre todo si es el alumno el que elige el tema. El
alumno quiere resolver el problema, no es impuesto por el profesor.
• Se aprende mejor qué son los datos reales, y se introducen ideas que no aparecen con los
“datos inventados por el profesor”: precisión, variabilidad, fiabilidad, posibilidad de me-
Selección de lecturas
Didáctica de la Estocástica – 577 10
dición, sesgo.
• Se muestra que la estadística no se reduce a contenidos matemáticos.
Comienzo
La fase de planteamiento de preguntas es una de las más difíciles. Los alumnos rara vez
comienzan con un problema claramente formulado. Generalmente podrían comenzar sin pre-
guntas claramente definidas y el papel del profesor es ayudarles a pasar de un tema general
(deportes) a una pregunta que pueda contestarse (en la pasada temporada, ¿los equipos de
fútbol que jugaron en su propio campo, lo hicieron mejor que los que jugaron en campo con-
trario?). Nolan y Speed (2002) sugieren que en el comienzo el profesor no debe centrarse en
la terminología estadística, sino proporcionar estrategias generales que puedan generalizarse a
otros datos y contextos. Una lista de puntos a tener en cuenta al plantear las preguntas de in-
vestigación es la siguiente:
• ¿Qué quieres probar?
• ¿Qué tienes que medir /observar /preguntar?
• ¿Qué datos necesitas? ¿Como encontrarás tus datos? ¿Qué harás con ellos?
• ¿Crees que puedes hacerlo? ¿Encontrarás problemas? ¿Cuáles?
• ¿Podrás contestar tu pregunta? ¿Para qué te servirán los resultados?
Selección de lecturas
Didáctica de la Estocástica – 577 11
En otras ocasiones los datos son recogidos por los alumnos mediante la realización de una
encuesta o a través de un experimento. La encuesta requerirá la elaboración de un cuestiona-
rio, fijando los objetivos del mismo, eligiendo las variables explicativas y redactando las pre-
guntas que permitan obtener la información deseada de una forma clara y concisa. Si se pre-
tende extender los resultados más allá de la muestra, la selección de una muestra representati-
Selección de lecturas
Didáctica de la Estocástica – 577 12
va plantea problemas de tipo teórico y práctico, relacionados con la población objetivo y al-
canzada, el marco de muestro, los métodos de selección, la administración del cuestionario y
los problemas de no respuesta.
La información que queremos recoger puede corresponder a diversos niveles que se co-
rresponden con diferentes técnicas de obtención de datos: información consciente y conocida
(encuesta), información desconocida, pero que puede deducirse de la observación e informa-
ción no consciente ni observable (medida). Finalmente es importante considerar la naturaleza
de las escalas de medida y tipo de variable estadística, puesto que de ellas depende el método
de análisis de datos que se puede aplicar. La elección del conjunto de datos es crítica, pues
dependiendo del tipo de datos la gama de técnicas estadísticas será más o menos amplia, ya
que no todas las técnicas son aplicables a cualquier tipo de dato.
Calculadoras y ordenadores
Cuando sea posible, los alumnos pueden usar ordenadores para llevar a cabo sus proyec-
tos, no sólo para el análisis de los datos, sino también para elaborar sus informes. Los proce-
sadores de texto (como WORD) son hoy compatibles con los programas estadísticos. El pro-
yecto es así un pretexto para aprender estas herramientas que son hoy día esenciales. Es por
ello que en el caso concreto de la estadística, los ordenadores son, con mucho, preferible a las
calculadoras, cuando estén disponibles. Es un hecho de que un número creciente de alumnos
cuenta en su casa o en la de algún amigo o familiar con ordenador personal.
Respecto a los programas estadísticos (software estadístico) existe hoy día una gran varie-
dad, desde programas profesionales, como SPSS o Statgraphics, las hojas de cálculo como
Excel o programas específicos para la enseñanza, algunos de los cuales están disponibles en
Internet. Tanto la localización de estos programas como de los datos para los proyectos supo-
ne un uso didáctico de la Internet que también justifica el empleo de los ordenadores. Hemos
incluido una lista de algunos de estos recursos en la Tabla 5.
Si no es posible recurrir a los ordenadores, las calculadoras, en especial las gráficas pue-
den sustituirlos. El volumen de datos en muchos proyectos (como los presentados como
ejemplo) hace posible el trabajo con calculadora. Tanto en este caso, como en el del uso del
ordenador, se requiere la codificación de los datos en forma numérica. Es importante que el
profesor resalte la diferencia entre el código y el valor de la variable. El hecho de, por ejem-
plo, poder calcular la media de los códigos numéricos asignados a los valores de una variable
cualitativa (como el sexo) no indica que tenga sentido el valor obtenido.
Selección de lecturas
Didáctica de la Estocástica – 577 13
Un punto que sin duda preocupa, tanto a alumnos como a profesores, es la evaluación. En
NCTM (1993) se concibe la evaluación como un proceso dinámico y continuo de producción de
información sobre el progreso de los alumnos hacia los objetivos de aprendizaje. El principal
propósito es mejorar el aprendizaje de los alumnos.
Es necesario reconocer la complejidad de la función evaluadora, debido a que ésta debe
atender a las múltiples facetas del conocimiento estadístico (comprensión conceptual y
procedimental, actitudes). Precisamos todo un sistema para recoger datos sobre el trabajo y
rendimiento del alumno y no es suficiente evaluarlo a partir de las respuestas breves dadas a
preguntas rutinarias en una única evaluación (o examen). Por el contrario, en un proyecto se
reflejan bien los diversos aspectos del conocimiento matemático, que se deben tener en cuenta en
la planificación de la instrucción y en su correspondiente evaluación según los estándares del
NCTM, algunos de los cuales incluimos a continuación:
• Comprensión conceptual: Dar nombre, verbalizar y definir conceptos; identificar y generar
ejemplos válidos y no válidos; utilizar modelos, diagramas y símbolos para representar
conceptos; pasar de un modo de representación a otro; reconocer los diversos significados e
interpretaciones de los conceptos; identificar propiedades de un concepto determinado y
reconocer las condiciones que determinan un concepto en particular; comparar y contrastar
conceptos.
• Conocimiento procedimental: Reconocer cuándo es adecuado un procedimiento; explicar las
razones para los distintos pasos de un procedimiento; llevar a cabo un procedimiento de
forma fiable y eficaz; verificar el resultado de un procedimiento empíricamente o
analíticamente; reconocer procedimientos correctos e incorrectos; reconocer la naturaleza y
el papel que cumplen los procedimientos dentro de las matemáticas.
• Resolución de problemas: Formular y resolver problemas; aplicar diversas estrategias para
resolver problemas; comprobar e interpretar resultados; generalizar soluciones.
• Formulación y comunicación matemática: Expresar ideas matemáticas en forma hablada,
escrita o mediante representaciones visuales; interpretar y juzgar ideas matemáticas,
presentadas de forma escrita, oral o visual; utilizar el vocabulario matemático, notaciones y
estructuras para representar ideas, describir relaciones
• Razonamiento matemático: Utilizar el razonamiento inductivo para reconocer patrones y
formular conjeturas; utilizar el razonamiento deductivo para verificar una conclusión, juzgar
la validez de un argumento y construir argumentos válidos; analizar situaciones para hallar
propiedades y estructuras comunes;
• Actitud o disposición hacia las matemáticas: Confianza en el uso de las matemáticas para
resolver problemas, comunicar ideas y razonar; flexibilidad al explorar ideas matemáticas y
probar métodos alternativos para la resolución de problemas; deseo de continuar hasta el
final con una tarea matemática; interés, curiosidad e inventiva al hacer matemáticas;
inclinación a revisar y reflexionar sobre su propio pensamiento y su actuación; valorar la
aplicación de las matemáticas a situaciones que surjan de otras materias y de la experiencia
diaria; reconocer el papel que cumplen las matemáticas en nuestra cultura, y el valor que
tienen como herramienta y como lenguaje.
Selección de lecturas
Didáctica de la Estocástica – 577 14
La evaluación del proyecto debe llevarse a cabo en varias etapas (Starkings, 1997), para
proporcionar a los estudiantes ayuda en su ejecución. Esta autora sugiere también que la eva-
luación de los proyectos, y evaluación individual de cada estudiante participante, debe tener
en cuenta el interés del proyecto, su completitud, la corrección de las técnicas estadísticas e
interpretación, la claridad del informe, así como la integración del estudiante en el equipo, su
esfuerzo individual y su contribución al trabajo colectivo.
Puesto que los estudiantes valoran aquello sobre los que los examinamos, debemos exa-
minarlos sobre las habilidades y conocimientos que para nosotros son más importantes. Una
buena evaluación debe asegurar que el estudiante aprende y no sólo que aprueba.
Queremos finalizar analizando uno de los proyectos presentados por nuestros alumnos en
una asignatura de libre configuración de Análisis de Datos y su Didáctica, que se oferta en la
Facultad de Educación de la Universidad de Granada y está dirigida a alumnos de primeros
cursos de universidad. Es parte de un trabajo más amplio realizado por un grupo de alumnas
de la Licenciatura de Psicología para una asignatura de su especialidad. Una de ellas, que hab-
ía elegido como libre configuración nuestra asignatura, actuó como coordinadora del grupo, y
realizó el análisis de los datos y su interpretación. Asimismo coordinó la redacción y organi-
zación del informe, que incluía una parte teórica y una parte experimental, que es la que re-
sumimos a continuación.
Selección de lecturas
Didáctica de la Estocástica – 577 15
El estudio se realizó en tres centros educativos, de las ciudades de Sevilla, Guadix, y Gra-
nada. Las alumnas visitaron personalmente los centros, recabaron permiso de la dirección
para pasar el cuestionario y realizaron ellas mismas la recogida de datos.
En total, los alumnos que respondieron al cuestionario fueron 98, aunque no todos los ca-
sos fueron considerados válidos, ya que algunos estaban incompletos y presentaban respuestas
contradictorias y fueron eliminados del conjunto de datos. Los alumnos de la muestra perte-
necían a los niveles de primaria (1° y 5° curso) y secundaria (1° y 2° ESO. De los 84 alumnos
que consideraron finalmente, 5 eran de etnia gitana y el resto, payos. Aunque la muestra de
niños gitanos es muy reducida, eran todos los que había en los grupos participantes. Indepen-
dientemente de la posible generalizabilidad de las conclusiones, vemos positivo el hecho de
que en su proyecto estas alumnas llevaron a cabo las diferentes etapas de una investigación
educativa, donde la estadística es sólo una parte del proceso de investigación.
La forma de administrar el cuestionario fue independiente para los alumnos de mayor
edad, ya que los chicos respondieron a los cuestionarios cada uno de forma individual. Para
los niños más pequeños se les leían las preguntas (a modo de entrevista semiestructurada)
Selección de lecturas
Didáctica de la Estocástica – 577 16
para que respondieran directamente al administrador del cuestionario y éste convertía la res-
puesta en puntuación. Es decir, las alumnas también se introdujeron a la técnica de entrevista
y en los dos casos tuvieron gran cuidado en la comprensión de las preguntas por parte de los
sujetos.
Respecto al análisis estadístico, en primer lugar se realizó un estudio con la muestra com-
pleta donde se elaboraron:
• Tablas comparativas de porcentajes de respuestas para cada ítem por curso, nivel educati-
vo y etnia, con objeto de analizar la actitud global de la muestra hacia la integración, así
como en los diferentes aspectos de la integración.
• Para cada una de las siete variables dependientes se elaboraron representaciones gráficas
de la media y error típico en cada uno de los ítems que la definen (ver, como ejemplo, la
figura 8).
• Histograma de la puntuación total en la categoría. Las alumnas definieron variables auxi-
liares, y, por medio de la opción de transformación de datos realizaron automáticamente,
tanto la recodificación de las preguntas formuladas negativamente, como el cálculo de
puntuaciones parciales, es decir, suma de las puntuaciones en los ítems correspondientes a
una misma variable dependiente. Analizan a continuación el histograma de la variable ob-
tenida (ver, como ejemplo, la figura 9).
Las alumnas utilizan estas gráficas para hallar respuestas a las preguntas que se plantea-
ron. Por ejemplo, respecto a la figura 8 concluyen que “Las puntuaciones medias de los suje-
tos en estos cuatro ítemes se sitúan entre –0’7 y 0’25. Los ítemes 2, 10 y 1, que se refieren a
Selección de lecturas
Didáctica de la Estocástica – 577 17
la relación con los compañeros en el contexto escolar, son más positivos, mientras que el
item 25 se refiere a la relación con los compañeros fuera de clase, tiene puntuación negativa.
Parece que los niños interactúan más con niños de otras etnias en el contexto del aula que
fuera de ella”.
1,0
,5
0,0
Media y error típico
-,5
-1,0
item 2 item 10 item 17 item 25
Respecto a la figura 9 sugieren: “Para la variable Relación con los compañeros, la media
se sitúa en 0 y la desviación típica es de 4’30. Estos datos indican que las relaciones con los
compañeros son variables”.
20
10
Una vez analizadas globalmente, en la misma forma anterior las otras seis categorías de
variables dependientes, las alumnas realizan un análisis comparativo de sus resultados, para
analizar el efecto de cada una de las variables independientes: etnia, nivel educativo. Produ-
cen para cada una de ellas tablas comparativas de media y desviación típica para cada item
(véase tabla 7) y representación gráfica de las puntuaciones medias en cada item (véase figura
10).
Tabla 7. Relaciones con los compañeros: Medias y desviaciones típicas por etnias
Payos Gitanos
Media Desv. típ. Media Desv. típ.
2- Cuentan conmigo para grupos/ cuento con... 0,12 1,56 1,00 1,22
10- En el recreo juegan conmigo/ juego con... ,28 1,58 1,20 1,30
17- Los compañeros me ayudan/ ayudo a… ,12 1,43 1,80 ,45
25- Me llaman/ llamo para quedar fuera… -,80 1,21 ,80 1,79
Selección de lecturas
Didáctica de la Estocástica – 577 18
Figura 10. Relaciones con los compañeros: Puntuaciones medias según etnias
2,0
1,5
1,0
,5
item2
0,0
item10
-,5 item17
Media
-1,0 item25
integradores integrados
ETNIA
Presentan de esta forma sus conclusiones: “En cuanto a las relaciones con sus compañe-
ros, los chicos integradores cuentan poco con sus compañeros de otras etnias para hacer
grupos o jugar en el recreo, menos aún para salir fuera de clase. Sin embargo, los integrados
no lo sienten así. Esto lo podemos ver en las puntuaciones positivas en los ítems y la puntua-
ción positiva global en esta variable para los niños gitanos. Por contra en sus compañeros
las puntuaciones medias tienden a cero e incluso es negativa en un ítem. De todos modos el
gráfico de la caja indica que hay bastante variabilidad en el comportamiento de los niños
payos respecto a sus compañeros. Hay también un caso atípico entre los niños gitanos, que
no se siente integrado”.
Figura 11. Puntuación total en relación con los compañeros según la etnia
10
Relaciones con los compañeros
53
-10
integradores integrado
ETNIA
Análisis semejantes se realizaron para estudiar el efecto de las otras variables indepen-
dientes. Finalizado el estudio global y de las variables independientes, se hizo un estudio
comparado de los resultados entre niños payos y gitanos, para cada uno de los cursos partici-
pantes, presentando tablas comparativas de media y desviación típica para cada item (como
ejemplo, presentamos la tabla 8, que se ha reducido sólo a los ítems de relaciones con los
alumnos, aunque en el estudio original se presentan todos los ítems) y representación gráfica
de las puntuaciones medias en cada item (como ejemplo presentamos la figura 12). Ambas
fueron comentadas con detalle.
Selección de lecturas
Didáctica de la Estocástica – 577 19
Gitanos
2- Cuentan conmigo para grupos.. 50,0 50,0
10- En el recreo juegan conmigo.. 100,0
17- Los compañeros me ayudan.. 100,0
25- Me llaman para quedar fuera… 50,0 50,0
Puesto que en la figura 12 los ítems correspondientes a una misma variable aparecen
juntos, es útil para ver en conjunto qué aspectos de la integración son negativos (para esta
gráfica los prejuicios, y ámbito personal- profesional. Puesto que las alumnas presentan una
gráfica similar para cada curso, es posible ver la evolución de las diferentes variables con la
edad.
-1
-2
Media
-3
4 12 19 9 10 25 13 18 8 23 15 24
6 14 1 2 17 5 3 22 16 7 20
Conclusiones obtenidas
Aparte de los comentarios de las diferentes tablas y gráficas a lo largo del documento,
las alumnas presentan finalmente una sección de conclusiones, con una extensión de casi tres
páginas. Reproducimos aquí algunas de las que nos han parecido más interesantes, que mues-
tra cómo este grupo de alumnas han obtenido algunas respuestas a las preguntas planteadas,
completando así el ciclo de investigación.
Selección de lecturas
Didáctica de la Estocástica – 577 20
clase. Sin embargo, los integrados no lo sienten así. Es posible que los chicos integrados tengan
su grupo de amigos y aunque no interaccionen con todos sus compañeros de clase, no se sientan
mal adaptados.
• En general, parecen preferir trabajar en actividades conjuntas, tanto integrados como integrado-
res, aunque los chicos de Primaria resulten ser un poco más individualistas.
• Los niños no son conscientes de las diferencias culturales con sus compañeros, Además, los chi-
cos integrados se muestran algo más tolerantes que sus compañeros integradores y piensan que la
escuela no tiene en cuenta las características de su etnia.
• Las familias valoran que los niños vayan a la escuela y les apoyan, pero en general, ayudan poco
a los niños en las tareas escolares. Los sujetos integrados más apoyo familiar para ir a la escuela
y en las tareas escolares que sus compañeros integradores. Puede que la importancia de la fami-
lia en la etnia gitana se canalice en un mayor apoyo en las tareas escolares por parte de los pa-
dres y hermanos mayores de los alumnos gitanos.
• Los chicos de este estudio parecen considerar importante ir a la escuela y no suelen perder clase.
Los integradores dan más importancia a la escuela, tal vez porque en sus casas den más impor-
tancia a estos aspectos. Aún así, las diferencias no son muy acusadas”.
Vemos que, a partir de este u otros proyectos similares podemos identificar los diferentes
componentes de la evaluación sugeridos en NCTM (1993). Además, podemos también valorar
los siguientes objetivos de aprendizaje, que según Anderson y Loynes (1987) se consiguen
mediante los proyectos:
• Trabajar en equipo y trabajar dentro de unos plazos de tiempo establecidos.
• Comunicarse clara y efectivamente oralmente y por escrito, lo que se consigue tanto en la
Selección de lecturas
Didáctica de la Estocástica – 577 21
Conclusiones
El ejemplo mostrado es sólo uno entre otros desarrollados por nuestros alumnos en los
últimos años sobre las áreas más diversas: indicadores de medio ambiente en el mundo, com-
paración de las ganancias /pérdidas en bolsa a lo largo de un mes de cuatro modelos de inver-
sión de una misma cantidad de dinero, estudio de los intereses de la juventud de Maracena
(pueblo de Granada), valoración de los participantes sobre unas Jornadas de la LOGSE, exis-
tencia de discriminación educativa respecto a sexo en la escuela infantil, estudio hidrológico
de ríos de Granada, comparación del umbral de percepción en la piel en diferentes condicio-
nes experimentales, etc. La mayor parte de estos proyectos podrían haberse llevado a cabo por
chicos de Bachillerato y versiones simplificadas de los mismos serían adecuados para la Edu-
cación Secundaria Obligatoria, así como otros proyectos que sugerimos en Batanero (2001).
Hemos analizado cómo los proyectos están concebidos para introducir en la clase una filo-
sofía exploratoria y participativa, en concordancia con las recomendaciones recientes sobre
enseñanza de la estadística, presentando, tanto un ejemplo propuesto por el profesor, como
otro elegido y llevado a cabo por una alumna, como parte de un trabajo en grupo. Lo deseable
sería que los propios alumnos eligieran el tema en el que quieren trabajar y elaborasen sus
propios proyectos en grupos de dos o tres alumnos, que podrían también conectarse con otras
áreas curriculares. Con ello aumentaríamos su interés por la materia.
Como sugieren Murray y Gal (2002) la comprensión, interpretación y reacción frente a la
información estadística no sólo requiere conocimiento estadístico o matemático, sino también
habilidades lingüísticas, conocimiento del contexto, capacidad para plantear preguntas y una
postura crítica que se apoya en un conjunto de creencias y actitudes. Todas estas capacidades
se incentivan en el trabajo con proyectos.
Selección de lecturas
Didáctica de la Estocástica – 577 22
Cobb y Hodge (2002) sugieren también que el trabajo en grupos y la perspectiva socio
cultural en la clase de estadística centra la atención de los estudiantes en lo que supone la es-
tadística como una parte importante de su aprendizaje. Focaliza su propia identificación como
posibles productores de estadísticas con relación a sus propios intereses y problemas.
Finalmente Nolan y Speed (2002) resaltan la importancia de desarrollar la capacidad dis-
cursiva de los estudiantes, como medio de ampliar sus habilidades de pensamiento crítico. En
la producción de su informe el estudiante debe situar el análisis de sus datos dentro de un ar-
gumento coherente y convincente que apoye sus hipótesis. La comunicación de ideas a partir
de tablas y gráficos es especialmente importante en el razonamiento estadístico.
Referencias
Anderson, C. W. y Loynes, R. M. (1987). The teaching of practical statistics. Nueva York:
Wiley.
Batanero, C. (2001). Didáctica de la estadística. Granada: Grupo de Investigación en Educa-
ción Estadística (disponible en http://www.ugr.es/local/batanero).
Batanero, C. y Godino, J. D. (2000). Análisis de datos y su didáctica.. Departamento de
Didáctica de la Matemática. Granada.
Cobb, P. y Hodge, L. (2002). Learning, identity, and statistical data analysis. En B. Phillips
(Ed.). ICOTS-6 papers for school teachers. Cape Town: International Association for
Statistics Education (CD Rom).
Connor, D., Davies, N. y Payne, B. (2002). Web-based project and key skill work. Teaching
Statistics, 24(2), 62-65.
Fernández Enguita, J. (1996). Escuela y etnicidad: el caso del pueblo gitano. Granada: Uni-
versidad de Granada
Gal, I (2002). Adult's statistical literacy. Meanings, components, responsibilities. Internatio-
nal Statistical Review, 70(1), 1-25.
Graham, A. (1987). Statistical investigations in the secondary school. Cambridge: The Open
University Centre for Mathematics Education.
Hawkins, A. (1991). Student’s project work and the UK applied statistics competition. En
Vere-Jones, D. (editor) (1991). Proceedings of the Third International Conference on
Teaching Statistics (pp. 209-213).Voorburg, The Netherlans: International Statistical
Institute.
Holmes, P. (1997). Assessing project work by external examiners. En I. Gal y J. B: Garfield
(Eds.), The assesment challenge in statistics education (pp. 153-164). Voorburg: IOS
Press.
Jové, G. (1998). Diversidad cultural en los centros educativos: el vitae desde una perspectiva
intercultural. Madrid: Cultura y Educación.
Murray, S., & Gal, I. (2002). Preparing for diversity in statistics literacy: Institutional and
educational implications. En B. Phillips (Ed.). ICOTS-6 papers for school teachers. Ca-
pe Town: International Association for Statistics Education(CD Rom).
N.C.T.M. (2000). Principles and standards for school mathematics. Reston, VA; N.C.T.M.
http://standards.nctm.org/
Nolan, D., & Speed, T.P. (1999). Teaching statistics theory through applications. American
Statistician, 53, 370-375.
San Román, T. (1986). Entre la marginación y el racismo: reflexión sobre la vida de los gita-
nos. Madrid: Alianza.
Starkings, S. (1997). Assessing students’ projects. En I. Gal y J. B: Garfield (Eds.), The as-
sesment challenge in statistics education (pp. 139-152). Voorburg: IOS Press.
Wild, C., y Pfannkuch, M. (1999). Statistical Thinking in Empirical Enquiry (with discus-
sion). International Statistical Review, 67(3), 223-265.
Selección de lecturas
LA INFERENCIA ESTADÍSTICA BÁSICA EN LA ENSEÑANZA SECUNDARIA 1
1. INTRODUCCIÓN
La enseñanza de la estadística ha experimentado un aumento en la apreciación de su impor-
tancia. Este hecho se pone de manifiesto por el incremento de los trabajos de investigación publica-
dos sobre esta materia 2 (se puede encontrar una revisión bibliográfica general en Sahai (1996)), la
creación de grupos internacionales de trabajo, la consolidación de congresos periódicos y la elabo-
ración de proyectos de enseñanza que facilitan materiales al profesor (Díaz et al., 1987; Landwehr
et al., 1987; Dolan, 1992a; Dolan, 1992b; Scheaffer et al., 1996; Cubero, 2001).
En este sentido se han producido avances desde que Garfield (citado en Shaughnessy, 1992)
enunciara las cuatro cuestiones que ha su juicio impedían la enseñanza efectiva de la estocástica: a)
el papel de la probabilidad y la estadística en el currículo, b) las conexiones entre investigación e
instrucción, c) la preparación de los profesores de matemáticas y d) el modo de aprendizaje que aún
está siendo evaluado.
Las nuevas orientaciones curriculares para la enseñanza secundaria obligatoria y postobliga-
toria en nuestro país han prestado una mayor atención a los contenidos de estadística y probabilidad.
Se reconoce de esta manera también en nuestro país la necesidad de que estos formen parte de la
formación básica de los ciudadanos, de acuerdo con las recomendaciones hechas con anterioridad
en otros países en este sentido (Cockroft, 1985; N.C.T.M., 1991). Sin embargo, en este momento se
ha producido una novedad importante que es la introducción de la estadística inferencial en los
currículos de estos niveles.
La estadística está asociada comúnmente a la idea de datos numéricos y su análisis y repre-
sentación, esto es, a la interpretación de información numérica. Esta es, efectivamente, la parte des-
criptiva de la estadística, pero junto a ésta está la parte inferencial que nos permitirá describir los
aspectos probabilísticos de la vida real, esto es, aquellos fenómenos no determinísticos, en los que
está presente de una u otra manera el azar. Se reconoce así la importancia que tiene para la forma-
ción básica científica y humana de los ciudadanos el reconocer la importancia de los métodos es-
tadísticos en el mundo económico y social moderno así como en la investigación.
Las razones anteriores justifican la necesidad de que la investigación educativa se ocupe de
analizar el modo en que los alumnos realizan inferencias estadísticas recurriendo al estudio de la
comprensión de diversos conceptos implicados y al modo en que los alumnos se enfrentan al propio
proceso de inferencia.
En este trabajo presentamos parte de los resultados obtenidos en un estudio exploratorio so-
bre el conocimiento de conceptos básicos en inferencia estadística en estudiantes del nivel de se-
cundaria. Este estudio exploratorio forma parte del proyecto de investigación “Dificultades teóricas,
metodológicas y curriculares de la estadística inferencial en la enseñanza secundaria” que se desa-
rrolla en la actualidad y cuyos propósitos son, en general, determinar áreas problemáticas, dificulta-
des de los alumnos, entornos de aprendizaje favorables o cuestiones metodológicas que puedan ser-
vir como base para mejorar la enseñanza de la inferencia estadística en el nivel de secundaria.
1
Trabajo presentado en Jornadas europeas de estadística. La enseñanza y la difusión de la estadística. Disponible
www.caib.es/ibae/esdeveniment/jornades_10_01/doc/jornadas%20europeas%20de%20estadistica2001.doc
2
De toda la revisión bibliográfica llevada a cabo por Becker (1996) sobre trabajos de investigación en educación es-
tadística, el 3% de las referencias bibliográficas son anteriores a 1970, el 32% en la década de los setenta, 35% en los
ochenta y en el período 1990-95 el 30% de las referencias encontradas.
Didáctica de la Estocástica – 577 2
2. RAZONAMIENTO INFERENCIAL ESTADÍSTICO
A continuación se lleva a cabo un análisis de los razonamientos de tipo inductivo y estadísti-
co que se utilizan en la comprensión de la inferencia estadística. Las investigaciones estudiadas
sobre estos tipos de razonamiento presentan dos caminos distintos, de un lado las investigaciones de
los psicólogos y de otro las de los matemáticos. Los primeros se preocupan principalmente de ob-
servar y describir lo que ocurre cuando los sujetos se enfrentan a tareas de inferencia. Los matemá-
ticos y estadísticos mayoritariamente persiguen modificar las concepciones sobre estadística y pro-
babilidad.
2.1. Investigaciones del campo de la psicología
El razonamiento inductivo supone la formación de conceptos, la generalización desde ejem-
plos y la predicción (Nisbett et al. (1983)). Su función primordial es proporcionarnos un horizonte
cognitivo amplio para realizar la toma de decisiones y proyectar los futuros cursos de acción (Cas-
tañeda y Rodrigo (1993)).
El razonamiento inductivo es objeto de interés del campo de la psicología preocupada prin-
cipalmente por su utilización en la predicción y en la toma de decisiones.
Los científicos comenzaron utilizando modelos de tradición racionalista para explicar el ra-
zonamiento predictivo (Castañeda y Rodrigo (1993)). Según estos modelos, los procesos de razo-
namiento del hombre de la calle se describen acudiendo a principios normativos derivados de la
lógica y la matemática. Desde esta perspectiva, la predicción probabilística final depende de la pro-
babilidad de ocurrencia de ese suceso en el pasado y de la probabilidad actual, tras la aparición de
un determinado dato. Fischbein y Piaget son ejemplos de esta tradición.
Los modelos pragmáticos del razonamiento humano sucedieron a los modelos racionalistas
en la explicación del razonamiento inductivo. Durante las tres últimas décadas han influenciado la
investigación sobre el razonamiento inferencial. Nisbett y Ross (1980) señalan dos tipos amplios de
implementaciones para realizar inferencias intuitivas: estructuras de conocimiento que permiten al
individuo definir e interpretar los datos de fenómenos físicos y sociales y heurísticas juiciosas que
reducen tareas de inferencia complejas a juicios simples.
Las estructuras de conocimiento etiquetan y categorizan objetos y eventos, definen un con-
junto de expectativas sobre dichos objetos y sucesos y sugieren respuestas apropiadas a ellos. Cual-
quier persona sometida a un estímulo, lo procesa basándose en un sistema preexistente de conoci-
mientos esquematizados y abstractos. Sin embargo, la categorización errónea de los objetos y suce-
sos junto con el empleo de inapropiadas estructuras de conocimiento, conduce al error en la emisión
de juicios inductivos.
La noción de modelo mental para explicar el razonamiento predictivo es de reciente desarro-
llo. La encontramos en los trabajos de Nisbett et al. (1983), Holland et al. (1986) y su aplicación al
razonamiento predictivo de expertos en Castañeda et al. (1993). De Vega y Rodrigo (en Castañeda
(1993)) definen el modelo mental como una representación temática que implica personajes, objetos
y acciones, basada en una parte del sistema de conocimiento del sujeto activada por el contenido de
la tarea. Desde esta perspectiva, la inducción consiste en generar y revisar las unidades que constru-
yen los modelos mentales (Holland et al. (1986)).
2.1.1. Empleo de heurísticas
El término heurística puede definirse como un proceso cognitivo que se utiliza para reducir
la complejidad de un problema durante el proceso de resolución, convirtiéndolo así en accesible
para el resolutor (Kahneman et al. (1982)). Se diferencia del algoritmo en que las primeras son ge-
neralmente automáticas y se aplican de forma no reflexiva sin considerar su adecuación al juicio a
realizar (Serrano (1996)).
Selección de lecturas
Didáctica de la Estocástica – 577 3
Las investigaciones de los psicólogos Daniel Kahneman y Amos Tversky inician la hipótesis
de que los sujetos emplean un número limitado de heurísticas para realizar inferencias inductivas 3.
Estas heurísticas no respetan los principios estadísticos (Nisbett et al. (1983)) y consecuentemente
pasan por alto variables estadísticas como el tamaño de la muestra, la correlación y otras cuando se
resuelven problemas de razonamiento inductivo.
Kahneman et al. (1982) definen tres heurísticas fundamentales atendiendo a la forma de ac-
ceso a la información o al proceso cognitivo empleado: representatividad, disponibilidad y ajuste y
anclaje.
Heurística de la representatividad
La representatividad de una muestra es «el grado en que es (a) similar en las propiedades
esenciales a la población de la que ha sido extraída y (b) refleja las características principales del
proceso por el cual ha sido generada» (Tversky y Kahneman, 1974, en Vallecillos (1996)). La
heurística de la representatividad consiste en calcular la probabilidad de un suceso sobre la base de
la representatividad del mismo respecto a la población de la que proviene. De este modo, se estima
la probabilidad de obtención de una muestra por el parecido de ésta con la población de la que pro-
viene.
Esta heurística aparece asociada a la creencia de que una muestra debería reflejar la distribu-
ción de la población de la que se obtiene, o que una muestra debería reflejar el proceso por el cual
los sucesos aleatorios se generan. También el empleo de la heurística de la representatividad se con-
sidera causante de no considerar el tamaño de la muestra en la realización de inferencias inductivas.
El fenómeno de la representatividad no está asociado sólo con personas sin formación es-
tadística sino que también se pone de manifiesto en investigadores con formación estadística como
recogen Shaughnessy (1983), White (1980), Vallecillos y Batanero (1995).
Heurística de la disponibilidad
Kahneman, Slovic y Tversky (1982) explican que se usa esta heurística al juzgar la frecuen-
cia de una muestra “valorando la facilidad con la que las principales operaciones mentales de re-
cuperación, construcción o asociación pueden ser llevadas a cabo” (pág. 164). Este tipo de razo-
namiento es el que lleva a los sujetos a considerar más probables aquellos sucesos de los que pue-
den recordar más casos. Induce sesgos importantes basados en la propia experiencia y subjetividad.
Heurísticas estadísticas
Nisbett et al. (1983) encuentran razones para pensar que las personas poseen otras heurísti-
cas basadas en conceptos estadísticos. Las heurísticas estadísticas se consideran reglas generales,
intuitivas, de procesos inferenciales que recuerdan procedimientos estadísticos formales. Para estos
autores no resulta difícil encontrar casos de buenas intuiciones estadísticas en problemas cotidianos
y consideran que incluso en juicios basados en la heurística de la representatividad subyace un subs-
trato de pensamiento probabilístico.
Estas heurísticas se aplican al comportamiento de mecanismos de generación aleatoria en
edades bastante tempranas. La comprensión formal de los principios estadísticos aumenta al menos
hasta la adolescencia.
Los individuos no aplican siempre mecanismos de pensamiento estadístico donde debieran
hacerlo aunque posean formación estadística. Nisbett et al. (1983) señala tres factores que están
implícitos en la dificultad de aplicar las heurísticas estadísticas cuando se requieren: a) claridad del
espacio muestral y del proceso de muestreo, b) reconocimiento del papel del azar en una situación
particular y c) prescripciones culturales para razonar estadísticamente sobre eventos de un deter-
3
En Shaughnessy (1993, pág. 470) se referencian numerosas investigaciones que, a juicio del autor, confirman esta
hipótesis.
Selección de lecturas
Didáctica de la Estocástica – 577 4
minado tipo. Estos factores actuarán individualmente y más probablemente juntos para incrementar
la tendencia de los sujetos a aplicar heurísticas en problemas que requieren una aproximación es-
tadística.
Como consecuencia de lo anteriormente expuesto se sostienen las predicciones siguientes
para tareas de inferencia:
(a) Actividades diseñadas para el reconocimiento de los factores relacionados con el azar en
determinados sucesos servirían para incrementar el uso de razonamiento estadístico.
(b) Quienes mejor conocen los eventos de un determinado tipo estarán más inclinados a
aplicarles el razonamiento estadístico que quienes están menos familiarizados con ese tipo de even-
tos debido a que las distribuciones del suceso y la influencia del azar aparecerían más claros.
(c) Las personas no razonarían estadísticamente sobre sucesos que reconozcan como varia-
bles e inciertos porque el espacio muestral y el proceso aleatorio subyacente aparecería opaco.
(d) La enseñanza de la estadística debería promover el uso del razonamiento estadístico in-
cluso en sucesos mundanos de la vida diaria porque la formación estadística les ayudaría a construir
modelos de distribución para sucesos, y les ayudaría a reconocer errores y a evidenciar la influencia
del azar.
2.1.2. Críticas a las heurísticas
Shaughnessy (1983) refiere investigaciones de Well, Pollatsek y Konold en las que se sugie-
re que se debe tener precaución al atribuir a los individuos estrategias de inferencia como la repre-
sentatividad, la disponibilidad y otras heurísticas basándose en resúmenes de resultados numéricos.
Los individuos pueden emplear muchas estrategias diferentes que no se apreciarían en resúmenes de
tipo estadístico. Estas diferencias, a juicio de los autores anteriores, son mejor apreciadas por medio
de las entrevistas clínicas.
Una de las críticas más importantes a los estudios de Tversky y Kahneman se basa en mos-
trar que, en ocasiones, los sujetos usan la información que aporta el tamaño de la muestra apropia-
damente. Aunque, también es cierto, esto no siempre ocurre por las razones correctas. Well et al.
(1990) señalan que se responden especialmente bien aquellas cuestiones en las que se pregunta por
cuál de dos muestras estima de manera más precisa alguna característica de la población.
Para Well et al. (1990) la atención debe ponerse en los tipos de juicios que se requiere que
los sujetos emitan. Estos responden satisfactoriamente cuando se les pide que juzguen si la carac-
terística de una muestra estima la correspondiente característica de la población o hasta qué punto la
característica de una muestra grande o pequeña constituyen una evidencia de la característica de la
población. Por el contrario, “los problemas de Kahneman y Tversky en los que se obtienen peores
resultados aportan a la gente información acerca de un población y se le pide juicios acerca de si
características de grandes o pequeñas muestras son más probables de tomar un cierto valor. Si los
problemas que requieren el último tipo de juicios resultan con peores resultados, no está claro si
esto es porque ellos a) requieren una comprensión más sofisticada de la ley de los grandes números,
b) elicitan diferentes y menos apropiadas heurísticas, o c) simplemente son más difíciles de com-
prender que problemas que requieran el primer tipo de juicios” (pág. 291).
2.1.3. Alternativas a las heurísticas
Frente a quienes consideran que la estructura cognitiva humana no refleja ni cálculo de pro-
babilidades ni competencias estadísticas efectivas, Cosmides y Tooby (1996) sugieren que la mente
humana puede contener una serie de competencias bien trabadas capaces de ser activadas en condi-
ciones adecuadas. La competencia frecuentista sería una de ellas.
Selección de lecturas
Didáctica de la Estocástica – 577 5
Cosmides y Tooby (1996) presentan un marco alternativo al de las heurísticas para el estu-
dio de las competencias inductivas humanas. La activación de estas competencias requiere aportes
válidos ecológicamente (por ejemplo, la información en formato de frecuencia).
Para estos autores, almacenar los datos en forma frecuentista presenta ventajas frente a la
forma probabilística. Por ejemplo:
(a) En la forma probabilística se perdería el número de eventos en los que se basa el juicio.
(b) La representación frecuentista permite reorganizar fácilmente la nueva información. Por
ejemplo 5 de 20 es fácilmente convertible a 5 de 21.
(c) La representación frecuentista permite organizar la información en clases de referencia
permitiendo con ello responder a una variedad mayor de preguntas.
De las hipótesis postuladas por este marco se siguen las predicciones siguientes:
(1) La realización de razonamientos inductivos diferirá dependiendo de si a los sujetos se
les pide juzgar una frecuencia o la probabilidad de un evento simple.
(2) La realización de problemas correctos en versiones frecuentistas será superior a las ver-
siones no frecuentistas.
(3) La realización de problemas en términos frecuentistas satisfará alguna de las obligacio-
nes que especifica el cálculo de probabilidades, como la regla de Bayes. Esto ocurriría porque algu-
nos mecanismos del razonamiento inductivo de nuestra estructura cognitiva envuelven aspectos del
cálculo de probabilidades.
2.1.4. Implicaciones didácticas
La investigación en psicología no solamente aporta modelos teóricos para la comprensión de
los procesos de pensamiento que supone la realización de inferencias inductivas, también se ha pre-
ocupado de la influencia de la enseñanza estadística sobre las inferencias cotidianas. En este senti-
do, encontramos tres afirmaciones principales: (1) la enseñanza influye en el razonamiento de las
personas sobre problemas cotidianos, (2) en contextos conocidos se emplean más las estrategias
estadísticas y (3) la enseñanza debe incorporar aspectos de la inferencia informal.
(1) La enseñanza influye en el razonamiento de las personas sobre problemas cotidianos
Desde la perspectiva de la psicología cognitiva, la enseñanza estadística puede crear nuevas
estructuras cognitivas más competentes. Mantiene, sin embargo, una posición escéptica sobre la
posibilidad de hacer que desaparezcan nuestras heurísticas y sesgos (Cosmides y Tooby (1996)). En
este sentido se manifiestan también Slovic, Fischhoff y Lichtenstein (citados en Shaughnessy
(1983)) y Nisbett y Ross (1980). Para estos autores las personas tienden a confiar en exceso en sus
habilidades y además poseen creencias que son extraordinariamente resistentes al cambio.
Nisbett, Krantz, Jepron y Kunda (1983) estudiaron el razonamiento inferencial de cuatro
grupos de personas con distintos niveles de formación estadística. Los sujetos eran estudiantes de
colegio (unos con formación estadística y otros no), graduados y doctores con varios años de expe-
riencia. Se les presentó una situación problemática y los sujetos debían explicar por escrito lo que
allí ocurría. Los resultados muestran que las personas sin preparación estadística no dan respuestas
de tipo estadístico mientras que un amplio grupo de personas (80%) con preparación en estadística
utilizan estos datos.
Sobre el mismo tema Fong, Krantz y Nisbett (1986) realizaron cuatro experimentos en los
que se pretendía estudiar el efecto de la enseñanza en el razonamiento estadístico. Se evidenció que
la enseñanza estadística influye en el razonamiento estadístico de las personas sobre problemas co-
tidianos. Sus resultados podemos resumirlos como sigue:
Selección de lecturas
Didáctica de la Estocástica – 577 6
El efecto de la enseñanza se produce con independencia del método, del contexto y del
tipo de sujeto.
La enseñanza provee beneficios con independencia de su duración.
El efecto positivo de la enseñanza se produjo no solamente cuando el contexto de las
pruebas de evaluación de resultados coincidía con el contexto en el que fueron enseñados, sino tam-
bién cuando no fue así.
La mejora en el pensamiento estadístico sucedió tanto en alumnos universitarios como
también en alumnos de instituto y en adultos.
Tanto la frecuencia como la calidad del pensamiento estadístico acaeció no sólo con
eventos que normalmente están asociados con la incertidumbre y la probabilidad, sino también, para
los que raramente se asocian con tales conceptos.
(2) Las estrategias estadísticas se emplean más en contextos conocidos
Nisbett, Krantz, Jepron y Kunda (1983) han encontrado que el uso del razonamiento estadís-
tico está asociado, incluso en personas sin formación estadística, con la familiaridad del contenido
del que se realiza la inferencia.
Para Castañeda y Rodrigo (1993), quienes participan de la noción de modelo mental, esto
significa que, “en los dominios más conocidos, el espacio muestral o distribución de los sucesos
están más claros y por tanto las personas utilizan este dato. En cambio en los dominios subjetivos
los sujetos tienden a utilizar menos estrategias estadísticas”. Estos autores realizaron un estudio
con 40 profesores universitarios de matemáticas y física, encontrando que en sucesos cotidianos no
utilizaban estrategias de tipo estadístico.
(3) La enseñanza debe incorporar aspectos de la inferencia estadística básica
El trabajo de Fong, Krantz y Nisbett (1986) indica que cuando la formación se basa en la en-
señanza abstracta de nociones de estadística influye en el razonamiento sobre sucesos concretos.
Hace sin embargo, una llamada para limitar la enseñanza basada en el cálculo y potenciar los aspec-
tos del sentido común. Los cursos introductorios de estadística deben incorporar ejemplos de cómo
los principios estadísticos se pueden aplicar a los juicios de la vida cotidiana.
También Nisbett y Ross (1980) y Shaughnessy (1983) consideran que la enseñanza de la es-
tadística debe conjuntar la enseñanza de la inferencia formal desde la secundaria con la presentación
de materiales de inferencia informal y errores inferenciales. Estos materiales trabajarían anécdotas,
paradojas, máximas del tipo la suerte del principiante y refranes como no se debe juzgar un libro
por su portada.
2.2. Aportaciones desde el campo de la Educación Estadística
La investigación sobre la naturaleza de las concepciones que poseen los estudiantes ha mos-
trado que los estudiantes tienen ideas acerca de la probabilidad y de la estadística que están reñidas
con la teoría aceptada. “La existencia de estas ideas fuertemente arraigadas pueden explicar en
parte por qué el aprendizaje de la probabilidad y la estadística es especialmente problemático”
(Konold (1995)). Este autor resume los resultados de sus numerosas investigaciones resaltando tres
conclusiones que tienen importantes implicaciones para la evaluación de las comprensiones intuiti-
vas de los estudiantes: a) los alumnos llevan a clase intuiciones básicamente incorrectas que se en-
cuentran muy arraigadas; b) Estas intuiciones son difíciles de cambiar; y c) alterarlas es complicado
por el hecho de que un estudiante lleva arraigadas múltiples y a menudo contradictorias creencias
sobre una situación particular.
No sólo Konold (1995) aporta evidencias para aseverar las afirmaciones anteriores. Garfield
y delMas (citado en Shaughnessy (1992)) examinaron, con un programa de ordenador desarrollado
por ellos (Coin Toss), los efectos de una experiencia de ordenador con estudiantes sin conocimien-
Selección de lecturas
Didáctica de la Estocástica – 577 7
tos estadísticos sobre sus concepciones erróneas acerca de conceptos como el de variabilidad mues-
tral, efectos del tamaño de la muestra en la variabilidad, la independencia y la aleatoriedad. Sus
resultados muestran que un gran número de alumnos persisten en las concepciones erróneas sobre el
tamaño de la muestra y la variabilidad después de la experiencia. Estos resultados concuerdan con
los de Well et al. (1990) quienes encontraron que muchos estudiantes seguían sin comprender el
efecto del tamaño de la muestra en la variabilidad de la media después de realizar varias experien-
cias de modelización de distribuciones muestrales con el ordenador.
Konold (1995) no puede hacer recomendaciones explícitas del tipo de instrucción que ha
demostrado ser efectiva para alterar las concepciones referidas anteriormente. De modo que profun-
dizaremos en la búsqueda de investigaciones que orienten sobre la naturaleza del razonamiento es-
tadístico.
El razonamiento estadístico se puede definir como la manera en la que los sujetos razonan
con ideas estadísticas o dan sentido a la información estadística (Garfield (1998)). Esto abarca las
interpretaciones de conjuntos de datos, representaciones de datos, o resúmenes estadísticos de datos.
Implícito al razonamiento estadístico está la comprensión de importantes ideas como distribución,
incertidumbre, aleatoriedad y muestreo.
El objetivo de la investigación que Pfannkuch y Wild (1998) realizaron con estudiantes de
estadística y estadísticos profesionales era el conocimiento de la naturaleza del razonamiento es-
tadístico. La muestra investigada se estructuró en tres grupos. Un primer grupo de once estudiantes
a los que se les pidió que resolviesen una variedad de problemas estadísticos mientras se les entre-
vistaba sobre su resolución o sus reacciones al enfrentarse a la información. El segundo grupo lo
formaban cinco estudiantes que tenían en común el haber sido los líderes de grupos de trabajo de
estudiantes que realizaban proyectos reales en distintas organizaciones. Debían resolver un proble-
ma vagamente explicado y dar una solución que podía ser utilizada por un supuesto cliente. Final-
mente, al grupo de seis estadísticos se les entrevistó sobre su perspectiva de la naturaleza del razo-
namiento estadístico y sobre cómo abordar proyectos de esta naturaleza.
Wild y Pfannkuch estaban interesados en desarrollar un marco para los patrones de pensa-
miento envueltos en la resolución de problemas, para las estrategias de resolución de problemas, y
la integración de elementos estadísticos dentro de la resolución de problemas.
El marco propuesto por los autores como resultado del análisis de los resultados consta de
cuatro dimensiones. La primera no se diferencia mucho de otras propuestas de estructuración del
proceso de resolución de problemas estadísticos. Se trata de un ciclo problema-plan-obtención de
datos-análisis de datos- conclusiones.
La segunda dimensión se refiere a los tipos de pensamiento. Considera unos tipos generales
como el estratégico, la búsqueda de explicaciones, la modelización y la aplicación de técnicas. Pero
también consideran tipos específicos de pensamiento estadístico: reconocimiento de la necesidad de
datos, transnumeración (cambiar las representaciones para mejorar la comprensión), consideración
de la variación, razonamiento con modelos estadísticos, integración de la estadística y el contexto.
Añaden también los autores al marco una tercera dimensión que sería un nivel psicológico
que aparece en cada una de los estados de la primera dimensión pero que no puede ser considerado
exclusivo del pensamiento estadístico. La dimensión cuatro es una lista de aptitudes: escepticismo,
imaginación, curiosidad y capacidad de observación, capacidad para cambiar ideas preconcebidas,
propensión a profundizar en los significados, ser lógico, compromiso y perseverancia.
Resumiendo, la característica que emergió fue que el pensamiento estadístico es la integra-
ción de la comprensión del problema real y el estadístico. Ciertos elementos lo facilitan: la interco-
nexión de procesos, comprender y ocuparse de la variación, buscar explicaciones alternativas para
los fenómenos bajo estudio, la transnumeración es un término acuñado por los autores con el que
quieren identificar el proceso por el que se hace una transformación para pasar de una representa-
Selección de lecturas
Didáctica de la Estocástica – 577 8
ción numérica a otra que facilite la comprensión. Esto ocurre cuando hay una descripción cuantita-
tiva del sistema real; cuando los datos son transformados en el sistema estadístico; y cuando los
resúmenes estadísticos se combinan en formas que relacionan más directamente al problema del
sistema real. También aparecieron como características: interrogarse constantemente, encapsular la
complejidad y conocer las limitaciones (Pfannkuch y Wild (1998)).
3. OBSTÁCULOS, ERRORES Y DIFICULTADES EN LA COMPRENSIÓN DE CONCEP-
TOS DE INFERENCIA ESTADÍSTICA ELEMENTAL
Las investigaciones las hemos centrado alrededor de un conjunto de conceptos relacionados
con el muestreo que son centrales para comprender la inferencia estadística, pero hay conceptos
más generales sobre probabilidad y estadística cuya comprensión errónea puede influir en las con-
clusiones sacadas por los alumnos del análisis de un conjunto de datos.
El diagnóstico de la existencia de éstas no supone la necesidad de sustitución de una estruc-
tura cognitiva sino su reestructuración. La validez de una idea no es intrínseca a ella sino una carac-
terística vinculada al contexto. Los errores sistemáticos se consideran por tanto, dentro de una pers-
pectiva contextual, en la que las concepciones erróneas no son reemplazadas sino que se construye
una nueva estructura cognitiva.
Dificultades de carácter general
Cuando intentamos desarrollar, a través de la enseñanza, un razonamiento probabilístico co-
rrecto y coherente encontramos que los alumnos presentan errores de concepción y de interpreta-
ción, sesgos y como dicen los psicólogos, tendencias emocionales. Las causas de estas disfunciones
pueden ser dificultades lingüísticas, falta de herramientas lógicas, dificultades para extraer la estruc-
tura matemática de las experiencias, la dificultad para comprender el concepto de azar (Fischbein et
al. (1991)), dificultad con los conceptos de números racionales y razonamiento proporcional, con-
flicto entre las ideas de probabilidad y las experiencias de los estudiantes y su manera de ver el
mundo, un rechazo hacia la probabilidad por haberle sido presentada inicialmente en forma abstrac-
ta y formal (Garfield y Alhgreen (1988)) y por haber enfatizado en los currículos aquellos aspectos
deterministas de la ciencia.
Los alumnos presentan dificultades con el concepto de número racional y con el razona-
miento proporcional, lo que dificulta la comprensión del concepto de probabilidad y conceptos aso-
ciados a ella (Cañizares (1997); Serrano (1996)). En Estadística, también el concepto de correlación
necesita del razonamiento proporcional.
Por otro lado, el reciente desarrollo de la Probabilidad y de la Estadística, provoca contro-
versias sobre el significado del término probabilidad. Podemos encontrar interpretaciones frecuen-
cialistas, clásicas, subjetivas, etc. que se refleja en las aplicaciones y en los planteamientos didácti-
cos en los distintos libros de texto.
La Inferencia Estadística refleja esta diferencia de significados en la controversia sobre si es
posible o no atribuir probabilidades a las hipótesis y si ello puede lograrse o no con la aproximación
clásica o bayesiana de la inferencia.
Fischbein et al. (1991) han tratado de obtener una mejor comprensión de los orígenes y natu-
raleza de algunos obstáculos intuitivos probabilísticos. Los siguientes factores se presentan como
explicaciones de las distorsiones en los juicios probabilísticos:
• Los sujetos no tienen una definición clara de los términos “cierto”, “posible” e “imposi-
ble”. Algunos confunden “raro” con “imposible”.
• Los conceptos de sucesos compuestos y simples entrañan también interés didáctico.
Concretamente han identificado las situaciones siguientes: No hay una comprensión natural del
hecho de que, en un espacio muestral, posibles resultados deberían distinguirse y contarse separa-
Selección de lecturas
Didáctica de la Estocástica – 577 9
damente si el orden de sus componentes elementales es distinto. Trabajando también con sucesos
compuestos encuentran que, generalmente, muchos sujetos parecen poder relacionar espontánea-
mente las estimaciones de probabilidad a la magnitud de los espacios muestrales aunque, en algunas
ocasiones, la descripción de estos espacios muestrales es incorrecta. La magnitud de los números de
las probabilidades que tienen que comparar representa el principal factor en las decisiones de los
sujetos.
• La capacidad para abstraer estructuras matemáticas idénticas de diferentes experimen-
tos. Por ejemplo, la probabilidad de obtener (5, 5, 5) lanzando un dado tres veces o arrojando si-
multáneamente tres dados.
• La capacidad de sintetizar lo necesario de lo aleatorio. La idea de que un resultado es-
tocástico de pende sólo del azar, con independencia de cuales sean las condiciones dadas, hace lue-
go cualquier predicción infundada.
Concepto de población.
Lavoie y Caille (1986) llevaron a cabo una investigación con 66 alumnos universitarios, con
el objetivo de estudiar la comprensión de cuatro niveles iniciales del concepto probabilista y es-
tadístico de población. Diseñaron para ello una unidad didáctica que permitió a los alumnos del
grupo experimental adquirir mejor comprensión de esos cuatro niveles del concepto de población.
Los niveles estudiados fueron: nivel 1, concepto de población en sentido usual, es decir,
conjunto de individuos o de objetos sobre el que realizamos el estudio. El nivel 2 es el concepto de
población en el sentido que se utiliza en probabilidad y estadística. Se ha estructurado en distintos
subniveles determinados por los procedimientos de construcción del concepto.
El concepto de población del subnivel 2.1. se construye con el procedimiento siguiente: cada
individuo u objeto del conjunto en estudio es reemplazado por el valor que le caracteriza en el estu-
dio (llamada población madre de tipo discreto).
Si la característica de estudio es cualitativa, la población obtenida por el procedimiento ante-
rior es un conjunto de valores no numéricos. El subnivel 2.2. (población madre de tipo discreto) se
obtiene remplazando cada valor no numérico de la anterior población por un nombre. Si la carac-
terística es dicotómica, la población de subnivel 2.2. es una población de Bernoulli.
Para construir el concepto de población de subnivel 2.3. (población de muestreo de tipo dis-
creto), extraemos todas las muestras de tamaño n de la población madre y cada muestra es reempla-
zada por un nombre.
En el subnivel 2.4., el concepto de población madre de tipo discreto y población de muestreo
de tipo discreto son sustituidos por el más general de población de tipo discreto ya que en los dos
tienen como invariante el hecho de ser un conjunto finito o numerable de nombres. Esta población
recibe el nombre de población de tipo discreto.
La investigación dejó abiertas dos preguntas que no obtuvieron respuesta de la investiga-
ción: ¿Es más fácil acceder a un nivel de comprensión del concepto de población en aquellas pobla-
ciones que se definen por un carácter cuantitativo o en las que se definen por un carácter cualitati-
vo?; ¿Es más fácil acceder a un nivel de comprensión del concepto de población cuando se utiliza el
lenguaje de las poblaciones o cuando se utiliza el lenguaje de las variables aleatorias?
Concepto de muestra
La comprensión de la naturaleza de las afirmaciones estadísticas supone alcanzar un equili-
brio entre dos ideas, la representatividad de la muestra y la variabilidad de ésta. La representativi-
dad de la muestra es la idea de que una muestra tomada de una población tendrá a menudo carac-
terísticas similares a la población de origen. La variabilidad de la muestra es la idea de que las
Selección de lecturas
Didáctica de la Estocástica – 577 10
muestras de una población simple no son todas la misma así que no igualan a la población (Rubin et
al. (1990)).
Con objeto de estudiar las concepciones de los estudiantes sobre estas dos ideas, Rubin,
Bruce y Tenney (1990) entrevistaron a doce estudiantes del equivalente al último curso de Bachille-
rato que nunca habían recibido ningún curso sobre estadística. En la entrevista se preguntaban seis
cuestiones abiertas sobre muestreo e inferencia estadística.
Encontraron que los estudiantes investigados, al construir una distribución muestral, estaban
influenciados por la idea de la representatividad de la muestra. Subestimaron la frecuencia de las
muestras cerca de la cola de la distribución y sobrestimaron la frecuencia de la muestra modal, in-
cluso cuando fueron conscientes del número de categorías entre las que tenían que distribuir las
muestras. En unas situaciones las respuestas están guiadas por la representatividad mientras que en
otras el concepto de variabilidad muestral es más fuerte. El tamaño de la muestra no parece operar
apropiadamente para separar las dos ideas. En definitiva, los estudiantes tenían modelos inconsis-
tentes de la relación entre muestras y población incluso en problemas donde los modelos matemáti-
cos que subyacen son distribuciones binomiales. Investigaciones posteriores de Moreno y Valleci-
llos (1998) encuentran resultados similares.
Para Rubin et al. (1990), los resultados de sus entrevistas evidencian que cuando en clase de
matemáticas se pone el énfasis en la respuesta correcta y se subraya que las matemáticas suponen
precisión y falta de error se converge con la tendencia de los estudiantes a creer en la representati-
vidad muestral. De este modo, se produce en los estudiantes una concepción en la cual la muestra
representativa es la única que se obtiene si se muestrea correctamente. Al mismo tiempo en la ense-
ñanza de las escuelas estadounidenses el estudio de las muestras empiezan con la idea de que son
representativas de la población en la mayoría de las ocasiones. Estas dos ideas se refuerzan “para
socavar la comprensión de los estudiantes de la variabilidad muestral” (pág. 319).
Tamaño de la muestra
Distintos trabajos han puesto de manifiesto que el tamaño de la muestra no es tenido en
cuenta para realizar inferencias e incluso cuando el tamaño de la muestra es más pequeño, la heurís-
tica de la representatividad aparece con más fuerza como factor determinante de la inferencia (Ru-
bin (1990); Pollatsek et al. (1984)). De este modo, se estima la probabilidad de obtención de una
muestra por el parecido de ésta con la población de la que proviene o se considera que la población
sobre la que se infiere tendrá las mismas características que la muestra obtenida.
En determinadas situaciones la información aportada por el tamaño de la muestra se utiliza
apropiadamente. Well et al. (1990) señalan que responden especialmente bien aquellas cuestiones
en las que se les pregunta por cual de dos muestras estima de manera más precisa alguna caracterís-
tica de la población.
Parámetros y estadísticos
Schuyten (1991) ha señalado como un problema relacionado con el muestreo, los diferentes
niveles de concreción de un mismo concepto en estadística descriptiva e inferencia. Por ejemplo, es
esencial distinguir entre la media teórica en la población (que es una constante desconocida), la me-
dia particular obtenida en nuestra muestra; los posibles valores de las diferentes medias que se ob-
tendrían en las diferentes muestras aleatorias de tamaño n (que es una variable aleatoria) y la media
teórica de esta variable aleatoria, que coincide con la media de la población en el muestreo aleato-
rio.
El espacio muestral
La identificación correcta del espacio muestral se presenta como un factor importante en la
evaluación probabilística de los sucesos. El análisis de los resultados de un experimento realizado
por Fischbein et al (1991), concluye que para los sujetos sin preparación probabilística, existe una
Selección de lecturas
Didáctica de la Estocástica – 577 11
capacidad intuitiva para evaluar la magnitud del espacio muestral correspondiente a una cierta expe-
riencia estocástica. Además, apuntan los siguientes obstáculos interfiriendo en la correcta evalua-
ción probabilística:
a) No hay un respaldo natural e intuitivo para contar separadamente como distintos resul-
tados, los mismos grupos de resultados con diferentes secuencias (por ejemplo 1, 3 y 3, 1).
b) Los sujetos tienden a olvidar, algunas veces, las condiciones específicas de la experien-
cia estocástica y el espacio muestral se construye sin considerar las respectivas limitaciones (por
ejemplo considerar los números 7, 8,... en un juego de dados)
c) Muchos sujetos no poseen una técnica sistemática para producir todos los posibles re-
sultados de una experiencia.
d) La disponibilidad parece ser un factor importante en la evaluación intuitiva de la magni-
tud de un espacio muestral. Los sujetos obtienen mejor como suma de dos números 2 o 12 que 3 u
11.
Muestreo aleatorio
En un estudio desarrollado por Pollatsek et al. (1984) se comparan los errores cometidos en
los juicios a partir de muestras de sujetos “novatos” en estadística con las inferencias que realizan
los estadísticos expertos. Observaron que éstos emplean como modelo del proceso de muestreo
aleatorio la extracción de bolas de una urna. En este modelo, el muestreo aleatorio se considera
isomorfo al proceso de extracción con reemplazamiento de bolas de una urna, lo que implica la
comprensión de la idea de independencia de ensayos repetidos. El empleo de la heurística de la re-
presentatividad incluso en muestras pequeñas se justificaría entonces por el empleo de modelos
inadecuados para el proceso de muestreo o incluso la ausencia de un modelo.
4. APRENDIZAJE DE CONCEPTOS INFERENCIALES EN SECUNDARIA
Describimos, resumidamente, las características de un estudio exploratorio sobre el aprendi-
zaje de conceptos inferenciales en secundaria (Moreno y Vallecillos (2001a, 2001b)). Los objetivos
generales principales de este estudio son: a) explicitar las ideas que poseen los estudiantes del nivel
de secundaria sobre conceptos básicos de inferencia estadística; b) estudiar comparativamente estas
ideas en alumnos estadísticamente novatos con los que finalizan su formación secundaria y c) anali-
zar la influencia en la conceptualización de distintos contextos de presentación de la pregunta.
El estudio se ha llevado a cabo con un en total 49 alumnos de dos Institutos de Enseñanza
Secundaria de Granada. 30 de ellos pertenecen a 3er curso de la E.S.O. y no han recibido formación
estadística previa, los otros 19 estudiantes pertenecen al curso de COU, son alumnos que terminan
su formación secundaria este curso y pasarán a la Universidad el año próximo.
Los datos se han tomado a partir de un cuestionario escrito que consta de doce preguntas re-
feridas a los siguientes conceptos de inferencia estadística básica: conceptos de población y de
muestra; el proceso de inferencia de la muestra a la población; la influencia del tamaño de la mues-
tra en el proceso de inferencia; la influencia de distintos métodos de muestreo para realizar la infe-
rencia; el concepto de aleatoriedad y la presencia de sesgos en el muestreo.
Los enunciados se presentan en tres contextos distintos: a) concreto; b) de narración y c)
numérico. La variable contexto debe entenderse como medio de presentación de la tarea y está divi-
dido en dos partes: la Parte I que contiene los enunciados en contexto concreto, requiere el empleo
de material manipulativo (bolas, botellas de muestreo y baraja de naipes) y la intervención del in-
vestigador; la Parte II contiene los enunciados en los contextos narrativo y numérico y no es necesa-
ria la intervención del investigador.
En este trabajo presentaremos únicamente los resultados que se refieren a los conceptos de
población y muestra y al propio proceso de inferencia.
Selección de lecturas
Didáctica de la Estocástica – 577 12
4.1. Conceptos de población y muestra
En la Tabla 1 tenemos resumidos los datos acerca de la identificación de la población y la
muestra.
Identifican la población de estudio en el contexto concreto el 57.1% de todos los estudiantes,
mientras que sólo lo hacen el 49% en los contextos narrativo y el numérico.
Identifican la muestra el 30.6% de los estudiantes en el contexto concreto, el 22.4% en el
contexto narrativo y el 20.4% en el numérico.
No identifican la población ni la muestra en el contexto concreto el 42.9%, el 48.9% en el
narrativo y el 49% en el contexto numérico.
En estos primeros resultados globales se observa un mayor porcentaje de alumnos que iden-
tifican la población o la muestra o no identifican ninguna de ellas en el contexto concreto que en el
narrativo y el numérico. Parece deducirse de ellos claramente una ordenación de los contextos, con-
creto, narrativo, numérico, de mayor a menor facilidad para los alumnos en cuanto a la identifica-
ción de los conceptos analizados se refiere.
En el estudio por cursos, el 53.3% de los alumnos de ESO identifican la población frente al
63.2% de los de COU en el contexto concreto; el 50% de los alumnos de ESO lo hacen frente al
47.4 % de los de COU en el contexto narrativo y en el contexto numérico los resultados obtenidos
son el 33.3% en el grupo de ESO y el 73.6% de los alumnos de COU.
Los resultados para el grupo de ESO (53.3%, 50.0%, 33.3%) mantienen el orden inicial para
los contextos (concreto, narrativo, numérico) de mayor a menor facilidad. Para el grupo de COU
(63.2%, 47.4%, 73.6%), sin embargo se deduce que ha resultado para ellos más familiar y más fácil
el contexto numérico para la identificación de la población estudiada. Comparativamente, los por-
centajes de alumnos que identifican la población, son mas altos para los alumnos de COU en los
contextos concreto y numérico, con una diferencia especialmente notable para el caso numérico. En
el narrativo son ligeramente más altos los porcentajes del grupo de ESO (50%, 47.4%).
Selección de lecturas
Didáctica de la Estocástica – 577 13
derablemente más grandes que las anteriores. Estos datos son un indicador inicial de una posible
mayor dificultad para la identificación de la muestra que la de la población en todos los contextos y
por cursos.
No identifican la población ni la muestra, por cursos, el 46.7% de los alumnos de ESO frente
al 36.8% de los de COU en el contexto concreto; el 50% en ESO frente al 47.3% en COU en el na-
rrativo y el 66.6% en ESO frente al 21.1% en COU.
Comparando nuevamente por contextos, los resultados para ESO son (46.7%, 50%, 66.6%)
y para COU (36.8%, 47.3%, 21.1%) observamos que las diferencias son ciertamente notables, ex-
cepto para el contexto narrativo. La diferenciación mayor se produce en el contexto numérico, en
donde se observa una diferencia entre los porcentajes del 45%.
En resumen: muchos estudiantes de ambos niveles de enseñanza no identifican los concep-
tos básicos de población y muestra si bien hay diferencias importantes en los porcentajes de éxito en
los ítems correspondientes en función del contexto. El concreto es el que ofrece mayor porcentaje
de respuestas correctas. El grupo de COU ofrece mejores resultados globales que el de ESO y en el
contexto numérico. Las dos terceras partes de los alumnos de ESO no identifican ni la población ni
la muestra mientras que en COU no lo hacen la quinta parte.
4.2. Proceso de inferencia de la muestra a la población
Esta parte del estudio tenía como objetivo encontrar concepciones de los alumnos al realizar
inferencias inductivas. El término concepción es utilizado en el sentido de Artigue (1990), como
“objeto local, estrechamente asociado al saber en juego y a los diferentes problemas en cuya resolu-
ción interviene”. También empleamos el término concepción en el sentido de modelo teórico cons-
truido por el investigador, como si en efecto fuera el empleado por el alumno, en terminología de
Robert (1983), de manera que lo que llamamos concepción en este trabajo, es un modelo teórico de
razonamiento inferencial, construido por nosotros para la investigación, sobre la base de conoci-
mientos locales de los alumnos manifestados en el momento de la investigación, para esquematizar
y formalizar los rasgos comunes de las respuestas de un grupo de estudiantes. Para el profesor lo
interesante de este catálogo de concepciones es la información básica que le proporciona para poste-
riormente intentar cambiar las inadecuadas.
Para categorizar las respuestas de los alumnos se utilizó inicialmente la clasificación en tres
grandes grupos según los criterios de descripción de la población empleados en ellas descrita en
Moreno (2000) y en contexto concreto. Estos fueron:
C1) Concepción inferencial: El proceso de inferencia está sujeto al azar y no permite deter-
minar con precisión las características de una población a partir de las de una de sus muestras.
C2) Concepción de identidad: El proceso de inferencia permite describir la población con
características idénticas a las de una de sus muestras.
C3) Concepción previa: La población tiene unas características descritas por ideas previas y
no por las observadas en la muestra extraída.
En el contexto narrativo hemos encontrado hasta un 20.4% del total de respuestas que expre-
san la idea de que la encuesta no permite saber nada si no se estudia toda la población. Hemos aña-
dido, pues, una nueva categoría en la clasificación anterior que hemos llamado concepción determi-
nista:
C4) Concepción determinista: Solo el estudio de la población completa permite determinar
sus características propias.
En la Tabla 2 están resumidos los resultados obtenidos según los contextos y por grupos de
estudiantes. Como puede verse en ella, en los dos contextos y en los dos grupos la mayoría de los
alumnos manifiestan la concepción de identidad, C2, en el proceso de inferencia. Se manifiesta in-
Selección de lecturas
Didáctica de la Estocástica – 577 14
dependiente del contexto y en porcentajes altos, en general, y especialmente en COU. En este curso
el porcentaje de alumnos que manifiestan esta concepción es especialmente alto en el contexto con-
creto.
Selección de lecturas
Didáctica de la Estocástica – 577 15
6. BIBLIOGRAFÍA
Artigue, M. (1990). Epistemologie et Didáctique. Recherches en Didactique des Mathematiques,
10(2-3), 241-286.
Batanero, C., Godino, J. D., Vallecillos, A., Green, D. R., y Holmes, P. (1994). Errors and difficul-
ties in understanding elementary statistical concepts. International Journal of Mathematics
Education in Science and Technology, 25(4), 527-547.
Cañizares, M. J. (1997). Influencia en el razonamiento proporcional y combinatorio y de creencias
subjetivas en las intuiciones probabilísticas primarias. Departamento de Didáctica de la
Matemática. Tesis Doctoral. Universidad de Granada.
Castañeda, J. P., y Rodrigo, M. J. (1993). Modelos mentales en el razonamiento predictivo de ex-
pertos. Revista de Psicología General y Aplicada, 46 (3), 275-283.
Cockcroft, W. (1985). Las matemáticas sí cuentan. Madrid: MEC.
Cohen, S., Smith, G., Chechile, R.A., Burns, G., y Tsai, F. (1996). Identifying Impediments to Le-
arning Probability and Statistics From an Assessment of Instructional Software. Journal of
Educational and Behavioral Statistics, 21(1), 35-54.
Cosmides, L., y Tooby, J. (1996). Are humans good intuitive statisticians after all? Rethinking so-
me conclusions from the literature on judgment uncertainty. Cognition, 58, 1-73.
Cubero, J. (2001). Dados y datos. Dirección General de Economía. Gobierno de las Islas Baleares:
Palma (Mallorca).
Díaz Godino, J., Batanero, M. C., y Cañizares, M. J. (1987). Azar y Probabilidad. Madrid: Síntesis.
Dolan, S. (Project director). (1992a). Data collection. The School Mathematics Project. Cambridge
University Press.
Dolan, S. (Project director). (1992b). Living with uncertainty. The School Mathematics Project.
Cambridge University Press.
Fischbein, E., Sainati, M., y Sciolis, M. (1991). Factors affecting Probabilistic Judgements in Chil-
dren and Adolescents. Educational Studies in Mathematics, 22, 523-549.
Fong, G.T., Krantz, D.H., y Nisbett, R. E. (1986). The Effects of Staqtistical Training on Thinking
about Everyday Problems. Cognitive Psychology, 18, 253-292.
Garfield, J. (1998). The statistical Reasoning Assessment: development and validation of a research
tool. Proceedings of the Fifth International Conference on Teaching of Statistics, 781-786.
Garfield, J., y Ahlgren, A. (1988). Difficulties in learning basic concepts in probability and statis-
tics: implications for research. Journal for Research in Mathematics Education, 19(1), 44-
63.
Garfield, J., y delMas, R. (1989). Reasoning about chance events: Assessing and changing students’
conception of probability. In C. Maher, G. Goldin, y B. Davis (eds.), The Proceedings of the
Eleven Annual Meeting of the North American Chapter of the International Group for the
Psychology of Mathematics Education (vol. II, pp. 189-195). Rutgers: Rutgers University
Press.
Holland, J., Holyoak, K., Nisbett, R., y Thagard, P. (1986). Induction. Processes of inference, lear-
ning and discovery. Cambridge: MIT Press.
Kahneman, D., Slovic, P., y Tverky, A. (eds.). (1982). Judgment under uncertainty: Heuristics and
Biases. Cambridge: Cambridge University Press.
Konold, C. (1995). Issues in Assessing Conceptual Understanding in Probability and Statistics.
Journal of Statistics Education, 3(1). (on-line)
Landwehr, J; Swift, J. y Watkins, A. (1987). Exploring Surveys and Information from Samples.
Quantitative Literacy Series. Palo Alto, Ca.: Dale Seymour Pub.
Selección de lecturas
Didáctica de la Estocástica – 577 16
Lavoie, R.; Caillé, A. (1986). La compréhension du concept de population: une étude exploratoire.
Ann. Sc. Math. Québec, 10(1), 27-49.
Moreno, A. (2000). Investigación y enseñanza de la estadística inferencial en el nivel de secunda-
ria. Memoria de Tercer Ciclo. Universidad de Granada.
Moreno, A. y Vallecillos, A. (1998). El muestreo en la enseñanza secundaria. En F. Muñoz, Cárde-
nas, D y López, A. (Eds.): Actas de las VIII Jornadas Andaluzas de Educación Matemática
“Thales”, (pp. 249-254). Jaén: S.A.E.M. “Thales”.
Moreno, A. y Vallecillos, A. (1999a). ¿Cuántas ranas hay en la charca?. Actas de las 9º Jornadas
para el Aprendizaje y la Enseñanza de las Matemáticas, (pp. 294-296). Lugo: CEFOCOP.
Moreno, A. y Vallecillos, A. (1999b). La educación estadística en la sociedad actual. En: I. Beren-
guer, J. M. Cardeñoso y M. Toquero (Eds.). Investigación en el aula de matemáticas: Ma-
temáticas en la sociedad, (pp 253-261). Granada: Universidad de Granada y Sociedad Anda-
luza de Educación Matemática “Thales”.
Moreno, A. y Vallecillos, A. (en revisión). Exploración de concepciones iniciales sobre procesos infe-
renciales. Educación Matemática.
Moreno, A.; Vallecillos, A. (2000). Dificultades en la comprensión de conceptos básicos de infe-
rencia estadística en la educación secundaria. En: Gámez, A.; Macías, C.; Suárez, C. (Eds.).
Actas del IX Congreso Andaluz de Educación Matemática “Thales”, (pp. 109-111). Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
Moreno, A.; Vallecillos, A. (2001a). Exploratory study on inferential concepts’ learning in seconda-
ry level in Spain. En: Van den Heuvel, M. (eds.). Proceedings of the 25th Conference of the
International Group for Psychology of Mathematics Education, vol. 1, pp.343.
Moreno, A.; Vallecillos, A. (2001b). Influencia del nivel escolar y el contexto en el conocimiento
informal de conceptos inferenciales. En: Moreno, F., Gil, F., Socas, M. y Godino, J.D.
(eds.). V Simposio de la Sociedad Española de Investigación en Educación Matemática, pp.
187-196.
N.C.T.M. (2000). Principles and standards for schools mathematics. Reston, VA:NCTM.
Nisbett, R.E., Krantz, D.H., Jepson, C., y Kunda, Z. (1983). The Use of Statistical Heuristics in
Everyday Inductive Reasoning. Psychological Review, 90(4), 339-363.
Nisbett, R.E., y Ross, L. (1980). Human Inference: Strategies and Shorcoming of social judgment.
Englewood Cliffs, NJ: Prentice-Hall.
Pfannkuch, M., y Wild, C. (1998). Investigating the Nature of Statistical Thinking. Proceedings of
the Fifth International Conference on Teaching of Statistics. 459-465. Singapur: ISI.
Pollatsek, A., Konold, C., Well, A., y Lima, S. (1984). Beliefs underlying random sampling. Memo-
ry and Cognition, 12, 395-401.
Robert, A. (1983). L’adquisition de la notion de convergence des suites numeriques dans
l’enseigment superieure. Recherches en Didactique des Mathematiques, 3(3), 307-341.
Rubin, A., Bruce, B., y Tenney, Y. (1990). Learning about Sampling: Trouble at the Core of Statis-
tics. Proceedings of the Third International Conference on Teaching of Statistics, pp. 314-
319. Dunedin: University of Otago.
Sahai, H., Khurshid, A., y Misra, S. C. (1996). A Second Bibliography on the Teaching of Probabi-
lity and Statistics. Journal of Statistics Education 4(3). (on-line)
Scheaffer, R, Gnanadesikan, M., Watkins, A. y Witmer, J. (1996). Activity-Based Statistics. New
York: Springer.
Schuyten, G. (1991). Statistical Thinking In Psychology and Education. Actas de la ICOTS III, 486-
490. Dunedin: University of Otago.
Selección de lecturas
Didáctica de la Estocástica – 577 17
Serrano, L. (1996). Significados institucionales y personales de conceptos matemáticos ligados a la
aproximación frecuencial de la enseñanza de la probabilidad. Tesis Doctoral. Universidad
de Granada.
Shaughnessy, J. M. (1983). The Psychology of Inference and the Teaching of Probability and Statis-
tics: Two Sides of the Same Coin?. En R. W. Scholz (ed.), Decision Making Under Uncer-
tainty, 325-350. North-Holland: Elsevier Science Publishers B.V.
Shaughnessy, J. M. (1992). Research in probability and statistics: Reflection and Directions. En D.
Grouws (ed.), Handbook on Research in Mathematics Education, 465-494. London: McMi-
llan Publishing Co.
Tversky, A. y Kahneman, D. (1974). Judgment under uncertainty. Heuristics and Biases. Science,
185, 1124-1131.
Vallecillos, A. (1996). Inferencia Estadística y enseñanza: un análisis didáctico del contraste de
hipótesis estadísticas. Granada: Comares.
Vallecilllos, A. (1999). Some empirical evidences on learning difficulties about testing hypotheses.
Ponencia invitada, Topic IPM 58. Proceeding of the 52nd Session of the International Statis-
tical Institute, Vol. 2, Tome LVIII, pp. 201-204. The Netherland: ISI.
Vallecillos, A. y Batanero, C. (1995). La inferencia estadística en la investigación experimental en
el campo educativo. Revista de Educación de la Universidad de Granada, 8, 5-16.
Vallecillos, A. y Moreno, A. (1997). Los profesores de matemáticas y la inferencia estadística en la
enseñanza secundaria. En I. Berenguer, B. Cobo y F. Fernández ( Eds.), Investigación en el
aula de Matemáticas: La tarea docente, (pp. 279-287). Granada: Universidad de Granada y
Sociedad Andaluza de Educación Matemática “Thales”.
Well, A., Pollatsek, A., y Boyce, S. (1990). Understanding the effects of sample size on the variabi-
lity of the mean. Organizational behavior and human decision processes, 47, 289-312.
White, A.L. (1980). Avoiding errors in educational research. Research in Mathematics Education.
47-65.
Selección de lecturas
LA CALCULADORA ALGEBRAICA: UNA HERRAMIENTA DIDÁCTICA PARA LA ENSE-
1
ÑANZA DE LAS MATEMÁTICAS EN EL BACHILLERATO
INTRODUCCIÓN
El desarrollo de la tecnología computacional está modificando substancialmente
el entorno de la sociedad, y como consecuencia nuestras actividades cotidianas. El
ámbito educativo no es ajeno a este hecho, sin embargo, a diferencia de otras áreas
donde se tiene perfectamente claro el rol que juega la tecnología, en educación ma-
temática particularmente, aún es necesario profundizar en las discusiones acerca de
cómo ha de llevarse a cabo una adecuada implementación de estas herramientas en el
aula para transformarlas en instrumentos cognitivos, y ver cómo se ven alterados los
procesos de enseñanza y aprendizaje cuando se utilizan.
Además, dado que las matemáticas constituyen una ciencia estrechamente vinculada
con los avances tecnológicos, y que son parte esencial de este progreso, resulta espe-
cialmente importante analizar el papel que desempeña este tipo de instrumentos en la
formación matemática de los estudiantes.
ANTECEDENTES
Diversos investigadores y organizaciones de educación matemática (Waits B. y Dema-
na F., 2000, Kutzler B. 1999, Pomerantz 1997, Cedillo T. 2001, NCTM, 2000) recono-
cen que un uso apropiado de las calculadoras en la enseñanza de las matemáticas
puede ser de gran ayuda en la comprensión de conceptos matemáticos. La NCTM (Na-
tional Council Teachers of Mathematics), una asociación de profesores de matemáticas
en los Estados Unidos que tiene un reconocido prestigio en la educación matemática,
en un documento titulado Principles and Standards for School Mathematics (2000),
identifica al uso de la tecnología como un principio que le debe dar soporte a las pro-
puestas curriculares y señala:
1
MEMORIAS DE LA OCTAVA REUNIÓN DE ANÁLISIS: La actividad experimental en
La enseñanza de las Ciencias Naturales y Exactas. Culiacán, Sinaloa, Marzo de 2002. Centro de Ciencias de
Sinaloa Disponible en www.redexperimental.gob.mx/descargar.php?id=228
*
Profesor de Tiempo Completo en la Escuela de Informática-Culiacán y de asignatura en la Preparatoria Dr.
Salvador Allende de la Universidad Autónoma de Sinaloa.
Didáctica de la Estocástica – 577 2
LA CALCULADORA ALGEBRAICA
Dentro de las grandes ventajas que estas calculadoras tienen respecto a una computa-
dora propiamente dicha es son baratas, portátiles y fáciles de usar, y con ellas es
posible que cada salón puede llegar a ser un laboratorio de cómputo.
Selección de lecturas
Didáctica de la Estocástica – 577 3
Siguiendo las pantallas siguientes, las primeras dos muestran el cálculo de una integral
definida y su correspondiente interpretación como área bajo la curva, la tercera mues-
tra el cálculo de una derivada ordinaria, mientras que las últimas tres muestran la ob-
tención del límite de una función, su tabla de valores y su gráfica respectivamente.
En cuanto a la trivialización, señala que así como las calculadoras científicas volvieron
triviales las operaciones aritméticas, la calculadora graficadora trivializó la producción
de gráficas, la calculadora algebraica vuelve trivial las manipulaciones algebraicas.
Selección de lecturas
Didáctica de la Estocástica – 577 4
Selección de lecturas
Didáctica de la Estocástica – 577 5
La clave del éxito en una enseñanza apoyada en tecnología, radica en un buen entre-
namiento de los profesores y en un enfoque didáctico apropiado. La tecnología no
cambia la enseñanza por sí sola, pero la tecnología es un catalizador para que los pro-
fesores cambien sus métodos de enseñanza y se enfoquen hacia tópicos y habilidades
contribuyendo a una mejor enseñanza de las matemáticas (Kutzler, 1999).
Las calculadoras graficadoras están cambiando los tipos de problemas que son impor-
tantes en la clase de matemáticas. Los conceptos matemáticos pueden ser resueltos
desde diferentes enfoques (aritmético, algebraico, gráfico) y las calculadoras permiten
moverse fácilmente entre estas representaciones, reforzando su comprensión. Los es-
tudiantes pueden usar métodos para confirmar la respuesta obtenida por medios alge-
braicos o viceversa.
Por ejemplo un sistema de ecuaciones lineales, puede resolverse por métodos alge-
braicos y posteriormente interpretar su solución en términos gráficos, pudiendo así,
explicar porque la única, ninguna o múltiple solución.
Selección de lecturas
Didáctica de la Estocástica – 577 6
Se pueden seguir diferentes estrategias para llevar a cabo un uso apropiado de las
técnicas de papel y lápiz y la calculadora:
I. Resolver problemas usando papel y lápiz y verificar los resultados con tecnolog-
ía.
II. Resolver problemas usando tecnología y confirmar los resultados usando papel
y lápiz.
III. Resolver problemas para los cuales ellos elijan la técnica que más les guste,
papel y lápiz, calculadora o una combinación de ambas.
Otro enfoque es usar técnicas de papel y lápiz durante el desarrollo inicial del concepto
y usar calculadora para una extensión y generalización de los resultados.
REFERENCIAS BIBLIOGRÁFICAS
Waits, B. y Demana, F. (2000). El papel de la computadora portátil en el álgebra simbólica en la educación
matemática del siglo XXI: Un llamado para la acción. Documento presentado por invitación y pre-
sentación en la Conferencia de Tecnología de los Standards 2000, patrocinada por NCTM el 5-6 de
junio de 1998 en Washington D. C.
Waits, B. y Demana, F. (2000). Calculators in Mathematics Teaching and Learning, Past, Present and Future.
Kutzler, B. (1999). The Algebraic Calculator as a Pedagogical Tool for Teaching Mathematics. Investigating
with information technologies. Australian Association of Mathematics Virtual Conference.
Pomerantz, H. (1997). The Role of Calculators in Mathematics Education. Document prepared for the Urban
Systematic Initiative/Comprehensive Partnership for Mathematics and Science Achievement. Dallas
Texas.
Cedillo, T. (2001). La Calculadora en la clase de Matemáticas: Implicaciones hacia la Enseñanza. Conferen-
cia Internacional sobre uso de Tecnología en la Enseñanza de las Matemáticas. Universidad Mi-
choacana de San Nicolás de Hidalgo. Morelia Michoacán México.
Inzunza, S. (2001). Enseñando Estadística mediante la calculadora TI-92. Conferencia Internacional sobre
uso de Tecnología en la Enseñanza de las Matemáticas. Universidad Michoacana de San Nicolás de
Hidalgo. Morelia Michoacán México.
Selección de lecturas
Nivel Medio Superior y Superior
Resumen
El presente artículo pretende dar una visión general sobre las bondades que tiene el uso de
herramientas computacionales en la enseñanza de la probabilidad y estadística. Todos los ejemplos
se refieren al uso de la calculadora graficadora, como un tipo especial de tecnología que presenta
algunas ventajas como es costo y portatibilidad. Se trata de poner de manifiesto la potencialidad de
la herramienta computacional en la visualización de conceptos estadísticos. Se manejan tres grandes
áreas señaladas por Snell y Peterson, donde es factible su aplicación, como son, reducción de
cálculos manuales, análisis gráfico de datos y simulación.
Introducción
Es innegable la influencia que están teniendo tanto las computadoras como la nueva
generación de calculadoras graficadoras en la educación matemática y, en especial, en la
enseñanza de la probabilidad y estadística. En la actualidad se ha desarrollado software
computacional con características de simulación, visualización dinámica, múltiples formas de
representación y con alto grado de interactividad, que permite al estudiante obtener un acceso
más espontáneo a las ideas matemáticas que subyacen a muchos conceptos importantes en
probabilidad y estadística. Tales características no son exclusivas del software para
computadoras, también aparecen en las versiones más actualizadas de calculadoras graficadoras;
estas últimas con ventajas en cuanto al costo y accesibilidad en términos de portatibilidad, que
las hacen apropiadas para su uso en el salón de clases.
1
Email: sinzunsa@mail.cinvestav.mx, sinzunza@uas.uasnet.mx
1
Una razón social: el incremento del uso de la tecnología. Hoy la gente joven usa Internet,
teléfono celular, juegos electrónicos, etc. Entonces, la enseñanza de las matemáticas no
puede ignorar la tecnología.
Hay tecnología útil para matemáticas y para enseñanza de matemáticas, la cual permite a los
estudiantes visualizar fenómenos matemáticos, hacer conexiones, efectuar experimentos; en
una palabra, hacer matemáticas como expertos. Esta habilidad antes de la era de la
tecnología, estaba restringida a estudiantes dotados que podían imaginar en su mente los
objetos matemáticos y sus relaciones. La posibilidad de manipulación real de la tecnología,
ofrece acceso a las matemáticas a la mayoría de los estudiantes.
Scheaffer (1992), dice que la estadística debe ser enseñada como una ciencia de
laboratorio. Los estudiantes deben adquirir los datos por su propia cuenta. En el laboratorio las
computadoras deben ser un requerimiento para que los estudiantes discutan, escriban acerca de lo
que entienden y sus interpretaciones de los problemas.
Una característica importante que es necesario agregar respecto a la forma en que se usa la
tecnología en la enseñanza de las matemáticas actualmente respecto a hace algunos años, es que
no requiere que el usuario sea un experto en programación como solía suceder. Hoy día existe
software con características muy “amigables” que puede ser usado en forma eficiente con un
mínimo de interacción. A este tipo de software se le ha dado el calificativo de educativo, dado
que es diseñado teniendo como objetivo su uso en el salón de clases, y teniendo en consideración
una didáctica que facilite el aprendizaje. De esta forma, la computadora no sólo es un recurso de
cálculo, sino también un potente recurso didáctico que nos puede ayudar en el aprendizaje de
conceptos matemáticos.
Cálculos numéricos
Si le preguntamos a una persona que haya tomado un curso de estadística sobre su
impresión de la materia, seguramente nos dirá que se trata de una serie de fórmulas que tuvo que
memorizar y cálculos tediosos que debió efectuar para llegar a un resultado. Sin embargo, hoy
día con la ayuda de la tecnología, se puede descargar tanto al profesor como al alumno de una
parte de esa tarea que tanto tiempo requiere y que poco ayuda a la comprensión de un
determinado concepto. Mediante el uso de las computadoras es posible utilizar conjuntos de
datos más grandes y sobre todo relevantes para la experiencia de los estudiantes. Al respecto
Cobb (1992) enfatiza que los estudiantes deberían ver a la estadística como un proceso de
adquisición científica, descubriendo información con datos de la vida real. Si los estudiantes
pueden entender los datos, entonces tendrán una mejor retención de la información del ejemplo.
Además si los datos son recolectados por ellos mismos, los estudiantes participarán en forma
activa en el proceso.
2
Con el uso de herramientas computacionales, la destreza en el cálculo ya no es el punto
principal necesario para emplear estas técnicas; pero estas herramientas serán de poca ayuda en
la planificación del estudio, en la elección de la técnica apropiada y en la interpretación de los
resultados (Batanero, Godino, Holmes y Vallecillos, 1994).
Así, la computadora toma la parte de los cálculos, pero deja al estudiante actividades de
mayor trascendencia. Con esto, queremos decir es que sólo es una ayuda en el proceso mas no
quien resuelve el problema.
Figura 1 Figura 2
Figura 3 Figura 4
3
Es importante en estadística que el estudiante tenga claro el papel que juegan los
parámetros en una distribución de probabilidad, con la herramienta computacional es fácil
observar el efecto que se produce al variar dichos parámetros. Veamos el caso de dos
distribuciones muy conocidas, la binomial que pertenece al grupo de las discretas y la normal
que forma parte del grupo de las continuas. En la Figura 5 se ha fijado la media y variado la
desviación estándar, en la Figura 6, la desviación estándar permanece fija y la media varía,
mientras que en la Figura 7 corresponde a la distribución binomial para dos valores dados de sus
parámetros n y p.
Figura 8 Figura 9
Simulación
La utilidad de la simulación es más evidente en probabilidad e inferencia estadística. Se
pueden extraer muestras repetidas de un tamaño determinado de una distribución de probabilidad
y representar gráficamente la distribución que siguen las medias de las muestras, es decir la
distribución de muestreo, logrando con ella que el estudiante visualice un teorema de vital
importancia y sobre el que descansa una buena parte de la inferencia estadística, como es el
4
Teorema del Límite Central. En una clase tradicional solo podríamos limitarnos a que el
estudiante imagine lo que pasa al aumentar el tamaño de la muestra mediante una explicación
verbal. Sabemos que no es posible que el estudiante entienda fácilmente una demostración de
este teorema, sobre todo en un primer curso de inferencia estadística; sin embargo mediante la
tecnología se puede tener una demostración visual.
Conclusiones
Es evidente la ayuda que nos ofrece la tecnología computacional en la enseñanza de la
probabilidad y estadística; por un lado, el apoyo que brinda en la reducción de cálculos tediosos
y que requieren mucho tiempo enseñarlos en forma tradicional, y por otro lado, la visualización
de conceptos -algunos de ellos de difícil acceso sin la tecnología- además del aspecto de la
simulación, de tan vital importancia en la generación de situaciones de enseñanza que no sería
posible efectuarlas en la clase por otros métodos. Podría parecer demasiado optimista en cuanto a
los resultados que se presentan en este artículo; no se pretende hacer todo mediante la tecnología,
más bien creemos que es una ayuda valiosa que el profesor debe considerar y usarla en forma
balanceada con otras técnicas de enseñanza.
Bibliografía
Cobb (1992) Teaching Statistics, in Heeding the Call for Change: Suggestions for Curricular Action. Ed. L. Steen.
MAA Notes, No. 22.
Godino J. (1995) ¿Qué aportan los ordenadores a la enseñanza de la estadística?. Revista de Didáctica de las
Matemáticas UNO. No. 5. España.
Batanero C., Godino J, Green R., Holmes P. y Vallecillos A. (1994) Errors and difficulties in understanding
elementary statistical concepts. International Journal of Mathematics Education and Science and
Technology. 25(4).
5
Snell L. and Peterson W. (1992). Does the computer help us understanding statistics? In Statistics for the Twenty-
First Century. Ed. Florence G. and Gordon S. MAA Notes, No. 26.
Laborde C. (2000) Why technology is indispensable today in the teaching and learning of mathematics Contribution
to the T3 World-Wide conference in Tokyo, August 2000.
http://www.math.ohio-state.edu/~waitsb/t3posticme2000.html
Kutzler, B. (1999) “The Algebraic Calculator as a Pedagogical Tool for Teaching Mathematics”.
http://www.kutzler.com/main.html
Hitt F. (1998) Visualización matemática, representaciones, nuevas tecnologías y curriculum. Revista Educación
Matemática, Vol. 10, No. 2. Editorial Iberoamérica. México.
Hitt F. (2000) Construcción de conceptos matemáticos y uso de calculadoras simbólicas. Contribution to The 4°
International DERIVE-TI89/92 Conference: Computer Algebra in Mathematics Education. Liverpool UK.
Burril G. (1996) Graphing calculators and their potential for teaching and learning statistics, in Research on the Role
of Technology in Teaching and Learning Statistics. Proceedings of the 1996 IASE Round Table Conference
in University of Granada Spain. July 1996.
Waits B. and Demana F. (2000) Calculators in Mathematics Teaching and Learning Past, Present and Future.
http://www.math.ohio-state.edu/~waitsb/papers.html
Smith E. (1998) Social Constructivism, Individual Constructivism and the Role of Computers in Mathematics
Education. Journal of Mathematical Behavior Vol. 17, No. 4.
6
La Ciencia en tu Escuela1
Módulo de Matemáticas
Sesión 4: Estadística
Felipe Alfaro Aguilar
Índice
1. Introducción
2. Organización y representación de datos
3. Correlación y regresión lineal simple
4. Inferencia estadística
Introducción
En el ámbito internacional, actualmente el interés por la enseñanza de la Estadística está
cobrando un auge cada vez más considerable, los investigadores pedagogos y prestigia-
das instituciones educativas están apoyando decididamente su impartición en las escuelas
desde los niveles educativos más básicos. La razón de este movimiento se debe a la gran
importancia que está adquiriendo, por su carácter instrumental, en prácticamente todas
las disciplinas del quehacer humano.
Investigadores de la educación han señalado la conveniencia de educar estadísticamente
a los futuros ciudadanos, ya que éstos se verán en la constante necesidad de leer e inter-
pretar eficientemente tablas y gráficos estadísticos, que con frecuencia aparecen en los
medios de comunicación. Además de la utilidad que, por supuesto, representa para el
futuro desarrollo profesional de los jóvenes estudiantes, pues gran parte de las actuales
opciones educativas requieren de ella un mínimo de conocimientos elementales (Holmes,
1980).
Dentro del ambiente docente la Estadística es necesaria al menos para llevar a cabo las
siguientes 4 tareas (ICE 2001):
1. "Lectura de literatura profesional. La investigación en ciencias de la educación emplea
la Estadística como una herramienta habitual en la realización de cualquier experimen-
to. Por lo tanto, el profesor que quiera estar al día respecto a la enseñanza de su disci-
plina debe estar en condiciones de poder comprender textos de investigación docente.
2. Conocimiento de la clase. El profesor se enfrenta a la tarea de la educación de unos
alumnos ubicados en una clase, centro escolar y contexto social concreto, que van a
interaccionar con sus características personales. El conocimiento profundo de este con-
texto en que está involucrado el alumno resulta de vital importancia para el educador y
no será posible sin el análisis estadístico de los datos individuales de los elementos del
contexto.
3. Diagnosis didáctica. El profesor, a la hora de tomar decisiones acerca de sus alumnos,
contará con el apoyo del análisis comparativo de la situación relativa de cada individuo
en su clase, distintas asignaturas y distintas variables psico-sociológicas. También la
propia actividad del profesor puede verse mejorada tras un análisis del rendimiento es-
colar del grupo en su conjunto. Estas tareas requieren tratamientos estadísticos sim-
ples de los datos de los alumnos.
1
http://www.amc.unam.mx/laciencia/matsec1.htm
Didáctica de la Estocástica – 577 2
Selección de lecturas
Didáctica de la Estocástica – 577 3
Ejemplo 2.
Se les proporciona un texto a cada grupo. Tras la lectura del texto deberán elaborar una
serie de conclusiones que quedarán registradas en un cuadro de frecuencias. A partir de
estos datos, los profesores calcularán la media, moda y mediana. Posteriormente confec-
cionarán un gráfico (barras, sectores, lineal, etc.)
En el caso de los alumnos, esperamos que con todos estos datos y muchos más, éstos se
verán más familiarizados con el mundo estadístico de una forma fácil y amena. Los alum-
nos podrían debatir y comentar todos los aspectos que quieran en clase. Pueden comuni-
car datos al resto de los grupos. Al final de cada actividad se hará una puesta en común
de todos los grupos unificando los datos y los resultados obtenidos.
Tras estas actividades, los profesores pueden empezar ya a elaborar otros gráficos algo
más complicados: densidad de población, natalidad, mortalidad, migraciones... para cuya
elaboración se les proporcionarán datos actualizados de México.
También pueden realizar la lectura e interpretación de gráficos como el siguiente. Hacien-
do una valoración final de los aspectos más resaltados e importantes.
Selección de lecturas
Didáctica de la Estocástica – 577 4
Dato X Frecuencia
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
¿Qué te llama la atención de esta tabla?
Si no se te ha ocurrido nada, te ayudo con preguntas: Se llama MODA al valor más
frecuente:
¿Cuál ha sido la MODA de esta tabla?
¿La ves simétrica o asimétrica (es decir, no simétrica)?
Selección de lecturas
Didáctica de la Estocástica – 577 5
Puntuaciones f1 f2
1 30 4
2 15 9
3 25 23
4 6 34
5 4 10
a. ¿Se debe preferir la media o la mediana como índice de tendencia central? ¿Por
qué?
b. Calcula la más adecuada para ambas proposiciones.
Selección de lecturas
Didáctica de la Estocástica – 577 6
c. Comenta a partir de ellas el grado de acuerdo de la muestra ante las dos proposi-
ciones.
Ejemplo 5. En la siguiente tabla aparecen las distribuciones de frecuencias de la variable
X: puntuación obtenida en una prueba de la asignatura de Química realizada en cuatro
grupos A, B, C y D de primero de Bachillerato de 100 alumnos cada uno. Compara estas
distribuciones visualmente, sin ningún tipo de cálculo, en cuanto a propiedades estadísti-
cas (tendencia central, variabilidad, simetría,...) y ofrece al profesor de cada grupo suge-
rencias didácticas para optimizar el funcionamiento de la clase.
Puntuación A B C D
10 5 2 1 6
9 10 5 2 8
8 15 8 3 9
7 22 10 6 10
6 16 15 8 11
5 12 20 12 12
4 8 15 16 11
3 6 10 22 10
2 3 8 15 9
1 2 5 10 8
0 1 2 5 6
Selección de lecturas
Didáctica de la Estocástica – 577 7
Mujer Sra. Sra. Sra. Sra. Sra. Sra. Sra. Sra. Sra. Sra.
A B C D E F G H I J
Antes del trata- 115 112 107 119 115 138 126 105 104 115
miento
Después del trata- 128 115 106 128 122 145 132 109 102 117
miento
Usando la información contenida en esta tabla,
¿Piensa que la presión sanguínea en esta muestra depende del momento de que se
tome, antes o después del tratamiento?
Razone la respuesta.
Ítem 3: En un estudio sociológico, se han recogido datos relativos a la tasa de natalidad
y el consumo diario de proteínas animales en diferentes países representándolos en el
gráfico de la figura 1. ¿Cree que la relación entre el consumo diario de proteínas animales
y la tasa de natalidad en los diferentes países es directa, inversa o no existe relación en-
tre estas variables? Razone su respuesta.
Ítem 4: Numerosas investigaciones señalan que ver la televisión con asiduidad afecta al
rendimiento escolar de los niños. Se ha preguntado a 10 niños de 6º de Primaria el
número de horas semanales que dedican a ver la televisión (Variable X) Hemos llamado
variable Y a la nota media de la última evaluación. Los datos obtenidos son los siguientes:
X Y
9 5
10 6
4 10
10 7
8 4
6 6
4 9
9 8
5 8
3 9
a) ¿Compruebe gráficamente si hay relación lineal entre las dos variables?
b) ¿Qué conclusión se puede obtener de dicho resultado?
4.Inferencia estadística.
POBLACIÓN Y MUESTRAS
Distinguir entre una muestra y una población es fundamental en un estudio estadístico.
Lo siguiente ilustra esta diferencia a la perfección:
Selección de lecturas
Didáctica de la Estocástica – 577 8
Un ejemplo que encaja perfectamente por la relevancia y las repercusiones que ha tenido
es la evaluación internacional (TIMSS) en la que participó nuestro país en 1995, sobre
Matemáticas y Ciencia para estudiantes de la escuela primaria y secundaria. Dicha eva-
luación, por supuesto, no se realizó sobre todo el universo de estudiantes involucrados
que son varios millones, lo que resultaría muy costoso tanto en tiempo como económica-
mente; en su lugar, lo que se hace es seleccionar adecuadamente una muestra represen-
tativa de los estudiantes, y sólo a ellos se practican las evaluaciones. Posteriormente, las
evaluaciones obtenidas para esta muestra se extienden al conjunto completo de estudian-
tes.
PREGUNTAS EN UN MUESTREO
1. Imagina que de la población formada por todos los alumnos de tu escuela, extraes
aleatoriamente una muestra de 40 alumnos, y les preguntas por su edad, encon-
trando que la edad media obtenida es de 15,8 años. Pero,
¿Qué ocurriría, si extrajéramos otra muestra?
¿Coincidirían las medias?
¿Y coincidirían con la media de la población, es decir, con la media de toda la escue-
la?
Selección de lecturas
Didáctica de la Estocástica – 577 9
Lo cierto es que parece lógico pensar que aunque no tengan porqué coincidir, si de-
berían estar bastante próximas. Pero,
¿Cuán próximas?
¿Dependería esta proximidad del tamaño de las muestras que elegimos?
2. Un profesor quiere medir la eficacia del uso sistemático de la hemeroteca para la
enseñanza de la historia contemporánea. Este profesor no puede realizar un estudio
que involucre a todos los estudiantes de todo el país, así que decide realizar un ex-
perimento con los dos grupos de los cuales el mismo es profesor. En primer lugar
confecciona una prueba de conocimientos previos de un tema de la asignatura y la
pasa a sus alumnos. En la clase A, aparte de la clase habitual, pide a sus alumnos
que lean algunos periódicos que reflejen algún aspecto del tema. En la clase B, se
limita a dar su clase habitual. Cuando acaba de explica el tema examina a sus
alumnos. Ahora, con ayuda de la Estadística, puede responder algunas preguntas
como:
¿Obtienen mejores notas los alumnos de la clase A que los de la clase B?
¿Partían del mismo nivel de conocimientos previos?
¿Podría este hecho influir sobre los resultados del experimento?
¿Se pueden generalizar los resultados del experimento de este profesor?
ACTIVIDADES DE MUESTREO
1. Encuentra en un periódico o revista, un artículo o información en la que a tu juicio
se esté haciendo uso de una muestra.
2. Utilizando una tabla de números aleatorios, elige 15 elementos de una población
numerada del 1 al 89.
3. Dí de que forma elegirías una muestra de 50 alumnos de tu escuela, por muestreo
aleatorio simple, sistemático y estratificado (cada estrato una clase, o un nivel)
4. Establece un método para elegir una muestra de vecinos de una calle.
5. Si pretendieras hacer una encuesta a una muestra de tamaño 50, ¿cómo la tomar-
ías?, ¿Sería indiferente el aspecto estadístico que tuvieras que estudiar?
6. Un hospital dispone de un listado de los pacientes, organizados por áreas de aten-
ción (neurología, traumatología, etc.) Dí que tipos de muestreo podrían realizarse, y
como los harías.
7. Para realizar una encuesta sobre el consumo de un producto en una ciudad, se tomó
una muestra de forma que de cada barrio se consultaba a un número de personas
proporcional a la superficie ocupada por el barrio. ¿Te parece un método fiable? Es-
cribe un comentario.
8. Un mayorista de alimentos, quiere enviar muestras de sus productos, a una mues-
tra de supermercados. Elige de las 5 grandes cadenas de supermercados, una
muestra de cada una, y manda sus productos para ponerlos a prueba. ¿Qué tipo de
muestreo está utilizando?
BIBLIOGRAFÍA
Batanero, C. (1998) Recursos para la educación estadística en Internet. UNO, 15, 13-26.
Batanero C., Godino J., Estepa A., (1998) Construcción del significado de la asociación
estadística mediante actividades de análisis de datos. Proceedings of the 22nd Confe-
Selección de lecturas
Didáctica de la Estocástica – 577 10
Selección de lecturas