Sunteți pe pagina 1din 120

Didáctica de la Estocástica – 577 2

La aleatoriedad, sus significados e implicaciones educativas


Carmen Batanero Bernabeu, Luis Serrano Romero
UNO, 1995, 5, 15-28.
Resumen
En este trabajo presentamos un análisis de los diferentes significados asociados al término
aleatoriedad a lo largo de su evolución histórica y un resumen de las investigaciones sobre la
percepción de la aleatoriedad por parte de niños y adolescentes. Finalizamos con algunas
sugerencias sobre la enseñanza de la probabilidad que posibiliten a los alumnos y alumnas a
adquirir gradualmente un conocimiento adecuado de las características de los fenómenos
aleatorios.
Summary
ln this article we present an analysis of the diffetent meanings that have been associated with
the term randomness throughout its historical evolution, together with a brief account of rese-
arch into the way children and teenagers understand this concept. We finish with some sug-
gestions fot the teaching of ptobability which may help students to learn gradually the charac-
teristics of random phenomena.
INTRODUCCIÓN
Las cuestiones epistemológicas ocupan un lugar fundamental en la reflexión de las personas
interesadas por el aprendizaje de las matemáticas. Ello es debido a que los obstáculos surgidos
históricamente en la formación de los conceptos se reproducen, con cierta frecuencia, en los
alumnos. Otras veces, los estudios de tipo epistemológico pueden ayudar a comprender las
dificultades de los alumnos en el uso de los conceptos para la resolución de problemas.
El cálculo de probabilidades ocupa una situación muy particular a este respecto, ya que, a pe-
sar de contar con una axiomática satisfactoria, prosiguen las controversias sobre la interpreta-
ción de conceptos básicos, como los de probabilidad o independencia. Estas controversias no
son de tipo técnico, ya que el cálculo de probabilidades, como tal no plantea contradicciones
ni paradojas, como ocurriera en el caso de la teoría de conjuntos, ni se han propuesto otras
axiomáticas que compitan con éxito con la de Kolmogorov. Los problemas que la axiomatiza-
ción no ha resuelto se refieren a la naturaleza de los objetos que se representan por medio de la
probabilidad. Como indica Matalón (1 979), de modo más o menos explícito, todos los teóri-
cos admiten que el cálculo de probabilidades formaliza algo que, en cierto sentido »existe» en
todas partes; las divergencias se, refieren a la naturaleza de ese »algo», el cual estaría repre-
sentado a través de la probabilidad matemático (pág. 121).
En este trabajo vamos a presentar un reflexión epistemológica -desde una perspectiva didácti-
ca- sobre la noción de aleatoriedad, la cual, junto con la idea de probabilidad es punto de par-
tida del cálculo de probabilidades. El interés y necesidad de este estudio parece claro, ya que
la mayor parte de los nuevos currículos de matemáticas de los niveles de enseñanza obligatoria
proponen intensificar el estudio de los fenómenos aleatorios. Las expresiones "experimento
aleatorio", "suceso aleatorio", incluso los sustantivos el "azar", "aleatorio", aparecen con fre-
cuencia, tanto en el lenguaje cotidiano, como en los manuales escolares. Pero su significado, al
referirse a una entidad abstracta, no queda unívoca y nítidamente determinado, lo cual creará
dificultades de comprensión en los estudiantes.

Selección de lecturas
Didáctica de la Estocástica – 577 3

Como afirmamos en Godino y Batanero (1994), el significado de los objetos matemáticos no


puede reducirse a su mera definición matemática cuando nos interesamos por los procesos de
enseñanza y aprendizaje de los mismos. Las diversas situaciones problemáticas y las prácticas
que hacen las personas para resolverlas en distintas instituciones y momentos históricos apor-
tan rasgos característicos de las nociones que en ellas intervienen, los cuales deben ser tenidos
en cuenta en la enseñanza.
En lo que respecta a la noción de aleatoriedad, veremos en este trabajo que en distintos mo-
mentos históricos se ha interpretado de forma diferente y que, incluso en la actualidad, se re-
siste a una definición sencilla que permita determinar con nitidez si un suceso o una secuencia
de sucesos es o no aleatoria. Por este motivo presentaremos una discusión de estas cuestiones,
a partir de las reflexiones realizadas por estadísticos, filósofos, psicólogos e investigadores en
Didáctica de la Matemática preocupados por este problema.
ALEATORIEDAD Y CAUSALIDAD
Una primera acepción de lo aleatorio la podemos encontrar en el diccionario del uso del espa-
ñol de M. Moliner (1 983), donde encontramos la siguiente definición: Incierto. Se dice de
aquello que depende de la suerte o del azar, siendo el azar la supuesta causa de los sucesos
no debidos a una necesidad natural ni a una intervención humana o divina.
En esta acepción lo aleatorio seria contrapuesto a aquello de lo que se conoce sus causas y el
"azar" estaría personificado como una supuesta causa de los fenómenos aleatorios. Esta acep-
ción correspondería a una primera fase histórica exploratoria en el desarrollo de la idea de
aleatoriedad que se extendería, según Bennet (1993) desde la antigüedad hasta el comienzo de
la Edad Media. En esta etapa los dispositivos aleatorios como dados o huesos de astrálago, se
usaron para adivinar el futuro, tomar decisiones y en los juegos, cuando se quería impedir dar
ventaja a alguna de las partes interesadas, puesto que se suponía que lo aleatorio no podía ser
controlado humanamente.
Se atribuyese a fuerzas sobrenaturales o no, el azar suprimía la posibilidad de que la voluntad,
inteligencia o conocimiento humano influenciara la decisión o el destino. Poincaré (1936) in-
dicó que los clásicos diferenciaban los fenómenos que parecían obedecer a leyes armónicas,
establecidas de una vez para siempre, y aquellos que atribuían al azar, que no podían preverse
porque se rebelaban ante toda ley. Según este autor, la aleatoriedad tenia, además, un sentido
preciso, objetivo. Lo que era aleatorio lo era para cualquier persona.
Una variante de esta acepción es suponer que todo fenómeno tiene una causa. Nada sucede
por azar sino que todo ocurre por una razón y por una necesidad (Leucippus, siglo V a. C.,
citado por Bennett).Es debido a nuestra ignorancia por lo que existe "el azar" para nosotros.
Incluso lo que es aleatorio para una persona puede no serlo para otra, por lo que, en esta acep-
ción, tendría un carácter subjetivo: El azar no es más que la medida de nuestra ignorancia.
Los fenómenos fortuitos son, por definición aquellos cuyas leyes ignoramos. (Poincaré, 1 936,
pág. 69 de la reproducción en el libro de Newmann).
Poincaré encuentra que esta definición no es satisfactoria, ya que ciertos fenómenos cuyas
leyes no conocemos son, sin embargo, considerados como deterministas. No sabemos con
seguridad por qué llegado a un punto de envejecimiento morimos, pero la muerte es conside-
rada un hecho seguro, lo mismo que lo será la puesta del sol para un niño o una persona primi-
tiva que desconociera el fenómeno de rotación de la Tierra. Además, ciertas teorías físicas,
como la teoría cinética de los gases, tienen causas conocidas que son explicadas precisamente

Selección de lecturas
Didáctica de la Estocástica – 577 4

mediante leyes probabilísticas. Las leyes que se utilizan para explicar estos fenómenos serían
mucho más complicadas si, en lugar de emplear la hipótesis de que las partículas se mueven
aleatoriamente, se supusiera que siguen una cierta ecuación de tipo determinista. Por ello, en-
tre los fenómenos de los cuales ignoramos sus leyes, Poincaré diferencia los aleatorios o for-
tuitos, sobre los cuales el cálculo de probabilidades nos informará provisionalmente y los que
no lo son, sobre los cuales no hay esta posibilidad de predicción hasta que hayamos encontra-
do las leyes que los rigen.
Para los primeros, incluso el día que encontremos sus reglas, el cálculo de probabilidades no
perderá su validez. Así, el director de una compañía de seguros de vida ignora cuándo morirá
un asegurado particular. Sin embargo, sus beneficios seguirán siendo los mismos, incluso
cuando conociese el tiempo de vida que queda a cada uno de estos asegurados, porque la dis-
tribución estadística de esta población sería la misma, independientemente de este conoci-
miento; por tanto, estos beneficios no son fruto de su ignorancia. Como indica Ayer (1974) un
fenómeno se considera aleatorio si se comporta de acuerdo al cálculo de probabilidades. Una
causa muy pequeña determina, a veces, un efecto considerable y decimos que el resultado es
aleatorio porque la predicción resulta imposible. Es el caso de la meteorología o del juego de
la ruleta. En otros casos, como en la teoría cinética de los gases, al barajar las cartas o en la
teoría de errores, es la complejidad o multitud de las causas lo que determina un resultado
aleatorio.
ALEATORIEDAD Y PROBABILIDAD
Al surgir el cálculo de probabilidades se relaciona la aleatoriedad con la equiprobabilidad, que
se basa en el principio de indiferencia. Esto es debido a la relación de los primeros desarrollos
teóricos con los juegos de azar, en los que el número de posibilidades era finito y el principio
de indiferencia podía considerarse razonable. Esta interpretación se encuentra, por ejemplo, en
el Liber de Ludo Aleae de Cardano. Bennett (l993) indica que, hacia el final del siglo XVIII y
principios del XIX, hay un desplazamiento de las situaciones consideradas aleatorias, desde el
mundo de los juegos de azar al de los fenómenos naturales. Paralelamente, se produce un
cambio en el concepto de aleatoriedad, que se hace progresivamente más formalizado. Se in-
troduce el concepto de "independencia", que se considera un requisito imprescindible para
asegurar la aleatoriedad de un suceso en sucesivos experimentos repetidos. Sin embargo, el
resultado de un experimento aleatorio es para estos autores determinado pero desconocido,
dependiente de la ignorancia del hombre.
También actualmente la noción de aleatoriedad se explica, a veces, en términos de probabili-
dades y esta explicación dependerá de la concepción subyacente respecto a la probabilidad. En
un concepto clásico de probabilidad decimos que un objeto (o un suceso) es un miembro alea-
torio de una cierta clase, si la probabilidad de este objeto es igual que la de cualquier otro
miembro de su clase. Aunque esta definición, en principio, es suficiente para los juegos de
azar basados en dados, monedas, cartas, extracción de bolas en urnas, etc., podemos aplicarle
las mismas críticas que se atribuyen a la concepción laplaciana de la probabilidad. Es difícil, a
partir de esta definición, discriminar un miembro aleatorio o no aleatorio en una clase dada.
Por ejemplo, ¿cómo sabemos que una moneda dada o un dado, no están ligeramente sesgados?
Kyburg (1975) sugiere que este método de definir la aleatoriedad impone restricciones severas
y no naturales a la aplicación de esta idea. Sólo podríamos decir que un objeto es un miembro
aleatorio de una clase, si la clase es finita. Si fuese infinita, entonces la probabilidad de cada

Selección de lecturas
Didáctica de la Estocástica – 577 5

miembro de la clase siempre sería nula (por tanto idéntica), aunque el método de selección
fuese sesgado. ¿Qué ocurriría, además, en el caso de sucesos elementales no equiprobables?
Sin embargo, la idea de equiprobabilidad es muy atrayente para definir la aleatoriedad, como
se ve, por ejemplo, al definir las muestras aleatorias -todos los elementos tienen la misma pro-
babilidad de ser elegidos- o la asignación aleatoria de sujetos a los experimentos -cada sujeto
tiene la misma probabilidad de ser asignado al grupo experimental o al control-.
Cuando desplazamos la aplicación de la idea de probabilidad a situaciones del mundo físico o
natural, como por ejemplo, el grupo sanguíneo de un recién nacido o cualquier o otra carac-
terística hereditaria, nos encontramos con que no podemos aplicar el principio de equiprobabi-
lidad. Podríamos decir, en estos casos, que un objeto es un miembro aleatorio de una clase si
pudiéramos elegirlo mediante un método que proporcionase a cada miembro de la clase una
cierta frecuencia relativa "a priori" a la larga. Usaríamos, en estos casos, la concepción fre-
cuencial, que es especialmente adecuada cuando disponemos de estadísticas registradas sobre
un gran número de casos, como en los ejemplos citados. Tendríamos, sin embargo, el proble-
ma teórico de decidir el número necesario de experimentos para considerar que, a partir de
este número, habríamos probado suficientemente el carácter aleatorio del objeto.
En estas dos acepciones la aleatoriedad es una propiedad "objetiva" que se asigna al suceso o
elemento de una clase, como podría asignársele un color o un sexo, si se trata de una persona.
Kyburg (1 974) crítica esta visión y propone una interpretación de la aleatoriedad compuesta
de cuatro términos, que son los siguientes:
• el objeto que se supone es miembro aleatorio de una clase;
• el conjunto del cual el objeto es un miembro aleatorio (población o colectivo);
• la propiedad con respecto a la cual el objeto es un miembro aleatorio de la clase dada;
• el conocimiento de la persona que emite el juicio de aleatoriedad.
Si un objeto es o no considerado como miembro aleatorio de una clase, depende, en esta inter-
pretación, de nuestro conocimiento sobre el mismo. Lo que puede ser aleatorio para una per-
sona puede no serlo para otra. La aleatoriedad no es una propiedad física "objetiva", sino que
tiene un carácter subjetivo. Reconocemos en esta definición el paralelismo con la concepción
subjetiva de la probabilidad, por la que todas las probabilidades serían condicionales. Esta
visión sería más adecuada en las situaciones en que poseemos cierta información que puede
cambiar nuestro juicio sobre la aleatoriedad o la probabilidad de un suceso.
Para Kyburg hay cierta clase de situaciones que todo el mundo consideraría aleatorias y donde
el uso de la idea de equiprobabilidad para definir un suceso aleatorio parece claro y no contro-
vertido. Por ejemplo, en el caso de un dado equilibrado, cualquier lanzamiento es simplemente
un ejemplo de cualquier otro posible lanzamiento. No hay nada nuevo que podamos conocer
acerca del dado que nos permita predecir otra probabilidad diferente de l/6 para un resultado
particular del dado.
En otros casos la situación no es tan clara. Consideremos, por ejemplo, la probabilidad de que
un individuo particular viva más de 35 años. Es verdad que poseemos información estadística
sobre sus posibilidades de supervivencia a esta edad, pero hay muchas consideraciones que
podrían influenciar un cambio en esta probabilidad, si tuviésemos que estimarla. Por ejemplo,
el hecho de que el sujeto sufriera cierta enfermedad, como cáncer o ~ sida, o que fuese piloto
de carreras.

Selección de lecturas
Didáctica de la Estocástica – 577 6

En este ejemplo reconocemos la importancia de elegir la clase de referencia adecuada para


juzgar la probabilidad de un cierto suceso. Asimismo podemos ver aquí la importancia del
cuerpo de conocimiento, puesto que, si el sujeto en cuestión sufre una enfermedad muy grave
y yo lo supiera, me llevaría a hacer una estimación diferente de sus esperanzas de vida.
PROCESOS Y SECUENCIAS ALEATORIAS
Para Zadell (1 992) la idea de aleatoriedad contiene dos aspectos distintos que, a o veces, pue-
den no coincidir, que son:
• el proceso de generación, que es lo que, matemáticamente se conoce como experimen-
to aleatorio;
• el patrón de la secuencia aleatoria producida como consecuencia del experimento.
Hasta ahora hemos considerado que estos dos aspectos están ligados entre si, ya que espera-
mos que un proceso aleatorio proporcione un patrón de resultados aleatorios. Veremos que
estos dos aspectos son separables.
En primer lugar, puede haber secuencias que, aparentemente, parezcan aleatorias, siendo pro-
ducidas por un proceso completamente determinista. Consideremos, por ejemplo la secuencia
32823066470938446095. Por su aspecto, parece ser una secuencia aleatoria de números. Pero,
en realidad, es la expresión de los dígitos decimales 111 al 130 del número Pi. Aunque el
patrón que sigue esta secuencia parezca aleatorio, el proceso que la genera no lo es, porque
siempre obtendremos la misma secuencia de cifras como resultado del "experimento".
Por otro lado, incluso una secuencia aparentemente regular y determinista, como 100100 100,
puede obtenerse como resultado de un experimento aleatorio. Esta secuencia particular es tan
probable como cualquier otra secuencia de ceros y unos obtenida en 9 ensayos en que los valo-
res 1 y O sean equiprobables. Su probabilidad será 2-9. Si repetimos el experimento un número
mayor que 29 veces, cabe esperar que se obtenga alguna vez la sucesión dada por azar.
No fue hasta finales del siglo XIX cuando el empleo de la estadística en la investigación apli-
cada empezó a basarse en la elección de muestras aleatorias de datos, a partir de los trabajos
de Edgeworth, Galton, Pearson, Fisher y sus colaboradores. Anteriormente, los estudios es-
tadísticos estaban basados en la recogida de datos empíricos masivos, esto es, tenían un carác-
ter descriptivo de poblaciones completas, más que un carácter inferencial. En los casos en que
se utilizaban muestras, éstas no se elegían al azar, porque no se era consciente de la importan-
cia de elegir muestras aleatorias para poder realizar inferencias válidas y precisas sobre la po-
blación. Cuando los desarrollos teóricos empiezan a mostrar la importancia de este punto, em-
pieza el interés por encontrar modelos de procesos que aseguren la consecución de largas se-
cuencias de dígitos aleatorios. Éstos serían utilizados para elegir muestras aleatorias en las
aplicaciones estadísticas.
PROCESOS QUE GENERAN SUCESIONES ALEATORIAS
Hay tres modelos básicos de procesos que se emplean para generar secuencias aleatorias: dis-
positivos físicos; las tablas de números aleatorios y los generadores de números pseudoaleato-
rios.
Ciertos procesos físicos pueden generar resultados aleatorios, como, por ejemplo, elegir a cie-
gas una bola de una urna llena de bolas de distinto color. Este tipo de dispositivos -dados; rule-
tas; bombos con fichas,...- es el sistema más antiguo, familiar y natural de obtener tales resul-

Selección de lecturas
Didáctica de la Estocástica – 577 7

tados aleatorios. Es el método que también empleamos en clase con nuestros alumnos, aprove-
chando el interés que muestran por los juegos de azar. Sin embargo, es muy difícil conseguir
construir dispositivos que aseguren la aleatoriedad física perfecta, por ejemplo, asegurar que
un dado asigne exactamente una probabilidad 1/6 a cada una de sus caras. Además, es un pro-
cedimiento lento si queremos obtener una serie larga de resultados aleatorios.
Debido a la dificultad de disponer con suficiente rapidez de secuencias aleatorias largas con
dispositivos físicos, se crean las tablas de números aleatorios. Lord Kelvin y Típpet se encuen-
tran entre los pioneros en la construcción de las mismas. Otras tablas notables son las de Fis-
her y Yates publicadas en 1 938, o las de Kendall y Babbington- Smith, en 1 939, culminando
en la publicación de la corporación RAND "Un millón de dígitos aleatorios" en 1955. Este
tipo de tablas puede también ser usado en clase con los alumnos de educación secundaria.
El tercer método importante para generar números aleatorios consiste en el uso de una fórmu-
la, es decir, mediante los llamados "números pseudoaleatorios". Con ayuda de un algoritmo de
ordenador, se produce una secuencia numérica que puede ser empleada como aleatoria para
los propósitos prácticos. La mayor parte de los ordenadores traen incorporadas este tipo de
órdenes, con lo que podemos cómodamente obtener sucesiones aleatorias dentro de una mag-
nitud numérica y longitud deseada. Asimismo, podemos obtener sucesiones aleatorias extraí-
das de distintos tipos de distribución teórica, como la distribución normal con una cierta media
y varianza.
FORMALIZACIÓN DE LA IDEA DE ALEATORIEDAD
Con las tablas de números aleatorios surgió la preocupación de asegurar la "calidad" de los
mismos. La obtención de números pseudoaleatorios con ayuda de algoritmos deterministas
sugirió también que debía examinarse la sucesión producida, independientemente del proceso
por el cual había sido generada. En el siglo XX se llevan a cabo estas discusiones, que llevar-
ían a la formalización del concepto.
Fine (1973) discute algunas de las aproximaciones que se han usado para definir lo que sería
una sucesión aleatoria. La reflexión sobre este tema partió de la idea intuitiva de que una suce-
sión debería ser considerada como aleatoria si nos llevara al convencimiento de que es impo-
sible inventar un método que nos permita ganar en un juego de azar cuyos resultados fuesen
los de la sucesión dada; o bien de la visión de la sucesión aleatoria como altamente irregular o
compleja. A continuación presentamos estos dos enfoques:
Enfoque de los algoritmos de selección
Von Mises introdujo la idea de colectivo, como fenómeno de masas, suceso repetitivo o larga
serie de observaciones, para las cuales hay razones suficientes para creer en la hipótesis de que
la frecuencia relativa de un suceso tiende a un límite fijo. A partir de esta idea, definió la alea-
toriedad en una secuencia de observaciones proponiendo una propiedad para todas sus posi-
bles subsucesiones. Esta propiedad consiste en exigir que la frecuencia relativa de cada posible
suceso en la sucesión aleatoria sea invariante en todas sus posibles subsucesiones. Dicho de
otra forma, en una secuencia aleatoria no puedo encontrar un algoritmo por el cual seleccionar
una subsecuencia en la cual la frecuencia relativa de uno de los resultados se vea afectada.
Supongamos, por ejemplo, que al elegir todos los elementos pares, o cada diez elementos, o
todos los elementos primos en una sucesión de caras y cruces obtenidas al lanzar una moneda
obtuviese una secuencia en la que la probabilidad de cara fuese 2/3. Consideraría, entonces,

Selección de lecturas
Didáctica de la Estocástica – 577 8

que la secuencia dada no era realmente aleatoria, ya que podría obtener ventaja en un juego de
azar apostando a favor de la cara cada dos, diez jugadas o en las jugadas número primo.
Esta definición de aleatoriedad es la base de los contrastes por los cuales se prueban las tablas
de números aleatorios, antes de ponerlas en uso en la comunidad científica. Los algoritmos
que se usan tratan de detectar las posibles regularidades de la sucesión; (propiedades que pu-
diesen emplearse para obtener ventajas por parte de un jugador en un juego de azar). Sin em-
bargo, puesto que todo contraste de hipótesis siempre lleva asociado una posible probabilidad
de error, nunca podríamos tener total seguridad de que una sucesión dada, a pesar de haber
pasado todas las pruebas, tuviese algún tipo de patrón que nos hubiera pasado desapercibido y,
por tanto, no fuese totalmente aleatoria.
Enfoque de la complejidad absoluta
Otro intento, debido a Kolmogorov, de definir la aleatoriedad de una sucesión se basa en su
complejidad computacional, que puede definirse a partir de la teoría de autómatas y conmuta-
bilidad. La complejidad de una sucesión es la dificultad de describirla (o almacenarla en un
ordenador) mediante un código que nos permita reconstruirla más tarde. El mínimo número de
signos necesarios para codificar esta sucesión proporciona una escala para medir la dificultad
de almacenarla, o, lo que es lo mismo, su complejidad. En general, puede haber más de un
programa para la misma sucesión. La complejidad debe ser juzgada a partir de la forma más
simple de almacenar la sucesión. Por ejemplo, si comparamos las secuencias:
CC++C+CC++
C+C+C+C+C+
vemos que puedo codificar más abreviadamente la primera como CC+2+CC++, mientras que
la segunda la podríamos codificar como 4C+. Por lo tanto la primera sucesión es más compleja
que la segunda, ya que precisa más signos para codificarse. Bajo este enfoque, una secuencia
sería aleatoria si no se puede codificar en forma más abreviada, por lo que la ausencia de pa-
trones periódicos sería su característica esencial. Es decir, una secuencia sería aleatoria si sólo
podemos describirla listando uno tras otros todos sus componentes, Chaitin sugirió que esta
definición establece una jerarquía en los grados de aleatoriedad de diferentes sucesiones y que
la aleatoriedad perfecta sería vista como un concepto teórico o límite.
Como resumen, y siguiendo a Steinbring (1991), podríamos señalar que el concepto de aleato-
riedad se refiere a dos dominios diferentes; formal e informal. Desde el punto de vista infor-
mal, hablamos del azar, como patrón que explica aquellos efectos para los que no conocemos
la causa o que no son predecibles. Se ha usado para tratar relaciones causa efecto que parecen
demasiado complejas para ser analizadas o en las que no hay una relación determinista entre
causa y efecto. Esta interpretación refleja muchos aspectos filosóficos epistemológicos socia-
les y personales, y es una importante fuente de confrontación entre las probabilidades subjeti-
vas y objetivas.
Desde el punto de vista formal (Harten y Steinbring, 1983) el concepto se ha especializado,
siendo la idea central de esta especialización la de sucesión aleatoria o sucesión de resultados
de un mismo experimento realizado repetida e independientemente, cuya matematización
hemos descrito.

Selección de lecturas
Didáctica de la Estocástica – 577 9

LA ALEATORIEDAD DESDE EL PUNTO DE VISTA PSICOLÓGICO: PERCEP-


CIÓN SUBJETIVA DE LA ALEATORIEDAD
Al introducir un nuevo tema como objeto de enseñanza, una cuestión fundamental es conocer
la posibilidad de comprensión por parte de los estudiantes. ¿Son capaces los niños de diferen-
ciar los fenómenos aleatorios de los deterministas? ¿Qué características atribuyen a las se-
cuencias aleatorias? ¿Existen ideas previas que dificulten el aprendizaje? Este tema ha sido
objeto de atención por parte de numerosos investigadores, como puede verse en las revisiones
bibliográficas de Scholz (1991) y Shaughnessy (1992).
Piaget e Inhelder (1951) vieron el desarrollo de la idea de azar en el niño como complementa-
ria a la de la relación causa-efecto. Para ellos, sin esta comprensión de la causación, no hay un
marco de referencia para identificar los fenómenos aleatorios. En consecuencia, hasta la etapa
de las operaciones concretas en la que hay cierta apreciación de los factores que caracterizan
los fenómenos causados, el niño y la niña no pueden comprender la idea de azar.
Según este autor, el azar se concibe como debido a la interferencia de una serie de causas in-
dependientes y la «no presencia» de todas las combinaciones posibles, salvo en el caso en que
hubiera un gran número de repeticiones del experimento. Cada caso aislado es indeterminado
o imprevisible, pero el conjunto de posibilidades puede determinarse mediante un razonamien-
to de tipo combinatorio, con lo que se vuelve previsible. Esta es la vía por la que aparece la
idea de probabilidad, como razón entre las posibilidades de un caso y el conjunto de posibili-
dades. Por tanto, la idea de azar, para Piaget, lo mismo que la de probabilidad, no puede ser
totalmente comprendida hasta que se desarrolle el razonamiento combinatorio, en la etapa de
las operaciones formales (12- 14 años).
Hoeman y Ross (1 982) señalan que, en las primeras etapas de los estadios descritos por Pia-
get, hay una falta de diferenciación entre sucesos causados y aleatorios; la natural inclinación
de la persona a buscar el orden y estructura, incluso donde no existe, puede explicar la incapa-
cidad de los niños pequeños para comprender apropiadamente la aleatoriedad.
Algunos autores han documentado la dificultad que tienen los niños y niñas para diferenciar
los aspectos deterministas de los aleatorios. Por ello explican sus ganancias altas o bajas en un
juego de azar como el resultado de la habilidad o concentración. Por ejemplo, Fischbein y Ga-
zit (1984) estudiaron estas creencias y, en Fischbein y cols. (1991), muestran que algunos es-
tudiantes suponen que es posible controlar un experimento aleatorio si lo repiten varias veces.
Piaget e lnhelder (1951) investigaron la comprensión de los niños y niñas patrones que apare-
cen en las secuencias de resultados aleatorios. Diseñaron un aparato que simulaba la caída de
gotas de lluvia sobre las baldosas de un pavimento. El deseo de regularidad dominó las predic-
ciones de los niños. Al preguntarles dónde siguiente gota de lluvia, los niños del estadio I (6 a
9 años) las distribuían aproximadamente en igual número sobre cada cuadro de la cuadrícula.
Si la retícula tenia cuadros con alguna gota, excepto un cuadro vacío, los niños colocaban la
gota en vacío de modo que se lograse un patrón uniforme. Al aumentar la edad, y aparece el
razonamiento proporcional y se acepta la irregularidad de la distribución. Piaget e lnhelder
indican que los niños comprenden la ley de los grandes números, que contempla a la vez la
regularidad global y la variabilidad particular de cada experimento. Sin embargo, esto es dis-
cutido por Green (1983, 1 989, 1991), quien en sus investigaciones con 2.930 res observó que
el porcentaje de los que reconocían la distribución aleatoria o semi aleatoria descendía al au-
mentar la edad.

Selección de lecturas
Didáctica de la Estocástica – 577 10

Green (1991) describe un estudio longitudinal sobre conceptos de aleatoriedad con escolares
de 7 a 11 años en el que pide a los niños escribir una sucesión aleatoria de caras y cruces que
represente los resultados de lanzar 50 veces una moneda. Identifica tres aspectos básicos en las
sucesiones generadas por los niños: la frecuencia relativa, la independencia y la consistencia.
En primer lugar, se preguntó si los alumnos, en promedio, producen aproximadamente el
mismo número de caras que de cruces. El estudio probó que son muy exactos al reflejar la
equiprobabilidad. Además producen sucesiones cuya primera y última mitad son altamente
consistentes; quizás demasiado consistentes para reflejar la variabilidad aleatoria, sin embargo,
los aspectos de independencia de ensayos no son captados por los niños, quienes producen
series con rachas demasiado cortas de un mismo resultado, respecto a lo que cabe esperar en
un proceso aleatorio.
En Green (1983) incluye, como parte de su test sobre intuición probabilística, una pregunta en
la cual los niños deben discriminar una sucesión cuyo patrón es aleatorio de otra que no cum-
ple esta condición. Las dos sucesiones propuestas simulan el resultado de lanzar 150 veces una
moneda equilibrada. Como resultado descubre que la mayoría de los niños elige precisamente
la secuencia no aleatoria y que no mejora la apreciación de la aleatoriedad con la edad. Entre
las razones aducidas por los niños y niñas para su decisión encontró las siguientes:
a. Razones correctas:
1. El patrón de la sucesión es demasiado regular para ser aleatorio.
2. Demasiadas rachas o rachas demasiado cortas.
b, Razones incorrectas:
1. El patrón de la sucesión aleatoria es demasiado irregular; no se apreciaba suficiente-
mente la irregularidad de una sucesión aleatoria.
2. Se espera que la frecuencia relativa sea exactamente el 50% de caras y cruces o un va-
lor muy próximo; no se admiten fluctuaciones lógicas en esta proporción, es decir, se
aplicaría la heurística de la representatividad (Kahneman y cols., 1 982).
3. Rachas demasiado largas; no se admite la posibilidad de este tipo de rachas en una su-
cesión aleatoria.
Resultados similares se han obtenido en las investigaciones con sujetos adultos en los que se
observa, en general, que no se reconoce suficientemente la irregularidad propia de las sucesio-
nes aleatorias. Respecto a los experimentos aleatorios Konold y cols. (1991) caracterizan las
concepciones de los sujetos en la siguientes categorías:
• Sujetos para los que un experimento es aleatorio sólo si los posibles resultados son
igualmente probables; si las probabilidades de los sucesos implicados son muy diferen-
tes -como el caso de que llueva un día para el que se predice un 80% de posibilidades
de lluvia- no sería considerado aleatorio.
• Aleatoriedad como contrapuesta a la causalidad, o como un tipo especial de causa.
• Aleatoriedad como incertidumbre; existencia de múltiples posibilidades en las mismas
condiciones.
• Aleatoriedad como modelo para representar ciertos fenómenos, dependiente de nuestra
información sobre el mismo.

Selección de lecturas
Didáctica de la Estocástica – 577 11

IMPLICACIONES SOBRE LA PRÁCTICA EDUCATIVA


A pesar de las dificultades filosóficas y psicológicas descritas, las situaciones aleatorias revis-
ten una gran importancia. El problema de asegurar que una sucesión sea aleatoria sigue te-
niendo una gran actualidad debido a sus aplicaciones. Los números aleatorios se necesitan hoy
para organizar planes de muestreo en la industria y la experimentación médica, sociológica y
demográfica. Gracias a los ordenadores, mediante los métodos de simulación se resuelven
problemas probabilísticos muy complejos en física, ecología, o gestión, que están basados en
la obtención de largas secuencias de resultados aleatorios. De todo ello se deduce la importan-
cia de desarrollar en los alumnos una comprensión adecuada de los rasgos de los fenómenos y
secuencias aleatorias.
En los nuevos diseños curriculares se sugiere realizar experimentos de simulación, basados en
la obtención de secuencias aleatorias. Por ejemplo, en el diseño curricular del Ministerio de
Educación y Ciencia para la enseñanza secundaria obligatoria, en el bloque 5, denominado
"Tratamiento del azar" encontramos como concepto a presentar a los alumnos: "Fenómenos
aleatorios y terminología para describirlos". Dentro de los procedimientos, se hace referencia a
la "utilización del vocabulario adecuado para describir y cuantificar situaciones relacionadas
con el azar" y a la "confección de tablas de frecuencias y gráficas para representar el compor-
tamiento de fenómenos aleatorios". Entre los algoritmos y destrezas a desarrollar se sugieren
la "obtención de números aleatorios con diversas técnicas, tales como sorteos, tablas. calcula-
doras" y la "detección de los errores habituales en la interpretación del azar". Como estrategias
generales previstas encontramos el "reconocimiento de fenómenos aleatorios en la vida coti-
diana y en el conocimiento científico", la "formulación y comprobación de conjeturas sobre el
comportamiento de fenómenos aleatorios sencillos" y la "planificación y realización de expe-
riencias sencillas para estudiar el comportamiento de fenómenos de azar". Términos parecidos
se emplean respecto a las actitudes que conviene fomentar en los estudiantes. El currículo del
MEC no es una excepción, ya que encontramos parecidos términos o expresiones en los dise-
ños curriculares de las comunidades autónomas y en otros países, como Inglaterra o Estados
Unidos, que han propuesto reformas recientes sobre el currículo de Matemáticas.
A la vista de la importancia y dificultad del tema, ¿cómo hacer asequible a los alumnos y
alumnas los rasgos característicos de estas situaciones? Desde nuestro punto de vista, esto pasa
necesariamente por una aproximación gradual, como la que se sugiere en Godino y cols.
(1987), en la que se guíe a los alumnos, a partir de sus experiencias con juegos y simulación
hacia la formalización progresiva.
Comenzando con materiales manipulativos con propiedades de simetría como dados o mone-
das, puede pasarse progresivamente al estudio de materiales que no tengan estas propiedades -
ruletas con áreas desiguales; chinchetas-; y, posteriomente, al de fenómenos demográficos o
sociales. Al final de la enseñanza secundaria puede iniciarse el uso de tablas de números alea-
torios para seleccionar muestras; incluso puede iniciarse el análisis de propiedades de los
números aleatorios generados mediante una calculadora u ordenador.
La experimentación, registro y análisis de las secuencias producidas en todas estas actividades
permitirá integrar el estudio de la probabilidad con el de la estadística. La introducción gradual
de los conceptos y notación probabilística servirá para explicar matemáticamente las regulari-
dades observadas en los datos recogidos. Actividades similares se sugieren en Shaughnessy y
Arcidiacono (1993) o en el artículo de Shaughnessy incluido este mismo número de la revista.

Selección de lecturas
Didáctica de la Estocástica – 577 12

Esperamos que, a partir de estas experiencias, los alumnos adquieran las siguientes caracterís-
ticas esenciales de los fenómenos aleatorios:
1. En condiciones fijadas de antemano hay más de un resultado posible.
2. Con los conocimientos que posee el sujeto que emite el juicio, el resultado concreto
que ocurrirá es impredecible.
3. Hay posibilidad- al menos imaginada- de repetir indefinidamente la observación o pro-
ducción del fenómeno.
4. Las secuencias de resultados obtenidas en esta repetición carecen de un patrón que el
sujeto pueda controlar o predecir.
5. En este aparente desorden, pueden descubrirse una multitud de regularidades globales,
comenzando por la estabilización de las frecuencias relativas de cada uno de los resul-
tados posibles. Esta regularidad global es el fundamento que nos permite estudio de es-
tos fenómenos aleatorios mediante el cálculo de probabilidades.
Como argumentan Konold y cols. (1991), de hecho, es preferible ver el término "aleatoriedad"
como una etiqueta a la que van asociados muchos conceptos, como 1os de experimento, suce-
so, espacio muestral, probabilidad, etc. En este sentido, la palabra aleatoriedad nos remite a
una colección de conceptos y procedimientos matemáticos que podemos aplicar en muchas
situaciones. Por ello, deberíamos pensar en una orientación que tomamos hacia el fenómeno
que calificamos de "aleatorio" más que en una cualidad del mismo. Aplicamos un modelo ma-
temático a la situación, porque nos resulta útil para describirla y comprenderla pero no cree-
mos que la situación sea idéntica al modelo. Decidir cuándo el cálculo de probabilidades es
más conveniente o adecuado a la situación que otros modelos matemáticos es una parte del
trabajo de modelización que debiera fomentar en nuestros alumnos y alumnas.
Nota: Este trabajo ha sido realizado en el marco del Proyecto PS93-0196 de la DGICYT
(MEC, Madrid).
Referencias bibliográficas
AYER, A J. (1974). El Azar. En Kline, M. (Ed.), Matemáticas en el mundo moderno. Barcelona: Blu-
me,172-181.
BENNETT, D. (1993). The development of the mathematical concept of randomness; educational im-
plications. Tesis doctoral. New York University. (DAI n. 931 7657).
FALK, R. (1981) The perception of randomness. En Proceedings of the V PME Conference. Grenoble,
222-229.
FINE, T. L (1973). Theories of Probabiliry: An examinarion of foundations. New York: Academic
Press.
FISCHBEIN, E. y GAZIT, A (1984). Does the teaching of probability improve probabilistic intuitions?
Educational Studies in Mathematics, 15 (1), 1 -24.
FISCHBEIN, E., SAINATI NELLO, M. y SCIOLIS MARINO, M. (1991). Factors affecting probabi-
listic judgements in children and adolescents. En Educational Studies in Mathematics, 22, 523-249.
GODINO, J.D., BATANERO, C. y CAÑIZARES, M. J. (1987). Azar y probabilidad Fundamentos
didácticos y propuestas curriculares. Madrid: Síntesis.
GODINO, J. D. y BATANERO, C. (1994). Significado institucional y personal de los objetos matemá-
ticos. Recherches en Didactique des Mathematiques, 14 (3), 325-355.

Selección de lecturas
Didáctica de la Estocástica – 577 13

GREEN, D. R (1983). A Survey of probabilistic concepts in 3.000 pupils aged 11 -16 years. En D. R.
Grey et al. (Eds.), Proceedings of the ICOTS 1 University of Sheffield, 2, 766-783.
GREEN, D. R. (1989) Schools pupils’s understanding of randomness. En R Morris (Ed.), Studies in
Mathematics Education. Unesco, 7, 27-39.
GREEN, D. R. (1991) A longitudinal study of pupil’s probabilty concepts. Universidad de Loughbo-
rough.
HARTEN, G. y STEINBRING, H. (1983). Randomness and stochastic independence. On the rela-
tionship between intuitive and mathematical definition. En R W. Scholz (Ed.), Decision making un-
der uncertainty. Amsterdam, 363-373.
HOEMANN, H. y ROSS, B. M. (1982) Children’s concepts of chance and probability. En Brainerd
(Ed.), Children's logical and mathematical cognition. Springer.
KAHNEMAN, D., SLOVIC, P. y TVERSKY, A (1982). Judgement under uncertainty: heuristics and
biases. Cambridge University Press.
KONOLD, C., LOHMEIER, J., POLLATSEK, A. y WELL, A. (1991). Novices views on randomness.
Comunicación presentada en el XIII PME Conference.
MATALÓN, B. (1979) Epistemología de las Probabilidades. En J. Piaget (Ed.), Epistemología de la
Matemática. Buenos Aires: Paidós, 121 -145.
KYBURG, H. (1974) The logical foundations of statistical inference. Boston: Reidel.
PIAGET, J. e INHELDER, B. (1974) La genése de l’idée de hasard chez l’enfant Paris: Presses Uni-
versitaires de France.
POINCARE, H. (1936) El Azar. Artículo publicado originalmente en lengua inglesa en Journal of the
Atnerican Statistical Association, 31, 10-30. Recogido en J. Newman (Ed.), Sigma. El mundo de las
Matemáticas, 3, 68-82.
SCHOLZ, R. W. (1991). Psychological research in probabilistic understanding. En R. Kapadia y M.
Borovníck (Eds.), Chance Encounters: Probability in Education. Dordrecht: Kluwer Academic Pu-
blishers, 213-249.
SHAUGHNESSY, J. M. (1992) Research ín Probabílity and Statistics: reflections and directions. En D.
A. Grows (Ed.), Handbook of research en mathematics teaching and learning New York: Mac Mi-
llan, 465-494.
SHAUGHNESSY, J.M. y ARCIDIACONO, M. (1 993) Visual encounters with chance. Math and the
Mind’s Eye Volume VIII. The Math Learning Center.
STEINBRING, H. (1991) The concept of chance in everyday teaching. Aspects of a social epistemolo-
gy of mathematical knowledge. En Educational Studies in Mathematics 22, 503-522.
ZABELL, S. L (1 992) Randomness and statistical applications. En F. Gordon and S. Gordon (Eds,),
Statistics for the XX1 Century. The Mathematical Association of America.

Selección de lecturas
SIGNIFICADO Y COMPRENSIÓN DE LAS MEDIDAS DE
POSICIÓN CENTRAL
Carmen Batanero
UNO, 2000, 25, 41-58
Resumen
Los nuevos diseños curriculares incorporan la enseñanza de la estadística en la escuela pri-
maria y secundaria enfatizando el enfoque exploratorio y el trabajo de los alumnos con pro-
yectos interdisciplinares abiertos. Para afrontar con éxito esta propuesta, el profesor debe ser
consciente de la complejidad de los conceptos estadísticos, incluso los "elementales" cuyo
significado debe construirse progresivamente. Como ejemplo, analizamos los componentes
del significado de las medidas de posición central y describimos las dificultades en su com-
prensión, que, respecto a estos componentes se han puesto de manifiesto en las investigacio-
nes en educación estadística.
1 Introducción
En la actualidad la estadística se ha incorporado, de forma generalizada, al currículo de ma-
temáticas de la enseñanza primaria y secundaria, debido al uso frecuente de datos y conceptos
estadísticos en la vida cotidiana, así como en otras disciplinas que debe cursar el alumno, a la
necesidad de un conocimiento básico de estadística en muchas profesiones y a su papel en el
desarrollo de un razonamiento crítico. El reconocimiento de estas razones y la consecuente
incorporación de la estadística al currículo escolar se debe, en gran medida, al trabajo desarro-
llado desde el ISI (International Statistical Institute), primero por el Comité de Educación y
desde 1991 por IASE, la International Association for Statistical Education, que a lo largo de
tres décadas han promovido congresos y publicaciones específicas orientadas a la introducción
de la estadística en la escuela (Batanero, 2000).
Ayudar a los niños y jóvenes a comprender progresivamente las ideas estocásticas fundamen-
tales no es una tarea sencilla, puesto que es necesario adaptar estas ideas a sus capacidades
cognitivas y diseñar situaciones didácticas que propicien el aprendizaje significativo. La es-
tadística es enseñada, tradicionalmente, como parte de la asignatura de matemáticas por el
profesor de esta materia. Nos encontramos con la paradoja de pedir a estos profesores que im-
partan un nuevo contenido, para el que no todos han tenido una formación didáctica específi-
ca, porque la didáctica de la estadística no está aún suficientemente desarrollada. Mientras que
la estadística como ciencia, está en un periodo de notable expansión, el número de investiga-
ciones sobre la enseñanza de la estadística es aún escaso, y sólo estamos comenzando a cono-
cer las principales dificultades de los alumnos en los conceptos más importantes. Es también
preciso experimentar y evaluar métodos de enseñanza adaptados a la naturaleza específica de
la estadística, a la que no siempre se pueden transferir los principios generales de la enseñanza
de las matemáticas.
Un problema particular es que la investigación sobre educación estadística se está llevando a
cabo en áreas muy diversas (estadística, psicología, educación matemática y profesores de
estadística en diferentes áreas de conocimiento), con diferentes tipos de alumnos, metodología
y marcos teóricos. Es preciso, por tanto, realizar una labor de síntesis de estos trabajos, y de
posterior difusión entre los profesores, que son los que tienen finalmente la posibilidad y res-
Didáctica de la Estocástica – 577 2

ponsabilidad de la formación estadística de los escolares. En este trabajo tratamos de contri-


buir a esta labor, analizando las dificultades que los alumnos pueden encontrar en las medidas
de tendencia central. Nos apoyamos en un modelo teórico que permite sintetizar estas investi-
gaciones, explicar las dificultades y proporcionar al profesor criterios en la organización de la
enseñanza del tema. En Batanero y cols. (1994) se describen errores y dificultades de los estu-
diantes en otros conceptos estadísticos elementales.
2. Significado de las medidas de posición central
Cuando queremos reflexionar sobre la dificultad que el aprendizaje de ciertos conceptos tiene
para los alumnos, es necesario comenzar por hacer un análisis epistemológico de su significa-
do. Como indica Godino (1996), "el problema de la comprensión está, por consiguiente, inti-
mamente ligado a cómo se concibe el propio conocimiento matemático. Los términos y expre-
siones matemáticas denotan entidades abstractas cuya naturaleza y origen tenemos que expli-
citar para poder elaborar una teoría útil y efectiva sobre qué entendemos por comprender
tales objetos. Esta explicitación requiere responder a preguntas tales como: ¿Cuál es la es-
tructura del objeto a comprender? ¿Qué formas o modos posibles de comprensión existen
para cada concepto? ¿Qué aspectos o componentes de los conceptos matemáticos es posible y
deseable que aprendan los estudiantes en un momento y circunstancias dadas? ¿Cómo se
desarrollan estos componentes? (pg. 418).
En Godino y Batanero (1994) proponemos un marco teórico sobre el significado de un objeto
matemático, partiendo como noción primitiva de la situación-problemática y resaltando la
génesis personal e institucional del conocimiento matemático. En lo que sigue, analizaremos el
campo de problemas y de actividades del que emerge progresivamente el objeto matemático
designado con el término "media", y posteriormente otras medidas de tendencia central. Con-
sideremos el siguiente problema:
P1. Un objeto pequeño se pesa con un mismo instrumento por ocho estudiantes de una
clase, obteniéndose los siguientes valores en gramos: 6'2, 6'0, 6'0, 6'3, 6'1, 6'23, 6'15, 6'2
¿Cuál sería la mejor estimación del peso real del objeto?
Si planteamos este problema a nuestros alumnos, la mayoría sumará los valores y dividirá por
ocho para obtener el valor 6'1475. Este es un ejemplo particular de una clase de problemas:
estimación de una cantidad desconocida, en presencia de errores de medida. En muchas si-
tuaciones necesitamos medir una cantidad X desconocida de una cierta magnitud. Pero debido
a la imperfección de nuestros instrumentos, en mediciones sucesivas obtenemos distintos
números como medidas de X. No tenemos ninguna razón para pensar que el verdadero valor
esté más cercano a uno u otro de los datos obtenidos. ¿Cómo determinar, a partir de un con-
junto de medidas x 1 , x 2 , ..., x n la mejor estimación posible del verdadero valor X desconocido?
Según Plackett (1970), los astrónomos de Babilonia resolvieron el problema calculando la
suma total de las observaciones y dividiendo por el número de datos y esta práctica se ha con-
servado hasta nuestros días.
Para enunciar y resolver el problema P1 necesitamos representaciones simbólicas de los obje-
tos matemáticos abstractos (números, operaciones, ...). Por ejemplo, actualmente usamos la
expresión (1) para resolver el problema P1 en su enunciado general, donde los distintos símbo-
los representan el número de datos, los valores obtenidos en las distintas mediciones, su suma,
la división y el resultado obtenido:

Selección de lecturas
Didáctica de la Estocástica – 577 3

(1)  x= (x 1 + x 2 + ...+ x n )/n


Es característico de la actividad matemática extender las soluciones a otros ejemplos, diferen-
tes de la situación concreta particular. Nosotros podríamos generalizar la expresión (1) para un
valor arbitrario n, posteriormente a un número infinito de valores, en variables discretas o con-
tinuas:
(2) E(X) = ∑ x i p i = µ
(3) E(X) = ∫ xf(x)dx
Sumar un conjunto dado de valores y dividir por el número de valores o escribir las expresio-
nes anteriores son ejemplos de prácticas matemáticas, es decir de acciones llevadas a cabo
para resolver problemas matemáticos, comunicar a otros la solución, mostrar que la solución
es correcta y generalizarla a otros contextos y problemas. Aunque en cada problema concreto
de estimación de la magnitud de interés, el instrumento de medición, el número de medidas
tomadas y los valores concretos obtenidos varían, la expresión (1) es aplicable de forma gene-
ral para el cálculo de la mejor estimación del valor desconocido. Esta práctica es el germen de
la emergencia progresiva del concepto que hoy conocemos como "media aritmética", prime-
ramente como útil implícito en la solución de problemas prácticos, más tarde como objeto de
estudio en sí mismo. El estudio y caracterización de sus propiedades llevó progresivamente a
la aplicación del concepto en la solución de otras situaciones problemáticas como las siguien-
tes:
P2. Unos niños llevan a clase caramelos. Andrés lleva 5, María 8, José 6, Carmen 1 y
Daniel no lleva ninguno. ¿Cómo repartir los caramelos de forma equitativa?
Cuando se necesita obtener una cantidad equitativa a repartir para conseguir una distribución
uniforme, como en el ejemplo, se toma la media aritmética. Problemas semejantes serían obte-
ner la "renta per cápita", la velocidad media durante un viaje o la calificación final en un exa-
men compuesto de varios exámenes parciales.
P3. Al medir la altura en cm. que pueden saltar un grupo de escolares, antes y después de haber efectuado
un cierto entrenamiento deportivo, se obtuvieron los valores siguientes. ¿Piensas que el entrenamiento es
efectivo?
Altura saltada en cm.
Alumno Ana Bea Carol Diana Elena Fanny Gia Hilda Ines Juana
Antes del entrenamiento 115 112 107 119 115 138 126 105 104 115
Después del entrenamiento 128 115 106 128 122 145 132 109 102 117
Otra aplicación de la media es servir de elemento representativo de un conjunto de valores
dados x i , cuya distribución es aproximadamente simétrica. En el ejemplo P3 usaríamos la altu-
ra media saltada antes y después del entrenamiento para ver si éste ha producido algún efecto.
Para representar un conjunto de datos se toma la media por sus propiedades de localización
central, por ser "centro de gravedad" del espacio de valores muestrales o poblacionales. Si la
distribución es muy asimétrica, el valor más frecuente (Moda) o el valor central en el conjunto
de datos ordenados (Mediana) podría ser más representativo. Vemos que cuando añadimos
condiciones a un campo de problemas surgen conceptos relacionados con el de interés con el
cual guardan diferencias y semejanzas, que es necesario investigar. De los primitivos proble-

Selección de lecturas
Didáctica de la Estocástica – 577 4

mas extramatemáticos, pasamos posteriormente a problemas internos a la misma matemática,


como estudiar las diferentes propiedades de las medidas de posición central.
P4. La altura media de los alumnos de un colegio es 1'40. Si extraemos una muestra
aleatoria de 5 estudiantes y resulta que la altura de los 4 primeros es de 1'38, 1'42, 1'60,
1'40. ¿Cuál sería la altura más probable del quinto estudiante?
En otras ocasiones se necesita conocer el valor que se obtendrá con mayor probabilidad al to-
mar un elemento al azar de una población. Por ejemplo, al predecir la esperanza de vida o el
beneficio esperado en una inversión en bolsa, se toma la media de la variable en la población
como predicción, como valor esperado, por sus propiedades muestrales derivadas del teorema
central del límite. Del concepto de valor esperado se derivan muchos modelos de predicción,
como los distintos tipos de regresión. Así, cuando predecimos el peso de una persona en fun-
ción de su altura, usamos el peso promedio de todas las personas que en la población tienen la
altura dada.
Problemas como los P1 a P4 y otros problemas, primero prácticos más tarde teóricos, han lle-
vado a la definición del concepto de media, a la identificación de sus propiedades, más tarde a
la definición de otras medidas de posición central, como la mediana o moda, que son preferi-
bles a la media en algunas situaciones concretas. Además, ha sido necesario "probar" o "de-
mostrar" la validez de estas soluciones y propiedades, para aceptarlas como parte del conoci-
miento matemático.
Por tanto, cuando nos preguntamos por el significado de la media o de las medidas de posición
central, observamos que este significado tiene un carácter complejo y podemos identificar en
el mismo los siguientes tipos de elementos:
• Elementos extensivos: El campo de problemas de donde surge el objeto. Ejemplos, para
el caso de la media serían los problemas tipo P1 a P4 y sus generalizaciones;
• Elementos actuativos: Las prácticas empleadas en la solución de problemas, como su-
mar una serie de valores y dividir por el número de sumandos, encontrar el valor más
frecuente en una tabla de frecuencias, calcular las frecuencias acumuladas y hallar el
valor al que corresponde la mitad del número total de datos, o integrar el producto de
la variable por la función de densidad en un cierto dominio;
• Elementos ostensivos: Las notaciones, gráficos, palabras y en general todas las repre-
sentaciones del objeto abstracto; como los términos "media", "valor medio", "prome-
dio", E(X), ∑ x i p i µ, ∫ xf(x)dx, que podemos usar para referirnos al concepto;
• Elementos intensivos: Las definiciones y propiedades características y sus relaciones
con otros conceptos. Por ejemplo, en la investigación de Strauss y Bichler (1988) en-
cuentra una proporción importante de niños de entre 8 y 12 años eran capaces de com-
prender y aplicar adecuadamente las propiedades a) c) y d) siguientes de la media,
mientras que el resto de ella resultaron demasiado abstractas:
a. La media es un valor comprendido entre los extremos de la distribución;
b. La suma de las desviaciones de cada valor a la media es igual a cero;
c. El valor medio es influenciado por los valores de cada uno de los datos;
d. La media no tiene por qué ser igual a uno de los valores de los datos;

Selección de lecturas
Didáctica de la Estocástica – 577 5

e. El valor obtenido de la media de números enteros puede ser una fracción, que
no tenga sentido en el contexto de los datos;
f. Hay que tener en cuenta los valores nulos en el cálculo de la media;
g. El valor medio es representativo de los valores promediados.
• Elementos validativos: Las demostraciones que empleamos para probar las propieda-
des del concepto y que llegan a formar parte de su significado y los argumentos que
empleamos para mostrar a otras personas la solución de los problemas.
3. Dimensiones institucional y personal del conocimiento
En general los problemas no aparecen de forma aislada, sino que los mismos problemas son
compartidos dentro de cada institución, y las soluciones encontradas dependen de los instru-
mentos y prácticas sociales disponibles. Así, problemas similares a P1 de estimación de una
cantidad desconocida son compartidos en instituciones de investigación experimental, como la
astronomía o la agronomía y también en las instituciones escolares, pero los instrumentos dis-
ponibles son muy diferentes en uno y otro caso, de modo que el significado de un concepto
matemático, entendido de una forma sistémica, como hemos descrito, varía según la institu-
ción considerada.
Los matemáticos y estadísticos profesionales constituyen una institución interesada en resolver
problemas de promedios, pero existen otras instituciones diferentes que también podrían estar
interesadas en la media, aunque podría atribuirle un significado más restringido al que recibe
dentro de la matemática, por ejemplo:
(I1) En la escuela primaria los curricula proponen que se enseñe a los alumnos:
- la definición de la media, mediana y moda en el caso más simple, empleando una no-
tación sencilla (se evita el sumatorio y la ponderación);
- algunos ejemplos de aplicación, limitando el cálculo de las medidas de tendencia cen-
tral a conjuntos sencillos de datos, y haciéndolo manualmente o con calculadora.
- discriminación respecto de otras medidas de tendencia central (mediana, moda).
(I2) En la escuela secundaria (y en la universidad) se amplia la definición de la media, tra-
bajándose primero con medias ponderadas y luego con medias de variables aleatorias discretas
y continuas. Se enuncian y demuestran algunas propiedades de los promedios y se presentan
aplicaciones a situaciones problemáticas más realistas y complejas. Por ejemplo, en la univer-
sidad se introduce la noción de media o esperanza matemática de una distribución de probabi-
lidad y se muestra que la media es un parámetro que define algunas distribuciones de probabi-
lidad, como la normal; al iniciar el estudio de la inferencia, distinguimos varias medias: media
de la muestra, media de la población, media de la media muestral en todas las muestras de
tamaño dado.
(I3) En la "vida diaria" encontramos la media en los medios de comunicación y el trabajo pro-
fesional, por ejemplo, cuando analizamos los números índices de la evolución de la bolsa, pre-
cios, producción, empleo y otros indicadores económicos.
Por otro lado, el conocimiento sobre cada objeto matemático (como la media) no ha sido
siempre igual al actual, sino que se ha desarrollado lentamente a lo largo del tiempo, ya que a
medida que se han ido resolviendo problemas progresivamente diferentes y más complejos, el

Selección de lecturas
Didáctica de la Estocástica – 577 6

objeto se desarrolla y completa en su significado. Consideremos, por ejemplo, el siguiente


enunciado:
P5. Hay 10 personas en un ascensor, 4 mujeres y 6 hombres. El peso medio de las muje-
res es de 60 kilos y el de los hombres de 80. ¿Cuál es el peso medio de las 10 personas
del ascensor?
No podemos ahora resolver este problema por medio de la media aritmética simple
(60+80)/2=70, sino que necesitaríamos ampliar el concepto al de media ponderada:
(60x4+70x6)=72. Como cualquier otro concepto, la media y otras medidas de tendencia cen-
tral han tenido un lento desarrollo dentro de la matemática hasta el momento en que fueron
reconocidos como conceptos matemáticos e incluidos en la enseñanza. Durante este desarrollo
ha sufrido transformaciones progresivas según se ha ido ampliando el campo de problemas
asociado.
La didáctica de la matemática ha puesto de manifiesto cómo el aprendizaje del sujeto es tam-
bién un proceso lento y progresivo que con frecuencia se asemeja a la construcción de los ob-
jetos en la ciencia. Para las medidas de posición central no hay todavía un estudio comprehen-
sivo del desarrollo a diversas edades, aunque el trabajo de Watson y Moritz (en prensa) es un
primer paso en este estudio. Como veremos en nuestra exposición, en realidad estos conceptos
son bastante elaborados, de modo que el conocimiento que un sujeto puede adquirir fuera del
ámbito escolar es necesariamente muy limitado y restringido. Ello posiblemente haya influido
en la falta de interés por el desarrollo de estos conceptos por parte de la psicología.
Al considerar una cierta institución escolar, como la escuela primaria, el significado construi-
do por un alumno particular, en un momento del proceso de aprendizaje puede no correspon-
der exactamente al significado del objeto en la institución dada, por lo que conviene distinguir
entre significado institucional y significado personal de un objeto matemático. En la clase de
matemáticas el profesor sigue las directrices curriculares, los libros de texto y materiales
didácticos -que marcan un significado particular restringido para la media y las medidas de
posición central. Al realizar la evaluación, el profesor considera que el alumno "conoce" o
"comprende" las medidas de tendencia central si hay un ajuste entre el significado institucional
y el personal construido por el sujeto. Si no hay acuerdo entre estos dos significados conside-
ramos que existen dificultades o que el tema es difícil para el alumno. Por esto, también en la
comprensión debemos diferenciar una dimensión personal e institucional. En las instituciones
escolares se organizan procesos educativos para determinados alumnos, y se asigna al profesor
la tarea de ayudar a los estudiantes a adquirir unas propiedades y relaciones culturalmente
aceptadas para los términos y expresiones matemáticas. Godino (1996) indica que la compren-
sión deja de ser meramente un proceso mental y se convierte en un proceso social y que po-
demos considerar que un alumno "comprende" suficientemente los promedios desde el punto
de vista de la enseñanza secundaria y que no lo comprende desde el punto de vista de unos
estudios universitarios.
4. Algunas dificultades en la comprensión de las medidas de tendencia central
Al planificar la enseñanza del tema o al tratar de evaluar el aprendizaje de los alumnos, debe-
mos tener en cuenta los cinco tipos de elementos que constituyen el significado sistémico de
un objeto matemático y que hemos descrito anteriormente. La comprensión de un concepto no
puede reducirse a conocer las definiciones y propiedades (elementos intensivos), sino a reco-
nocer los problemas donde debe emplearse el concepto (elementos extensivos), las notaciones

Selección de lecturas
Didáctica de la Estocástica – 577 7

y palabras con que lo denotamos y en general todas sus representaciones (elementos ostensi-
vos), habilidad operatoria en los diferentes algoritmos y procedimientos relacionados con el
concepto (elementos actuativos) y capacidad de argumentar y justificar propiedades, relacio-
nes y soluciones de problemas (elementos validativos). A continuación describimos los resul-
tados de investigaciones que han resaltado dificultades en cada unos de estos puntos en rela-
ción a las medidas de tendencia central.
Elementos actuativos
El cálculo de la media parece sencillo. Sin embargo Pollatsek, Lima y Well (1981) encontra-
ron que incluso alumnos universitarios no ponderan adecuadamente los valores al resolver el
problema P5 y en ocasiones usan la media simple, en lugar de la media ponderada. Li y Shen
(1992) indican que cuando se pide a los estudiantes calcular la media a partir de una tabla de
frecuencias donde los datos se agrupan en intervalos, los estudiantes olvidan con frecuencia
que cada uno de estos grupos debe ponderarse de modo distinto al calcular la media.
En otros casos el algoritmo se aplica de forma mecánica sin comprender su significado. Cai
(1995) encontró que mientras la mayoría de alumnos de 12-13 años en su investigación eran
capaces de aplicar adecuadamente el algoritmo para calcular la media, sólo algunos alumnos
eran capaces de determinar un valor desconocido en un conjunto pequeño de datos para obte-
ner un valor medio dado. Incluso encontrando el valor desconocido, fueron pocos los que lo
hicieron a partir de un uso comprensivo del algoritmo, multiplicando el valor medio por el
número de valores para hallar la suma total y de ahí el valor faltante, sino que la mayoría sim-
plemente usó el ensayo y error.
Otros errores de cálculo en media, mediana y moda descritos por Carvalho (1998) al analizar
las producciones escritas de los alumnos al resolver tareas estadísticas son los siguientes:
• Moda: Tomar la mayor frecuencia absoluta;
• Mediana: No ordenar los datos, para calcular la mediana; calcular el dato central de las
frecuencias absolutas ordenadas de forma creciente; calcular la moda en vez de la me-
diana; equivocarse al calcular el valor central;
• Media: Hallar la media de los valores de las frecuencias; no tener en cuenta la frecuen-
cia absoluta de cada valor en el cálculo de la media.
En realidad, el cálculo de la mediana es complejo, porque el algoritmo de cálculo es diferente,
según tengamos un número par o impar de datos, y según los datos se presenten en tablas de
valores agrupados o sin agrupar (Cobo y Batanero, en prensa) y también el valor obtenido es
diferente, según se aplique uno u otro algoritmo. Esto puede resultar difícil para los alumnos
que están acostumbrados a un único método de cálculo y una única solución para los proble-
mas matemáticos.
Gattuso y Mary (1998) analizan la evolución de la comprensión del algoritmo de cálculo de la
media ponderada de los alumnos durante la enseñanza secundaria, usando problemas con dife-
rentes contextos y forma de representación. Las tareas presentadas fueron: cálculo de medias
ponderadas, efecto que el cambio de un dato produce sobre la media y hallar un valor faltante
en un conjunto de datos para obtener un promedio dado. Identifican las siguientes variables
didácticas que afectan a la dificultad de las tareas: formato (tabla, serie de números, gráfico),
si los valores de las variables son o no mucho mayores que los de las frecuencias (lo que in-
fluye en que el niño discrimine los dos conceptos); si una de las frecuencias es mucho mayor

Selección de lecturas
Didáctica de la Estocástica – 577 8

que las otras (de modo que se fuerce al niño a tener en cuenta las frecuencias). Observaron el
efecto de estas variables y también la mejora con la instrucción, aunque no fue muy persistente
en el tiempo.
Elementos intensivos
Cuando los alumnos comienzan a estudiar la media, mediana y moda por primera vez ya co-
nocen ciertas operaciones aritméticas como la suma y multiplicación, e inconscientemente
aplican a la operación de "promediar" algunas propiedades de las anteriores operaciones que
no se cumplen en el caso de los promedios. Mevarech (1983) observa que incluso los estudian-
tes universitarios piensan que la media tiene la propiedad asociativa y cuando tienen que hallar
la media de un conjunto grande de números, lo dividen en partes hallando primero la media de
cada parte y luego promediando el resultado obtenido. Podemos comprobar que esta propie-
dad, en general, no es cierta, si hallamos primero la media de tres números diferentes y luego
promediamos los dos primeros y hacemos la media del valor obtenido con el último elemento.
En otros casos no se tiene en cuenta el cero en el cálculo de la media, como si fuese un ele-
mento neutro o bien se piensa que la media debe ser un elemento del mismo conjunto numéri-
co del que se toman los datos.
Strauss y Bichler (1988) analizan la comprensión de los niños de 8 a 14 años de las propieda-
des a) a e) que hemos listado al describir los elementos intensivos en el punto 2. Aunque una
proporción importante de niños parecieron usar espontáneamente estas propiedades, algunos
niños no tenían en cuenta el cero para calcular la media, o bien suponían que la media podría
estar fuera del rango de variación de la variable, o que debería coincidir con uno de los valores
de los datos.
León y Zawojeski (1991) realizan entrevistas a niños entre 8 y 14 años y analizan el efecto de
la edad sobre la comprensión de estas propiedades. Además de encontrar una importante in-
fluencia de la edad sobre la comprensión de la media, también observaron que la contextuali-
zación de las tareas facilita mucho su resolución. Sin embargo, propiedades tales como que la
suma de desviaciones respecto a la media es cero, que la media es un valor representativo de
los valores promediados o que hay que tener en cuenta los valores nulos en el cálculo de la
media continuaron siendo demasiado abstractas para una proporción importante de alumnos de
14 años.
La idea de representante de un conjunto de datos es importante en las aplicaciones prácticas,
por ejemplo, al comparar dos conjuntos de datos respecto a una misma variable de interés.
Como indican Mokros y Russell (1995) hasta que los niños no conciben el conjunto de datos
como un todo, y no como un agregado de valores, no podrán comprender las ideas de resumen
de los datos o representante de los datos, que se refiere al conjunto global y no a ninguno de
sus valores aislados.
Por otro lado, se tiende a situar la media en el centro del recorrido de la distribución, propie-
dad que es cierta para distribuciones simétricas. Pero cuando la distribución es muy asimétrica
la media se desplaza hacia uno de los extremos y la moda o la mediana serían un valor más
representativo del conjunto de datos. Esto no es siempre comprendido por algunos alumnos
quienes invariablemente eligen la media como mejor representante de los datos sin tener en
cuenta la simetría de la distribución o la existencia de valores atípicos, como hemos observado
en nuestra propia experiencia.

Selección de lecturas
Didáctica de la Estocástica – 577 9

Respecto a la comprensión de la mediana Barr, (1980) indica que los alumnos entienden que la
mediana es el centro de "algo" pero no siempre comprenden a que se refiere ese "algo" porque
no comprenden realmente que una tabla de frecuencia es sólo un resumen de los datos y no
son capaces de pasar de la tabla a la lista de valores que es una representación alternativa de
los datos. Incluso si se les da los datos en forma de lista no entienden por qué hay que ordenar-
los para calcular la mediana, porque no entienden que la mediana es un estadístico que se re-
fiere al conjunto ordenado de datos.
Elementos extensivos
No sirve de nada conocer las definiciones de las medidas de posición central y saber calcular-
las si luego no se reconocen los problemas relacionados con estos conceptos. Pollasek y cols.
(1981) propusieron a sus alumnos el siguiente problema, que es semejante al P4 descrito ante-
riormente:
La media en fluidez verbal de una clase de un colegio es de 400. Si extraemos una muestra aleatoria de 5
estudiantes y resulta que la puntuación de los 4 primeros es de 380, 420, 600, 400. ¿Cuál sería aproxima-
damente la puntuación esperada para el quinto estudiante?
La respuesta correcta a este ítem es 400, el valor esperado en la población. Sin embargo, son
pocos los alumnos que dieron una respuesta correcta al problema, en la investigación citada,
sino que, generalmente se busca un valor de la puntuación del quinto sujeto tal que, sumada a
las cuatro anteriores, dé una media de 400.
Respecto al problema P3 (usar la media como representante de un conjunto de datos), resulta
aún más difícil para los alumnos construir un conjunto de datos que tenga un promedio dado.
Goodchild (1988) proporcionó a los estudiantes cajas de cerillas en las que se había impreso la
frase "contenido medio 35 cerillas" y pidió a sus alumnos construir una distribución hipotética
del contenido de 100 cajas. Lo que más le sorprendió fue que las distribuciones construidas
por los alumnos, no tenían forma acampanada como la distribución normal. Goodchild sugirió
que ello se debe a la falta de comprensión de la media como medida de posición central de la
distribución.
En nuestra investigación (Estepa y Batanero, 1994) con alumnos del curso preuniversitario
hemos observado casos de alumnos que basan la comparación de dos conjuntos de datos en
valores aislados, por ejemplo, en la comparación de los máximos o los mínimos, o bien en la
comparación de totales, o la inspección visual de la distribución global.
Elementos ostensivos y validativos
Los términos matemáticos con que designamos los conceptos tiene un significado preciso,
pero éste no siempre coincide con el asignado al término en el lenguaje coloquial. Russell y
Mokros (1991) clasificaron en cuatro categorías los significados incorrectos atribuidos por los
estudiantes a la palabra "media": valor más frecuente (en realidad esto sería una confusión son
la palabra "moda"), "valor razonable" ( significado coloquial del término), "punto medio"
(confusión con la mediana) y "algoritmo" (es un significado restringido, donde la media se ve
sólo como el algoritmo de cálculo). Watson y Moritz (en prensa), analizan el significado intui-
tivo dado por los niños al término "promedio" y hallan un gran número de niños para los cua-
les el promedio es simplemente un valor en el centro de la distribución (es una idea próxima al
concepto de mediana). Pocas veces se relaciona la palabra "promedio" con la moda y menos
aún con la media aritmética. Las siguientes definiciones de "promedio" fueron obtenidas en

Selección de lecturas
Didáctica de la Estocástica – 577 10

entrevistas a niños realizadas por Watson y Moritz (en prensa): "Significa igual", "que es nor-
mal", "no eres realmente bueno, pero tampoco malo".
Al preguntar que quiere decir que el número medio de niños por familia es 2'3, obtienen res-
puestas correctas y otras como las siguientes: "Que tienen dos niños grandes y otro que no ha
crecido todavía", "que en las familias australianas el número más frecuente de niños es 2'3",
"el '3 es un niño que tiene que crecer para hacerse mayor. Por ejemplo, tiene 3 años ahora y
cuando cumpla 10, contará como 1 y entonces el número promedio de niños será 3". Para el
profesor los enunciados sobre los promedios pueden parecer muy claros, pero estas respuestas
indican la necesidad de poner atención al significado que las palabras y valores numéricos
tienen para los estudiantes en relación a contextos específicos.
Eisenbach (1994) plantea a estudiantes universitarios en un curso introductorio de estadística
el significado de la frase: "¿Qué quiere decir que el salario medio de un empleado es 3.600
dólares?" obteniendo respuestas como "que la mayoría de los empleados gana alrededor de
3.600 dólares", o que "es el salario central; los otros trabajadores ganan más o menos de
3600 dólares", que muestran la confusión terminológica entre las palabras "media", "mediana"
y "moda".
Ya hemos indicado que la idea de promedio no se puede comprender hasta tanto se visualice el
conjunto de datos como un todo y también que la forma de presentación de los datos (tabla,
gráfico, datos sin tabular) incide en la dificultad de las tareas. Reading y Pegg (1996) estu-
diando la forma en que los niños de grados 7 a 12 reducen los conjuntos de datos observaron
que algunos alumnos que eran capaces de dar un resumen de datos presentado en forma numé-
rica, fracasaron en la tarea cuando los datos se presentaban por medio de un gráfico estadísti-
co. También observaron que los niños mostraban dificultad a la hora de dar un argumento o
justificar su respuesta de por qué se elegía un cierto promedio, al plantearles el siguiente pro-
blema, que es, esencialmente una versión simplificada del problema P3.
Como parte de un proyecto los estudiantes de una clase miden cada uno su número de calzado, obtenién-
dose los siguientes datos:
26 26 26 27 27 27 27 28 28 28 28 28 28 29 33
29 29 29 29 30 30 30 30 30 30 30 31 32 32
Si te preguntan cuál sería el mejor número para representar este conjunto de datos, ¿Qué número o
números elegirías? Explícanos por qué has elegido ese(esos) número(s).
En su investigación clasifica a los alumnos en 8 niveles diferentes de respuesta, pero, incluso
los estudiantes de nivel 6 y 7 que son capaces de proporcionar un resumen como la media, son
incapaces de argumentar el por qué de su decisión, más allá de dar la definición del concepto.
Solo una pequeña parte de los estudiantes de su investigación (nivel 8) fueron capaces de justi-
ficar la elección de las medidas de valor central y dispersión relacionándolas con característi-
cas del conjunto de datos.
Por nuestra parte en Estepa y Batanero (1999) hemos encontrado algunos alumnos del curso
preuniversitario que basan sus argumentos en sus teorías previas, en lugar de en los datos al
plantearles problemas similares al P3.
5. Algunas implicaciones para la enseñanza
Este trabajo pone de manifiesto que los conceptos estadísticos, incluso los más sencillos como
la media, mediana y moda tienen un significado complejo y por tanto será necesario un perio-

Selección de lecturas
Didáctica de la Estocástica – 577 11

do dilatado de enseñanza a lo largo de la educación primaria y secundaria para lograr el pro-


gresivo acoplamiento de los significados personales que construyen los alumnos a los signifi-
cados institucionales que pretendemos adquieran.
Tradicionalmente, en el aprendizaje de la estadística, se ha dado una gran importancia al
cálculo y a los aspectos actuativos, que ahora pierden importancia, debido a las nuevas tecno-
logías. En lugar de tener que ejercitarse en la realización con lápiz y papel de cálculos y gráfi-
cos, el alumno debe aprender el uso de calculadoras gráficas y programas de ordenador, como
la hoja de cálculo. Las nuevas tecnologías introducen también nuevos elementos actuativos y
ostensivos, ya que el rango de representaciones disponibles es mucho mayor. Permiten tam-
bién plantear situaciones de aprendizaje en las que el alumno se enfrente a problemas más re-
ales cuya solución requiera el uso y aprendizaje de conceptos estadísticos. Estas situaciones
requieren también el trabajo cooperativo, motivan el interés del alumno y le permiten explorar
tanto los datos, como los conceptos implicados, reforzando los elementos intensivos y valida-
tivos.
Por supuesto la enseñanza de la estadística en la escuela usando ordenadores requiere una pla-
nificación cuidadosa. Frecuentemente los datos reales son demasiado complejos y es necesario
tomar versiones simplificadas de los conjuntos de datos. Si queremos mostrar una cierta pro-
piedad, será preciso a veces manipular el conjunto de datos, para, por ejemplo, conseguir que
el valor de la media, mediana y moda sean marcadamente diferentes.
El trabajo con ordenador debe, además, ser complementado con otras situaciones encaminadas
a que el alumno se familiarice con los campos de problemas, las representaciones, tipos de
prácticas y propiedades de los promedios, y que ejercite su capacidad de argumentación. Las
distintas situaciones problemáticas que hemos presentado como ejemplo a lo largo de este tra-
bajo pueden servir de partida para plantear en clase situaciones didácticas que contribuyan a
lograr este aprendizaje.
Referencias
Batanero, C. (2000). Cap on va l'educació estadística?. Blaix, 15, 2-13.
Batanero, C., Godino, J. D., Vallecillos, A., Green, D. R. y Holmes, P. (1994). Errors and dif-
ficulties in understanding statistical concepts. International Journal of Mathematics Education
in Science and Technology, 25(4), 527-547.
Barr, G. V. (1980). Some students ideas on the median and mode. Teaching Statistics, 2, 38-
41.
Cai, J. (1995). Beyod the computational algorithm: Students' understanding of the arithmetic
average concept. En L. Meira (Ed.). Proceedings of the 19th PME Conference (v.3, pp. 145-
151). Universidade Federal de Pernambuco, Recife, Brasil.
Carvalho. C. (1998). Tarefas estatísticas e estratégias de resposta. Comunicación pre-
sentada en el VI Encuentro en Educación Matemática de la Sociedad Portuguesa de Ciencias
de la Educación. Castelo de Vide, Portugal.
Cobo, B. y Batanero, C. (En prensa). La mediana en la educación secundaria ¿Un con-
cepto sencillo? UNO.

Selección de lecturas
Didáctica de la Estocástica – 577 12

Estepa, A. y Batanero, C. (1999). Judgments of association in the comparison of two samples:


students' intuitive strategies and preconceptions. Hiroshima Journal of Mathematics Educa-
tion.
Eisenbach, R. (1994). What does de mean mean? Comunicación presentada en el Fourth In-
ternational Conference on Teaching Statistics. Marrakesh, Marruecos.
Gattuso, L. y Mary, C. (1998). Development of the concept of weighted average among high-
school students. En L. Pereira-Mendoza, L. Seu Keu, T. Wee Kee y W. K. Wong, Proceedings
of the Fifth International Conference on Teaching Statistics (pp. 685-691). Singapur: Interna-
tional Association for Statistical Education.
Godino, J. D. (1996). Mathematical concepts, their meanings and understanding]. En, L. Puig
y A. Gutiérrez (Eds.), Proceedings of the 20th PME Conference (v.2, pp. 417-424). Universi-
dad de Valencia, España.
Godino, J. D. y Batanero, C. (1994). Significado personal e institucional de los objetos ma-
temáticos. Recherches en Didactique des Mathématiques, 14 (3), 325-355.
Goodchild (1988). School pupils' understanding of average. Teaching Statistics, 10, 77-81.
Leon, M. R., y Zawokeswski, J. S. (1991). Use of the arithmetic mean: An investigation of
four properties. Issues and preliminary resuls. En D. Vere-Jones (Ed.), Proceedings of the
Third International Conference on Teaching Statistics (pp. 302-306). Voorburg, Holanda: In-
ternational Statistical Institute.
Li, K. Y. y Shen, S. M. (1992). Students' weaknesses in statistical projects. Teaching Statis-
tics, 14 (1), 2-8.
Mevarech, Z. R. (1983). A deep structure model of students' statistical misconceptions. Educa-
tional Studies in Mathematics, 14, 415-429.
Mokros, J. y Russell, S. J. (1995). Children's concepts of average and representativeness.
Journal for Research in Mathematics Education, 26, 20-39.
Pollasek, A., Lina, S. y Well, A. D. (1981). Concept or computation: Students' understanding
of the mean. Educational Studies in Mathematics, 12, 191-204.
Plackett, R.L. (1970), The principle of the arithmetic mean. En E. S. Pearson y M. Kendall
(Eds), Studies in the history of statistics and probability (v,1, pp. 121-126). London, Charles
Griffin.
Reading, C. y Pegg, J. (1996). Exploring understanding of data reduction. En L. Puig y A.
Gutiérrez (Eds.), Proceedings of the 20th Conference of the International group for the Psy-
chology of Mathematics Education (v.4, pp. 187-194). Universidad de Valencia, España.
Russell, S. J. y Mokros, J. R. (1991). What's Typical?: Children's Ideas about Average. En D.
Vere-Jones (Ed.), Proceedings of the Third International Conference on Teaching Statistics
(pp. 307-313).Voorburg: International Statistical Institute.
Strauss, S. y Bichler, E. (1988). The development of children's concepts of the arithmetic ave-
rage. Journal for Research in Mathematics Education, 19 (1), 64-80.
Watson, J. M. y Moritz, J. B. (En prensa). The longitudinal development of understanding of
average. Mathematical Thinking and Learning.

Selección de lecturas
INTERPRETACIÓN DE ENUNCIADOS DE PROBA-
BILIDAD, EN SU ACEPCIÓN FRECUENCIAL, POR
ESTUDIANTES ESPAÑOLES Y VENEZOLANOS
Audy Salcedo, Universidad Nacional Abierta

El Objetivo del presente trabajo es exponer los resultados de un estudio descriptivo


sobre la interpretación de enunciados de probabilidad, en términos de frecuencia, por
parte de estudiantes venezolanos de Educación Media y de 1er año de Educación Supe-
rior. El trabajo se basa en la investigación de Serrano, Batanero y Ortiz de Haro
(1996) sobre el mismo tema con estudiantes españoles de bachillerato. En la primera
parte se describe el tipo de respuesta dada por un grupo de estudiantes venezolanos
egresados de Educación Básica y de Educación Media. En la segunda parte se exami-
nan las respuestas dadas por los estudiantes españoles con sus pares etarios venezola-
nos, de tal manera de poder establecer semejanzas y diferencias en cuanto a la inter-
pretación de los enunciados de probabilidad presentados a ambos grupos. Por último
se ofrecen algunas conclusiones generales sobre el tema planteado.

tes al entorno del estudiante, para reali-


Introducción
zar actividades de experimentación y
simulación de experimentos aleatorios.
Desde la reforma curricular lleva-
(Ministerio de Educación, 1985, 1998).
da a cabo en la década de los 80, los
Sugerencias similares se encuentran en
programas de matemática de Educación
los estándares del National Council of
Básica en Venezuela presentan conteni-
Teachers of Mathematics (NCTM). Los
dos referentes al área de Probabilidad.
estándares indican que los estudiantes
La incorporación de estos contenidos
deben explorar, mediante situaciones
responde a los nuevos requerimientos
experimentales, los modelos de probabi-
de la sociedad, los cuales plantean la
lidad participando activamente en todas
necesidad de que el ciudadano común
y cada una de las partes del proceso.
debe poseer conocimientos elementales
(NCTM, 1989).
de Probabilidad. Estos conocimientos
Esta propuesta para la enseñanza
se consideran necesarios para manejarse
de la probabilidad se desprende de las
con soltura en la sociedad.
investigaciones de Piaget e Inhelder
Al tratar la probabilidad se pre-
(1975), Fischbein y Gazit (1984),
senta una variedad de problemas, con
Tversky y Kahneman (1973, 1974) y
los cuales los alumnos pueden formular
Shaugehnessy (1992). Estos trabajos
hipótesis, comprobar conjeturas y apli-
indican que la intuición de los indivi-
car elementos del análisis de datos.
duos, producto de sus experiencias, a
Adicionalmente, la probabilidad provee
menudo los conduce a cometer errores
un contexto adecuado para brindar ma-
en la comprensión de la probabilidad.
yor significado a conceptos como frac-
La participación activa del estudiante,
ciones, decimales y porcentajes (Minis-
en procesos de simulación y experimen-
terio de Educación, 1998).
tación, es una manera de proporcionarle
Las orientaciones metodológicas
elementos que lo ayuden a superar las
presentes en los programas, recomien-
dificultades y obstáculos que pueda
dan partir de casos reales, pertenecien-
Didáctica de la Estocástica – 577 2

tener debido a su intuición probabilísti- lidad. Todo parece indicar que en situa-
ca. ciones probabilísticas, las personas usan
Se podría suponer, que si los do- las mismas estrategias o heurísticas que
centes venezolanos atienden las suge- aplican para situaciones no probabilísti-
rencias presentes en los programas de cas. La dificultad es que en ciertas cir-
matemáticas, en relación con la ense- cunstancias esas mismas estrategias
ñanza de la probabilidad, esto ayudará a logran sesgar la aplicación de los con-
los estudiantes venezolanos a depurar ceptos y reglas de la probabilidad.
sus “presunciones” respecto a la proba- Tversky y Kahneman (1973) pre-
bilidad. Ellos estudian conceptos ele- sentan la heurística de la disponibilidad.
mentales de probabilidad durante su Según estos autores las personas esti-
tránsito por la escuela básica (educación man la probabilidad de un evento por la
obligatoria). Esta formación es com- facilidad de recuerdo de ejemplos de
plementada en la educación media, dicho evento. Tversky y Kahneman
cuando se trata nuevamente la probabi- (1974) también presentan la heurística
lidad, esta vez con un nivel matemático de la representatividad, según la cual las
mayor. personas tienen la tendencia a estimar la
Se plantea entonces estudiar la probabilidad de un evento o suceso,
interpretación que le dan los estudiantes basado en la “representatividad” del
venezolanos a enunciados de probabili- mismo respecto a la población de la que
dad al finalizar la Educación Básica y proviene. El trabajo de Lecoutre (1992)
luego de culminar la Educación Media señala que el concepto de equiprobabi-
Diversificada y Profesional. Esto per- lidad, presente en la definición clásica
mitirá explorar si las interpretaciones de probabilidad, es un posible obstáculo
que hacen de esos enunciados tienen didáctico importante para el aprendizaje
alguna relación con el nivel académico de este concepto. Konold (1989) por su
alcanzado por ellos. Adicionalmente, a parte ha investigado sobre lo que él de-
partir de los datos presentes en el traba- nomina el “enfoque en el resultado ais-
jo de Serrano, Batanero y Ortiz de Haro lado”.
(1996), se compararan las respuestas Este trabajo sigue la línea de in-
dadas por los estudiantes venezolanos vestigación de Konold. Este autor
con las ofrecidas por un grupo de estu- centró sus trabajos en la información
diantes españoles de edades similares. probabilística que extraen los sujetos de
Esta comparación se realizará sin consi- situaciones que involucren la probabili-
derar el nivel educativo o contenidos dad, por ejemplo de un boletín meteo-
trabajados en cada nivel. rológico. En un estudio por medio de
En la literatura especializada se entrevistas, Konold solicitó a varios
encuentra una amplia gama de sesgos estudiantes universitarios que interpre-
que manifiestan las personas al ser en- taran el pronóstico "para hoy se tiene un
frentadas a situaciones probabilísticas 70% oportunidad de lluvia". La mayor-
donde se le exige un juicio o decisión. ía de los estudiantes entendieron la pre-
Trabajos como los de Tversky y Kah- dicción como "hoy va a llover". Al
neman (1973, 1974), Konold (1989), presentar una probabilidad cercana al
Lecoutre (1992), muestran diferentes 50% como pronóstico de lluvia, los es-
fuentes de obstáculos para el aprendiza- tudiantes se encontraban desorientados.
je de la probabilidad. Estos autores Konold afirma que cuando el pronóstico
indican que las decisiones o juicios de de lluvia se encuentra suficientemente
las personas sobre la base de una infor- por encima de 50% los estudiantes lo
mación probabilística no se corresponde calificaran como “sí lloverá”, mientras
con los conceptos y leyes de la probabi- si el pronóstico se encuentra suficien-

Selección de lecturas
Didáctica de la Estocástica – 577 3

temente por debajo de 50% la interpre- Ambas preguntas se han tomado


tación es “no lloverá”. Esta forma de del trabajo de Serrano et al (1996), aun-
razonamiento Konold la denominó "el que la primera de ellas corresponde al
acercamiento del resultado" o “enfoque test de Garfield (1991, citado por Serra-
en el resultado aislado”. no et al, 1996) y es una pregunta clásica
Las investigaciones de Konold de la entrevistas de Konold.
indican que las personas que utilizan el
“enfoque en el resultado aislado” inter- Resultados
pretan las probabilidades comparándo-
las con los valores 0%, 50% y 100%. Si Los resultados de este trabajo se
la probabilidad a interpretar se encuen- dividen en dos partes. En la primera se
tra cerca de los extremos 0% o 100%, el presentan los resultados que correspon-
evento será considerado como imposi- den a la aplicación del instrumento al
ble o seguro, respectivamente. Un tra- grupo de estudiantes venezolanos. En
tamiento distinto se le da a las probabi- la segunda parte se comparan los resul-
lidades cercanas al 50%. En algunos tados de los estudiantes venezolanos
casos se considera que no es verdade- con los resultados obtenidos por Serra-
ramente un pronóstico y ayuda muy no et al.
poco. En otros casos se les considera Para el análisis de las respuestas
como eventos realmente aleatorios. de los estudiantes se utilizó un método
similar al empleado por Serrano et al
El instrumento (1996), esto es:
o Registro de las opciones señalada
El instrumento está compuesta por dos por los estudiantes.
preguntas: o Análisis de los argumentos presen-
1. El centro de Meteorológico Cabo tados para soportar sus respuestas y
Kennedy quiso determinar la precisión la formación de categorías donde se
de su meteorólogo. Buscando sus regis- agrupen los mismos.
tros de aquellos días en los cuales el o Construcción de tablas de frecuencia
meteorólogo había informado que había clasificadas según el grupo de
un 70 por ciento de posibilidades de alumnos.
lluvia. Compararon estas predicciones o Aplicación del test Chi cuadrado.
con si llovió o no en esos días en parti-
cular. El caso venezolano
Elige la opción que consideras más
apropiada: La predicción del 70 por La muestra sobre la cual se realizó
ciento de posibilidades lluvia puede el estudio es opinática conformada por
considerarse muy precisa, si llovió entre un total de 237 estudiantes. Los estu-
el: diantes se seleccionaron de acuerdo con
a. 95 y el 100 por ciento de esos días. la facilidad ofrecida por los docentes
b. 85 y el 94 por ciento de esos días. para acceder a ellos. Un primer grupo
c. 75 y el 84 por ciento de esos días. estaba integrado por 127 egresados de la
d. 65 y el 74 por ciento de esos días. educación básica obligatoria. Las eda-
e. 55 y el 64 por ciento de esos días. des de los estudiantes se encontraban
2. Supongamos que este Meteorólogo entre 14 y 15 años. El segundo grupo
dice que mañana hay un 70 por ciento está conformado por 110 estudiantes
de posibilidades de lluvia y mañana no cursantes del primer año de estudios
llueve. ¿Qué conclusión sacarías sobre universitarios y por lo tanto egresados
su predicción de que había un 70 por de la Educación Media Diversificada y
ciento de posibilidades de lluvia?. Profesional. Las edades de estos estu-

Selección de lecturas
Didáctica de la Estocástica – 577 4

diantes se encontraban entre 17 y 18 que han trabajado estos estudiantes son:


años. Los contenidos de probabilidad (ME, 1993, p. 23)

Egresados de Educación Básica


Grado Contenido
5to. Noción de azar, sucesos imposibles, seguros y probables. Cálculo de proba-
bilidades a partir de la definición clásica.
6to. Cálculo de probabilidades a partir de la definición clásica. Diagrama de
árbol.
7mo. Problemas donde se apliquen las nociones de probabilidad. Diagrama de
árbol.
8vo. Sucesos independientes, cálculo de probabilidad compuesta de sucesos inde-
pendientes.
9no. Problemas en los cuales se utilicen las nociones elementales de probabilidad.
Egresados de Educación Media
Año Contenido
2do. Interpretación de la probabilidad, experimentos y sucesos, definición de la pro-
babilidad en espacios muestrales finitos, probabilidad de la unión de sucesos,
sucesos independientes, probabilidad condicional, regla de Bayes

continuación se presentan los resultados


Ambos grupos de estudiantes estaban
de la primera pregunta:
conformados aproximadamente con
igual número de varones y hembras. A

Egresados de Total
Respuesta Educación Básica Educación Media

Fi % Fi % Fi %
a 20 15,75 14 12,73 34 14,35
b 17 13,39 24 21,82 41 17,30
c 19 14,96 11 10,00 30 12,66
d 55 43,30 59 53,64 114 48,10
e 16 12,60 2 1,81 18 7,59
Total 127 100 110 100 237 100
Tabla 1. Frecuencias y porcentajes de respuesta a la pregunta 1.

La respuesta normativa es la op- entre un nivel y otro. En principio, este


ción d, es decir, la predicción del 70 por resultado podría indicar que la interpre-
ciento de posibilidades de lluvia puede tación correcta del enunciado tiene una
considerarse muy precisa, si llovió entre asociación positiva con el nivel acadé-
el 65 por ciento y el 74 por ciento de mico alcanzado. Sin embargo, si se
esos días. Esta opción fue señalada por examina el porcentaje de estudiantes
el 43,3% de los estudiantes egresados que marcaron como respuesta correcta
de Educación Básica y 53,64% de los las opciones a ó b (la frecuencia espe-
egresados de Educación Media, esto es rada de lluvia se debe encontrarse por
un aumento de un poco más del 10% encima del 85%) se puede notar que

Selección de lecturas
Didáctica de la Estocástica – 577 5

aumenta con el nivel académico. En logo no está equivocado, ya que su


el primer grupo hay un 29,14% de los pronóstico también incluía un 30% de
estudiantes que señalaron las opciones a posibilidades de no lluvia. Ejemplos de
o b, mientras que un 34,55% de los es- estos argumentos son: “existía un 30%
tudiantes del segundo grupo marcaron de posibilidades que no lloviera”.
estas mismas opciones. Estos estudian- b. Explicación de tipo causal. Aquí se
tes sobreestiman la frecuencia esperada ubican los argumentos que tratan de
de la posibilidad de lluvia, parecieran presentar motivos por los cuales no se
no relacionar la probabilidad teórica con cumplió la predicción. Presentan una
la frecuencia esperada de días de lluvia. interpretación incorrecta de la probabi-
Se ha utilizado el contraste Chi lidad frecuencial. Ejemplo de las res-
Cuadrado de homogeneidad de muestra, puestas ubicadas en esta categoría: “el
para probar la significación estadística viento se llevó la lluvia”
de las diferencias señaladas anterior- c. Se equivocó. En este grupo se ubican
mente, encontrándose un χ 2=14,271 con los estudiantes que consideran que el
4 g.l. (p<0,01). Este resultado indica meteorólogo realizó un pronóstico erra-
que existen diferencias significativas do y tratan de presentar posibles razones
entre el nivel académico logrado por los del por qué de ese fallo. Los sujetos
individuos, respecto a su interpretación que responden de esta forma presentan
del enunciado. el sesgo de “enfoque en el resultado
En términos globales se observa aislado”. Ejemplo de respuesta: “ha
que el 48,10% de los estudiantes en- debido cometer un error en sus cálcu-
cuestados señalaron la opción correcta, los”.
aunque no es despreciable el porcentaje d. No es posible concluir nada. En esta
de alumnos (31,65%) que sobreestiman categoría se ubicaron los argumentos
la frecuencia esperada de la posibilidad que consideran que debido a su carácter
de lluvia. aleatorio es imposible hacer pronósticos
Los argumentos dados por los del mismo. Ejemplo de respuesta: “no
estudiantes como respuesta a la segunda es posible predecir el tiempo”.
pregunta fueron clasificados, obtenién- La tabla siguiente muestra la frecuencia
dose los siguientes grupos: y porcentaje de cada una de las categor-
a. Cae dentro del 30% de probabilidad. ías formadas, con las respuestas ofreci-
En este grupo se ubican todos los argu- dos por los estudiantes.
mentos que consideran que el meteoró-

Egresados de Total
Respuesta Educación Básica Educación Media

Fr. % Fr. % Fr. %


a 20 15,75 40 36,36 60 25,32
b 28 22,05 16 14,55 44 18,57
c 58 45,67 42 38,18 100 42,19
d 7 5,51 7 6,36 14 5,90
En blanco 14 11,02 5 4,55 19 8,02
Total 127 100 110 100 237 100
Tabla 2. Frecuencias y porcentajes de respuesta a la pregunta 2.

El porcentaje de estudiantes egre- es mayor (36,36%) que en el grupo de


sados de EM que consideran que el me- egresados de EB (15,75%). Igualmente,
teorólogo no se equivocó, (categoría a) se observa un menor porcentaje de estu-

Selección de lecturas
Didáctica de la Estocástica – 577 6

diantes del grupo EM que se ubicaron la presencia del sesgo del “enfoque en
en la categoría c (38,18%), que los que el resultado aislado”.
se ubicaron en la misma categoría del
grupo EB (45,67%). Este resultado es La comparación: estudiantes venezo-
importante, ya que en esta categoría lanos – estudiantes españoles
están los argumentos que señalan que
hubo un error de parte del meteorólogo, Los resultados encontrados con
respuesta clásica encontrada por Konold los estudiantes venezolanos serán com-
y Serrano et al, en sus investigaciones. parados con sus similares etarios espa-
Se presume que este grupo de sujetos ñoles basados en el trabajo de Serrano
presenta el sesgo del enfoque en el re- et al (1996). El primer grupo español
sultado aislado. La significación es- esta conformado por estudiantes de
tadística de estas diferencias se proba- aproximadamente 14 años de edad que
ron mediante el contraste Chi cuadrado, no han estudiado formalmente aspectos
encontrándose que la misma es signifi- de probabilidad. En el segundo grupo
cativa con un χ2=12,363 con 3 g.l. (p < se encuentran estudiantes con edades
0,01). alrededor de los 18 años, que durante el
Por la combinación de los resul- año escolar anterior estudiaron conteni-
tados anteriores se puede presumir que dos de probabilidad. Los grupos conta-
la variable nivel académico tiene una ban con un número similar de varones y
relación positiva con la interpretación hembras.
correcta del enunciado de probabilidad Resultados pregunta 1. La si-
presentado. Así mismo, estos resulta- guiente tabla muestra los resultados de
dos hacen pensar que la formación en la pregunta 1 para el grupo con edades
probabilidad ayuda a la disminución de comprendidas entre 14 – 15 años.

Grupo 14 – 15 años Total


Respuesta Venezuela España
Fi % Fi % Fi %
a 20 15,75 17 11,56 37 13,50
b 17 13,39 19 12,93 36 13,14
c 19 14,96 32 21,77 51 18,62
d 55 43,30 51 34,69 106 38,69
e 16 12,60 28 19,05 44 16,06
Total 127 100 147 100 274 100
Tabla 3. Frecuencias y porcentajes de respuesta a la pregunta 1.

En la tabla se puede observar tudiantes españoles presentan un


una diferencia importante entre el por- 24,49%. Sin embargo, el contraste rea-
centaje de alumnos venezolanos que lizado indica que χ2=5,662 con 4 g.l.
señalaron la respuesta correcta (p=0,226), por lo que no hay diferencias
(43,30%) y los estudiantes españoles estadísticamente significativas. Esto
que señalaron la misma opción nos indica que las respuestas de los es-
(34,69%). Respecto al porcentaje de tudiantes son independientes de la na-
estudiantes que señalaron las alternati- cionalidad. Sin embargo, este resultado
vas a ó b (sobreestimación de la fre- llama la atención ya que los estudiantes
cuencia esperada de las posibilidades de venezolanos habían estudiado conteni-
lluvia) los estudiantes venezolanos pre- dos de probabilidad, por lo que se podr-
sentan un 29,14%, mientras que los es-

Selección de lecturas
Didáctica de la Estocástica – 577 7

ía esperar una diferencia significativa Se presentan a continuación los


entre las respuestas. resultados de la pregunta 1 para el gru-
po 17 – 18 años.

Grupo 17 – 18 años Total


Respuesta Venezuela España
Fi % Fi % Fi %
a 14 12,73 14 10,77 28 11,67
b 24 21,82 8 6,15 32 13,33
c 11 10,00 20 15,38 31 12,92
d 59 53,64 68 52,31 127 52,92
e 2 1,81 18 13,85 20 8,33
En blanco 0 0,00 2 1,54 2 0,83
Total 110 100 130 100 240 100
Tabla 4. Frecuencias y porcentajes de respuesta a la pregunta 1.

Al examinar la opción correcta, cada país. Venezuela sólo tiene perío-


se observa que la diferencia porcentual dos de lluvia y de sequía, mientras que
entre ambos grupos es muy pequeña. España cuenta con cuatro estaciones,
Mientras que el 53,64% de los venezo- por lo tanto la información climatológi-
lanos señaló la opción d, un 52,31% de ca tiene mayor relevancia y presencia en
los estudiantes españoles indicó esa los medios de comunicación. Por lo
misma alternativa. Una diferencia apre- tanto el estudiante español esta expuesto
ciable se observa al considerar el por- a mayor información de ese tipo y por
centaje de estudiante que indican las ende tiene un mejor manejo de la mis-
opciones a ó b. El 34,55% de los estu- ma, independientemente de su forma-
diantes venezolanos consideran que el ción en el área de la probabilidad. Los
vaticinio del meteorólogo se debería estudiantes venezolanos, menos expues-
cumplir al menos en el 85% de los ca- tos en los pronósticos climatológicos,
sos. Mientras que sólo el 16,92% de los interpretan correctamente la informa-
estudiantes españoles sobreestiman las ción gracias a su contacto con la proba-
posibilidades de lluvia. El contraste chi bilidad en la escuela.
cuadrado indica que hay diferencias Resultados pregunta 2. Uno los
estadísticamente significativas entre las resultados importantes de esta compara-
respuestas de ambos grupos (χ2=22,820 ción es haber encontrado que el tipo de
con 4 g.l. y p<0,01). Esto significa que argumento presentado por ambos gru-
las respuestas de los alumnos están re- pos es muy similar. Los argumentos
lacionadas con su nacionalidad. dados por los estudiantes venezolanos
El contexto de la situación plan- en la segunda pregunta fueron análogos
teada podría estar influenciado en las a los presentados por los españoles.
respuestas de ambos grupos. El pronós- Esta similitud facilitó la comparación de
tico del tiempo tiene una mayor impor- los resultados de la segunda pregunta.
tancia en España que en Venezuela,
considerando los ciclos climáticos de

Selección de lecturas
Didáctica de la Estocástica – 577 8

Grupo 14 – 15 años Total


Respuesta Venezuela España
Fr. % Fr. % Fr. %
a 20 15,75 29 19,7 49 17,88
b 28 22,05 5 3,4 33 12,04
c 58 45,67 74 50,3 132 48,18
d 7 5,51 27 18,4 34 12,41
En blanco 14 11,02 12 8,2 26 9,49
Total 127 100 147 100 274 100
Tabla 5. Frecuencias y porcentajes de respuesta a la pregunta 2.

españoles que de venezolanos (50,3%


El porcentaje de estudiantes es-
contra 45,67%). Estas diferencias son
pañoles (19,7%) cuyo argumento se
estadísticamente significativas con un
ubicó en la categoría a es mayor que el
de venezolanos (15,75%); sin embargo, χ2=29,669 con 3 g.l. (p<0,01). Estas
al comparar el porcentaje de estudiantes diferencias podrían estar explicadas por
que señalaron argumentos clasificados los ambientes donde se desenvuelve
en el grupo c (se equivocó) se observa cada grupo de estudiantes y su relación
una mayor proporción de estudiantes con la situación planteada.

Grupo 17 – 18 años Total


Respuesta Venezuela España
Fr. % Fr. % Fr. %
a 40 36,36 48 36,9 88 36,67
b 16 14,55 1 0,8 17 7,07
c 42 38,18 49 37,7 91 37,92
d 7 6,36 24 18,5 31 12,92
En blanco 5 4,55 8 6,2 13 5,42
Total 110 100 130 100 240
Tabla 6. Frecuencias y porcentajes de respuesta a la pregunta 2.

El porcentaje de estudiantes que tras que el 6,36% de los venezolanos


se ubicaron en las categorías a y c es presentaron argumentos donde manifes-
muy similar en ambos grupos, no así los taban que no podían sacar conclusiones
ubicados en la categoría b (explicacio- al hecho de que hubiera fallado la pre-
nes causales). En el grupo venezolanos dicción del meteorólogo, un 18,5% de
un 14,55% de los estudiantes presenta- los españoles señalaron esta opción.
ron argumentos que incluían algún tipo Estas diferencias son estadísticamente
de causa para la falla del meteorólogo, significativas de acuerdo con el contras-
mientras que sólo un 0,8% de los estu- te Chi cuadrado realizado. (χ2=22,678
diantes españoles presentó argumentos con 3 g.l. p<0,01).
de este tipo. Una situación parecida, Los grupos de ambos países
pero a la inversa, se encuentra con rela- muestran elevados porcentajes de res-
ción a los argumentos de tipo d. Mien- puesta asociadas con el “enfoque en el
resultado aislado”, independientemente

Selección de lecturas
Didáctica de la Estocástica – 577 9

de la edad y el estudio de contenidos de texto de la situación planteada influye


probabilidad. Obsérvese que en ambos en las respuestas dadas, de allí las dife-
grupos los porcentajes de respuesta de rencias encontradas.
las alternativas a y c son semejantes, Debido a estos resultados se con-
pero manifiestan diferencias en las al- sidera importante realizar un estudio
ternativas b y d. Mientras que el grupo más amplio, con muestras aleatorias y
venezolano le busca básicamente expli- donde se tenga un mayor control de las
caciones causales a la supuesta falla del variables consideradas, para comprobar
meteorólogo, el grupo español no pue- la validez de las conclusiones presenta-
den sacar conclusiones al respecto. Por das para las poblaciones estudiadas.
lo que se considera que nuevamente el Desde el punto de vista de la educación
contexto de la situación presentada estadística, es primordial hacer este tipo
podría estar influenciado en las respues- de estudio, ya que la correcta interpreta-
tas dadas por cada grupo. La búsqueda ción de las ideas básicas de probabili-
de explicaciones causales por parte de dad, afecta positivamente la compresión
los estudiantes venezolanos, podría es- de ideas estadísticas de mayor nivel
tar provocada por la combinación del como la inferencia estadística.
contexto de la situación con una la vi-
sión positivista de la matemática, donde
la explicación causal es la razón de ser.

A manera de conclusión

En el caso de los estudiantes ve-


nezolanos considerados, los resultados
indican que existe una relación positiva
entre nivel académico alcanzado por los
ellos y la correcta interpretación de los
enunciados de probabilidad presenta-
dos. Así mismo, se detectó un conside-
rable grupo de estudiantes que propor-
cionaron respuestas donde se juzga la
información probabilística presentada
en forma determinista, reflejando el
sesgo del “enfoque en el resultado ais-
lado”. Sin embargo, la presencia de
este sesgo fue menor en el grupo con
mayor nivel académico, por lo que se
puede suponer que la formación en pro-
babilidad ayuda a modificar sus “pre-
sunciones” respecto a la probabilidad.
Al comparar las respuestas de
estudiantes españoles con venezolanos,
se encuentra que: (a) coinciden en el
tipo de argumentos para explicar una
posible “falla” del meteorólogo, aunque
en proporciones diferentes, (b) un gru-
po significativo de cada país evidencia
la presencia del “enfoque en el resultado
aislado”, (c) muy posiblemente el con-

Selección de lecturas
Didáctica de la Estocástica – 577 10

Referencias Bibliográficas

Fischbein, E. y Gazit, A. (1984) Does the teaching of probability improve probabilistic


intuitionss. Educational studies in mathematics, 15, 1-24
Lecoutre, M.P. (1992) Cognitive models and problems space in “purely random” situa-
tions. Educational studies in mathematics, 23, 557-568.
Konold, C (1989). Informal conceptions of probability. Cognition and Instruction, 6,
59-98
Konold, C (1995). Issues in assessing conceptual understanding in probability an statis-
tics. Journal of Statistics Education. [Revista en línea], 2 (1) Disponible:
Piaget, J. e Inhelder, B. (1975). The origin of the idea of chance in children. London:
Routledge and Kegan Paul.
National Council of Teachers of Mathematics. (1989). Curriculum and evaluation
standards for school mathematics. Reston, VA: El autor.
Ministerio de Educación (1985) Programas II Etapa de Educación Básica. Caracas: El
autor.
Ministerio de Educación (1998) Programas II Etapa de Educación Básica. Caracas: El
autor.
Ministerio de Educación (1992) Programas de Estudio de Educación Media Diversifi-
cada. Caracas: El autor.
Serrano, L; Batanero, C. y Ortiz de Haro, J.J. (1996) Interpretación de enunciados de
probabilidad en términos frecuenciales por alumnos de bachillerato. Suma, 22, 43-
50.
Shaughnessy, J. M. (1992). Research in probability an statistics: reflections and direc-
tions. Grows D.A (Ed.): Handbook of Research on Mathematics Teaching and
Learning. New York: Mc Millan.
Tversky A. y Kahneman D. (1973) Availability: a heuristic for judging frequency and
probability. Kahneman, D. Slovic, P. y Tversky, A. (Ed) (1982). Judgment under
uncertainty: Heuristics and biases. Cambridge: Cambridge University Press.
Tversky A. y Kahneman D. (1974) Judgment under uncertainty: heuristics and biases.
Kahneman, D. Slovic, P. y Tversky, A. (Ed) (1982). Jugment under uncertainty:
Heuristics and biases. Cambridge: Cambridge University Press.

Selección de lecturas
ENSAYO Scotto MG, Tobías A

Interpretando correctamente en salud pública


estimaciones puntuales, intervalos
de confianza y contrastes de hipótesis
Manuel G Scotto, MSc, PhD,(1) Aurelio Tobías-Garcés, MSc, C Stat.(2)

Scotto MG,Tobías A. Scotto MG, Tobías A.


Interpretando correctamente en salud pública Accurate interpretation of point estimates,
estimaciones puntuales, intervalos confidence intervals,
de confianza y contrastes de hipótesis. and hypothesis tests in public health.
Salud Publica Mex 2003;45:506-511. Salud Publica Mex 2003;45:506-511.
El texto completo en inglés de este artículo está The English version of this paper
disponible en: http://www.insp.mx/salud/index.html is available at: http://www.insp.mx/salud/index.html

Resumen Abstract
El presente ensayo trata de aclarar algunos conceptos utili- This essay reviews some statistical concepts frequently used
zados habitualmente en el campo de investigación de la sa- in public health research that are commonly misinterpreted.
lud pública, que en numerosas situaciones son interpretados These include point estimates, confidence intervals, and
de manera incorrecta. Entre ellos encontramos la estima- hypothesis tests. By comparing them using the classical and
ción puntual, los intervalos de confianza, y los contrastes de the Bayesian perspectives, their interpretation becomes
hipótesis. Estableciendo un paralelismo entre estos tres clearer.The English version of this paper is available at: http:/
conceptos, podemos observar cuáles son sus diferencias /www.insp.mx/salud/index.html
más importantes a la hora de ser interpretados, tanto des-
de el punto de vista del enfoque clásico como desde la óp-
tica bayesiana. El texto completo en inglés de este artículo
está disponible en: http://www.insp.mx/salud/index.html
Palabras clave: estimación puntual; prueba de hipótesis; in- Key words: point estimate; hypothesis test; on the up and
tervalo de confianza; inferencia clásica; inferencia bayesiana up interval; classic inference; Bayesian inference

E nca,losseúltimos años, en el campo de la salud públi-


1-5
ha reabierto con creciente interés la contro-
perspectivas en este tipo de estudios, pero también ha
provocado que muchos resultados sean erróneamente
versia clásica6 sobre la combinación o comparación de interpretados, como los intervalos de confianza y los
las metodologías frecuentista y bayesiana en el diseño valores de p. Esto ha provocado la aparición de gran
y análisis de datos clínicos y epidemiológicos. La incor- número de trabajos4,7-12 con el objetivo de explicar la
poración de los métodos bayesianos ha abierto nuevas correcta utilización e interpretación de los resultados,

(1) Departamento de Matemática, Universidade de Aveiro, Aveiro, Portugal.


(2) Departamento de Estadística y Econometría, Universidad Carlos III de Madrid, Getafe, España.

Fecha de recibido: 18 de septiembre de 2002 • Fecha de aprobado: 15 de abril de 2003


Solicitud de sobretiros: Aurelio Tobías Garcés. Departamento de Estadística y Econometría.
Universidad Carlos III de Madrid C/ Madrid 126, E-28903 Getafe (España).
Correo electrónico: atobias@est-econ.uc3m.es

506 salud pública de méxico / vol.45, no.6, noviembre-diciembre de 2003


Correcta interpretación de intervalos de confianza ENSAYO

dependiendo de cuál metodología, clásica o bayesia- Estimación puntual


na, sea utilizada.
El objetivo de este ensayo es presentar de una Supongamos que se quiere obtener una estimación
manera formal los principios básicos de las metodolo- puntual del parámetro θ. Llamaremos θ^(x) al estima-
gías frecuentista o clásica, y la bayesiana, revisando dor utilizado. Se puede considerar en términos gene-
los conceptos teóricos de la estimación puntual, inter- rales que θ^ será un buen estimador cuando tenga una
valos de confianza, y contrastes de hipótesis. Presen- probabilidad elevada de conducir a estimaciones ‘muy
tamos las diferencias fundamentales entre ambas cercanas’ de θ. Por ejemplo, cuando para algún ε>0
metodologías, mostrando sencillos ejemplos que ayu- pequeño P(|θ^(x)–θ<ε|)=0.99. Es decir, cuando a partir
den a clarificar las cuestiones más teóricas. de un conjunto de observaciones se obtiene una esti-
mación, θ^(x), lo único que se puede confirmar es una
Principios de la inferencia clásica de estas dos aseveraciones:

En los problemas de inferencia estadística se trabaja 1. Que |θ^(x)–θ|<ε


casi siempre en el marco de un modelo probabilístico. 2. Que ha ocurrido un acontecimiento improbable
En particular, en la inferencia clásica este modelo sirve (por ejemplo, en este caso con p=0.01).
para describir el proceso experimental o biológico a par-
tir del cual se han generado los datos. El modelo clási- Como el parámetro θ es desconocido, no sabemos
co comprende un espacio de resultados, denominado en cuál de las dos situaciones nos encontramos. Des-
espacio muestral, cuyos elementos resultan del con- de el punto de vista de la inferencia clásica, recurri-
junto de todos los posibles valores que puede tomar una mos al principio de muestreo repetido, y afirmamos
variable aleatoria X. Las posibles funciones de proba- que si repitiésemos el cálculo de la estimación un gran
bilidad para X las designaremos por ƒθ(x), siendo θ el número de veces la proporción de dichas estimaciones
vector de parámetros que clasifica dicha función. que verifican la primera condición estará cerca de 0.99.
Entonces podemos decir que ℑ={ƒθ(x):θ∈Θ} forma una En otras palabras, el estimador θ^(x) es bueno porque
familia de distribuciones de probabilidad y constituye en 99% de los casos conduce a estimaciones que di-
la parte central del modelo clásico. La inferencia clásica fieren poco del verdadero valor del parámetro. Con-
intenta responder a las siguientes preguntas: a) ¿son sideraciones análogas pueden hacerse en relación, por
los datos recogidos compatibles con algún miembro ejemplo, con los intervalos de confianza y con los con-
de la familia ℑ?, y b) admitiendo que el modelo es váli- trastes de hipótesis.
do ¿qué inferencias podemos hacer sobre el verdadero
valor del vector de parámetros θ? Es en este último Intervalos de confianza
punto donde se engloba la estimación paramétrica,
puntual, o por intervalo. Un intervalo de confianza se define mediante dos va-
La caracterización del modelo estadístico clásico lores entre los cuales se encuentra el valor del pará-
refleja diferentes aspectos. El primero es que la informa- metro con un cierto grado de confianza. El grado de
ción relevante que se utiliza para realizar inferencia es la confianza se refiere al procedimiento de construcción
obtenida por muestreo; y segundo, dichos procedimientos del intervalo, que se calcula con los datos muestrales y
deben ser analizados a través de su comportamiento en sus valores cambian de una muestra a otra. El grado
un gran número de repeticiones, hipotéticas, efectuadas de confianza no es la probabilidad de que un inter-
bajo las mismas condiciones. Este procedimiento se valo concreto incluya o no el valor del parámetro, ya
conoce como ‘principio de muestreo repetido’. Una de que al ser el parámetro un valor fijo estará, o no, den-
las facetas de este principio es que cualquier inferencia tro de un intervalo concreto. El grado de confianza se
ha de basarse en el concepto ‘frecuentista’ de la proba- refiere a la probabilidad de que, al aplicar repetida-
bilidad. Este concepto se fundamenta en la observación mente el procedimiento, el intervalo contenga el pa-
de la frecuencia relativa en un conjunto numeroso de ex- rámetro, es decir, expresa la proporción de intervalos
periencias independientes llevadas a cabo en las mismas que efectivamente incluyen el parámetro.
condiciones. Otra de sus características importantes re- Por ejemplo, Burton y colaboradores7 propor-
side en la interpretación de los resultados con relación a cionan un ejemplo de la incorrecta interpretación que
la frecuencia con la que ocurren, es por ello que la dis- suele darse a los intervalos de confianza. Si el in-
tribución muestral de lo(s) estadístico(s) que define(n) tervalo de confianza de 95% para una razón de mo-
el comportamiento a largo plazo del procedimiento in- mios es [1.6-6.4], muchos investigadores interpretarían
ferencial juega un papel fundamental. este resultado diciendo que hay una probabilidad de

salud pública de méxico / vol.45, no.6, noviembre-diciembre de 2003 507


ENSAYO Scotto MG, Tobías A

95% de que el verdadero valor de la razón de momios de tamaño 16 de una población N(µ,l) lo que podemos
está contenido en ese intervalo, lo que es incorrecto decir es que el intervalo (X±0.49) contiene µ con pro-
considerando la definición de intervalo de confianza babilidad 0.95, es decir que en 95% de las muestras, µ
descrita previamente. está contenido en (x±0.49). Esto no significa que
(16.8±0.49) contenga µ, ya que podríamos haber obte-
Contrastes de hipótesis nido una de 5% de las muestras para las cuales µ no
está contenido en dicho intervalo. De este modo, no se
Por lo que se refiere a los contrastes de hipótesis, cuan- consigue tener una idea de la mayor o menor plausi-
do queremos contrastar una hipótesis nula simple H0 bilidad de µ estar contenido en (16.8±0.49), es decir, de
contra una alternativa H1 también simple, diciendo que la probabilidad posterior del proceso de estimación por
una región crítica provoca un error de tipo I con pro- intervalo.
babilidad 0.05 y un error de tipo II con probabilidad El siguiente ejemplo14 muestra los problemas que
0.1, utilizando la interpretación frecuentista de la pueden aparecer cuando se hace un uso indiscriminado
probabilidad, lo que se pretende decir es que si repi- de la probabilidad previa. Consideremos que la varia-
tiésemos el contraste más veces, éste nos conduciría a ble X~N(µ,σ2) es observada con el objetivo de contras-
rechazar incorrectamente H0 en 5% de los casos y a tar H0:µ=0 contra H1:µ=10. La observación de X se
aceptar de forma incorrecta H1 en 10% de los casos. puede hacer con dos instrumentos de medida: el pri-
Todas las probabilidades mencionadas hasta el mero, I1 es poco preciso (σ=10) y el segundo, I2, es más
momento (0.99, 0.1, y 0.05) hacen referencia a la preciso (σ=1). El observador usa I1 o I2 con probabili-
probabilidad previa del estimador considerado. La pro- dades conocidas p y 1-p, respectivamente, sabiendo
babilidad previa también recibe el nombre de pre-ex- siempre cuál instrumento utiliza. Para realizar el con-
perimental, ya que se refiere a una situación anterior a traste H0 contra H1 podemos utilizar, entre otros, las
la observación de los datos. La probabilidad previa es siguientes pruebas, ambas de tamaño α:
un importante criterio de evaluación de los proce-
dimientos clásicos y no plantea problemas cuando se Prueba 1. Utilizando el instrumento I1 rechazamos H0
utilizan procedimientos que se repiten un gran núme- cuando X>k0k0=10φ-1(1-α) y utilizando el instrumento
ro de veces. Lo que ciertamente es discutible es el em- I2 rechazamos H0 cuando X>k1 k1=φ-1(1-α) donde φ(x)
pleo de la probabilidad previa en aquellas situaciones es la función de distribución de la normal estándar. Es
que sólo ocurren una vez y no se repiten. fácil verificar que la prueba 1 tiene tamaño α.
Para ilustrar esta última situación, consideremos Ptueba 2. Con el instrumento I1 rechazamos siempre
el siguiente ejemplo.13 Supongamos que a partir de H 0 y con el instrumento I2 rechazamos H 0 cuando
una muestra queremos inferir sobre el parámetro λ X>k 2k 2=φ -1( 1-α ), α>p. El tamaño de la prueba 2
1-p
de una distribución de Poisson. Para ello, utilizaremos también es α.
el valor medio de los datos muestrales, X, como esti-
mador, sabiendo que bajo ciertas condiciones sigue Se puede demostrar que para varios valores de α
una distribución normal, de valor medio λ y varianza y de p, la prueba 2 es más potente que la prueba 1. Por
λ/n. Con base en esta distribución, podemos decir lo tanto, la doctrina clásica diría que la prueba 2 es
que X∈(λ±1.96√λ/n) con una probabilidad a doble mejor de las dos, si se tiene en cuenta la probabilidad
cola de 95%. Cualquiera de estas afirmaciones se re- previa. Si el observador se propone realizar una larga
fiere a la probabilidad previa, ya que está en juego el serie de ensayos no tiene ningún motivo que lleve a
conjunto de valores posibles de X. Lo que ahora nos rechazar la recomendación de la doctrina clásica. El
preguntamos es ¿qué podemos decir de x como esti- problema es que si el observador puede realizar una
mación de λ? Por ejemplo, si en una muestra de ta- sola vez la experiencia (utilizando la prueba 2) a uno
maño 16 obtenemos que x=16.8, ¿qué podemos decir le extraña la idea de ignorar el resultado de no consi-
sobre la proximidad de este valor en relación a λ? La derar la observación cuando utilizamos el instrumento
respuesta que un estadístico clásico dará es que puesto I1. De hecho, es natural que al observador no le inte-
que x es un valor típico de X, éste hereda las propie- rese utilizar la probabilidad previa sino la precisión
dades de la distribución muestral de X. Esto nos re- que obtendrá cuando se utilice cualquiera de los dos
vela que la metodología clásica no consigue medir la instrumentos de medida.
precisión efectivamente realizada, conocida como pro- El papel central de la probabilidad previa en los
babilidad posterior, o sea la proximidad entre x y λ una procedimientos clásicos es consecuencia directa del
vez observados los datos. Ejemplificando una vez principio de muestreo repetido. Este principio implica
más, si x=16.8 es una media de una muestra concreta la transferencia, para los procedimientos estadísticos,

508 salud pública de méxico / vol.45, no.6, noviembre-diciembre de 2003


Correcta interpretación de intervalos de confianza ENSAYO

mismo cuando se tenga la intención de aplicarlos sólo no que normalmente se utiliza para obtener una esti-
una vez, de las propiedades que los mismos revelan mación puntual es la moda de la distribución a poste-
en un conjunto ilimitado de repeticiones. Este es uno riori, ya que es el valor más probable que puede tomar
de los puntos de discordia entre clásicos y bayesianos, θ. En algunas situaciones, las estimaciones de máxima
ya que puede haber ambigüedad a la hora de conside- verosimilitud del modelo clásico y bayesiano son prác-
rar este conjunto hipotético de repeticiones ilimitadas, ticamente idénticas. Esto ocurre, por ejemplo, cuando
pues uno puede imaginarse diferentes formas de repe- se elige una distribución a priori poco informativa, lo
tir las experiencias y, en tal caso, no está claro cuál de que implicará que la distribución a posteriori estará
las formas es la más adecuada para realizar inferen- basada en la información obtenida por muestreo y en
cias sobre el parámetro. este caso las estimaciones para los dos modelos coinci-
dirán. A pesar de esta circunstancia, la interpretación
Principios de la inferencia bayesiana de los resultados, dependiendo de la metodología uti-
lizada, es completamente diferente.
La inferencia bayesiana se fundamenta en el Teorema
de Bayes sobre el cálculo de probabilidades condicio- Intervalos de credibilidad
nadas. La divergencia fundamental entre el modelo
clásico y el modelo bayesiano es que el parámetro θ∈Θ, Con relación a los intervalos de confianza clásicos, en
que en el modelo clásico es un escalar o vector desco- el modelo bayesiano se utilizan los llamados interva-
nocido pero fijo, pasa en la metodología bayesiana a los de credibilidad. Estos intervalos se construyen de
ser considerado aleatorio. Para los bayesianos, todo lo la siguiente manera. Observado x, se quiere encontrar
que es desconocido es incierto y toda incertidumbre dos valores [a1,a2] de tal manera que θ ∈[a1,a2] con una
tiene que ser cuantificada en términos probabilísticos. probabilidad elevada, o sea P(a1<θ<a2)|x)≥1–α, sien-
Al mismo tiempo, admiten que la información inicial do 1–α el nivel de credibilidad. Esta definición de in-
o a priori (anterior a la experiencia pero demasiado im- tervalos de credibilidad presenta un inconveniente:
portante para ser ignorada) puede traducirse for- hay muchos valores de a1 y a2 que cumplen esta pro-
malmente en una distribución de probabilidad para θ, piedad. Se plantea entonces el problema de cómo ele-
que se conoce como distribución a priori que desig- gir estos dos valores. Una buena solución es considerar
naremos como p(θ). Por lo tanto, p(θ) proporciona el el intervalo C={θ:p(θ|x)>γ} donde γ es el mayor núme-
grado de credibilidad que una persona atribuye a los ro real que satisface p(θ∈C|x)≥1–α. Esta regla da ori-
posibles valores de θ. Este aspecto de la distribución a gen a un intervalo de amplitud mínima, de modo que
priori es el más controvertido del método bayesiano, cualquier punto excluido del intervalo no tenga ma-
ya que mucha gente rechaza que la información ini- yor credibilidad que cualquier punto incluido en él.
cial, que puede incluir los prejuicios del investigador, Estos intervalos se conocen como intervalos HPD (hig-
se incluya en un proceso de inferencia estadística. No hest posterior density).
obstante, este problema se soluciona por los bayesia-
nos utilizando distribuciones a priori que no aporten Diferencias entre la inferencia clásica y la
información relevante sobre el parámetro. bayesiana
Una vez cuantificada esta información inicial acer-
ca del parámetro, las observaciones obtenidas por Como ya vimos, la diferencia fundamental entre el
muestreo servirán para actualizar la información ya modelo clásico y el bayesiano es que en este último los
existente sobre el parámetro. De este modo, combi- parámetros son considerados aleatorios, por lo que
nando la información inicial y la información mues- pueden ser cuantificados en términos probabilísticos.
tral, utilizando el Teorema de Bayes se atribuyen Por otro lado, es importante resaltar que la inferencia
nuevos grados de credibilidad a los valores del pará- bayesiana se basa en probabilidades asociadas con di-
metro θ , que dan lugar a la distribución a posteriori ferentes valores del parámetro θ que podrían haber
p(θ|x). De aquí se deduce que todos los procedimien- dado lugar a la muestra x que se observó. Por el con-
tos de inferencia bayesiana se basan en la distribución trario, la inferencia clásica se basa en probabilidades
a posteriori. asociadas con las diferentes muestras x que se podrían
observar para algún valor fijo, pero desconocido, del
Estimación puntual bayesiana parámetro θ . En relación con la obtención de esti-
maciones puntuales para los parámetros poblaciona-
Veamos ahora cómo resuelven los bayesianos el pro- les, en el caso del modelo clásico, la estimación se
blema de la estimación puntual. El estimador bayesia- interpreta como el valor de θ, que hace más plausible

salud pública de méxico / vol.45, no.6, noviembre-diciembre de 2003 509


ENSAYO Scotto MG, Tobías A

haber obtenido la muestra observada, mientras en el cuando es falsa). Estas probabilidades reflejan la pro-
modelo bayesiano, la estimación será el valor de θ que, babilidad previa. Desde el punto de vista bayesiano el
puesto que se ha observado x, sea más verosímil o más problema del contraste de hipótesis es encarado de
creíble. manera más directa, calculando las probabilidades a
Veamos cuáles son las diferencias que existen en- posteriori, P(Θ0|x) e P(Θ1|x) decidiendo después de
tre los intervalos de confianza clásicos y los intervalos compararlas. Por ejemplo, se puede optar por la hi-
de credibilidad bayesianos. En relación con la elección pótesis nula si P(Θ0|x)>P(Θ1|x). Estas probabilidades
del α, no hay ninguna diferencia, elegimos siempre un reflejan la probabilidad posterior del procedimiento.
valor pequeño. En los restantes aspectos no hay nin- Por lo tanto, en el contexto de los contrastes de hipóte-
guna coincidencia. Visto que la distribución a posterio- sis, se puede afirmar que el resultado de la inferencia
ri es la distribución del parámetro, en el caso bayesiano, bayesiana no es la aceptación o rechazo de las hipó-
podemos hablar de la probabilidad de que el paráme- tesis, pero sí la alteración de la credibilidad que es
tro esté contenido en el intervalo de credibilidad. Esto atribuida a cada una de ellas.
contrasta con los intervalos de confianza clásicos, los
cuales sólo pueden ser interpretados en relación con Conclusiones
su probabilidad de cobertura, o sea, la probabilidad
de obtener una muestra de manera que la región de En el presente ensayo se ha ofrecido una visión global
confianza resultante contenga θ. Como se dijo, los in- de los conceptos básicos para hacer inferencia, estima-
tervalos clásicos son una medida de la probabilidad ciones puntuales, intervalos de confianza, y pruebas
previa, mientras que los intervalos de credibilidad ba- de hipótesis, bajo el prisma de la metodología clásica
yesianos son una medida de la probabilidad posterior. y de la metodología bayesiana. Aunque es importante
Esto se traduce en que una vez que se observa x, los recalcar que ni el método inferencial clásico ni el baye-
bayesianos saben que con probabilidad como mínimo siano prescinden de un abordaje general que incluya
de 1–α, el verdadero valor del parámetro está conte- los criterios de causalidad, el método adecuado, la ca-
nido en el intervalo de credibilidad. Por lo tanto, y de lidad de los datos, y el contexto del problema de salud
manera contraria a lo que cabría esperar, la interpre- bajo investigación.
tación de los intervalos de confianza como se usa co- Las inferencias generadas a partir de la metodolo-
múnmente es propia del método bayesiano y no del gía bayesiana son más informativas y fáciles de inter-
clásico, independientemente de la metodología utili- pretar que las realizadas a partir de la metodología
zada para su cálculo. clásica, proporcionando respuestas más directas a
Veamos un ejemplo. Supongamos que construi- muchas de las cuestiones planteadas por los investi-
mos el intervalo de manera que para las dos metodo- gadores en el campo de la epidemiología y de la salud
logías se obtenga x±1.96σ/√n. Mientras que para un pública.4,8-10 Pero encontramos que todavía es bastante
bayesiano P(x–1.96σ/√n<θ<x+1.96σ/√n|x) tiene una habitual que, tanto epidemiólogos como clínicos inter-
interpretación directa como probabilidad, represen- preten los intervalos de confianza calculados por mé-
tando por lo tanto la probabilidad posterior, para un todos clásicos utilizando el concepto bayesiano de la
clásico, antes de obtener una muestra dicho intervalo probabilidad subjetiva.7 Este hecho es debido principal-
representa la probabilidad de cobertura de θ por un mente a dos motivos: en primer lugar, la escasa reper-
intervalo aleatorio (probabilidad previa). Después de cusión que los métodos bayesianos han tenido, tanto
recoger la información por muestreo lo único que un en los libros de texto más populares en el ámbito de la
clásico podrá decir es que, o efectivamente el verda- bioestadística,15-18 como en la formación de los investi-
dero valor del parámetro está en ese intervalo, o bien, gadores. Por otro lado, la total inviabilidad de los pro-
que ocurrió un suceso de probabilidad 0.05. gramas estadísticos de carácter general de mayor
Finalmente, veamos cuáles son las diferencias difusión en el ámbito de la investigación médica (como
fundamentales con relación a los contrastes de hipó- Stata, SAS, o SPSS) respecto de la aplicación de técni-
tesis. Supongamos que se quiere contrastar si H0:θ∈Θ0 cas estadísticas bayesianas.
respecto H1:θ∈Θ1. Como ya se explicó anteriormente, En este sentido, sería deseable un cambio mucho
siguiendo la metodología clásica este contraste se lle- más progresivo en la manera de concebir y analizar
varía a cabo delimitando una región de rechazo V en los estudios epidemiológicos actuales, de tal manera
el espacio muestral, que sería evaluada a través de las que la metodología bayesiana se convierta en el modo
probabilidades de los errores de tipo I (probabilidad natural de concebir los análisis estadísticos con fines
de rechazar la hipótesis nula cuando es cierta) y de inferenciales. Este cambio de pensamiento ha coin-
tipo II (probabilidad de no rechazar la hipótesis nula cidido con el desarrollo de los métodos avanzados

510 salud pública de méxico / vol.45, no.6, noviembre-diciembre de 2003


Correcta interpretación de intervalos de confianza ENSAYO

de simulación (Monte Carlo –MC– o Markov Chain 5. Silva LC, Muñoz A. Debate sobre métodos frecuentistas vs métodos
Monte Carlo –MCMC–)19 y su implantación en el soft- bayesianos. Gac Sanit 2000;14:482-494.
6. Rothman KJ. A show of confidence. N Engl J Med 1978;299:
ware estadístico para análisis bayesiano, principalmente 1362-1363.
WinBugs,20 haciendo posible que la aplicación de la 7. Burton PR. Helping doctors to draw appropiate inferences from the
metodología bayesiana sea cada vez más habitual en analysis of medical studies. Stat Med 1994;13:1699-1713.
el campo de la salud pública.21,22 Pero mientras un pro- 8. Goodman SN. Of p-values and Bayes: A modest proposal. Epidemiol
gresivo cambio de mentalidad se va produciendo, co- 2001; 12: 295-297.
9. Silva LC, Benavides A. El enfoque bayesiano: otra manera de inferir.
incidimos en que conceptos de la metodología clásica, Gac Sanit 2001;15:341-346.
tal como el valor de p, no deben ser descartados radi- 10. Bayarri JM, Cobo E. Una oportunidad para Bayes. Med Clin
calmente.22,23 Por ello compartimos con Bacallao2 la re- 2002;119:252-253.
comendación de que mientras el pensamiento 11. Alamo F, Vázquez FJ, Rodríguez JC. Herramientas para la
bayesiano va desplazando al clásico, conviene utilizar investigación biomédica: la perspectiva bayesiana (I). Med Clin
2002;119:265-268.
las pruebas estadísticas habituales únicamente cuan- 12. Alamo F, Vázquez FJ, Rodríguez JC. Herramientas para la
do se pueda garantizar un alto grado de plausibilidad investigación biomédica: la perspectiva bayesiana (II). Med Clin
de la hipótesis nula a contrastar. 2002;119:269-272.
13. Murteira JF. Estatística: Inferência e decisão. Lisboa: Imprensa
Agradecimientos Nacional, Casa da Moeda, 1988.
14. Cox DR. Some problems connected with statistical inference. Ann
Math Stat 1958;29:357-372.
Agradecemos a los dos revisores anónimos sus valio- 15. Colton T. Statistics in medicine. Boston: Little Brown, 1974.
sos comentarios a versiones previas del manuscrito, 16. Armitage P, Berry G. Statistical methods in medical research. Oxford:
así como a los editores por su gentileza a la hora de Blackwell, 1987.
considerar este manuscrito en formato de ensayo para 17. Bland M. An introduction to medical statistics. Oxford: Oxford
University Press, 1987.
su publicación. 18. Campbell MJ, Machin D. Medical statistics: A commonsense approach.
Chichester: John Wiley, 1993.
19. Casella G, George EL. Explaining the Gibbs sampling. Am Stat
Referencias 1992;46:167-174.
20. Spiegelhalter D, Thomas A, Best N, Gilks W. BUGS Bayesian inference
1. Etzioni RD, Kadane JB. Bayesian statistical methods in public health using Gibbs sampling version 0.50. Cambridge: MRC Biostatistics Unit,
1995.
and medicine. Annu Rev Public Health 1995;16:23-41.
2. Bacallao J. La perspectiva exploratorio-confirmatoria en las 21. Spiegelhalter DJ, Myles JP, Jones DR, Abrams KR. Methods in health
aplicaciones biomédicas de la estadistica: dos diálogos (I). Bayesianismo service research. An introduction to Bayesian methods in health
technology assessment. Br Med J 1999;319:508-512.
frente a frecuencialismo: sus respectivas implicaciones prácticas en
relación con el análisis de datos. Med Clin 1996;107:467-471. 22. Spiegelhalter DJ, Myles JP, Jones DR, Abrams KR. Bayesian methods in
3. Bacallao J. La perspectiva exploratorio-confirmatoria en las health technology assessment: A review. Health Technol Assess 2000;
4:1-130.
aplicaciones biomédicas de la estadística: dos diálogos (II).
Consideraciones críticas acerca de las pruebas de significación. Med 23. Cobo E, Campbell MJ. Interpreting results of observational research.
Clin 1996;107:539-543. P values are still useful. Br Med J 1994;309:1439.
24. Weinberg CR. It’s time to rehabilitate the p-value. Epidemiol
4. Burton PR, Gurrin LC, Campbell MJ. Clinical significance not statistical
significance: A simple Bayesian alternative to p values. J Epidemiol 2001;12:288-290.
Community Health 1998;52:318-323.

salud pública de méxico / vol.45, no.6, noviembre-diciembre de 2003 511


27 Congreso Nacional de Estadística e Investigación Operativa
Lleida, 8-11 de abril de 2003

UN INDICADOR PRIVILEGIADO: EL PORCENTAJE

E. Zurbano1, C. Corral2, I. Díaz3


Departamento de Estadística, I. O. y Didáctica de la Matemática
Universidad de Oviedo, 33005 Oviedo, España
E-mail: 1zurbano@pinon.ccu.uniovi.es
2 ccorral@pinon.ccu.uniovi.es
3 irene@pinon.ccu.uniovi.es

RESUMEN

Los porcentajes constituyen el contenido matemático más frecuentemente utilizado,


tanto en los estudios, informes o trabajos de investigación, como también en las
noticias, en la publicidad y, en general, en todos los medios de comunicación de masas.
A partir de diversos trabajos que se han ocupado de reflejar las dificultades que
presenta su manejo, hemos realizado un estudio exploratorio acerca de la interpretación
de ciertas situaciones porcentuales por parte de alumnos de Ciencias Matemáticas, y
por parte de maestros de Educación Primaria en ejercicio. Los resultados parecen
confirmar la existencia de las dificultades anteriores.

Palabras y frases clave: Cultura estadística, razonamiento proporcional,


porcentajes, IPC.
Clasificación AMS: 97C70

1. Introducción
La Estadística es, a nuestro juicio, un elemento imprescindible en la formación
elemental de los ciudadanos de nuestra sociedad. Forma parte de aquello que, llamado
en otros tiempos “cultura general”, se podría caracterizar como el conjunto de todos los
conocimientos que los individuos de nuestro entorno sería deseable que poseyeran. No
parece que sea excesivamente complicada la tarea de encontrar justificaciones a las
consideraciones anteriores:

1. Las tablas y gráficos estadísticos aparecen con gran frecuencia en determinados


medios de comunicación de masas, como la prensa o la televisión. Nuestros
ciudadanos han de estar capacitados, por tanto, para la lectura e interpretación
crítica de los mismos, ya que un desarrollo limitado de dichas capacidades les
podría dejar indefensos ante ciertas presentaciones no neutrales de la información:
“Los números vienen determinados por intereses e intenciones, por lo que no son
tan sólo medios para interpretar y comprender una situación...” Keitel (1997).

1
2. El pensamiento estadístico facilita y enriquece el desarrollo integral de la persona,
pues a la par que orienta hacia la introspección crítica y reflexiva, potencia también
una componente actitudinal muy a tener en cuenta: “El pensamiento estadístico es
una actitud mental para el enfoque de los datos” Paulos (1992). En este sentido,
sería deseable que nuestros ciudadanos fueran poseedores de una actitud previa
analíticamente crítica ante las informaciones estadísticas. En nuestra opinión, la
Educación Estadística puede y debe intentar ayudar a la estructuración de dicha
disposición.

3. La Estadística posee un evidente valor funcional, al ser muchas las Áreas que
necesariamente han de hacer uso de la misma, debiendo apoyarse en ella para su
adecuado desarrollo. Nuestra disciplina constituye un potentísimo instrumento,
base del método científico experimental, que un gran número de profesionales de
nuestra Comunidad va a tener que usar. Hemos de formarles para ello.
4. La Estadística afecta a nuestras vidas. El Índice de la Bolsa, el EURIBOR o el IPC
son indicadores estadísticos que gobiernan gran cantidad de aspectos de nuestra
cotidianeidad; la presentación de los resultados de determinadas encuestas de
opinión puede ser capaz de condicionar, sesgar y orientar nuestros propios
pensamientos o creencias; en nuestra vida diaria tomamos continuamente decisiones
acerca del consumo, el ocio, la sanidad o la higiene que se apoyan en potentes
estudios estadísticos...la Estadística está continuamente presente, directa o
indirectamente, en nuestra vida cotidiana.

Batanero (2002), muestra cómo en los últimos tiempos se ha venido acuñando el


término “statistics literacy” para reflejar el papel que juega el conocimiento estadístico
elemental en el Currículo. Se trataría por tanto de proporcionar a los futuros ciudadanos,
y como parte de la “cultura general” a la que nos hemos referido anteriormente, una
cultura estadística básica, imprescindible para convivir con una cierta autonomía en
nuestra sociedad.
La autora anterior describe a este respecto el modelo de Watson (1997), que nos parece
de gran interés, en el que se recogen las tres componentes siguientes, sucesivas y
jerarquizadas:
1. El conocimiento básico de los conceptos estadísticos y probabilísticos.

2. La comprensión de los razonamientos y conclusiones que se presenten en el marco


de algún tipo de estudio estadístico.

3. Una actitud crítica manifestada al analizar el rigor con el que puedan estar
formulados los argumentos o las reflexiones estadísticas anteriores.

2
2. El porcentaje

En este sentido, nos ha parecido conveniente ocuparnos de un indicador


estadístico, como es el porcentaje, que constituye muy posiblemente una adecuada
materialización del modelo de Watson, ya que:
1. Es un conocimiento básico, elemental, dentro de la Educación Estadística.
Probablemente sea el primer indicador que se construya en la mayoría de los
procesos de tratamiento de la información.

2. Aunque se nos aparezca como conceptualmente simple, puede presentar en su


manejo e interpretación abundantes dificultades, como tendremos ocasión de
analizar más adelante.

3. Para que las conclusiones que se formulen a partir del estudio en cuestión resulten
admisibles, es preciso ser absolutamente escrupulosos en la estructuración
sintáctica de aquéllas, ya que la proyección semántica de las mismas presenta muy
frecuentemente ambigüedades que no siempre resulta sencillo detectar.
Hemos de hacer notar que, en nuestra opinión, los tantos por ciento constituyen el
contenido matemático que con más frecuencia aparece, no solo en la mayoría de los
estudios, informes o trabajos de investigación, sino también en las noticias, en la
publicidad y, en general, en todos los medios de comunicación de masas.
Pero esa convivencia prácticamente diaria con los porcentajes no implica en los
ciudadanos una especial destreza en el manejo de los mismos. Así:
Cockcroft (1985) reflejó la existencia de una manifiesta incapacidad de los encuestados
para entender los porcentajes. Muchos de aquellos confesaron ser incapaces tanto de
usarlos como de interpretarlos, lo cual muy frecuentemente les producía un acusado
rechazo al manejo de los mismos.
Udina (1989) afirma que individuos que entienden y saben resolver situaciones
planteadas en términos de proporcionalidad, tropiezan cuando se encuentran con frases
que tratan de porcentajes. Apunta que el problema podría tener un carácter
fundamentalmente semántico, es decir, de significado de las palabras empleadas.
Añade además que las dificultades en el manejo de los tantos por ciento se podrían
concretar fundamentalmente en el hecho de que, quizás con demasiada frecuencia, se
suele omitir el total respecto del que se han calculado, lo cual puede permitir una cierta
ambigüedad en la interpretación de los mismos.
Corbalán (1995) constata la poca soltura con la que se suelen manejar, y como posible
causa apunta entre otros factores al hecho de que en el aula se dedica muy poco tiempo
a los porcentajes, mucho menos que a las fracciones o a los decimales: “Hay algo así
como una relación inversa entre el tiempo que se dedica en la escuela a cada una de
estas tres formas de representar cantidades no enteras y la importancia (medida por su
utilización en la vida diaria) que la sociedad le concede fuera de ella”.

3
Hann (1999), realizó una evaluación de las competencias de los estudiantes manejando
porcentajes, para lo cual trabajó con tres grupos: estudiantes noveles, estudiantes
expertos y estudiantes graduados. Observó una tendencia a la estabilización de los
procedimientos empleados, de manera que, conforme los individuos iban siendo más
expertos, sus procedimientos tendían a ser menos erráticos; pero si bien los métodos que
utilizaban eran más estables, ello no suponía que fueran más correctos. Es decir, que el
estudio mostró cómo los estudiantes graduados no dominaban mejor la noción de
porcentaje que los otros dos grupos.
Su diagnóstico acerca de la causa de tales resultados conecta con el apuntado
anteriormente por Udina, si bien lo amplía y enriquece: lo atribuye al hecho de que en
los porcentajes se conjugan dificultades de tipo operatorio con otras de tipo semántico.
La conclusión de su trabajo es contundente: "Me parece inquietante que tantos futuros
ciudadanos no sean capaces de dominar la noción matemática más utilizada en la vida
cotidiana".
Parker et al. (1995), constatan que el porcentaje es uno de los temas más difíciles de las
matemáticas elementales; ambiguo y sutil a la vez, se nos presenta como un concepto
dinámico y cambiante. Añaden que, mientras que los tantos por ciento pueden tener
muchos significados diferentes, tal multiplicidad no puede ser abarcada en su totalidad
por el sistema natural del idioma, llegando a señalar varios aspectos del mismo muy a
tener en cuenta:
a) Su concisión enmascara muy frecuentemente al total de referencia.

b) La partícula “de”, que puede traducirse mecánicamente por una operación de


multiplicación entre dos números, pero que también puede significar “una parte de”,
en cuyo caso el soporte aritmético nos los proporcionaría una división.

c) Las partículas “más que” o “menos que”, decididamente aditivas y sustractivas


respectivamente, pero que en un contexto porcentual nos conducen a un esquema
multiplicativo, sugiriendo además una simetría que realmente no se manifiesta.
Conectan, por tanto, con aspectos semánticos, ya citados por los autores anteriores.

4. Un estudio exploratorio acerca de los porcentajes


En un marco como el anterior se sitúa el trabajo que vamos a describir, y que consiste
en un estudio inicial, exploratorio, acerca del conocimiento y manejo de los porcentajes
por parte de estudiantes de Matemáticas y de maestros de Educación Primaria de
Asturias. Para ello nos hemos centrado en aspectos de interpretación de ciertas
situaciones porcentuales que, por su propia naturaleza, pueden resultar problemáticas.
Como sujetos de la investigación, hemos decidido trabajar con tres grupos: estudiantes
universitarios de Matemáticas, de distintos Cursos; estudiantes universitarios también
de Matemáticas, pero del último curso de carrera y de la Especialidad de Estadística, y
profesores en ejercicio de Educación Primaria. A continuación vamos a detallar algunas
características de dichos grupos.

4
1. Los estudiantes de Matemáticas
Son alumnos de Matemáticas que han realizado con nosotros la asignatura
“Didáctica de las matemáticas en la ESO”. Es sabido que en una licenciatura como
la de Matemáticas el concepto de “Curso que se está realizando” es difuso, ya que
los alumnos pueden llegar a estar simultáneamente en asignaturas de los cuatro
cursos de la carrera. De todas formas, podemos señalar que los alumnos de este
grupo pertenecían mayoritariamente a los cursos intermedios: 2º y 3º.
Respecto de su Especialidad, eran indistintamente de Matemática Aplicada o de
Estadística. Trabajamos con 16 individuos, que formarán el grupo 1.
2. Los estudiantes de Estadística.
Se trata de alumnos básicamente del último curso de Ciencias Matemáticas, de la
Especialidad de Estadística. Lo que hicimos fue acudir a una clase correspondiente
a una asignatura, Análisis Multivariante, que es cursada habitualmente por alumnos
que están a punto de finalizar sus estudios. Podíamos suponer, por tanto, que la
formación de los mismos era ciertamente sólida. Encuestamos a 18 sujetos. Van a
ser el grupo 2.
3. Los profesores en ejercicio

Trabajamos con 40 maestros de Primaria en ejercicio, asistentes a unos Cursos de


Perfeccionamiento. Como quiera que estos profesores ya están actuando en el aula,
hay que tener en cuenta que los índices de respuestas proporcionados en el
cuestionario trascienden al individuo mismo, puesto que su capacitación a la hora
de interpretar los mensajes estadísticos propuestos se ve reflejada, y multiplicada,
en los propios alumnos con los que está desarrollando su labor profesional. Serán el
grupo 3.
El trabajo a realizar, como ya hemos indicado, era un pequeño estudio, exploratorio e
inicial. Si tenemos en cuenta que nuestro interés estaba centrado en obtener
informaciones sobre conocimiento práctico, parece lógico que utilizáramos un
cuestionario.
En la cumplimentación del mismo los individuos utilizaron aproximadamente entre 20 y
30 minutos, y se les aclararon “in situ” las dudas acerca de los enunciados propuestos.

4. Resultados de la investigación
Se presentaron 4 ítems restringidos, en los que se solicitaba justificación de las
respuestas dadas, más un ítem abierto, de respuesta libre. Este último, evidentemente
más difícil de interpretar y tabular, lo hemos resumido a la dicotomía respuesta válida -
respuesta errónea. A continuación vamos a detallar los ítems en cuestión, junto con los
resultados obtenidos. Aparte de los grupos 1 (estudiantes de estadística), 2 (estudiantes
de matemáticas) y 3 (maestros en ejercicio), vamos a considerar como grupo 4 al grupo
total, es decir, al formado por el conjunto de los 3 grupos anteriores.

5
Ítem 1. “Un comerciante, tras realizar un cursillo de Marketing, y decidido a
incrementar sus ventas a la vez que mantenía el margen de beneficio, aumentó los
precios de sus productos un 25%, ofreciendo posteriormente a sus clientes un descuento
del 25%. ¿Es correcta esa estrategia comercial, en cuanto a dicho margen de
beneficio?”
Esta cuestión, que aparece en Udina (1989), ha sido incorporada por alguna Editorial de
Textos de Matemáticas para la E. S. O. (Anaya, 2º), de manera que, a priori, nuestras
previsiones apuntaron a suponer que a una cierta parte de los encuestados podría no
resultarles del todo extraña. Se puede observar que la clave está en darse cuenta de que
el descuento posterior se realiza sobre una cantidad mayor que la inicial, de manera que
tal descuento es superior al incremento habido en el precio. En este ítem, lo mismo que
en todos los restantes, hemos considerado la respuesta acertada cuando se nos ha
justificado debidamente.

GRUPO MATEMÁT. 4º DE ESTAD. PROFESORES TOTAL

Nºde respuestas
correctas 5 9 0 14

% respuestas
correctas 36% 50% 0% 19%

Tabla 1. Resultados ítem 1

100%
80%
50%
60% 36%
40% 19%
20% 0%
0%
1 2 3 4

Gráfica 1. Resultados ítem 1


Los porcentajes de respuestas correctas son, en nuestra opinión, anormalmente
pequeños. Pensamos que muy posiblemente los individuos hayan contestado de manera
intuitiva y no razonada. De hecho, las respuestas se apoyaban en expresiones como
“...si sube un 25%, y baja también un 25%, es lógico que...” o “...si los precios suben y
bajan el mismo porcentaje, es de sentido común que...”. Pero ya sabemos que en

6
ocasiones la “lógica cotidiana”, o el “sentido común”, nos engañan. Llaman la atención
los resultados del grupo 3, de maestros en ejercicio.
Ítem 2. “En declaraciones a un medio informativo, un Ministro ha dicho: «Como en su
momento el PSOE subió la electricidad un 18%, y nosotros la hemos bajado un 6%,
estamos favoreciendo la economía de los españoles en un 24%». ¿Qué opinas acerca
de la veracidad de esta afirmación?”
Este ítem nos parece de gran interés, ya que ha sido tomado de un medio de
comunicación de masas. Se trata de una frase pronunciada por el Ilmo. Sr. Ministro de
Hacienda del Gobierno de España el día 4 de Mayo de 1999, en declaraciones a Radio
Nacional de España. La interpretación numérica que se realiza en la misma es, en los
términos en los que se formuló, claramente errónea. Nuestro interés era saber cómo
reaccionarían los sujetos de nuestra Investigación ante esta manipulación, un tanto
primitiva, de los porcentajes.

GRUPO MATEMÁT. 4º DE ESTAD. PROFESORES TOTAL

Nºde respuestas
correctas 7 14 12 33

% respuestas
correctas 50% 77% 30% 46%

Tabla 2. Resultados ítem 2

100% 77%
80%
50% 46%
60%
30%
40%
20%
0%
1 2 3 4

Gráfica 2. Resultados ítem 2


De las cuatro primeras cuestiones, que se han ocupado específicamente de situaciones
porcentuales, ha sido ésta la que nos ha proporcionado los mejores resultados, pero que
en todo caso no han llegado, globalmente, al 50% de repuestas acertadas. Ello ha sido
motivado por la influencia que sobre los resultados totales tienen los resultados del
grupo 3.

7
Ítem 3. “El Gobierno propone subir un determinado tipo de impuesto del 4% al 5%, y
afirma que la subida es pequeña, de tan solo el 1%. La Oposición, por su parte, dice
que se trata de una subida enorme, del 25%. ¿Pueden tener razón ambos, Oposición y
Gobierno?”
Se trata de una cuestión tomada de Krause (1987), en la que se puede comprobar cómo
es posible que, considerando los totales apropiados, pueden tener razón los dos a la vez:
el Gobierno está calculando el incremento porcentual en términos absolutos, y la
Oposición en términos relativos. Como vemos, lo que se hace aquí es jugar con el total
al que se refieren los porcentajes.

GRUPO MATEMÁT. 4º DE ESTAD. PROFESORES TOTAL

Nºde respuestas
correctas 2 12 15 29

% respuestas
correctas 14% 66% 37% 40%

Tabla 3. Resultados ítem 3

100%
80% 66%
60% 37% 40%
40%
14%
20%
0%
1 2 3 4

Gráfica 3. Resultados ítem 3

Si bien, como ya hemos comentado, estamos ante una cuestión no extraída directamente
del medio, ya que procede de un texto de Matemáticas para formación de Profesores de
Educación Primaria en los Estados Unidos, pensamos que nos permite modelizar gran
número de situaciones que se presentan bastante habitualmente en sociología y en
política, por razones que quizás sean fáciles de comprender. Pensamos que nuestros
ciudadanos han de tener instrumentos para interpretar adecuadamente porcentajes como
los que se han presentado en el ítem que nos ocupa.

8
Ítem 4. “En un paquete de cereales, que se encuentra a la venta en la actualidad en las
grandes superficies, se puede leer lo siguiente: «Premiamos tu fidelidad con un paquete
más grande en el que encontrarás un 20% más de cereales por el mismo precio: de
cada cinco desayunos, uno es gratis...¿no dejes pasar esta oportunidad!». ¿Qué opinas
acerca de la veracidad de lo afirmado en el texto?”
Se trata ésta de una cuestión que consideramos también especialmente relevante, ya que
como se indica procede de un artículo de consumo, estando por tanto ante un ítem
proporcionado directamente por el medio. Nuestro interés estaba situado en ver si, al
igual que los publicistas de Kellog’s, tampoco nuestros sujetos se percataban de que en
realidad era gratis un desayuno de cada seis, no uno de cada cinco.

GRUPO MATEMÁT. 4º DE ESTAD. PROFESORES TOTAL

Nºde respuestas
correctas 2 4 1 7

% respuestas
correctas 14% 22% 3% 10%

Tabla 4. Resultados ítem 4

100%
80%
60%
40% 22%
14% 10%
20% 3%
0%
1 2 3 4

Gráfica 4. Resultados ítem 4

Los resultados obtenidos en esta cuestión son ciertamente bajos. Pero queremos señalar
que no era fácil darse cuenta de que, para que fuera gratis un desayuno de cada cinco,
nos tendrían que dar gratis un 20% de los cereales, o un 25% más de cereales; si
afirman que nos dan un 20% más de cereales, eso se traduce en un desayuno gratis de
cada seis, no en uno de cada cinco. La verdad es que los razonamientos que hay que
poner en juego pueden resultar un tanto sutiles, y posiblemente se deban a ello los
resultados obtenidos.

9
Ítem 5. “Indica brevemente lo que crees que significan las siglas I. P. C., y señala
algunos posibles usos del mismo en la vida cotidiana”
Estamos ante una cuestión de cultura básica. Como mínimo una vez al mes se nos
muestra la evolución mensual del índice, junto con las variaciones anual e interanual, ya
que es un indicador estadístico que se toma como referencia en gran cantidad de hechos
económicos. Nuestros alumnos, o nuestros maestros en ejercicio, tendrían que estar
capacitados para responder adecuadamente a esta cuestión.
Veremos en primer lugar los resultados a la pregunta sobre reconocimiento de las siglas:

GRUPO MATEMÁT. 4º DE ESTAD. PROFESORES TOTAL

Nºde respuestas
correctas 4 12 24 40

% respuestas
correctas 29% 66% 60% 56%

Tabla 5. Reconocimiento de las siglas IPC

100%
80% 66% 60% 56%
60%
40% 29%
20%
0%
1 2 3 4

Gráfica 5. Reconocimiento de las siglas IPC

En esta pregunta el grupo total ha obenido el porcentaje más alto de aciertos de todas las
del cuestionario, y ello se debe muy posiblemente a la influencia que sobre dicho grupo
ejercen los resultados del conjunto de los maestros en ejercicio: ellos solos son más de
la mitad del total de individuos con los que estamos trabajando, y como aquí ha
respondido correctamente un 60% de aquellos, no nos ha bajado el porcentaje total,
como nos había venido ocurriendo hasta ahora. Los resultados de la segunda cuestión de
este ítem 5, como es lógico, están condicionados por los de la primera: el
desconocimiento del significado de las siglas conlleva la práctica imposibilidad para
citar algún uso del IPC en la vida cotidiana:

10
GRUPO MATEMÁT. 4º DE ESTAD. PROFESORES TOTAL

Nºde respuestas
correctas 1 7 10 18

% respuestas
correctas 7% 39% 25% 25%

Tabla 6. Aplicaciones del IPC

100%
80%
60% 39%
40% 25% 25%
20% 7%
0%
1 2 3 4

Gráfica 6. Aplicaciones del IPC

Dada la importancia que, en nuestra opinión, tienen las preguntas que nos ocupan,
pensamos que los resultados de este último ítem no requieren de más análisis, sino de
actuaciones concretas.

5. Conclusiones
En Zurbano (2002) se puede ver un adelanto, un tanto restringido y en un contexto no
exactamente igual al del estudio que estamos exponiendo en la presente comunicación.
Ya entonces apuntamos una serie de recomendaciones didácticas de diversos autores
(Cockcroft, 1985; Hann, 1999; Goffree, 2000), que coincidían básicamente en la
necesidad de tratar de modo claramente diferenciado el tópico que nos ocupa. Tenemos
que decir a ese respecto que en la actualidad algunas Editoriales de libros de texto de
nuestro país ya muestran en sus propuestas una mayor sensibilidad ante los porcentajes
(Aritmos, SM; Anaya).

11
Por nuestra parte, nosotros ya hemos incorporado a un Curso de Verano de la
Universidad de Oviedo, que se celebra bajo la Dirección de dos de los firmantes de la
presente Comunicación, una sesión dedicada exclusivamente a los porcentajes.
Tenemos que profundizar en el tema, pues su importancia pensamos que lo exige. A tal
fin, este Equipo Investigador tiene previsto realizar un estudio más amplio en el que
trataremos de llegar a la caracterización de los conocimientos, las concepciones y las
creencias de los profesores de matemáticas de Educación Secundaria Obligatoria de
Asturias, relativos a los porcentajes y a su enseñanza y aprendizaje.
Ello, entre otras cosas, nos habrá de proporcionar una información valiosa a la hora de
diseñar planes de formación, permanente e inicial, del profesorado de matemáticas de
los Centros de Educación Secundaria del Principado de Asturias. En este sentido hemos
de recalcar que nuestra intención final es poder llegar a un conocimiento que sea
utilizable para la acción en el aula: "¿Produciría el estudio del problema alguna
solución en lo que se refiere a la teoría y práctica de la educación?. Si no es así, existen
indudablemente problemas más importantes que esperan ser investigados". (Best, 1982)
Por otra parte, hemos de señalar que un factor esencial de nuestro trabajo va a radicar en
el estudio de la interpretación del tópico, esto es, del significado del mismo: “El punto
crucial en los procesos de instrucción matemática no está en el dominio de la sintaxis
del lenguaje simbólico matemático, incluso aunque éste sea también importante, sino en
su semántica, es decir, en la naturaleza de los propios conceptos y proposiciones
matemáticas y su relación con los contextos y situaciones problema de cuya resolución
provienen” Godino et al. (1998). A este respecto, es nuestro interés profundizar en el
modelo semiótico-antropológico propuesto por Godino (1999), adaptándolo, si nos
resultara posible y pertinente, a nuestro particular contexto.

5. Agradecimientos.
Este trabajo ha sido realizado en el marco del Proyecto de Investigación MB-02-513

5. Referencias Bibliográficas.
Batanero, C. (2002): Los retos de la cultura estadística, Conferencia inaugural de las
Jornadas Interamericanas de Enseñanza de la Estadística, Buenos Aires, accesible en
Internet: http://www.ugr.es/~batanero/
Best, J. W. (1982): Cómo investigar en educación, Ediciones Morata, Madrid.
Cockcroft, Comisión (1985): Las matemáticas sí cuentan, MEC, Madrid.
Corbalán, F. (1995): La matemática aplicada a la vida cotidiana, Graó, Barcelona.
Godino, J. D. et al. (1998): “A semiotic model for analysing the relationship between
thought, language and context in mathematics education”, en A. Olivier y K. Newsatead
(Eds.), Proceedings of the 22 Conference of the International Group for the Psychology
of Mathematics Education, Vol. 3: pp.1-8, University of Stellenbosch, South Africa,
accesible en Internet: http://www.ugr.es/~batanero/

12
Godino, J. D. (1999): Implicaciones metodológicas de un enfoque semiótico-
antropológico para la investigación en Didáctica de las Matemáticas, en Actas del III
SEIEM, pp 196-212, Universidad de Valladolid.
Goffree, F. (2000): Principios y paradigmas de una “educación matemática realista”, en
Gorgorió y otros (coords.): Matemáticas y educación, pp. 151-167, Graó, Barcelona.
Hann, C.(1999): Relacionar la enseñanza de las matemáticas con el mundo extraescolar,
en Uno, nº 19, pp. 105-113, Graó, Barcelona.
Keitel, C. (1997): Matemáticas y realidad en la clase, en UNO, nº 12, pp. 49-66, Graó,
Barcelona.
Krause, E. (1987): Mathematics for Elementary Teachers, D. C. Heat and Company,
Lexington, Massachussets
Parker, M. et al (1995): Percent, a privileged proportion, Review of Educational
Research, v 95, n 4, pp. 421-481
Udina, F. (1989): Aritmética y calculadoras, Síntesis, Madrid.
Watson, J. (2002): Doing research in statistics education: More just than data, en B.
Phillips (Ed.) ICOTS-6 papers for school teachers, pp. 13-18, Cape, Town: IASE, citado
por Batanero (2002)
Zurbano, E. (2002): “Los porcentajes y su interpretación”, en Penalva, C. et al.
(Coords.): “Aportaciones de la Didáctica de la Matemática a diferentes perfiles
profesionales”, pp 265-276, Universidad de Alicante.

13
El Papel de los Proyectos en la Enseñanza y Aprendizaje de la Estadística 1
Carmen Batanero y Carmen Díaz
Universidad de Granada

“Para la mayoría de los estudiantes la estadística es un tema misterioso donde


operamos con números por medio de fórmulas que no tienen sentido” (Graham,
1987, p. 5).

Introducción

En una sociedad en continuo cambio, como la que nos ha tocado vivir, hemos dejado de
asombrarnos por los avances de la ciencia y la tecnología. La estadística ha jugado un papel
primordial en este desarrollo, al proporcionar herramientas metodológicas generales para ana-
lizar la variabilidad, determinar relaciones entre variables, diseñar de forma óptima experi-
mentos, mejorar las predicciones y la toma de decisiones en situaciones de incertidumbre.
Esta relevancia ha producido un interés creciente por la enseñanza de la estadística, co-
mo se refleja en diferentes documentos curriculares, donde se insiste en la necesidad de co-
menzarla lo antes posible, y, al menos, en la educación secundaria obligatoria. Se habla de
proporcionar una cultura estadística,
“que se refiere a dos componentes interrelacionados: a) capacidad para interpretar y
evaluar críticamente la información estadística, los argumentos apoyados en datos o
los fenómenos estocásticos que las personas pueden encontrar en diversos contextos,
incluyendo los medios de comunicación, pero no limitándose a ellos, y b) capacidad pa-
ra discutir o comunicar sus opiniones respecto a tales informaciones estadísticas cuan-
do sea relevante” (Gal, 2002, p. 2-3).

Por ejemplo, en los recientes Principios y Estándares Curriculares del National Council of
Teachers of Mathematic (NCTM, 2000) se recogen los siguientes objetivos para los niños de
los niveles de 3º a 5º de primaria:
• Diseñar investigaciones para contestar una pregunta y considerar cómo los métodos de
recogida de datos afectan al conjunto de datos.
• Recoger datos de observación, encuestas y experimentos.
• Representar datos en tablas, gráficos de línea, puntos y barras.
• Reconocer las diferencias al representar datos numéricos y categóricos.
• Usar las medidas de posición central, particularmente la mediana y comprender qué es lo que
cada una indica sobre el conjunto de datos.
• Comparar distintas representaciones de los mismos datos y evaluar qué aspectos importantes
del conjunto de datos se muestran mejor con cada una de ellas.
• Proporcionar y justificar conclusiones y predicciones basadas en los datos y diseñar estudios
para mejorar las conclusiones y predicciones.

Objetivos semejantes, aunque a nivel más avanzado, se incluyen para el resto de la educa-
ción primaria y educación secundaria obligatoria, en que no sólo se hace referencia a los con-
ceptos y procedimientos, sino que se enfatiza todo el proceso de razonamiento estadístico, y el
sentido de los datos.
Sin duda esta es una propuesta curricular avanzada. A una mayor variedad y cantidad de
contenidos estadísticos se une también la recomendación sobre un cambio en el enfoque: Se
trata de presentar el análisis exploratorio de datos, centrar la estadística sobre las aplicaciones
y mostrar su utilidad a partir de áreas diversas.

1
En J. Patricio Royo (Ed.),(2 004) Aspectos didácticos de las matemáticas (125 – 164). Zaragoza: Instituto de
Ciencias de la Educación. Colección educación abierta, nº 165.
Didáctica de la Estocástica – 577 2

Pensamos que la mejor forma de seguir estas recomendaciones es introducir en las clases
de estadística el trabajo con proyectos, algunos de los cuales son planteados por el profesor y
otros escogidos libremente por los alumnos. En lugar de introducir los conceptos y técnicas
descontextualizadas, o aplicadas únicamente a problemas tipo, difíciles de encontrar en la
vida real, se trata de presentar las diferentes fases de una investigación estadística: plantea-
miento de un problema, decisión sobre los datos a recoger, recogida y análisis de datos y ob-
tención de conclusiones sobre el problema planteado.
Este recurso es ya habitual en algunos países, que incluso organizan competiciones de
proyectos estadísticos en las escuelas y universidades, semejantes a lo que nosotros conoce-
mos como Olimpiadas Matemáticas (Hawkins, 1991; Holmes, 1997). Por ejemplo, Connor,
Davies y Payne (2002) indican que cada vez es más frecuente la realización de estos proyec-
tos por los alumnos de secundaria de entre 14 y 16 años en Inglaterra y el País de Gales, debi-
do a que en su currículo de matemáticas se contempla la realización obligatoria de proyectos.
Los proyectos varían desde problemas sencillos de representación de datos, hasta la compro-
bación de hipótesis o el uso de la simulación.
Nosotros hemos aplicado esta filosofía de enseñanza desde hace algunos años, preparando
algunos materiales (Batanero y Godino, 2001) para asignaturas de estadística aplicada que
hemos impartido a alumnos de primer curso de Universidad.
Comenzaremos este capítulo presentando un ejemplo, que puede ser reproducido por los
profesores de secundaria o bachillerato en sus clases de estadística. Describiremos sus objeti-
vos, los datos y la forma en que han sido recogido, sugiriendo algunas posibles actividades
que propicien la reflexión sobre los conceptos estadísticos y permitan la ejercitación de las
diversas representaciones, técnicas y tipos de argumentación. Dependiendo de la edad y cono-
cimientos previos de los alumnos, de sus intereses, tiempo disponible, el profesor puede su-
primir o añadir otras actividades. Otros ejemplos pueden encontrarse en Anderson y Loynes
(1987) y en Batanero (2001), en donde presentamos un curso de estadística para secundaria
basado en cinco proyectos.
Seguidamente, justificaremos la importancia de contextualizar la enseñanza de la estadís-
tica alrededor de una o varias investigaciones al alcance de los alumnos, y reflexionaremos
sobre las características de un buen proyecto, abordando también el problema de la evalua-
ción. Analizaremos a continuación uno de los proyectos realizados dentro de una asignatura
de introducción a la estadística por una de nuestras estudiantes, reflexionando sobre los obje-
tivos de aprendizaje que la elaboración de este tipo de trabajos –frente a tareas específicas o
rutinarias- supone para el alumno. Finalizamos con algunas implicaciones para la labor docen-
te.

Un Proyecto Propuesto por el Profesor: Comprobar las intuiciones sobre el azar

Una de las primeras actividades que proponemos a nuestros alumnos, cuando estamos co-
menzando un curso de estadística, consiste en realizar un experimento para decidir si tienen
buenas intuiciones respecto a los experimentos aleatorios.
El experimento consiste en averiguar si son capaces de engañar a un compañero, inven-
tando una secuencia de caras y cruces que pueda pasar por aleatoria. El profesor reflexionará
con los alumnos que el experimento aleatorio más sencillo posible es justamente lanzar una
moneda equilibrada. Se propone comparar los resultados obtenidos al lanzar realmente una
moneda con los inventados.
La finalidad principal es hacer reflexionar al alumno sobre el hecho de que nuestras intui-
ciones sobre el azar nos engañan con frecuencia. También se les quiere mostrar la utilidad de
la estadística en la prueba de nuestras hipótesis o teorías (en este caso la hipótesis de que
nuestras intuiciones sobre los fenómenos estocásticos son correctas).
Puesto que las variables a tratar son discretas y las actividades no introducen conceptos es-
tadísticos complejos, el proyecto podría ser adecuado para alumnos a partir de 13-14 años, es

Selección de lecturas
Didáctica de la Estocástica – 577 3

decir, desde el comienzo de la educación secundaria.


Se sugiere empezar con preguntas similares a las siguientes y realizar en clase una discu-
sión colectiva de las soluciones en cada paso.

1. ¿Cómo piensas que deberían ser los resultados de lanzar una moneda 20 veces seguidas? ¿Ser-
ías capaz de escribir 20 resultados de lanzar una moneda (sin lanzarla realmente, sino como tú
pienses que debieran salir) de forma que otras personas piensen que has lanzado la moneda en
realidad. O, ¿podría otra persona adivinar que estás haciendo trampa?

Los datos
Los datos son producidos como resultados del experimento que será realizado por cada
uno de los alumnos de la clase. Se le proporciona a cada alumno una pauta cuadriculada,
dándole la siguiente consigna:

2. Vamos a comprobar qué tal son tus intuiciones respecto a los resultados aleatorios. Abajo tie-
nes dos cuadrículas. En la primera de ellas escribe 20 resultados sin realizar realmente el expe-
rimento. En la segunda mitad lanza la moneda 20 veces y escribe los resultados obtenidos. Pon C
para cara y + para cruz.

Una vez que los alumnos han realizado el experimento tendrán diferentes resultados. Un
ejemplo (obtenido realmente por uno de los alumnos) es el siguiente:

C C + C + + + C C + C + C + + C C C + +

+ C + C + + C + C C C C + + + + + C + +

Actividades y gestión de la clase


Cuando todos los alumnos han finalizado la realización del experimento se pueden plante-
ar preguntas similares a las que reproducimos a continuación.

3. ¿Cómo podremos distinguir una secuencia realmente aleatoria de otra que hemos inventado?

Se dejará algún tiempo para pensar y a continuación se organiza una discusión colectiva.
Es frecuente que algún alumno sugiera contar el número de caras y cruces que debe ser
aproximadamente igual, ya que hay las mismas posibilidades para la cara que para la cruz.

4. Pero, ¿hemos de obtener exactamente 10 caras y 10 cruces? ¿Qué pasa si obtenemos 11 caras
y 9 cruces? ¿Y si obtenemos 18 y 2? ¿Que os parece si comparamos el número de caras en las se-
cuencias real e inventada de todos los alumnos de la clase?

Para realizar esta comparación se recogen los datos de todos los alumnos de la clase, tanto
del número de caras en las secuencias inventadas como en las reales, para proceder, primero
al análisis de cada una de estas dos variables, y luego a la comparación de las principales dife-
rencias en su distribución. Para ejemplificar la realización de la actividad utilizaremos los
resultados obtenidos en una clase de 27 alumnos, quienes obtuvieron los siguientes números
de caras en las secuencias inventadas.
10, 12, 11,10, 11, 9, 10, 11, 9, 10, 10, 10, 7, 10, 10, 10, 10, 12, 11, 10, 9, 10, 10, 9, 10, 12, 11

4. Hemos recogido el número de caras en las secuencias inventadas por cada alumno de la clase
¿Como podríamos organizar y resumir estos datos? ¿Cuáles son el valor mínimo y máximo obte-
nido? ¿Cómo representar los datos de modo que sepamos cuántas veces aparece cada valor?
Selección de lecturas
Didáctica de la Estocástica – 577 4

¿Cuál es el valor más frecuente?

El profesor ayudaría a los chicos a identificar el valor máximo y mínimo y a organizar un


recuento y tabla de frecuencias como la Tabla 1, haciéndoles ver su utilidad para resumir la
información. Para chicos mayores se podría agregar las columnas de frecuencias relativas y
frecuencias acumuladas.

Tabla 1. Número de caras en las secuencias inventadas


Número de caras Recuento Frecuencia
7 x 1
8 0
9 xxxx 4
10 xxxxxxxxxxxxxx 14
11 xxxxx 5
12 xxx 3
Total 27

Figura 1. Número de caras en secuencias inventadas. Gráfico de puntos


x
x
x
x
x
x
x
x
x
x x
x x x
x x x x
x x x x
x x x x x
7 8 9 10 11 12

Figura 2. Gráfico de barras Figura 3. Gráfico de sectores

Secuencia inventada N. Caras en la secuencia inventada


Fre c u e n c ia

14 1 0
15 3 7
10 4 8
4 5
5 3 9
1 0 5 10
0
7 8 9 10 11 12 11
14 12
N ú m e ro d e c a ra s

El gráfico de puntos (Figura 1) es muy sencillo de construir con ayuda de un papel cuadri-
culado y puede ser un paso previo a la introducción del gráfico de barras (Figura 2) y gráfico
de sectores (Figura 3), que en este ejemplo se han elaborado con la hoja Excel, aunque podr-
ían también realizarse a mano con ayuda de instrumentos de dibujo adecuados.
Mientras en los dos primeros gráficos se visualiza mejor el carácter numérico de la varia-
ble, la moda, la dispersión y la forma de la distribución, en el gráfico de sectores se percibe
mejor la importancia relativa de cada valor respecto al conjunto de datos. Puede mostrarse

Selección de lecturas
Didáctica de la Estocástica – 577 5

también como una aplicación en el tema de las fracciones y servir para introducir o repasar los
conceptos de sector circular y amplitud del mismo, así como de aplicación en el tema de la
proporcionalidad. Si no se dispone de ordenadores, el profesor podría dividir la clase en equi-
pos, de modo que cada uno de ellos elaborase uno de los gráficos. Posteriormente se fotoco-
piarían para todos los equipos para que se pudieran utilizar en la obtención de conclusiones.

De igual manera se realizaría el estudio del número de caras en las secuencias reales, para
finalmente comparar las dos distribuciones y analizar si existen algunas diferencias importan-
tes que indiquen que nuestra intuición respecto a la aleatoriedad nos engaña. En nuestra clase
hemos obtenido los siguientes valores:
11, 11, 11, 8, 7, 8, 9, 11, 10, 9, 9, 9, 9, 14, 7, 10, 9, 10, 11, 13, 11, 8, 8, 11, 12, 9, 8

5. Compara ahora los gráficos del número de caras en las secuencias reales e inventadas. ¿En
qué se parecen? ¿En que se diferencian? ¿Es el valor más frecuente el mismo? ¿Hay el mismo
rango de variación de valores? ¿Cuál de las dos variables tiene mayor variabilidad? ¿Piensas
que nuestras intuiciones sobre el número de caras que se obtienen al lanzar 20 veces una moneda
equilibrada son totalmente correctas? ¿Podrías idear algún tipo de gráfico en que se viesen más
claramente las diferencias?

Una característica del número de caras en una secuencia real es que, en general, es más va-
riable de lo que nuestra intuición nos sugiere, mientras que los valores medios coinciden,
aproximadamente, en ambas distribuciones, ya que somos muy exactos al reflejar la equipro-
babilidad de resultados, incluso más exactos de lo debido, puesto que la secuencia inventada
tiene menos dispersión que la real.
En el ejemplo de nuestra clase, hemos obtenido una distribución bimodal (Figura 4) lo
cual sugiere la necesidad de introducir aquí las ideas de media (x=10,14 para las secuencias
inventadas, x=9,74 para las reales en nuestro ejemplo).
También surge en esta actividad la idea de dispersión de una forma sencilla. Bien a través
del recorrido, o del 50 % de casos centrales, se observa mayor dispersión en la secuencia real,
donde el 50% de los casos centrales se presentan en el intervalo (9-11) y el recorrido es 7,
mientras que en la secuencia simulada el 50% de casos centrales se reduce al valor 10 y el
recorrido es 5. Es conveniente llevar a los alumnos a realizar gráficos simultáneos para las dos
distribuciones, como el presentado en la Figura 4 o el gráfico de barras adosado (Figura 5).

Figura 4. Comparación del número de caras en secuencias reales e inventadas


Secuencia inventada N. Caras Secuencia real
X 7 XX
8 XXXXX
XXXX 9 XXXXXXX
XXXXXXXXXXXXXX 10 XXX
XXXXX 11 XXXXXXX
XXX 12 X
13 X
14 X

El número de caras es sólo una de las variables que podemos analizar en una secuencia de
resultados aleatorios, en la que aparecen otros muchos modelos probabilísticos. Uno de ellos
es la longitud de las rachas que, intuitivamente esperamos que sean cortas. Es bien conocida
la falacia del jugador por la que esperamos que, tras una corta racha de, por ejemplo, caras, la
probabilidad de que aparezca una cruz aumente. En otro plano, si un matrimonio tiene ya dos
hijos varones, tendrá una gran seguridad en que el siguiente sea una niña, sin darse cuenta que
no es demasiado raro (1 caso de cada ocho) los matrimonios con tres varones ni de que, de los

Selección de lecturas
Didáctica de la Estocástica – 577 6

matrimonios que ya tienen dos varones, aproximadamente la mitad de los que tengan un nue-
vo hijo, deben esperar que sea varón, exactamente lo mismo que cuando esperaban a su hijo
mayor.

Figura 5. Gráficos de barras adosados del número de caras en secuencias reales y simula-
das

15 14

10
7 7 Simulada
5 5 real
5 4 3
2 3
1 1 1 1
0 0 0
0
7 8 9 10 11 12 13 14

En este proyecto proponemos analizar dos nuevas variables en las secuencias producidas
por los alumnos: el número de rachas y la longitud de la racha más larga. Para aclarar el len-
guaje, llamaremos racha a una secuencia de resultados iguales, de modo que, si después de
una cara aparece una cruz (o viceversa) la racha tiene longitud 1. Para clarificar la idea de
racha volvemos al ejemplo inicial y coloreamos las rachas que aparecen. Vemos que en la
secuencia simulada, la racha más larga es de longitud 3 (3 caras) y que el número de rachas es
12, mientras que en la secuencia real hay una racha de 5 cruces y el número de rachas es 11.

C C + C + + + C C + C + C + + C C C + +

+ C + C + + C C + C C C + + + + + C + +

Para motivar el estudio de estas variables, el profesor puede preguntar si el resultado obte-
nido arriba, donde aparecen 5 cruces seguidas, parece razonable. Probablemente algún alum-
no sugiera que la moneda utilizada no está bien construida y se plantee el estudio de las rachas
en las secuencias.
El profesor explicará cómo identificar las rachas y sugerirá a los alumnos que busquen
cuál es la racha más larga en cada una de sus dos secuencias, así como que cuenten el número
de rachas, procediendo de nuevo al estudio y comparación de estas variables en las dos se-
cuencias, tal y como se ha hecho con el número de caras y finalizando con una discusión so-
bre sus diferencias y si nuestras intuiciones sobre las rachas son o no correctas.
El profesor puede usar una hoja de registro como la que reproducimos a continuación (Fi-
gura 6) donde cada alumno anota sus resultados. Luego la hoja se fotocopia y se reparte a los
chicos. Si hay poco tiempo, la clase puede dividirse en grupos para que cada uno de ellos se
encargue de analizar una de las variables y posteriormente, una vez disponibles los gráficos se
realiza la discusión conjunta.

Tabla 2. Hoja de recogida de datos de la clase


Secuencia simulada Secuencia real
N. caras N. rachas Racha mayor N. caras N. rachas Racha mayor
10 14 4 11 9 4
12 9 4 11 16 2
11 12 4 11 16 2
10 9 4 8 9 4
11 11 3 7 11 4
9 13 3 8 10 5
10 12 3 9 9 4

Selección de lecturas
Didáctica de la Estocástica – 577 7

11 14 3 11 4 7
9 13 3 10 12 3
10 8 5 9 9 5
10 12 3 9 10 5
10 12 3 9 10 5
7 10 6 9 10 5
10 11 3 14 11 5
10 13 4 7 7 5
10 11 3 10 10 3
10 12 4 9 12 3
12 10 4 10 11 4
11 12 4 11 14 3
10 13 3 13 12 4
9 7 3 11 5 4
10 13 3 8 11 5
10 11 4 8 10 7
9 14 3 11 11 4
10 7 2 12 4 4
12 13 3 9 10 5
11 14 3 8 8 5

Con alumnos mayores, puede ampliarse el tipo de gráficos y resúmenes estadísticos


utilizables para comparar las distribuciones. Podríamos, por ejemplo, calcular las medianas y
cuartiles de las diferentes variables y construir gráficos de cajas paralelos para cada par de
variables a comparar. En la Figura 7 mostramos los gráficos de caja de la longitud de la racha
mayor en las dos secuencias, donde se observa cómo la media, mediana y cuartiles de la variable
es menor en la secuencia real. Asimismo, el 50 % central de valores está por debajo, lo que nos
indica que esperamos demasiadas rachas en una secuencia aleatoria. La menor dispersión nos
indica que en esto somos menos variables de lo que ocurre en la realidad.

Figura 6. Gráficos de cajas paralelos

Número de rachas
secuencia inventada

Número de rachas
secuencia real

4 6 8 10 12 14 16

Algunas dificultades y errores previsibles


Los alumnos podrían tener dificultades en la realización de los gráficos, construyendo,
por ejemplo, unas escalas no homogéneas u omitiendo las escalas o etiquetas que identifiquen
claramente el propósito del gráfico. Es importante concienciar a los alumnos de que un gráfi-
co mal construido proporciona una información engañosa. Una actividad complementaria
podría ser buscar ejemplos en la prensa de tablas estadísticas o gráficos que presenten errores de
construcción o que induzcan a obtener conclusiones equivocadas y posteriormente elaborar una
lista de los principales tipos de errores detectados.
Al calcular la media a partir de la tabla de frecuencias, los alumnos podría omitir el pon-
derar los valores de la variables por las frecuencias, ya que los alumnos tienen con frecuencia
dificultad en el cálculo de medias ponderadas. Pueden planteárseles problemas como el si-
Selección de lecturas
Didáctica de la Estocástica – 577 8

guiente, para hacerles ver la necesidad de ponderación:

Hay 10 personas en un ascensor, 4 mujeres y 6 hombres. El peso medio de las mujeres es de 60 kilos
y el de los hombres de 80. ¿Cuál es el peso medio de las 10 personas del ascensor?

Los alumnos tienen a veces dificultades en comprender la idea de mediana; sugerimos el


cálculo de la mediana a partir del conjunto de datos ordenados y pasar a los algoritmos de
cálculo sólo cuando el alumno ha comprendido bien el significado del concepto.

Análisis del contenido estadístico


Mientras que en los problemas y ejercicios “tradicionales” nos concentramos cada vez en
un sólo concepto, propiedad o capacidad, en un proyecto se suelen trabajar bastantes conteni-
dos. Nosotros hemos presentado aquí una posible secuenciación del proyecto, que, por su
carácter abierto, podría haber tenido una resolución diferente por algunos de los alumnos.
Además, aquí hemos presentado sólo un resumen del posible trabajo, ya que se podrían repetir
los cálculos o gráficos con otras variables.
Sin embargo, es interesante analizar los contenidos que los alumnos trabajan implícita o
implícitamente desarrollando el trabajo en la forma descrita, que son los siguientes:
1. Aplicaciones de la estadística: Diseño de un experimento; análisis de datos experimenta-
les; comparación de datos experimentales con patrones teóricos.
2. Conceptos y propiedades: Aleatoriedad: experimento aleatorio; secuencia de resultados
aleatorios, sucesos equiprobables, independencia de ensayos, rachas; variable estadística
discreta, frecuencia absoluta; tabla de frecuencias; distribución de frecuencias; posición
central, moda, media, mediana; dispersión: rango, casos centrales, 50% de casos centra-
les.
3. Notaciones y representaciones: Palabras como frecuencia, media, mediana, moda, reco-
rrido, etc. Símbolos como x, Me, Mo; tablas de frecuencia; gráficos de puntos, barras,
barras adosados, sectores, cajas.
4. Técnicas y procedimientos: Diseño de un experimento; generación de hipótesis y conjetu-
ras; recogida y registro de datos experimentales; elaboración de tablas de frecuencias; re-
cuento y cálculo de frecuencia, elaboración de gráficos de puntos, diagramas de barras,
diagramas de barras adosados y gráficos de sectores; Interpretación de tablas y gráficos;
elaboración de conclusiones a partir del análisis de tablas y gráficos; elaboración de argu-
mentos y conclusiones a partir del análisis de datos obtenidos en un experimento; uso de
calculadora gráfica, hojas de cálculo o software estadístico.
5. Actitudes: Reflexión sobre las propias intuiciones incorrectas en relación a los experimen-
tos aleatorios; valoración de la utilidad de la estadística para analizar datos obtenidos me-
diante experimentación; valoración de la estética y la claridad en la construcción de tablas
y gráficos estadísticos.

Además, el razonamiento estadístico es una componente esencial del desarrollo del pro-
yecto. Este tipo de razonamiento, incluye según (Wild & Pfannkuch, 1999) cinco compomen-
tes fundamentales:
• Reconocer la necesidad de los datos: La base de la investigación estadística es la hipótesis
de que muchas situaciones de la vida real sólo pueden ser comprendidas a partir del análi-
sis de datos que han sido recogidos en forma adecuada. La experiencia personal o la evi-
dencia de tipo anecdótico no es fiable y puede llevar a confusión en los juicios o toma de
decisiones.
• Transnumeración: Los autores usan esta palabra para indicar la comprensión que puede
surgir al cambiar la representación de los datos. Al contemplar un sistema real desde la
perspectiva de modelización, puede haber tres tipos de transnumeración: (1) a partir de la
medida que “captura” las cualidades o características del mundo real, (2) al pasar de los
datos brutos a una representación tabular o gráfica que permita extraer sentido de los
Selección de lecturas
Didáctica de la Estocástica – 577 9

mismos; (3) al comunicar este significado que surge de los datos, en forma que sea com-
prensible a otros.
• Percepción de la variabilidad. La recogida adecuada de datos y los juicios correctos a par-
tir de los mismos requieren la comprensión de la variabilidad que hay y se transmite en los
datos, así como de la incertidumbre originada por la variabilidad no explicada. El razo-
namiento estadístico comienza al percibir la variabilidad de la situación y permite adoptar
estrategias en cada paso de la investigación. La estadística permite hacer predicciones,
buscar explicaciones, hallar causas y aprender del contexto. Se buscan y caracterizan los
patrones en los datos para comprenderlos.
• Razonamiento con modelos estadísticos. Cualquier útil estadístico, incluso un gráfico
simple, una línea de regresión o un resumen puede contemplarse como modelo, puesto
que es una forma de representar la realidad. Lo importante es diferenciar el modelo de los
datos y al mismo tiempo relacionar el modelo con los datos.
• Integración de la estadística y el contexto: Es también un componente esencial del razo-
namiento estadístico.

¿Por qué una Estadística Basada en Proyectos?

Una vez presentado y analizado un proyecto, desarrollaremos las principales razones


que aconsejan su inclusión en las clases de estadística. La primera es que, como señalan An-
derson y Loynes (1987), la estadística es inseparable de sus aplicaciones, y su justificación
final es su utilidad en la resolución de problemas externos a la propia estadística. La historia
de la estadística muestra también como ésta recibe ideas y aportes desde áreas muy diversas,
donde, al tratar de resolver problemas diversos (transmisión de caracteres hereditarios, medida
de la inteligencia, etc.) se han creado conceptos y métodos estadísticos de uso general (corre-
lación, análisis factorial).
Por otro lado, hay que diferenciar entre conocer y ser capaz de aplicar un conocimiento.
La habilidad para aplicar los conocimientos matemáticos es frecuentemente mucho más difícil
de lo que se supone, porque requiere no sólo conocimientos técnicos (tales como preparar un
gráfico o calcular un promedio), sino también conocimientos estratégicos (saber cuándo hay
que usar un concepto o gráfico dado). Los problemas y ejercicios de los libros de texto sólo
suelen concentrarse en los conocimientos técnicos. Al trabajar con proyectos se coloca a los
alumnos en la posición de tener que pensar en preguntas como las siguientes (Graham, 1987):
• ¿Cuál es mi problema?
• ¿Necesito datos? ¿Cuáles?
• ¿Cómo puedo obtenerlos?
• ¿Qué significa este resultado en la práctica?

Los proyectos estadísticos aumentan la motivación de los estudiantes. No hay nada que
haga más odiosa la estadística que la resolución de ejercicios descontextualizados, donde se
pida al alumno calcular la media o ajustar una recta de regresión a un conjunto de números.
No hay que olvidar que la estadística es la ciencia de los datos y los datos no son números,
sino números en un contexto. La principal característica de un curso basado en proyectos es
que el énfasis se da a las tareas, que, al menos aproximadamente, deben ser realistas. Como
sugiere Holmes (1997) si los estudiantes trabajan la estadística por medio de proyectos se
consiguen varios puntos positivos:
• Los proyectos permiten contextualizar la estadística y hacerla más relevante. Si los datos
surgen de un problema, son datos con significado y tienen que ser interpretados.
• Los proyectos refuerzan el interés, sobre todo si es el alumno el que elige el tema. El
alumno quiere resolver el problema, no es impuesto por el profesor.
• Se aprende mejor qué son los datos reales, y se introducen ideas que no aparecen con los
“datos inventados por el profesor”: precisión, variabilidad, fiabilidad, posibilidad de me-

Selección de lecturas
Didáctica de la Estocástica – 577 10

dición, sesgo.
• Se muestra que la estadística no se reduce a contenidos matemáticos.

¿Cómo Elegir y Trabajar con un Proyecto?

Los proyectos se conciben como verdaderas investigaciones, donde tratamos de integrar la


estadística dentro del proceso más general de investigación. Deben escogerse con cuidado, ser
realistas (incluso cuando sean versiones simplificadas de un problema dado) abiertos y apro-
piados al nivel del alumno.
Se comienza planteando un problema práctico y se usa luego la estadística para resolverlo.
El razonamiento estadístico es una herramienta de resolución de problemas y no un fin en sí
mismo. La Figura 7 contiene el esquema de la forma de trabajo en la que vemos que la parte
puramente “matemática” de la estadística (la reducción, análisis e interpretación de los datos)
es sólo una de las fases, y aún la interpretación ha de hacerse en función del contexto del pro-
blema planteado.

Figura 7. Esquema del desarrollo de un Proyecto

Comienzo

Plantear las Recogida


Problema preguntas de datos

NO ¿Resolver el Organizar, analizar e


problema? interpretar los datos
SI
Escribir el
informe

La fase de planteamiento de preguntas es una de las más difíciles. Los alumnos rara vez
comienzan con un problema claramente formulado. Generalmente podrían comenzar sin pre-
guntas claramente definidas y el papel del profesor es ayudarles a pasar de un tema general
(deportes) a una pregunta que pueda contestarse (en la pasada temporada, ¿los equipos de
fútbol que jugaron en su propio campo, lo hicieron mejor que los que jugaron en campo con-
trario?). Nolan y Speed (2002) sugieren que en el comienzo el profesor no debe centrarse en
la terminología estadística, sino proporcionar estrategias generales que puedan generalizarse a
otros datos y contextos. Una lista de puntos a tener en cuenta al plantear las preguntas de in-
vestigación es la siguiente:
• ¿Qué quieres probar?
• ¿Qué tienes que medir /observar /preguntar?
• ¿Qué datos necesitas? ¿Como encontrarás tus datos? ¿Qué harás con ellos?
• ¿Crees que puedes hacerlo? ¿Encontrarás problemas? ¿Cuáles?
• ¿Podrás contestar tu pregunta? ¿Para qué te servirán los resultados?

El trabajo con proyectos en la clase de estadística plantea el problema de la gestión de la


clase, de modo que se oriente a los alumnos hacia el aprendizaje de conceptos y gráficos, la

Selección de lecturas
Didáctica de la Estocástica – 577 11

ejercitación de las técnicas de cálculo y la mejora en sus capacidades de argumentación, for-


mulación de conjeturas y creatividad.
Aunque la estadística se suele enseñar separada de la probabilidad, durante la enseñanza
media, nosotros creemos que esta separación es artificial, puesto que, detrás de cualquier es-
tudio estadístico hay una componente aleatoria. Por ello hemos de tratar de relacionar estos
dos campos cuando sea posible, y en particular, en los proyectos.

Datos, sus tipos, fuentes de datos


Hemos de animar a los alumnos a ser creativos. No todos los datos serán dados por el
profesor. Para completar el proyecto el alumno necesita recoger datos, que, pueden provenir
de diversas fuentes, ser obtenidos mediante diferentes técnicas, y corresponder a diversas es-
calas de medida y tipos de variables estadísticas (Tabla 3).

Tabla 3. Tipos de datos en los Proyectos


Procedencia de los datos Anuarios estadísticos, Encuestas, Experimento realiza-
do en la clase, Internet, Prensa, Simulación
Técnica de recogida de datos Observación, Encuesta, Medida
Naturaleza de la escala de medida Nominal, Ordinal, Intervalo, Razón
Variables estadísticas incluidas Cualitativa, Cuantitativa discreta, pocos valores, Cuan-
titativa discreta, necesidad de agrupar, continua

Consideramos importante que, a lo largo de la educación secundaria el alumno tenga opor-


tunidad de apreciar esta diversidad de datos estadísticos. Algunas veces los datos se encuen-
tran disponibles, pero hay que saber localizarlos de diferentes fuentes, como libros o anuarios
estadísticos. La red Internet proporciona en la actualidad datos para cualquier tema por el que
los alumnos estén interesados, bien a partir de servidores estadísticos específicos donde los
profesores de estadística han puesto sus datos al servicio de la enseñanza, bien recurriendo a
organismos oficiales como el INE (Instituto Nacional de Estadística), Eurostat, Unesco u
otros. En la Tabla 4 mostramos algunos de estos servidores.
Por ejemplo en Connor, Davies y Bradley (2002) se sugieren diversas formas de usar los
datos disponibles en el servidor Census at School para trabajar en educación secundaria. En
este proyecto participaron niños de 7 a 16 años quienes contribuyeron a recoger información
para formar una base de datos nacional sobre los niños en las escuelas que luego pudiera usar-
se para trabajar en las clases de estadística. El servidor es accesible a las escuelas y contiene
materiales didácticos, así como resúmenes y datos que pueden usarse en una variedad de asig-
naturas, enfatizando así el uso de la Internet y la estadística.
Otra fuente de datos es la revista Journal of Statistical Education que contiene una sección
fija sobre datos y proyectos. En su servidor pueden encontrarse artículos que describen estos
datos y como usarlos en la elaboración de proyectos y actividades prácticas. Las direcciones
de éstos y otros servidores útiles para encontrar conjuntos de datos se presenta en la Tabla 4.

Tabla 4. Algunas fuentes de datos en Internet


Journal of Statistical Edu- http://www2.ncsu.edu/ncsu/pams/stat/info/jse/homepage.html
cation
The Chance Database http://www.geom.umn.edu/docs/education/chance/
The Data and Story Library http://lib.stat.cmu.edu/DASL/
Census at School Project http://www.censusatchool.ntu.ac.uk

En otras ocasiones los datos son recogidos por los alumnos mediante la realización de una
encuesta o a través de un experimento. La encuesta requerirá la elaboración de un cuestiona-
rio, fijando los objetivos del mismo, eligiendo las variables explicativas y redactando las pre-
guntas que permitan obtener la información deseada de una forma clara y concisa. Si se pre-
tende extender los resultados más allá de la muestra, la selección de una muestra representati-

Selección de lecturas
Didáctica de la Estocástica – 577 12

va plantea problemas de tipo teórico y práctico, relacionados con la población objetivo y al-
canzada, el marco de muestro, los métodos de selección, la administración del cuestionario y
los problemas de no respuesta.
La información que queremos recoger puede corresponder a diversos niveles que se co-
rresponden con diferentes técnicas de obtención de datos: información consciente y conocida
(encuesta), información desconocida, pero que puede deducirse de la observación e informa-
ción no consciente ni observable (medida). Finalmente es importante considerar la naturaleza
de las escalas de medida y tipo de variable estadística, puesto que de ellas depende el método
de análisis de datos que se puede aplicar. La elección del conjunto de datos es crítica, pues
dependiendo del tipo de datos la gama de técnicas estadísticas será más o menos amplia, ya
que no todas las técnicas son aplicables a cualquier tipo de dato.

Calculadoras y ordenadores
Cuando sea posible, los alumnos pueden usar ordenadores para llevar a cabo sus proyec-
tos, no sólo para el análisis de los datos, sino también para elaborar sus informes. Los proce-
sadores de texto (como WORD) son hoy compatibles con los programas estadísticos. El pro-
yecto es así un pretexto para aprender estas herramientas que son hoy día esenciales. Es por
ello que en el caso concreto de la estadística, los ordenadores son, con mucho, preferible a las
calculadoras, cuando estén disponibles. Es un hecho de que un número creciente de alumnos
cuenta en su casa o en la de algún amigo o familiar con ordenador personal.
Respecto a los programas estadísticos (software estadístico) existe hoy día una gran varie-
dad, desde programas profesionales, como SPSS o Statgraphics, las hojas de cálculo como
Excel o programas específicos para la enseñanza, algunos de los cuales están disponibles en
Internet. Tanto la localización de estos programas como de los datos para los proyectos supo-
ne un uso didáctico de la Internet que también justifica el empleo de los ordenadores. Hemos
incluido una lista de algunos de estos recursos en la Tabla 5.
Si no es posible recurrir a los ordenadores, las calculadoras, en especial las gráficas pue-
den sustituirlos. El volumen de datos en muchos proyectos (como los presentados como
ejemplo) hace posible el trabajo con calculadora. Tanto en este caso, como en el del uso del
ordenador, se requiere la codificación de los datos en forma numérica. Es importante que el
profesor resalte la diferencia entre el código y el valor de la variable. El hecho de, por ejem-
plo, poder calcular la media de los códigos numéricos asignados a los valores de una variable
cualitativa (como el sexo) no indica que tenga sentido el valor obtenido.

Tabla 5. Algunos programas de cálculo y exploración estadística en Internet


Recursos Educativos para Es- http://www.ucv.cl/web/estadistica/
tadística Descriptiva
Gráficos Interactivos http://nces.ed.gov/nceskids/Graphing/
Curso de Inferencia para Bachi- http://www.ibad-laspalmas.com/cei_archivos/cei.htm
llerato
Gasp: The Globally Accessible http://www.stat.sc.edu/rsrch/gasp/
Statistical Procedures,
Statiscope http://www.df.lth.se/~mikaelb/statiscope/statiscope-enu.shtml
Java Applets for Visualization http://www.kuleuven.ac.be/ucs/java/index.htm:
of Statistical Concepts
Elementary Statistical Java http://www.stat.uiuc.edu/~stat100/cuwu/
Applets and Tools
Rice Virtual Lab in Statistics http://www.ruf.rice.edu/~lane/rvls.html
STEPS - STatistical Education http://www.stats.gla.ac.uk/steps/home.html
through Problem Solving
WebStat http://www.stat.sc.edu/webstat/
Vista - The Visual Statistical http://forrest.psych.unc.edu/research/index.html
System
Berry Zielman Statistical Page http://huizen.dds.nl/~berrie/

Selección de lecturas
Didáctica de la Estocástica – 577 13

Escritura del informe


Es importante que los alumnos preparen un informe de la investigación llevada a cabo de
una forma clara y lógica. Los apartados que podría tener este informe, corresponden a las fa-
ses de la investigación: Problema, datos, análisis e interpretación. El informe puede irse reali-
zando según se avanza el trabajo, ayudará a los alumnos a pensar, planificar y llevar a cabo el
proyecto, y proporciona un resumen del trabajo realizado. Refuerza, además, el proceso de
razonamiento estadístico al tener que relatar para otra persona sus decisiones, acciones e in-
terpretaciones.

Evaluación de los Proyectos

Un punto que sin duda preocupa, tanto a alumnos como a profesores, es la evaluación. En
NCTM (1993) se concibe la evaluación como un proceso dinámico y continuo de producción de
información sobre el progreso de los alumnos hacia los objetivos de aprendizaje. El principal
propósito es mejorar el aprendizaje de los alumnos.
Es necesario reconocer la complejidad de la función evaluadora, debido a que ésta debe
atender a las múltiples facetas del conocimiento estadístico (comprensión conceptual y
procedimental, actitudes). Precisamos todo un sistema para recoger datos sobre el trabajo y
rendimiento del alumno y no es suficiente evaluarlo a partir de las respuestas breves dadas a
preguntas rutinarias en una única evaluación (o examen). Por el contrario, en un proyecto se
reflejan bien los diversos aspectos del conocimiento matemático, que se deben tener en cuenta en
la planificación de la instrucción y en su correspondiente evaluación según los estándares del
NCTM, algunos de los cuales incluimos a continuación:
• Comprensión conceptual: Dar nombre, verbalizar y definir conceptos; identificar y generar
ejemplos válidos y no válidos; utilizar modelos, diagramas y símbolos para representar
conceptos; pasar de un modo de representación a otro; reconocer los diversos significados e
interpretaciones de los conceptos; identificar propiedades de un concepto determinado y
reconocer las condiciones que determinan un concepto en particular; comparar y contrastar
conceptos.
• Conocimiento procedimental: Reconocer cuándo es adecuado un procedimiento; explicar las
razones para los distintos pasos de un procedimiento; llevar a cabo un procedimiento de
forma fiable y eficaz; verificar el resultado de un procedimiento empíricamente o
analíticamente; reconocer procedimientos correctos e incorrectos; reconocer la naturaleza y
el papel que cumplen los procedimientos dentro de las matemáticas.
• Resolución de problemas: Formular y resolver problemas; aplicar diversas estrategias para
resolver problemas; comprobar e interpretar resultados; generalizar soluciones.
• Formulación y comunicación matemática: Expresar ideas matemáticas en forma hablada,
escrita o mediante representaciones visuales; interpretar y juzgar ideas matemáticas,
presentadas de forma escrita, oral o visual; utilizar el vocabulario matemático, notaciones y
estructuras para representar ideas, describir relaciones
• Razonamiento matemático: Utilizar el razonamiento inductivo para reconocer patrones y
formular conjeturas; utilizar el razonamiento deductivo para verificar una conclusión, juzgar
la validez de un argumento y construir argumentos válidos; analizar situaciones para hallar
propiedades y estructuras comunes;
• Actitud o disposición hacia las matemáticas: Confianza en el uso de las matemáticas para
resolver problemas, comunicar ideas y razonar; flexibilidad al explorar ideas matemáticas y
probar métodos alternativos para la resolución de problemas; deseo de continuar hasta el
final con una tarea matemática; interés, curiosidad e inventiva al hacer matemáticas;
inclinación a revisar y reflexionar sobre su propio pensamiento y su actuación; valorar la
aplicación de las matemáticas a situaciones que surjan de otras materias y de la experiencia
diaria; reconocer el papel que cumplen las matemáticas en nuestra cultura, y el valor que
tienen como herramienta y como lenguaje.

Selección de lecturas
Didáctica de la Estocástica – 577 14

La evaluación del proyecto debe llevarse a cabo en varias etapas (Starkings, 1997), para
proporcionar a los estudiantes ayuda en su ejecución. Esta autora sugiere también que la eva-
luación de los proyectos, y evaluación individual de cada estudiante participante, debe tener
en cuenta el interés del proyecto, su completitud, la corrección de las técnicas estadísticas e
interpretación, la claridad del informe, así como la integración del estudiante en el equipo, su
esfuerzo individual y su contribución al trabajo colectivo.
Puesto que los estudiantes valoran aquello sobre los que los examinamos, debemos exa-
minarlos sobre las habilidades y conocimientos que para nosotros son más importantes. Una
buena evaluación debe asegurar que el estudiante aprende y no sólo que aprueba.

Proyecto Final de una estudiante: Diversidad Étnica en la Escuela

Queremos finalizar analizando uno de los proyectos presentados por nuestros alumnos en
una asignatura de libre configuración de Análisis de Datos y su Didáctica, que se oferta en la
Facultad de Educación de la Universidad de Granada y está dirigida a alumnos de primeros
cursos de universidad. Es parte de un trabajo más amplio realizado por un grupo de alumnas
de la Licenciatura de Psicología para una asignatura de su especialidad. Una de ellas, que hab-
ía elegido como libre configuración nuestra asignatura, actuó como coordinadora del grupo, y
realizó el análisis de los datos y su interpretación. Asimismo coordinó la redacción y organi-
zación del informe, que incluía una parte teórica y una parte experimental, que es la que re-
sumimos a continuación.

El problema y las preguntas planteadas


El proyecto (Diversidad Étnica en la Escuela) surgió desde la asignatura de Psicología de
la Educación, donde se pedía a los alumnos la elaboración de un estudio de campo sobre
algún tema relacionado con la educación. Este grupo concreto de alumnas se propuso estudiar
la diversidad étnica en la escuela y dentro de este tema, el estudio de la integración de la etnia
gitana en las aulas ordinarias.
En primer lugar, las alumnas llevaron a cabo una búsqueda bibliográfica, para ampliar sus
conocimientos de la problemática. Entre otros usaron los libros de Jové (1998), Fernández
Enguita (1996) y San Román (1986).Como indican las alumnas en la introducción del informe
que prepararon sobre su proyecto:
“Según la ley, todos los niños tienen el derecho y el deber de asistir a la escuela durante la edad
de la escolarización obligatoria. Esta escolarización se lleva a cabo en una determinada escuela, que
tiene una cultura que muchas veces no coincide con la de algunos niños y niñas que asisten a ella: Ni
el lenguaje, ni los valores, significados o intereses implícitos en la cultura académica conectan con
las preocupaciones o expectativas de los alumnos, particularmente con los de aquellos que provienen
de un medio social desfavorecido”.
El objetivo planteado por las alumnas en su estudio era acercarse a la realidad de la convi-
vencia entre payos y gitanos en la escuela. Para ello trataron de analizar si entre estos dos co-
lectivos se daban una serie de choques culturales, que decidieron agrupar en diferentes aspec-
tos, descritos en los términos siguientes:
1. “Individualismo frente a colectivismo: En contraposición a los valores de la mayoría paya, que
fomenta el individualismo y la competitividad, para el pueblo gitano la comunidad y el colectivis-
mo tienen una gran importancia.
2. Reafirmación cultural: El pueblo gitano se identifica como “gitano” para diferenciarse del “pa-
yo” como manera de construir y mantener la propia identidad.
3. Adquisición de hábitos y educación familiar: Debido a las condiciones en las que vive el pueblo
gitano, en ocasiones le resulta difícil mantener unos hábitos de salud, así como fomentar la edu-
cación de sus hijos.
4. Ámbito personal frente a ámbito profesional: las relaciones personales y el cuidado de la familia
estarían antes que tener un trabajo fijo y cualificado, para el colectivo gitano”.

Selección de lecturas
Didáctica de la Estocástica – 577 15

Los datos, su recogida e instrumentos


Una vez desarrollada la parte teórica del trabajo, las alumnas procedieron a la elaboración
de un cuestionario con el que recoger sus datos. Éste constaba de 25 ítems, que clasificaron
según 7 categorías, que definen las variables dependientes del estudio:
1. Prejuicio: ítems 4, 6, 12, 14 y 19.
2. Relaciones con el profesor: ítems 1 y 9
3. Relaciones con los compañeros: ítems 2, 10, 17 y 25.
4. Individualismo-Colectivismo: ítems 5 y 13
5. Reafirmación cultural: ítems 3, 18 y 22.
6. Adquisición de hábitos y educación familiar: ítems 8,16 y 23.
7. Ámbito personal-ámbito profesional: ítems 7, 15, 20 y 24.
Los ítems son afirmaciones que se presentan a los sujetos, quienes deben mostrar su grado
de acuerdo con ellas, puntuando cada afirmación con un número que varía desde –2 (nunca,
no estoy de acuerdo) a +2 (siempre, estoy de acuerdo), con una respuesta 0 que significa la
indiferencia. De los 25 items se eliminaron dos, una vez pasado el cuestionario, ya que pre-
sentaban algunos problemas de comprensión por los sujetos de la muestra. Además se tuvie-
ron que invertir las puntuaciones de algunas de las preguntas, ya que las alumnas tuvieron
cuidado en incluir enunciados tanto positivos como negativos para evitar el problema de la
aquiescencia (sujetos que siempre responden en forma positiva).
Como ejemplos, en la Tabla 6 mostramos los enunciados de los ítems que recogen las
preguntas correspondientes a la variable “Relaciones con los compañeros”. Hacemos notar
que cada ítem tiene dos enunciados posibles, ya que se usaron dos cuestionarios diferentes.
Mientras a los niños payos se les preguntaba siempre con relación a su visión de la otra etnia
(Cuando salimos al recreo jugamos con niños de otras etnias), las preguntas se personalizaban
en el caso de los niños gitanos, quienes, habitualmente eran tan sólo uno o dos casos en cada
aula encuestada (Cuando salimos al recreo juegan conmigo).

Tabla 6. Enunciado de los ítems sobre “Relaciones con los compañeros”


2. Cuando mis compañeros hacen un grupo para alguna actividad cuentan conmigo/
Cuando hacemos grupos para una actividad contamos con niños de otras etnias.
10. Cuando salimos al recreo juegan conmigo/ Cuando salimos al recreo jugamos con
niños de otras etnias
17. Los compañeros me ayudan cuando tengo que realizar alguna tarea difícil o que no
entiendo/ Ayudo a los niños de otras etnias en tareas difíciles que no entienden
25. Mis compañeros de clase me llaman para quedar fuera del colegio/ Llamo a los
compañeros de otras etnias para quedar fuera de clase.

El estudio se realizó en tres centros educativos, de las ciudades de Sevilla, Guadix, y Gra-
nada. Las alumnas visitaron personalmente los centros, recabaron permiso de la dirección
para pasar el cuestionario y realizaron ellas mismas la recogida de datos.
En total, los alumnos que respondieron al cuestionario fueron 98, aunque no todos los ca-
sos fueron considerados válidos, ya que algunos estaban incompletos y presentaban respuestas
contradictorias y fueron eliminados del conjunto de datos. Los alumnos de la muestra perte-
necían a los niveles de primaria (1° y 5° curso) y secundaria (1° y 2° ESO. De los 84 alumnos
que consideraron finalmente, 5 eran de etnia gitana y el resto, payos. Aunque la muestra de
niños gitanos es muy reducida, eran todos los que había en los grupos participantes. Indepen-
dientemente de la posible generalizabilidad de las conclusiones, vemos positivo el hecho de
que en su proyecto estas alumnas llevaron a cabo las diferentes etapas de una investigación
educativa, donde la estadística es sólo una parte del proceso de investigación.
La forma de administrar el cuestionario fue independiente para los alumnos de mayor
edad, ya que los chicos respondieron a los cuestionarios cada uno de forma individual. Para
los niños más pequeños se les leían las preguntas (a modo de entrevista semiestructurada)

Selección de lecturas
Didáctica de la Estocástica – 577 16

para que respondieran directamente al administrador del cuestionario y éste convertía la res-
puesta en puntuación. Es decir, las alumnas también se introdujeron a la técnica de entrevista
y en los dos casos tuvieron gran cuidado en la comprensión de las preguntas por parte de los
sujetos.

Análisis de datos: técnicas usadas


Como hemos dicho, aunque el proyecto se llevó a cabo por un equipo de cinco alumnas,
fue una de ellas la que se encargó del estudio estadístico, que presentó como proyecto para la
evaluación final en nuestra asignatura, que está basada en el uso de ordenadores, y donde,
además de trabajar con proyectos propuestos por el profesor a lo largo del curso, se introduce
a los alumnos al uso de paquetes de estadístico, como complemento de la asignatura. La
alumna usó el programa SPSS para el análisis de los resultados.
Recogidos los cuestionarios, se codificaron los datos y se grabaron en una tabla, que pre-
senta en las columnas los ítemes, separados según las categorías que mencionamos anterior-
mente. En las filas se incluyeron los sujetos, añadiendo variables que indiquen su nivel educa-
tivo, curso y etnia. Se designó a los sujetos de etnia 1 integradores, ya que son mayoría en la
clase (payos) y etnia 2 integrados (gitanos en el estudio).

Las variables independientes consideradas por las alumnas fueron:


• Etnia: gitana o paya;
• Nivel educativo: primaria o secundaria;
• curso: 1° y 5° de primaria, 1° y 2° de ESO.

Las variables dependientes fueron:


• Respuesta en cada ítem;
• Totales en cada una de las 7 variables que hemos descrito con anterioridad.

En lo que sigue y a modo de ejemplo, presentamos el análisis realizado en la variable “Re-


laciones con los compañeros”. Análisis similares se presentaron para cada una de las otras seis
variables consideradas. La extensión total del informe fue de 44 páginas, más anexos. La
estructuración del mismo fue correcta, desde el punto de vista metodológico, incluyendo los
apartados de planteamiento del problema, objetivos, datos, instrumentos y métodos, análisis y
discusión, conclusiones y referencias.

Respecto al análisis estadístico, en primer lugar se realizó un estudio con la muestra com-
pleta donde se elaboraron:
• Tablas comparativas de porcentajes de respuestas para cada ítem por curso, nivel educati-
vo y etnia, con objeto de analizar la actitud global de la muestra hacia la integración, así
como en los diferentes aspectos de la integración.
• Para cada una de las siete variables dependientes se elaboraron representaciones gráficas
de la media y error típico en cada uno de los ítems que la definen (ver, como ejemplo, la
figura 8).
• Histograma de la puntuación total en la categoría. Las alumnas definieron variables auxi-
liares, y, por medio de la opción de transformación de datos realizaron automáticamente,
tanto la recodificación de las preguntas formuladas negativamente, como el cálculo de
puntuaciones parciales, es decir, suma de las puntuaciones en los ítems correspondientes a
una misma variable dependiente. Analizan a continuación el histograma de la variable ob-
tenida (ver, como ejemplo, la figura 9).

Las alumnas utilizan estas gráficas para hallar respuestas a las preguntas que se plantea-
ron. Por ejemplo, respecto a la figura 8 concluyen que “Las puntuaciones medias de los suje-
tos en estos cuatro ítemes se sitúan entre –0’7 y 0’25. Los ítemes 2, 10 y 1, que se refieren a

Selección de lecturas
Didáctica de la Estocástica – 577 17

la relación con los compañeros en el contexto escolar, son más positivos, mientras que el
item 25 se refiere a la relación con los compañeros fuera de clase, tiene puntuación negativa.
Parece que los niños interactúan más con niños de otras etnias en el contexto del aula que
fuera de ella”.

Figura 8. Relaciones con los compañeros: media y error típico

1,0

,5

0,0
Media y error típico

-,5

-1,0
item 2 item 10 item 17 item 25

Respecto a la figura 9 sugieren: “Para la variable Relación con los compañeros, la media
se sitúa en 0 y la desviación típica es de 4’30. Estos datos indican que las relaciones con los
compañeros son variables”.

Figura 9. Relaciones con los compañeros: histograma de la puntuación total

20

10

Desv. típ. = 4,30


Media = -0
0 N = 83,00
-8 -6 -4 -2 0 2 4 6 8

Relaciones con los compañeros

Una vez analizadas globalmente, en la misma forma anterior las otras seis categorías de
variables dependientes, las alumnas realizan un análisis comparativo de sus resultados, para
analizar el efecto de cada una de las variables independientes: etnia, nivel educativo. Produ-
cen para cada una de ellas tablas comparativas de media y desviación típica para cada item
(véase tabla 7) y representación gráfica de las puntuaciones medias en cada item (véase figura
10).
Tabla 7. Relaciones con los compañeros: Medias y desviaciones típicas por etnias
Payos Gitanos
Media Desv. típ. Media Desv. típ.
2- Cuentan conmigo para grupos/ cuento con... 0,12 1,56 1,00 1,22
10- En el recreo juegan conmigo/ juego con... ,28 1,58 1,20 1,30
17- Los compañeros me ayudan/ ayudo a… ,12 1,43 1,80 ,45
25- Me llaman/ llamo para quedar fuera… -,80 1,21 ,80 1,79

Selección de lecturas
Didáctica de la Estocástica – 577 18

Figura 10. Relaciones con los compañeros: Puntuaciones medias según etnias

2,0

1,5

1,0

,5
item2
0,0
item10

-,5 item17
Media

-1,0 item25
integradores integrados

ETNIA

Presentan de esta forma sus conclusiones: “En cuanto a las relaciones con sus compañe-
ros, los chicos integradores cuentan poco con sus compañeros de otras etnias para hacer
grupos o jugar en el recreo, menos aún para salir fuera de clase. Sin embargo, los integrados
no lo sienten así. Esto lo podemos ver en las puntuaciones positivas en los ítems y la puntua-
ción positiva global en esta variable para los niños gitanos. Por contra en sus compañeros
las puntuaciones medias tienden a cero e incluso es negativa en un ítem. De todos modos el
gráfico de la caja indica que hay bastante variabilidad en el comportamiento de los niños
payos respecto a sus compañeros. Hay también un caso atípico entre los niños gitanos, que
no se siente integrado”.

Figura 11. Puntuación total en relación con los compañeros según la etnia
10
Relaciones con los compañeros

53

-10
integradores integrado

ETNIA

Análisis semejantes se realizaron para estudiar el efecto de las otras variables indepen-
dientes. Finalizado el estudio global y de las variables independientes, se hizo un estudio
comparado de los resultados entre niños payos y gitanos, para cada uno de los cursos partici-
pantes, presentando tablas comparativas de media y desviación típica para cada item (como
ejemplo, presentamos la tabla 8, que se ha reducido sólo a los ítems de relaciones con los
alumnos, aunque en el estudio original se presentan todos los ítems) y representación gráfica
de las puntuaciones medias en cada item (como ejemplo presentamos la figura 12). Ambas
fueron comentadas con detalle.

Selección de lecturas
Didáctica de la Estocástica – 577 19

Tabla 8. Porcentajes para los alumnos de Quinto de primaria


-2 -1 0 1 2 Siem-
NuncaPocoA vecesBastante pre
Payos
2- Cuento con los niños gitanos para formar grupos... 12,5 12,5 18,8 25,0 31,3
10- En el recreo juego con los niños gitanos... 6,3 25,0 31,3 37,5
17- Ayudo a los niños gitanos 6,3 25,0 37,5 31,3
25- Llamo para quedar fuera… 37,5 25,0 25,0 6,3 6,3

Gitanos
2- Cuentan conmigo para grupos.. 50,0 50,0
10- En el recreo juegan conmigo.. 100,0
17- Los compañeros me ayudan.. 100,0
25- Me llaman para quedar fuera… 50,0 50,0

Puesto que en la figura 12 los ítems correspondientes a una misma variable aparecen
juntos, es útil para ver en conjunto qué aspectos de la integración son negativos (para esta
gráfica los prejuicios, y ámbito personal- profesional. Puesto que las alumnas presentan una
gráfica similar para cada curso, es posible ver la evolución de las diferentes variables con la
edad.

Figura 12. Media de las puntuaciones de los alumnos de Quinto de Primaria


3

-1

-2
Media

-3
4 12 19 9 10 25 13 18 8 23 15 24
6 14 1 2 17 5 3 22 16 7 20

Conclusiones obtenidas
Aparte de los comentarios de las diferentes tablas y gráficas a lo largo del documento,
las alumnas presentan finalmente una sección de conclusiones, con una extensión de casi tres
páginas. Reproducimos aquí algunas de las que nos han parecido más interesantes, que mues-
tra cómo este grupo de alumnas han obtenido algunas respuestas a las preguntas planteadas,
completando así el ciclo de investigación.

“Según los resultados obtenidos se pueden sacar algunas conclusiones:


• Parece que los niños ven que sus profesores tratan por igual a todos los niños, sean de la etnia
que sean. Aunque si separamos a los niños por etnia, los integrados sienten que sus profesores
prestan más atención a los niños que son de otra etnia, mientras que los integradores no lo perci-
ben así.
• Por otro lado, los alumnos de Primaria piensan que sus profesores tienen más prejuicios que lo
que observan los alumnos de Secundaria. En este resultado hay que tener en cuenta que el profe-
sor era diferente para ambos niveles educativos.
• Las relaciones con los compañeros son buenas, aunque los niños interactúan más en el contexto
del aula con niños de otras etnias que fuera de ella. Los chicos integradores cuentan poco con sus
compañeros de otras etnias para hacer grupos o jugar en el recreo, menos aún para salir fuera de

Selección de lecturas
Didáctica de la Estocástica – 577 20

clase. Sin embargo, los integrados no lo sienten así. Es posible que los chicos integrados tengan
su grupo de amigos y aunque no interaccionen con todos sus compañeros de clase, no se sientan
mal adaptados.
• En general, parecen preferir trabajar en actividades conjuntas, tanto integrados como integrado-
res, aunque los chicos de Primaria resulten ser un poco más individualistas.
• Los niños no son conscientes de las diferencias culturales con sus compañeros, Además, los chi-
cos integrados se muestran algo más tolerantes que sus compañeros integradores y piensan que la
escuela no tiene en cuenta las características de su etnia.
• Las familias valoran que los niños vayan a la escuela y les apoyan, pero en general, ayudan poco
a los niños en las tareas escolares. Los sujetos integrados más apoyo familiar para ir a la escuela
y en las tareas escolares que sus compañeros integradores. Puede que la importancia de la fami-
lia en la etnia gitana se canalice en un mayor apoyo en las tareas escolares por parte de los pa-
dres y hermanos mayores de los alumnos gitanos.
• Los chicos de este estudio parecen considerar importante ir a la escuela y no suelen perder clase.
Los integradores dan más importancia a la escuela, tal vez porque en sus casas den más impor-
tancia a estos aspectos. Aún así, las diferencias no son muy acusadas”.

Objetivos de aprendizaje que se reflejan en el proyecto


Es claro, del breve resumen presentado que la alumna que realizó el análisis de datos y
coordinó este proyecto ha mostrado comprensión conceptual de muchos conceptos estadísti-
cos incluidos en nuestra asignatura, tales como los de población y muestra, unidad estadística,
variable y sus tipos, frecuencias y porcentajes, distribución de frecuencias, promedio, media,
desviación típica, error típico, mediana y valores centras, valor atípico, asociación entre va-
riables.
Del proyecto se deduce también su conocimiento procedimental, tanto en la elaboración
de tablas y gráficos diversos (barras simples, barras adosadas, histogramas, caja, medias),
como en el manejo de los programas de cálculo necesarios para producirlos. Esto incluye
también la codificación, grabación y depuración de los datos, la recodificación de variables y
cálculo de nuevas variables (puntuaciones parciales), así como la selección de casos para el
análisis (para llevar a cabo los análisis por curso).
La alumna, además ha mostrado conocimientos estratégicos al haber podido identificar las
técnicas pertinentes a diversos tipos de cuestiones, interpretando los resultados en función de
las preguntas de la investigación, que han sido planteadas por las mismas alumnas. Con fre-
cuencia en la enseñanza de resolución de problemas nos centramos en promover el desarrollo
de estrategias entre los alumnos para resolver problemas abiertos. En este caso (y en general
en el trabajo con proyectos) los problemas los plantean los mismos alumnos y esta es una
habilidad interesante, ya que, con frecuencia es más difícil plantear un problema que llegar a
resolverlo.
En el informe escrito las alumnas han debido desarrollar su capacidad de formulación y
comunicación matemática. Los términos, tablas y gráficas usadas para expresar ideas matemá-
ticas han sido correcta y significativamente empleadas en el contexto de un problema.
Las alumnas han mostrado su razonamiento matemático, al emplear los elementos anterio-
res para formular conjeturas y apoyar sus conclusiones. En particular las alumnas han usado
razonamiento inductivo al hacer generalizaciones de los datos obtenidos a la conducta de
otros posibles alumnos más allá de la muestra dada. Las alumnas han usado razonamiento
deductivo cuando extraen consecuencias, por ejemplo de una gráfica o valor estadístico, sobre
el comportamiento de la distribución de una variable.

Vemos que, a partir de este u otros proyectos similares podemos identificar los diferentes
componentes de la evaluación sugeridos en NCTM (1993). Además, podemos también valorar
los siguientes objetivos de aprendizaje, que según Anderson y Loynes (1987) se consiguen
mediante los proyectos:
• Trabajar en equipo y trabajar dentro de unos plazos de tiempo establecidos.
• Comunicarse clara y efectivamente oralmente y por escrito, lo que se consigue tanto en la
Selección de lecturas
Didáctica de la Estocástica – 577 21

producción del informe escrito, como en la presentación oral a sus compañeros.


• Determinar los fines de una investigación, ser capaz de contextualizarla. Las alumnas con-
textualizaron sus preguntas iniciales a unos niveles y centros escolares dados y a la rela-
ción payo-gitano.
• Concienciarse de la necesidad en situaciones reales de obtener una respuesta, aunque sea
imperfecta. Por medio del cuestionario, las alumnas son capaces de obtener algunas con-
clusiones, que por supuesto, no agotan la problemática.
• Traducir los fines generales a objetivos específicos realistas, decidiendo las variables y
factores relevantes. Del constructo inicial “diversidad étnica en la escuela”, pasaron a
“problemática de la integración de la etnia gitana” que aún es demasiado ambiciosa para
un estudio hecho por alumnos. No obstante las alumnas fueron capaces de definir las 7 va-
riables dependientes que podrían de algún modo “medir” esta integración y elaborar un
instrumento (aunque imperfecto, eficaz) para poder recabar alguna información sobre el
problema planteado.
• Organizar eficientemente la recogida de datos (buscar centros y recabar permiso, recoger
los datos por sí mismas, usando entrevista, cuando la edad de los niños hacía dudoso que
contestasen correctamente) reconocer las situaciones en que los datos podrían estar sesga-
dos (se desecharon varios casos que no estaban completos o parecían poco fiables), saber
establecer controles efectivos sobre la validez de los datos.
• Reconocer las técnicas apropiadas al problema. Aprender a utilizar una técnica. Analizar
los datos, interpretar y utilizar los resultados del análisis.
• Leer e interpretar críticamente material, tanto estadístico, como en el tema objeto del pro-
yecto. Como hemos visto, las alumnas localizaron y usaron bibliografía sobre la integra-
ción.
• Reconocer las limitaciones de una investigación. Reconocer lo que la estadística puede y
no puede hacer. Las alumnas reconocen las limitaciones de su investigación en sus con-
clusiones.

Conclusiones

El ejemplo mostrado es sólo uno entre otros desarrollados por nuestros alumnos en los
últimos años sobre las áreas más diversas: indicadores de medio ambiente en el mundo, com-
paración de las ganancias /pérdidas en bolsa a lo largo de un mes de cuatro modelos de inver-
sión de una misma cantidad de dinero, estudio de los intereses de la juventud de Maracena
(pueblo de Granada), valoración de los participantes sobre unas Jornadas de la LOGSE, exis-
tencia de discriminación educativa respecto a sexo en la escuela infantil, estudio hidrológico
de ríos de Granada, comparación del umbral de percepción en la piel en diferentes condicio-
nes experimentales, etc. La mayor parte de estos proyectos podrían haberse llevado a cabo por
chicos de Bachillerato y versiones simplificadas de los mismos serían adecuados para la Edu-
cación Secundaria Obligatoria, así como otros proyectos que sugerimos en Batanero (2001).
Hemos analizado cómo los proyectos están concebidos para introducir en la clase una filo-
sofía exploratoria y participativa, en concordancia con las recomendaciones recientes sobre
enseñanza de la estadística, presentando, tanto un ejemplo propuesto por el profesor, como
otro elegido y llevado a cabo por una alumna, como parte de un trabajo en grupo. Lo deseable
sería que los propios alumnos eligieran el tema en el que quieren trabajar y elaborasen sus
propios proyectos en grupos de dos o tres alumnos, que podrían también conectarse con otras
áreas curriculares. Con ello aumentaríamos su interés por la materia.
Como sugieren Murray y Gal (2002) la comprensión, interpretación y reacción frente a la
información estadística no sólo requiere conocimiento estadístico o matemático, sino también
habilidades lingüísticas, conocimiento del contexto, capacidad para plantear preguntas y una
postura crítica que se apoya en un conjunto de creencias y actitudes. Todas estas capacidades
se incentivan en el trabajo con proyectos.

Selección de lecturas
Didáctica de la Estocástica – 577 22

Cobb y Hodge (2002) sugieren también que el trabajo en grupos y la perspectiva socio
cultural en la clase de estadística centra la atención de los estudiantes en lo que supone la es-
tadística como una parte importante de su aprendizaje. Focaliza su propia identificación como
posibles productores de estadísticas con relación a sus propios intereses y problemas.
Finalmente Nolan y Speed (2002) resaltan la importancia de desarrollar la capacidad dis-
cursiva de los estudiantes, como medio de ampliar sus habilidades de pensamiento crítico. En
la producción de su informe el estudiante debe situar el análisis de sus datos dentro de un ar-
gumento coherente y convincente que apoye sus hipótesis. La comunicación de ideas a partir
de tablas y gráficos es especialmente importante en el razonamiento estadístico.

Referencias
Anderson, C. W. y Loynes, R. M. (1987). The teaching of practical statistics. Nueva York:
Wiley.
Batanero, C. (2001). Didáctica de la estadística. Granada: Grupo de Investigación en Educa-
ción Estadística (disponible en http://www.ugr.es/local/batanero).
Batanero, C. y Godino, J. D. (2000). Análisis de datos y su didáctica.. Departamento de
Didáctica de la Matemática. Granada.
Cobb, P. y Hodge, L. (2002). Learning, identity, and statistical data analysis. En B. Phillips
(Ed.). ICOTS-6 papers for school teachers. Cape Town: International Association for
Statistics Education (CD Rom).
Connor, D., Davies, N. y Payne, B. (2002). Web-based project and key skill work. Teaching
Statistics, 24(2), 62-65.
Fernández Enguita, J. (1996). Escuela y etnicidad: el caso del pueblo gitano. Granada: Uni-
versidad de Granada
Gal, I (2002). Adult's statistical literacy. Meanings, components, responsibilities. Internatio-
nal Statistical Review, 70(1), 1-25.
Graham, A. (1987). Statistical investigations in the secondary school. Cambridge: The Open
University Centre for Mathematics Education.
Hawkins, A. (1991). Student’s project work and the UK applied statistics competition. En
Vere-Jones, D. (editor) (1991). Proceedings of the Third International Conference on
Teaching Statistics (pp. 209-213).Voorburg, The Netherlans: International Statistical
Institute.
Holmes, P. (1997). Assessing project work by external examiners. En I. Gal y J. B: Garfield
(Eds.), The assesment challenge in statistics education (pp. 153-164). Voorburg: IOS
Press.
Jové, G. (1998). Diversidad cultural en los centros educativos: el vitae desde una perspectiva
intercultural. Madrid: Cultura y Educación.
Murray, S., & Gal, I. (2002). Preparing for diversity in statistics literacy: Institutional and
educational implications. En B. Phillips (Ed.). ICOTS-6 papers for school teachers. Ca-
pe Town: International Association for Statistics Education(CD Rom).
N.C.T.M. (2000). Principles and standards for school mathematics. Reston, VA; N.C.T.M.
http://standards.nctm.org/
Nolan, D., & Speed, T.P. (1999). Teaching statistics theory through applications. American
Statistician, 53, 370-375.
San Román, T. (1986). Entre la marginación y el racismo: reflexión sobre la vida de los gita-
nos. Madrid: Alianza.
Starkings, S. (1997). Assessing students’ projects. En I. Gal y J. B: Garfield (Eds.), The as-
sesment challenge in statistics education (pp. 139-152). Voorburg: IOS Press.
Wild, C., y Pfannkuch, M. (1999). Statistical Thinking in Empirical Enquiry (with discus-
sion). International Statistical Review, 67(3), 223-265.

Selección de lecturas
LA INFERENCIA ESTADÍSTICA BÁSICA EN LA ENSEÑANZA SECUNDARIA 1

Moreno Verdejo, Antonio Javier


Vallecilos Jiménez, Angustias

1. INTRODUCCIÓN
La enseñanza de la estadística ha experimentado un aumento en la apreciación de su impor-
tancia. Este hecho se pone de manifiesto por el incremento de los trabajos de investigación publica-
dos sobre esta materia 2 (se puede encontrar una revisión bibliográfica general en Sahai (1996)), la
creación de grupos internacionales de trabajo, la consolidación de congresos periódicos y la elabo-
ración de proyectos de enseñanza que facilitan materiales al profesor (Díaz et al., 1987; Landwehr
et al., 1987; Dolan, 1992a; Dolan, 1992b; Scheaffer et al., 1996; Cubero, 2001).
En este sentido se han producido avances desde que Garfield (citado en Shaughnessy, 1992)
enunciara las cuatro cuestiones que ha su juicio impedían la enseñanza efectiva de la estocástica: a)
el papel de la probabilidad y la estadística en el currículo, b) las conexiones entre investigación e
instrucción, c) la preparación de los profesores de matemáticas y d) el modo de aprendizaje que aún
está siendo evaluado.
Las nuevas orientaciones curriculares para la enseñanza secundaria obligatoria y postobliga-
toria en nuestro país han prestado una mayor atención a los contenidos de estadística y probabilidad.
Se reconoce de esta manera también en nuestro país la necesidad de que estos formen parte de la
formación básica de los ciudadanos, de acuerdo con las recomendaciones hechas con anterioridad
en otros países en este sentido (Cockroft, 1985; N.C.T.M., 1991). Sin embargo, en este momento se
ha producido una novedad importante que es la introducción de la estadística inferencial en los
currículos de estos niveles.
La estadística está asociada comúnmente a la idea de datos numéricos y su análisis y repre-
sentación, esto es, a la interpretación de información numérica. Esta es, efectivamente, la parte des-
criptiva de la estadística, pero junto a ésta está la parte inferencial que nos permitirá describir los
aspectos probabilísticos de la vida real, esto es, aquellos fenómenos no determinísticos, en los que
está presente de una u otra manera el azar. Se reconoce así la importancia que tiene para la forma-
ción básica científica y humana de los ciudadanos el reconocer la importancia de los métodos es-
tadísticos en el mundo económico y social moderno así como en la investigación.
Las razones anteriores justifican la necesidad de que la investigación educativa se ocupe de
analizar el modo en que los alumnos realizan inferencias estadísticas recurriendo al estudio de la
comprensión de diversos conceptos implicados y al modo en que los alumnos se enfrentan al propio
proceso de inferencia.
En este trabajo presentamos parte de los resultados obtenidos en un estudio exploratorio so-
bre el conocimiento de conceptos básicos en inferencia estadística en estudiantes del nivel de se-
cundaria. Este estudio exploratorio forma parte del proyecto de investigación “Dificultades teóricas,
metodológicas y curriculares de la estadística inferencial en la enseñanza secundaria” que se desa-
rrolla en la actualidad y cuyos propósitos son, en general, determinar áreas problemáticas, dificulta-
des de los alumnos, entornos de aprendizaje favorables o cuestiones metodológicas que puedan ser-
vir como base para mejorar la enseñanza de la inferencia estadística en el nivel de secundaria.

1
Trabajo presentado en Jornadas europeas de estadística. La enseñanza y la difusión de la estadística. Disponible
www.caib.es/ibae/esdeveniment/jornades_10_01/doc/jornadas%20europeas%20de%20estadistica2001.doc
2
De toda la revisión bibliográfica llevada a cabo por Becker (1996) sobre trabajos de investigación en educación es-
tadística, el 3% de las referencias bibliográficas son anteriores a 1970, el 32% en la década de los setenta, 35% en los
ochenta y en el período 1990-95 el 30% de las referencias encontradas.
Didáctica de la Estocástica – 577 2
2. RAZONAMIENTO INFERENCIAL ESTADÍSTICO
A continuación se lleva a cabo un análisis de los razonamientos de tipo inductivo y estadísti-
co que se utilizan en la comprensión de la inferencia estadística. Las investigaciones estudiadas
sobre estos tipos de razonamiento presentan dos caminos distintos, de un lado las investigaciones de
los psicólogos y de otro las de los matemáticos. Los primeros se preocupan principalmente de ob-
servar y describir lo que ocurre cuando los sujetos se enfrentan a tareas de inferencia. Los matemá-
ticos y estadísticos mayoritariamente persiguen modificar las concepciones sobre estadística y pro-
babilidad.
2.1. Investigaciones del campo de la psicología
El razonamiento inductivo supone la formación de conceptos, la generalización desde ejem-
plos y la predicción (Nisbett et al. (1983)). Su función primordial es proporcionarnos un horizonte
cognitivo amplio para realizar la toma de decisiones y proyectar los futuros cursos de acción (Cas-
tañeda y Rodrigo (1993)).
El razonamiento inductivo es objeto de interés del campo de la psicología preocupada prin-
cipalmente por su utilización en la predicción y en la toma de decisiones.
Los científicos comenzaron utilizando modelos de tradición racionalista para explicar el ra-
zonamiento predictivo (Castañeda y Rodrigo (1993)). Según estos modelos, los procesos de razo-
namiento del hombre de la calle se describen acudiendo a principios normativos derivados de la
lógica y la matemática. Desde esta perspectiva, la predicción probabilística final depende de la pro-
babilidad de ocurrencia de ese suceso en el pasado y de la probabilidad actual, tras la aparición de
un determinado dato. Fischbein y Piaget son ejemplos de esta tradición.
Los modelos pragmáticos del razonamiento humano sucedieron a los modelos racionalistas
en la explicación del razonamiento inductivo. Durante las tres últimas décadas han influenciado la
investigación sobre el razonamiento inferencial. Nisbett y Ross (1980) señalan dos tipos amplios de
implementaciones para realizar inferencias intuitivas: estructuras de conocimiento que permiten al
individuo definir e interpretar los datos de fenómenos físicos y sociales y heurísticas juiciosas que
reducen tareas de inferencia complejas a juicios simples.
Las estructuras de conocimiento etiquetan y categorizan objetos y eventos, definen un con-
junto de expectativas sobre dichos objetos y sucesos y sugieren respuestas apropiadas a ellos. Cual-
quier persona sometida a un estímulo, lo procesa basándose en un sistema preexistente de conoci-
mientos esquematizados y abstractos. Sin embargo, la categorización errónea de los objetos y suce-
sos junto con el empleo de inapropiadas estructuras de conocimiento, conduce al error en la emisión
de juicios inductivos.
La noción de modelo mental para explicar el razonamiento predictivo es de reciente desarro-
llo. La encontramos en los trabajos de Nisbett et al. (1983), Holland et al. (1986) y su aplicación al
razonamiento predictivo de expertos en Castañeda et al. (1993). De Vega y Rodrigo (en Castañeda
(1993)) definen el modelo mental como una representación temática que implica personajes, objetos
y acciones, basada en una parte del sistema de conocimiento del sujeto activada por el contenido de
la tarea. Desde esta perspectiva, la inducción consiste en generar y revisar las unidades que constru-
yen los modelos mentales (Holland et al. (1986)).
2.1.1. Empleo de heurísticas
El término heurística puede definirse como un proceso cognitivo que se utiliza para reducir
la complejidad de un problema durante el proceso de resolución, convirtiéndolo así en accesible
para el resolutor (Kahneman et al. (1982)). Se diferencia del algoritmo en que las primeras son ge-
neralmente automáticas y se aplican de forma no reflexiva sin considerar su adecuación al juicio a
realizar (Serrano (1996)).

Selección de lecturas
Didáctica de la Estocástica – 577 3
Las investigaciones de los psicólogos Daniel Kahneman y Amos Tversky inician la hipótesis
de que los sujetos emplean un número limitado de heurísticas para realizar inferencias inductivas 3.
Estas heurísticas no respetan los principios estadísticos (Nisbett et al. (1983)) y consecuentemente
pasan por alto variables estadísticas como el tamaño de la muestra, la correlación y otras cuando se
resuelven problemas de razonamiento inductivo.
Kahneman et al. (1982) definen tres heurísticas fundamentales atendiendo a la forma de ac-
ceso a la información o al proceso cognitivo empleado: representatividad, disponibilidad y ajuste y
anclaje.
Heurística de la representatividad
La representatividad de una muestra es «el grado en que es (a) similar en las propiedades
esenciales a la población de la que ha sido extraída y (b) refleja las características principales del
proceso por el cual ha sido generada» (Tversky y Kahneman, 1974, en Vallecillos (1996)). La
heurística de la representatividad consiste en calcular la probabilidad de un suceso sobre la base de
la representatividad del mismo respecto a la población de la que proviene. De este modo, se estima
la probabilidad de obtención de una muestra por el parecido de ésta con la población de la que pro-
viene.
Esta heurística aparece asociada a la creencia de que una muestra debería reflejar la distribu-
ción de la población de la que se obtiene, o que una muestra debería reflejar el proceso por el cual
los sucesos aleatorios se generan. También el empleo de la heurística de la representatividad se con-
sidera causante de no considerar el tamaño de la muestra en la realización de inferencias inductivas.
El fenómeno de la representatividad no está asociado sólo con personas sin formación es-
tadística sino que también se pone de manifiesto en investigadores con formación estadística como
recogen Shaughnessy (1983), White (1980), Vallecillos y Batanero (1995).
Heurística de la disponibilidad
Kahneman, Slovic y Tversky (1982) explican que se usa esta heurística al juzgar la frecuen-
cia de una muestra “valorando la facilidad con la que las principales operaciones mentales de re-
cuperación, construcción o asociación pueden ser llevadas a cabo” (pág. 164). Este tipo de razo-
namiento es el que lleva a los sujetos a considerar más probables aquellos sucesos de los que pue-
den recordar más casos. Induce sesgos importantes basados en la propia experiencia y subjetividad.
Heurísticas estadísticas
Nisbett et al. (1983) encuentran razones para pensar que las personas poseen otras heurísti-
cas basadas en conceptos estadísticos. Las heurísticas estadísticas se consideran reglas generales,
intuitivas, de procesos inferenciales que recuerdan procedimientos estadísticos formales. Para estos
autores no resulta difícil encontrar casos de buenas intuiciones estadísticas en problemas cotidianos
y consideran que incluso en juicios basados en la heurística de la representatividad subyace un subs-
trato de pensamiento probabilístico.
Estas heurísticas se aplican al comportamiento de mecanismos de generación aleatoria en
edades bastante tempranas. La comprensión formal de los principios estadísticos aumenta al menos
hasta la adolescencia.
Los individuos no aplican siempre mecanismos de pensamiento estadístico donde debieran
hacerlo aunque posean formación estadística. Nisbett et al. (1983) señala tres factores que están
implícitos en la dificultad de aplicar las heurísticas estadísticas cuando se requieren: a) claridad del
espacio muestral y del proceso de muestreo, b) reconocimiento del papel del azar en una situación
particular y c) prescripciones culturales para razonar estadísticamente sobre eventos de un deter-

3
En Shaughnessy (1993, pág. 470) se referencian numerosas investigaciones que, a juicio del autor, confirman esta
hipótesis.

Selección de lecturas
Didáctica de la Estocástica – 577 4
minado tipo. Estos factores actuarán individualmente y más probablemente juntos para incrementar
la tendencia de los sujetos a aplicar heurísticas en problemas que requieren una aproximación es-
tadística.
Como consecuencia de lo anteriormente expuesto se sostienen las predicciones siguientes
para tareas de inferencia:
(a) Actividades diseñadas para el reconocimiento de los factores relacionados con el azar en
determinados sucesos servirían para incrementar el uso de razonamiento estadístico.
(b) Quienes mejor conocen los eventos de un determinado tipo estarán más inclinados a
aplicarles el razonamiento estadístico que quienes están menos familiarizados con ese tipo de even-
tos debido a que las distribuciones del suceso y la influencia del azar aparecerían más claros.
(c) Las personas no razonarían estadísticamente sobre sucesos que reconozcan como varia-
bles e inciertos porque el espacio muestral y el proceso aleatorio subyacente aparecería opaco.
(d) La enseñanza de la estadística debería promover el uso del razonamiento estadístico in-
cluso en sucesos mundanos de la vida diaria porque la formación estadística les ayudaría a construir
modelos de distribución para sucesos, y les ayudaría a reconocer errores y a evidenciar la influencia
del azar.
2.1.2. Críticas a las heurísticas
Shaughnessy (1983) refiere investigaciones de Well, Pollatsek y Konold en las que se sugie-
re que se debe tener precaución al atribuir a los individuos estrategias de inferencia como la repre-
sentatividad, la disponibilidad y otras heurísticas basándose en resúmenes de resultados numéricos.
Los individuos pueden emplear muchas estrategias diferentes que no se apreciarían en resúmenes de
tipo estadístico. Estas diferencias, a juicio de los autores anteriores, son mejor apreciadas por medio
de las entrevistas clínicas.
Una de las críticas más importantes a los estudios de Tversky y Kahneman se basa en mos-
trar que, en ocasiones, los sujetos usan la información que aporta el tamaño de la muestra apropia-
damente. Aunque, también es cierto, esto no siempre ocurre por las razones correctas. Well et al.
(1990) señalan que se responden especialmente bien aquellas cuestiones en las que se pregunta por
cuál de dos muestras estima de manera más precisa alguna característica de la población.
Para Well et al. (1990) la atención debe ponerse en los tipos de juicios que se requiere que
los sujetos emitan. Estos responden satisfactoriamente cuando se les pide que juzguen si la carac-
terística de una muestra estima la correspondiente característica de la población o hasta qué punto la
característica de una muestra grande o pequeña constituyen una evidencia de la característica de la
población. Por el contrario, “los problemas de Kahneman y Tversky en los que se obtienen peores
resultados aportan a la gente información acerca de un población y se le pide juicios acerca de si
características de grandes o pequeñas muestras son más probables de tomar un cierto valor. Si los
problemas que requieren el último tipo de juicios resultan con peores resultados, no está claro si
esto es porque ellos a) requieren una comprensión más sofisticada de la ley de los grandes números,
b) elicitan diferentes y menos apropiadas heurísticas, o c) simplemente son más difíciles de com-
prender que problemas que requieran el primer tipo de juicios” (pág. 291).
2.1.3. Alternativas a las heurísticas
Frente a quienes consideran que la estructura cognitiva humana no refleja ni cálculo de pro-
babilidades ni competencias estadísticas efectivas, Cosmides y Tooby (1996) sugieren que la mente
humana puede contener una serie de competencias bien trabadas capaces de ser activadas en condi-
ciones adecuadas. La competencia frecuentista sería una de ellas.

Selección de lecturas
Didáctica de la Estocástica – 577 5
Cosmides y Tooby (1996) presentan un marco alternativo al de las heurísticas para el estu-
dio de las competencias inductivas humanas. La activación de estas competencias requiere aportes
válidos ecológicamente (por ejemplo, la información en formato de frecuencia).
Para estos autores, almacenar los datos en forma frecuentista presenta ventajas frente a la
forma probabilística. Por ejemplo:
(a) En la forma probabilística se perdería el número de eventos en los que se basa el juicio.
(b) La representación frecuentista permite reorganizar fácilmente la nueva información. Por
ejemplo 5 de 20 es fácilmente convertible a 5 de 21.
(c) La representación frecuentista permite organizar la información en clases de referencia
permitiendo con ello responder a una variedad mayor de preguntas.
De las hipótesis postuladas por este marco se siguen las predicciones siguientes:
(1) La realización de razonamientos inductivos diferirá dependiendo de si a los sujetos se
les pide juzgar una frecuencia o la probabilidad de un evento simple.
(2) La realización de problemas correctos en versiones frecuentistas será superior a las ver-
siones no frecuentistas.
(3) La realización de problemas en términos frecuentistas satisfará alguna de las obligacio-
nes que especifica el cálculo de probabilidades, como la regla de Bayes. Esto ocurriría porque algu-
nos mecanismos del razonamiento inductivo de nuestra estructura cognitiva envuelven aspectos del
cálculo de probabilidades.
2.1.4. Implicaciones didácticas
La investigación en psicología no solamente aporta modelos teóricos para la comprensión de
los procesos de pensamiento que supone la realización de inferencias inductivas, también se ha pre-
ocupado de la influencia de la enseñanza estadística sobre las inferencias cotidianas. En este senti-
do, encontramos tres afirmaciones principales: (1) la enseñanza influye en el razonamiento de las
personas sobre problemas cotidianos, (2) en contextos conocidos se emplean más las estrategias
estadísticas y (3) la enseñanza debe incorporar aspectos de la inferencia informal.
(1) La enseñanza influye en el razonamiento de las personas sobre problemas cotidianos
Desde la perspectiva de la psicología cognitiva, la enseñanza estadística puede crear nuevas
estructuras cognitivas más competentes. Mantiene, sin embargo, una posición escéptica sobre la
posibilidad de hacer que desaparezcan nuestras heurísticas y sesgos (Cosmides y Tooby (1996)). En
este sentido se manifiestan también Slovic, Fischhoff y Lichtenstein (citados en Shaughnessy
(1983)) y Nisbett y Ross (1980). Para estos autores las personas tienden a confiar en exceso en sus
habilidades y además poseen creencias que son extraordinariamente resistentes al cambio.
Nisbett, Krantz, Jepron y Kunda (1983) estudiaron el razonamiento inferencial de cuatro
grupos de personas con distintos niveles de formación estadística. Los sujetos eran estudiantes de
colegio (unos con formación estadística y otros no), graduados y doctores con varios años de expe-
riencia. Se les presentó una situación problemática y los sujetos debían explicar por escrito lo que
allí ocurría. Los resultados muestran que las personas sin preparación estadística no dan respuestas
de tipo estadístico mientras que un amplio grupo de personas (80%) con preparación en estadística
utilizan estos datos.
Sobre el mismo tema Fong, Krantz y Nisbett (1986) realizaron cuatro experimentos en los
que se pretendía estudiar el efecto de la enseñanza en el razonamiento estadístico. Se evidenció que
la enseñanza estadística influye en el razonamiento estadístico de las personas sobre problemas co-
tidianos. Sus resultados podemos resumirlos como sigue:

Selección de lecturas
Didáctica de la Estocástica – 577 6
 El efecto de la enseñanza se produce con independencia del método, del contexto y del
tipo de sujeto.
 La enseñanza provee beneficios con independencia de su duración.
 El efecto positivo de la enseñanza se produjo no solamente cuando el contexto de las
pruebas de evaluación de resultados coincidía con el contexto en el que fueron enseñados, sino tam-
bién cuando no fue así.
 La mejora en el pensamiento estadístico sucedió tanto en alumnos universitarios como
también en alumnos de instituto y en adultos.
 Tanto la frecuencia como la calidad del pensamiento estadístico acaeció no sólo con
eventos que normalmente están asociados con la incertidumbre y la probabilidad, sino también, para
los que raramente se asocian con tales conceptos.
(2) Las estrategias estadísticas se emplean más en contextos conocidos
Nisbett, Krantz, Jepron y Kunda (1983) han encontrado que el uso del razonamiento estadís-
tico está asociado, incluso en personas sin formación estadística, con la familiaridad del contenido
del que se realiza la inferencia.
Para Castañeda y Rodrigo (1993), quienes participan de la noción de modelo mental, esto
significa que, “en los dominios más conocidos, el espacio muestral o distribución de los sucesos
están más claros y por tanto las personas utilizan este dato. En cambio en los dominios subjetivos
los sujetos tienden a utilizar menos estrategias estadísticas”. Estos autores realizaron un estudio
con 40 profesores universitarios de matemáticas y física, encontrando que en sucesos cotidianos no
utilizaban estrategias de tipo estadístico.
(3) La enseñanza debe incorporar aspectos de la inferencia estadística básica
El trabajo de Fong, Krantz y Nisbett (1986) indica que cuando la formación se basa en la en-
señanza abstracta de nociones de estadística influye en el razonamiento sobre sucesos concretos.
Hace sin embargo, una llamada para limitar la enseñanza basada en el cálculo y potenciar los aspec-
tos del sentido común. Los cursos introductorios de estadística deben incorporar ejemplos de cómo
los principios estadísticos se pueden aplicar a los juicios de la vida cotidiana.
También Nisbett y Ross (1980) y Shaughnessy (1983) consideran que la enseñanza de la es-
tadística debe conjuntar la enseñanza de la inferencia formal desde la secundaria con la presentación
de materiales de inferencia informal y errores inferenciales. Estos materiales trabajarían anécdotas,
paradojas, máximas del tipo la suerte del principiante y refranes como no se debe juzgar un libro
por su portada.
2.2. Aportaciones desde el campo de la Educación Estadística
La investigación sobre la naturaleza de las concepciones que poseen los estudiantes ha mos-
trado que los estudiantes tienen ideas acerca de la probabilidad y de la estadística que están reñidas
con la teoría aceptada. “La existencia de estas ideas fuertemente arraigadas pueden explicar en
parte por qué el aprendizaje de la probabilidad y la estadística es especialmente problemático”
(Konold (1995)). Este autor resume los resultados de sus numerosas investigaciones resaltando tres
conclusiones que tienen importantes implicaciones para la evaluación de las comprensiones intuiti-
vas de los estudiantes: a) los alumnos llevan a clase intuiciones básicamente incorrectas que se en-
cuentran muy arraigadas; b) Estas intuiciones son difíciles de cambiar; y c) alterarlas es complicado
por el hecho de que un estudiante lleva arraigadas múltiples y a menudo contradictorias creencias
sobre una situación particular.
No sólo Konold (1995) aporta evidencias para aseverar las afirmaciones anteriores. Garfield
y delMas (citado en Shaughnessy (1992)) examinaron, con un programa de ordenador desarrollado
por ellos (Coin Toss), los efectos de una experiencia de ordenador con estudiantes sin conocimien-

Selección de lecturas
Didáctica de la Estocástica – 577 7
tos estadísticos sobre sus concepciones erróneas acerca de conceptos como el de variabilidad mues-
tral, efectos del tamaño de la muestra en la variabilidad, la independencia y la aleatoriedad. Sus
resultados muestran que un gran número de alumnos persisten en las concepciones erróneas sobre el
tamaño de la muestra y la variabilidad después de la experiencia. Estos resultados concuerdan con
los de Well et al. (1990) quienes encontraron que muchos estudiantes seguían sin comprender el
efecto del tamaño de la muestra en la variabilidad de la media después de realizar varias experien-
cias de modelización de distribuciones muestrales con el ordenador.
Konold (1995) no puede hacer recomendaciones explícitas del tipo de instrucción que ha
demostrado ser efectiva para alterar las concepciones referidas anteriormente. De modo que profun-
dizaremos en la búsqueda de investigaciones que orienten sobre la naturaleza del razonamiento es-
tadístico.
El razonamiento estadístico se puede definir como la manera en la que los sujetos razonan
con ideas estadísticas o dan sentido a la información estadística (Garfield (1998)). Esto abarca las
interpretaciones de conjuntos de datos, representaciones de datos, o resúmenes estadísticos de datos.
Implícito al razonamiento estadístico está la comprensión de importantes ideas como distribución,
incertidumbre, aleatoriedad y muestreo.
El objetivo de la investigación que Pfannkuch y Wild (1998) realizaron con estudiantes de
estadística y estadísticos profesionales era el conocimiento de la naturaleza del razonamiento es-
tadístico. La muestra investigada se estructuró en tres grupos. Un primer grupo de once estudiantes
a los que se les pidió que resolviesen una variedad de problemas estadísticos mientras se les entre-
vistaba sobre su resolución o sus reacciones al enfrentarse a la información. El segundo grupo lo
formaban cinco estudiantes que tenían en común el haber sido los líderes de grupos de trabajo de
estudiantes que realizaban proyectos reales en distintas organizaciones. Debían resolver un proble-
ma vagamente explicado y dar una solución que podía ser utilizada por un supuesto cliente. Final-
mente, al grupo de seis estadísticos se les entrevistó sobre su perspectiva de la naturaleza del razo-
namiento estadístico y sobre cómo abordar proyectos de esta naturaleza.
Wild y Pfannkuch estaban interesados en desarrollar un marco para los patrones de pensa-
miento envueltos en la resolución de problemas, para las estrategias de resolución de problemas, y
la integración de elementos estadísticos dentro de la resolución de problemas.
El marco propuesto por los autores como resultado del análisis de los resultados consta de
cuatro dimensiones. La primera no se diferencia mucho de otras propuestas de estructuración del
proceso de resolución de problemas estadísticos. Se trata de un ciclo problema-plan-obtención de
datos-análisis de datos- conclusiones.
La segunda dimensión se refiere a los tipos de pensamiento. Considera unos tipos generales
como el estratégico, la búsqueda de explicaciones, la modelización y la aplicación de técnicas. Pero
también consideran tipos específicos de pensamiento estadístico: reconocimiento de la necesidad de
datos, transnumeración (cambiar las representaciones para mejorar la comprensión), consideración
de la variación, razonamiento con modelos estadísticos, integración de la estadística y el contexto.
Añaden también los autores al marco una tercera dimensión que sería un nivel psicológico
que aparece en cada una de los estados de la primera dimensión pero que no puede ser considerado
exclusivo del pensamiento estadístico. La dimensión cuatro es una lista de aptitudes: escepticismo,
imaginación, curiosidad y capacidad de observación, capacidad para cambiar ideas preconcebidas,
propensión a profundizar en los significados, ser lógico, compromiso y perseverancia.
Resumiendo, la característica que emergió fue que el pensamiento estadístico es la integra-
ción de la comprensión del problema real y el estadístico. Ciertos elementos lo facilitan: la interco-
nexión de procesos, comprender y ocuparse de la variación, buscar explicaciones alternativas para
los fenómenos bajo estudio, la transnumeración es un término acuñado por los autores con el que
quieren identificar el proceso por el que se hace una transformación para pasar de una representa-

Selección de lecturas
Didáctica de la Estocástica – 577 8
ción numérica a otra que facilite la comprensión. Esto ocurre cuando hay una descripción cuantita-
tiva del sistema real; cuando los datos son transformados en el sistema estadístico; y cuando los
resúmenes estadísticos se combinan en formas que relacionan más directamente al problema del
sistema real. También aparecieron como características: interrogarse constantemente, encapsular la
complejidad y conocer las limitaciones (Pfannkuch y Wild (1998)).
3. OBSTÁCULOS, ERRORES Y DIFICULTADES EN LA COMPRENSIÓN DE CONCEP-
TOS DE INFERENCIA ESTADÍSTICA ELEMENTAL
Las investigaciones las hemos centrado alrededor de un conjunto de conceptos relacionados
con el muestreo que son centrales para comprender la inferencia estadística, pero hay conceptos
más generales sobre probabilidad y estadística cuya comprensión errónea puede influir en las con-
clusiones sacadas por los alumnos del análisis de un conjunto de datos.
El diagnóstico de la existencia de éstas no supone la necesidad de sustitución de una estruc-
tura cognitiva sino su reestructuración. La validez de una idea no es intrínseca a ella sino una carac-
terística vinculada al contexto. Los errores sistemáticos se consideran por tanto, dentro de una pers-
pectiva contextual, en la que las concepciones erróneas no son reemplazadas sino que se construye
una nueva estructura cognitiva.
Dificultades de carácter general
Cuando intentamos desarrollar, a través de la enseñanza, un razonamiento probabilístico co-
rrecto y coherente encontramos que los alumnos presentan errores de concepción y de interpreta-
ción, sesgos y como dicen los psicólogos, tendencias emocionales. Las causas de estas disfunciones
pueden ser dificultades lingüísticas, falta de herramientas lógicas, dificultades para extraer la estruc-
tura matemática de las experiencias, la dificultad para comprender el concepto de azar (Fischbein et
al. (1991)), dificultad con los conceptos de números racionales y razonamiento proporcional, con-
flicto entre las ideas de probabilidad y las experiencias de los estudiantes y su manera de ver el
mundo, un rechazo hacia la probabilidad por haberle sido presentada inicialmente en forma abstrac-
ta y formal (Garfield y Alhgreen (1988)) y por haber enfatizado en los currículos aquellos aspectos
deterministas de la ciencia.
Los alumnos presentan dificultades con el concepto de número racional y con el razona-
miento proporcional, lo que dificulta la comprensión del concepto de probabilidad y conceptos aso-
ciados a ella (Cañizares (1997); Serrano (1996)). En Estadística, también el concepto de correlación
necesita del razonamiento proporcional.
Por otro lado, el reciente desarrollo de la Probabilidad y de la Estadística, provoca contro-
versias sobre el significado del término probabilidad. Podemos encontrar interpretaciones frecuen-
cialistas, clásicas, subjetivas, etc. que se refleja en las aplicaciones y en los planteamientos didácti-
cos en los distintos libros de texto.
La Inferencia Estadística refleja esta diferencia de significados en la controversia sobre si es
posible o no atribuir probabilidades a las hipótesis y si ello puede lograrse o no con la aproximación
clásica o bayesiana de la inferencia.
Fischbein et al. (1991) han tratado de obtener una mejor comprensión de los orígenes y natu-
raleza de algunos obstáculos intuitivos probabilísticos. Los siguientes factores se presentan como
explicaciones de las distorsiones en los juicios probabilísticos:
• Los sujetos no tienen una definición clara de los términos “cierto”, “posible” e “imposi-
ble”. Algunos confunden “raro” con “imposible”.
• Los conceptos de sucesos compuestos y simples entrañan también interés didáctico.
Concretamente han identificado las situaciones siguientes: No hay una comprensión natural del
hecho de que, en un espacio muestral, posibles resultados deberían distinguirse y contarse separa-

Selección de lecturas
Didáctica de la Estocástica – 577 9
damente si el orden de sus componentes elementales es distinto. Trabajando también con sucesos
compuestos encuentran que, generalmente, muchos sujetos parecen poder relacionar espontánea-
mente las estimaciones de probabilidad a la magnitud de los espacios muestrales aunque, en algunas
ocasiones, la descripción de estos espacios muestrales es incorrecta. La magnitud de los números de
las probabilidades que tienen que comparar representa el principal factor en las decisiones de los
sujetos.
• La capacidad para abstraer estructuras matemáticas idénticas de diferentes experimen-
tos. Por ejemplo, la probabilidad de obtener (5, 5, 5) lanzando un dado tres veces o arrojando si-
multáneamente tres dados.
• La capacidad de sintetizar lo necesario de lo aleatorio. La idea de que un resultado es-
tocástico de pende sólo del azar, con independencia de cuales sean las condiciones dadas, hace lue-
go cualquier predicción infundada.
Concepto de población.
Lavoie y Caille (1986) llevaron a cabo una investigación con 66 alumnos universitarios, con
el objetivo de estudiar la comprensión de cuatro niveles iniciales del concepto probabilista y es-
tadístico de población. Diseñaron para ello una unidad didáctica que permitió a los alumnos del
grupo experimental adquirir mejor comprensión de esos cuatro niveles del concepto de población.
Los niveles estudiados fueron: nivel 1, concepto de población en sentido usual, es decir,
conjunto de individuos o de objetos sobre el que realizamos el estudio. El nivel 2 es el concepto de
población en el sentido que se utiliza en probabilidad y estadística. Se ha estructurado en distintos
subniveles determinados por los procedimientos de construcción del concepto.
El concepto de población del subnivel 2.1. se construye con el procedimiento siguiente: cada
individuo u objeto del conjunto en estudio es reemplazado por el valor que le caracteriza en el estu-
dio (llamada población madre de tipo discreto).
Si la característica de estudio es cualitativa, la población obtenida por el procedimiento ante-
rior es un conjunto de valores no numéricos. El subnivel 2.2. (población madre de tipo discreto) se
obtiene remplazando cada valor no numérico de la anterior población por un nombre. Si la carac-
terística es dicotómica, la población de subnivel 2.2. es una población de Bernoulli.
Para construir el concepto de población de subnivel 2.3. (población de muestreo de tipo dis-
creto), extraemos todas las muestras de tamaño n de la población madre y cada muestra es reempla-
zada por un nombre.
En el subnivel 2.4., el concepto de población madre de tipo discreto y población de muestreo
de tipo discreto son sustituidos por el más general de población de tipo discreto ya que en los dos
tienen como invariante el hecho de ser un conjunto finito o numerable de nombres. Esta población
recibe el nombre de población de tipo discreto.
La investigación dejó abiertas dos preguntas que no obtuvieron respuesta de la investiga-
ción: ¿Es más fácil acceder a un nivel de comprensión del concepto de población en aquellas pobla-
ciones que se definen por un carácter cuantitativo o en las que se definen por un carácter cualitati-
vo?; ¿Es más fácil acceder a un nivel de comprensión del concepto de población cuando se utiliza el
lenguaje de las poblaciones o cuando se utiliza el lenguaje de las variables aleatorias?
Concepto de muestra
La comprensión de la naturaleza de las afirmaciones estadísticas supone alcanzar un equili-
brio entre dos ideas, la representatividad de la muestra y la variabilidad de ésta. La representativi-
dad de la muestra es la idea de que una muestra tomada de una población tendrá a menudo carac-
terísticas similares a la población de origen. La variabilidad de la muestra es la idea de que las

Selección de lecturas
Didáctica de la Estocástica – 577 10
muestras de una población simple no son todas la misma así que no igualan a la población (Rubin et
al. (1990)).
Con objeto de estudiar las concepciones de los estudiantes sobre estas dos ideas, Rubin,
Bruce y Tenney (1990) entrevistaron a doce estudiantes del equivalente al último curso de Bachille-
rato que nunca habían recibido ningún curso sobre estadística. En la entrevista se preguntaban seis
cuestiones abiertas sobre muestreo e inferencia estadística.
Encontraron que los estudiantes investigados, al construir una distribución muestral, estaban
influenciados por la idea de la representatividad de la muestra. Subestimaron la frecuencia de las
muestras cerca de la cola de la distribución y sobrestimaron la frecuencia de la muestra modal, in-
cluso cuando fueron conscientes del número de categorías entre las que tenían que distribuir las
muestras. En unas situaciones las respuestas están guiadas por la representatividad mientras que en
otras el concepto de variabilidad muestral es más fuerte. El tamaño de la muestra no parece operar
apropiadamente para separar las dos ideas. En definitiva, los estudiantes tenían modelos inconsis-
tentes de la relación entre muestras y población incluso en problemas donde los modelos matemáti-
cos que subyacen son distribuciones binomiales. Investigaciones posteriores de Moreno y Valleci-
llos (1998) encuentran resultados similares.
Para Rubin et al. (1990), los resultados de sus entrevistas evidencian que cuando en clase de
matemáticas se pone el énfasis en la respuesta correcta y se subraya que las matemáticas suponen
precisión y falta de error se converge con la tendencia de los estudiantes a creer en la representati-
vidad muestral. De este modo, se produce en los estudiantes una concepción en la cual la muestra
representativa es la única que se obtiene si se muestrea correctamente. Al mismo tiempo en la ense-
ñanza de las escuelas estadounidenses el estudio de las muestras empiezan con la idea de que son
representativas de la población en la mayoría de las ocasiones. Estas dos ideas se refuerzan “para
socavar la comprensión de los estudiantes de la variabilidad muestral” (pág. 319).
Tamaño de la muestra
Distintos trabajos han puesto de manifiesto que el tamaño de la muestra no es tenido en
cuenta para realizar inferencias e incluso cuando el tamaño de la muestra es más pequeño, la heurís-
tica de la representatividad aparece con más fuerza como factor determinante de la inferencia (Ru-
bin (1990); Pollatsek et al. (1984)). De este modo, se estima la probabilidad de obtención de una
muestra por el parecido de ésta con la población de la que proviene o se considera que la población
sobre la que se infiere tendrá las mismas características que la muestra obtenida.
En determinadas situaciones la información aportada por el tamaño de la muestra se utiliza
apropiadamente. Well et al. (1990) señalan que responden especialmente bien aquellas cuestiones
en las que se les pregunta por cual de dos muestras estima de manera más precisa alguna caracterís-
tica de la población.
Parámetros y estadísticos
Schuyten (1991) ha señalado como un problema relacionado con el muestreo, los diferentes
niveles de concreción de un mismo concepto en estadística descriptiva e inferencia. Por ejemplo, es
esencial distinguir entre la media teórica en la población (que es una constante desconocida), la me-
dia particular obtenida en nuestra muestra; los posibles valores de las diferentes medias que se ob-
tendrían en las diferentes muestras aleatorias de tamaño n (que es una variable aleatoria) y la media
teórica de esta variable aleatoria, que coincide con la media de la población en el muestreo aleato-
rio.
El espacio muestral
La identificación correcta del espacio muestral se presenta como un factor importante en la
evaluación probabilística de los sucesos. El análisis de los resultados de un experimento realizado
por Fischbein et al (1991), concluye que para los sujetos sin preparación probabilística, existe una

Selección de lecturas
Didáctica de la Estocástica – 577 11
capacidad intuitiva para evaluar la magnitud del espacio muestral correspondiente a una cierta expe-
riencia estocástica. Además, apuntan los siguientes obstáculos interfiriendo en la correcta evalua-
ción probabilística:
a) No hay un respaldo natural e intuitivo para contar separadamente como distintos resul-
tados, los mismos grupos de resultados con diferentes secuencias (por ejemplo 1, 3 y 3, 1).
b) Los sujetos tienden a olvidar, algunas veces, las condiciones específicas de la experien-
cia estocástica y el espacio muestral se construye sin considerar las respectivas limitaciones (por
ejemplo considerar los números 7, 8,... en un juego de dados)
c) Muchos sujetos no poseen una técnica sistemática para producir todos los posibles re-
sultados de una experiencia.
d) La disponibilidad parece ser un factor importante en la evaluación intuitiva de la magni-
tud de un espacio muestral. Los sujetos obtienen mejor como suma de dos números 2 o 12 que 3 u
11.
Muestreo aleatorio
En un estudio desarrollado por Pollatsek et al. (1984) se comparan los errores cometidos en
los juicios a partir de muestras de sujetos “novatos” en estadística con las inferencias que realizan
los estadísticos expertos. Observaron que éstos emplean como modelo del proceso de muestreo
aleatorio la extracción de bolas de una urna. En este modelo, el muestreo aleatorio se considera
isomorfo al proceso de extracción con reemplazamiento de bolas de una urna, lo que implica la
comprensión de la idea de independencia de ensayos repetidos. El empleo de la heurística de la re-
presentatividad incluso en muestras pequeñas se justificaría entonces por el empleo de modelos
inadecuados para el proceso de muestreo o incluso la ausencia de un modelo.
4. APRENDIZAJE DE CONCEPTOS INFERENCIALES EN SECUNDARIA
Describimos, resumidamente, las características de un estudio exploratorio sobre el aprendi-
zaje de conceptos inferenciales en secundaria (Moreno y Vallecillos (2001a, 2001b)). Los objetivos
generales principales de este estudio son: a) explicitar las ideas que poseen los estudiantes del nivel
de secundaria sobre conceptos básicos de inferencia estadística; b) estudiar comparativamente estas
ideas en alumnos estadísticamente novatos con los que finalizan su formación secundaria y c) anali-
zar la influencia en la conceptualización de distintos contextos de presentación de la pregunta.
El estudio se ha llevado a cabo con un en total 49 alumnos de dos Institutos de Enseñanza
Secundaria de Granada. 30 de ellos pertenecen a 3er curso de la E.S.O. y no han recibido formación
estadística previa, los otros 19 estudiantes pertenecen al curso de COU, son alumnos que terminan
su formación secundaria este curso y pasarán a la Universidad el año próximo.
Los datos se han tomado a partir de un cuestionario escrito que consta de doce preguntas re-
feridas a los siguientes conceptos de inferencia estadística básica: conceptos de población y de
muestra; el proceso de inferencia de la muestra a la población; la influencia del tamaño de la mues-
tra en el proceso de inferencia; la influencia de distintos métodos de muestreo para realizar la infe-
rencia; el concepto de aleatoriedad y la presencia de sesgos en el muestreo.
Los enunciados se presentan en tres contextos distintos: a) concreto; b) de narración y c)
numérico. La variable contexto debe entenderse como medio de presentación de la tarea y está divi-
dido en dos partes: la Parte I que contiene los enunciados en contexto concreto, requiere el empleo
de material manipulativo (bolas, botellas de muestreo y baraja de naipes) y la intervención del in-
vestigador; la Parte II contiene los enunciados en los contextos narrativo y numérico y no es necesa-
ria la intervención del investigador.
En este trabajo presentaremos únicamente los resultados que se refieren a los conceptos de
población y muestra y al propio proceso de inferencia.

Selección de lecturas
Didáctica de la Estocástica – 577 12
4.1. Conceptos de población y muestra
En la Tabla 1 tenemos resumidos los datos acerca de la identificación de la población y la
muestra.
Identifican la población de estudio en el contexto concreto el 57.1% de todos los estudiantes,
mientras que sólo lo hacen el 49% en los contextos narrativo y el numérico.
Identifican la muestra el 30.6% de los estudiantes en el contexto concreto, el 22.4% en el
contexto narrativo y el 20.4% en el numérico.
No identifican la población ni la muestra en el contexto concreto el 42.9%, el 48.9% en el
narrativo y el 49% en el contexto numérico.
En estos primeros resultados globales se observa un mayor porcentaje de alumnos que iden-
tifican la población o la muestra o no identifican ninguna de ellas en el contexto concreto que en el
narrativo y el numérico. Parece deducirse de ellos claramente una ordenación de los contextos, con-
creto, narrativo, numérico, de mayor a menor facilidad para los alumnos en cuanto a la identifica-
ción de los conceptos analizados se refiere.
En el estudio por cursos, el 53.3% de los alumnos de ESO identifican la población frente al
63.2% de los de COU en el contexto concreto; el 50% de los alumnos de ESO lo hacen frente al
47.4 % de los de COU en el contexto narrativo y en el contexto numérico los resultados obtenidos
son el 33.3% en el grupo de ESO y el 73.6% de los alumnos de COU.
Los resultados para el grupo de ESO (53.3%, 50.0%, 33.3%) mantienen el orden inicial para
los contextos (concreto, narrativo, numérico) de mayor a menor facilidad. Para el grupo de COU
(63.2%, 47.4%, 73.6%), sin embargo se deduce que ha resultado para ellos más familiar y más fácil
el contexto numérico para la identificación de la población estudiada. Comparativamente, los por-
centajes de alumnos que identifican la población, son mas altos para los alumnos de COU en los
contextos concreto y numérico, con una diferencia especialmente notable para el caso numérico. En
el narrativo son ligeramente más altos los porcentajes del grupo de ESO (50%, 47.4%).

Tabla 1. Identificación de población y muestra


CURSO
ESO COU
CONTEXTO
Id. Pobla- Id. Muestra. NP / NM Id. Pobla- Id. Muestra NP /NM
ción ción
14 7 14 12 8 7
Concreto
53.3% 23.3% 46.7% 63.2% 42.1% 36.8%
15 5 15 9 6 9
Narrativo
50.0% 16.7% 50.0% 47.4% 31.6% 47.3%
10 3 20 14 8 4
Numérico
33.3% 10.0% 66.6% 73.6% 42.1% 21.1%

Si analizamos la identificación de la muestra por cursos observamos los datos siguientes: en


el contexto concreto lo hacen el 23.3% de los alumnos de ESO frente al 42.1% de los de COU; en el
narrativo el 16.7% de alumnos de ESO frente al 31.6% en COU; en el contexto numérico lo hacen
el 10% en ESO y el 42.1% en COU.
Los resultados para el grupo de ESO (23.3%, 16.7%, 10%) mantienen el orden citado (con-
creto, narrativo, numérico) para los contextos de mayor a menor facilidad. En COU los resultados
(42.1%, 31.6%, 42.1%) sin embargo indican pocas diferencias entre los contextos. Comparativa-
mente, los resultados obtenidos por el grupo de ESO son considerablemente más bajos que los de
COU. También las diferencias, con respecto al caso de la identificación de la población, son consi-

Selección de lecturas
Didáctica de la Estocástica – 577 13
derablemente más grandes que las anteriores. Estos datos son un indicador inicial de una posible
mayor dificultad para la identificación de la muestra que la de la población en todos los contextos y
por cursos.
No identifican la población ni la muestra, por cursos, el 46.7% de los alumnos de ESO frente
al 36.8% de los de COU en el contexto concreto; el 50% en ESO frente al 47.3% en COU en el na-
rrativo y el 66.6% en ESO frente al 21.1% en COU.
Comparando nuevamente por contextos, los resultados para ESO son (46.7%, 50%, 66.6%)
y para COU (36.8%, 47.3%, 21.1%) observamos que las diferencias son ciertamente notables, ex-
cepto para el contexto narrativo. La diferenciación mayor se produce en el contexto numérico, en
donde se observa una diferencia entre los porcentajes del 45%.
En resumen: muchos estudiantes de ambos niveles de enseñanza no identifican los concep-
tos básicos de población y muestra si bien hay diferencias importantes en los porcentajes de éxito en
los ítems correspondientes en función del contexto. El concreto es el que ofrece mayor porcentaje
de respuestas correctas. El grupo de COU ofrece mejores resultados globales que el de ESO y en el
contexto numérico. Las dos terceras partes de los alumnos de ESO no identifican ni la población ni
la muestra mientras que en COU no lo hacen la quinta parte.
4.2. Proceso de inferencia de la muestra a la población
Esta parte del estudio tenía como objetivo encontrar concepciones de los alumnos al realizar
inferencias inductivas. El término concepción es utilizado en el sentido de Artigue (1990), como
“objeto local, estrechamente asociado al saber en juego y a los diferentes problemas en cuya resolu-
ción interviene”. También empleamos el término concepción en el sentido de modelo teórico cons-
truido por el investigador, como si en efecto fuera el empleado por el alumno, en terminología de
Robert (1983), de manera que lo que llamamos concepción en este trabajo, es un modelo teórico de
razonamiento inferencial, construido por nosotros para la investigación, sobre la base de conoci-
mientos locales de los alumnos manifestados en el momento de la investigación, para esquematizar
y formalizar los rasgos comunes de las respuestas de un grupo de estudiantes. Para el profesor lo
interesante de este catálogo de concepciones es la información básica que le proporciona para poste-
riormente intentar cambiar las inadecuadas.
Para categorizar las respuestas de los alumnos se utilizó inicialmente la clasificación en tres
grandes grupos según los criterios de descripción de la población empleados en ellas descrita en
Moreno (2000) y en contexto concreto. Estos fueron:
C1) Concepción inferencial: El proceso de inferencia está sujeto al azar y no permite deter-
minar con precisión las características de una población a partir de las de una de sus muestras.
C2) Concepción de identidad: El proceso de inferencia permite describir la población con
características idénticas a las de una de sus muestras.
C3) Concepción previa: La población tiene unas características descritas por ideas previas y
no por las observadas en la muestra extraída.
En el contexto narrativo hemos encontrado hasta un 20.4% del total de respuestas que expre-
san la idea de que la encuesta no permite saber nada si no se estudia toda la población. Hemos aña-
dido, pues, una nueva categoría en la clasificación anterior que hemos llamado concepción determi-
nista:
C4) Concepción determinista: Solo el estudio de la población completa permite determinar
sus características propias.
En la Tabla 2 están resumidos los resultados obtenidos según los contextos y por grupos de
estudiantes. Como puede verse en ella, en los dos contextos y en los dos grupos la mayoría de los
alumnos manifiestan la concepción de identidad, C2, en el proceso de inferencia. Se manifiesta in-

Selección de lecturas
Didáctica de la Estocástica – 577 14
dependiente del contexto y en porcentajes altos, en general, y especialmente en COU. En este curso
el porcentaje de alumnos que manifiestan esta concepción es especialmente alto en el contexto con-
creto.

Tabla 2. Concepciones sobre el proceso de inferencia


CURSO
CONTEXTO ESO COU
C1 C2 C3 C4 C1 C2 C3 C4
15 10 13 2
Concreto
60.0% 40.0% 86.7% 13.3%
4
5 15 6 3 11
Narrativo 22.
19.2% 57.7% 23.1% 16.3% 61.1%
2%

El número de respuestas en blanco es mayor en el contexto concreto, 18.4%, que en el con-


texto narrativo, 10.2%.
Por cursos, los porcentajes de aparición de C2 en ambos contextos están en torno al 60% en
ESO y entre el 60 y el 87% en COU.
La concepción C4 aparece en el 23.1% de las respuestas de los alumnos de ESO y en un
22.2% de las de COU.
En resumen: muchos alumnos manifiestan la concepción de identidad en sus respuestas
acerca del proceso de inferencia que es una manifestación explícita de la heurística de la representa-
tividad descrita por Kahneman y cols. (1982) en otro contexto.
5. IMPLICACIONES PARA LA ENSEÑANZA EN SECUNDARIA
En los dos grupos de estudiantes de nivel de secundaria explorados, hemos encontrado im-
portantes errores que afectan a los conceptos de población y muestra en todos los contextos en los
que se han presentado las preguntas correspondientes. Estos resultados son llamativos porque podr-
ía suponerse que, al tratarse de conceptos subyacentes en muchas actividades de la vida diaria en
diversas formas, los estudiantes tienen muchos ejemplos y situaciones que les sirven de base para
construir estos conceptos.
El estudio de una muestra no proporciona una buena estimación de las característica de la
población estudiada, en opinión de muchos alumnos. Tampoco parecen apreciar claramente las ven-
tajas de la aleatoriedad frente a otros tipos de muestreo.
Todos estos resultados han sido obtenidos de un estudio exploratorio sobre una muestra in-
tencional de estudiantes y no pueden ser generalizados en absoluto. Sin embargo, dibujan un pano-
rama de concepciones e ideas previas de los estudiantes de secundaria que es necesario tener en
cuenta por las implicaciones de todo tipo que de ellas se derivan. En nuestro caso nos han servido
de momento para generar una serie de hipótesis de investigación sobre las que es necesario trabajar
mucho todavía con el fin de diseñar una metodología de trabajo para la enseñanza basada en teorías
generadas por la observación sistemática y organizada de la enseñanza y el aprendizaje de la es-
tadística inferencial en este nivel de enseñanza.
Agradecimientos: Este trabajo se realiza en el marco del Proyecto de Investigación PB97-
0827 de la Dirección General de Enseñanza Superior, MEC, Madrid.

Selección de lecturas
Didáctica de la Estocástica – 577 15
6. BIBLIOGRAFÍA
Artigue, M. (1990). Epistemologie et Didáctique. Recherches en Didactique des Mathematiques,
10(2-3), 241-286.
Batanero, C., Godino, J. D., Vallecillos, A., Green, D. R., y Holmes, P. (1994). Errors and difficul-
ties in understanding elementary statistical concepts. International Journal of Mathematics
Education in Science and Technology, 25(4), 527-547.
Cañizares, M. J. (1997). Influencia en el razonamiento proporcional y combinatorio y de creencias
subjetivas en las intuiciones probabilísticas primarias. Departamento de Didáctica de la
Matemática. Tesis Doctoral. Universidad de Granada.
Castañeda, J. P., y Rodrigo, M. J. (1993). Modelos mentales en el razonamiento predictivo de ex-
pertos. Revista de Psicología General y Aplicada, 46 (3), 275-283.
Cockcroft, W. (1985). Las matemáticas sí cuentan. Madrid: MEC.
Cohen, S., Smith, G., Chechile, R.A., Burns, G., y Tsai, F. (1996). Identifying Impediments to Le-
arning Probability and Statistics From an Assessment of Instructional Software. Journal of
Educational and Behavioral Statistics, 21(1), 35-54.
Cosmides, L., y Tooby, J. (1996). Are humans good intuitive statisticians after all? Rethinking so-
me conclusions from the literature on judgment uncertainty. Cognition, 58, 1-73.
Cubero, J. (2001). Dados y datos. Dirección General de Economía. Gobierno de las Islas Baleares:
Palma (Mallorca).
Díaz Godino, J., Batanero, M. C., y Cañizares, M. J. (1987). Azar y Probabilidad. Madrid: Síntesis.
Dolan, S. (Project director). (1992a). Data collection. The School Mathematics Project. Cambridge
University Press.
Dolan, S. (Project director). (1992b). Living with uncertainty. The School Mathematics Project.
Cambridge University Press.
Fischbein, E., Sainati, M., y Sciolis, M. (1991). Factors affecting Probabilistic Judgements in Chil-
dren and Adolescents. Educational Studies in Mathematics, 22, 523-549.
Fong, G.T., Krantz, D.H., y Nisbett, R. E. (1986). The Effects of Staqtistical Training on Thinking
about Everyday Problems. Cognitive Psychology, 18, 253-292.
Garfield, J. (1998). The statistical Reasoning Assessment: development and validation of a research
tool. Proceedings of the Fifth International Conference on Teaching of Statistics, 781-786.
Garfield, J., y Ahlgren, A. (1988). Difficulties in learning basic concepts in probability and statis-
tics: implications for research. Journal for Research in Mathematics Education, 19(1), 44-
63.
Garfield, J., y delMas, R. (1989). Reasoning about chance events: Assessing and changing students’
conception of probability. In C. Maher, G. Goldin, y B. Davis (eds.), The Proceedings of the
Eleven Annual Meeting of the North American Chapter of the International Group for the
Psychology of Mathematics Education (vol. II, pp. 189-195). Rutgers: Rutgers University
Press.
Holland, J., Holyoak, K., Nisbett, R., y Thagard, P. (1986). Induction. Processes of inference, lear-
ning and discovery. Cambridge: MIT Press.
Kahneman, D., Slovic, P., y Tverky, A. (eds.). (1982). Judgment under uncertainty: Heuristics and
Biases. Cambridge: Cambridge University Press.
Konold, C. (1995). Issues in Assessing Conceptual Understanding in Probability and Statistics.
Journal of Statistics Education, 3(1). (on-line)
Landwehr, J; Swift, J. y Watkins, A. (1987). Exploring Surveys and Information from Samples.
Quantitative Literacy Series. Palo Alto, Ca.: Dale Seymour Pub.

Selección de lecturas
Didáctica de la Estocástica – 577 16
Lavoie, R.; Caillé, A. (1986). La compréhension du concept de population: une étude exploratoire.
Ann. Sc. Math. Québec, 10(1), 27-49.
Moreno, A. (2000). Investigación y enseñanza de la estadística inferencial en el nivel de secunda-
ria. Memoria de Tercer Ciclo. Universidad de Granada.
Moreno, A. y Vallecillos, A. (1998). El muestreo en la enseñanza secundaria. En F. Muñoz, Cárde-
nas, D y López, A. (Eds.): Actas de las VIII Jornadas Andaluzas de Educación Matemática
“Thales”, (pp. 249-254). Jaén: S.A.E.M. “Thales”.
Moreno, A. y Vallecillos, A. (1999a). ¿Cuántas ranas hay en la charca?. Actas de las 9º Jornadas
para el Aprendizaje y la Enseñanza de las Matemáticas, (pp. 294-296). Lugo: CEFOCOP.
Moreno, A. y Vallecillos, A. (1999b). La educación estadística en la sociedad actual. En: I. Beren-
guer, J. M. Cardeñoso y M. Toquero (Eds.). Investigación en el aula de matemáticas: Ma-
temáticas en la sociedad, (pp 253-261). Granada: Universidad de Granada y Sociedad Anda-
luza de Educación Matemática “Thales”.
Moreno, A. y Vallecillos, A. (en revisión). Exploración de concepciones iniciales sobre procesos infe-
renciales. Educación Matemática.
Moreno, A.; Vallecillos, A. (2000). Dificultades en la comprensión de conceptos básicos de infe-
rencia estadística en la educación secundaria. En: Gámez, A.; Macías, C.; Suárez, C. (Eds.).
Actas del IX Congreso Andaluz de Educación Matemática “Thales”, (pp. 109-111). Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
Moreno, A.; Vallecillos, A. (2001a). Exploratory study on inferential concepts’ learning in seconda-
ry level in Spain. En: Van den Heuvel, M. (eds.). Proceedings of the 25th Conference of the
International Group for Psychology of Mathematics Education, vol. 1, pp.343.
Moreno, A.; Vallecillos, A. (2001b). Influencia del nivel escolar y el contexto en el conocimiento
informal de conceptos inferenciales. En: Moreno, F., Gil, F., Socas, M. y Godino, J.D.
(eds.). V Simposio de la Sociedad Española de Investigación en Educación Matemática, pp.
187-196.
N.C.T.M. (2000). Principles and standards for schools mathematics. Reston, VA:NCTM.
Nisbett, R.E., Krantz, D.H., Jepson, C., y Kunda, Z. (1983). The Use of Statistical Heuristics in
Everyday Inductive Reasoning. Psychological Review, 90(4), 339-363.
Nisbett, R.E., y Ross, L. (1980). Human Inference: Strategies and Shorcoming of social judgment.
Englewood Cliffs, NJ: Prentice-Hall.
Pfannkuch, M., y Wild, C. (1998). Investigating the Nature of Statistical Thinking. Proceedings of
the Fifth International Conference on Teaching of Statistics. 459-465. Singapur: ISI.
Pollatsek, A., Konold, C., Well, A., y Lima, S. (1984). Beliefs underlying random sampling. Memo-
ry and Cognition, 12, 395-401.
Robert, A. (1983). L’adquisition de la notion de convergence des suites numeriques dans
l’enseigment superieure. Recherches en Didactique des Mathematiques, 3(3), 307-341.
Rubin, A., Bruce, B., y Tenney, Y. (1990). Learning about Sampling: Trouble at the Core of Statis-
tics. Proceedings of the Third International Conference on Teaching of Statistics, pp. 314-
319. Dunedin: University of Otago.
Sahai, H., Khurshid, A., y Misra, S. C. (1996). A Second Bibliography on the Teaching of Probabi-
lity and Statistics. Journal of Statistics Education 4(3). (on-line)
Scheaffer, R, Gnanadesikan, M., Watkins, A. y Witmer, J. (1996). Activity-Based Statistics. New
York: Springer.
Schuyten, G. (1991). Statistical Thinking In Psychology and Education. Actas de la ICOTS III, 486-
490. Dunedin: University of Otago.

Selección de lecturas
Didáctica de la Estocástica – 577 17
Serrano, L. (1996). Significados institucionales y personales de conceptos matemáticos ligados a la
aproximación frecuencial de la enseñanza de la probabilidad. Tesis Doctoral. Universidad
de Granada.
Shaughnessy, J. M. (1983). The Psychology of Inference and the Teaching of Probability and Statis-
tics: Two Sides of the Same Coin?. En R. W. Scholz (ed.), Decision Making Under Uncer-
tainty, 325-350. North-Holland: Elsevier Science Publishers B.V.
Shaughnessy, J. M. (1992). Research in probability and statistics: Reflection and Directions. En D.
Grouws (ed.), Handbook on Research in Mathematics Education, 465-494. London: McMi-
llan Publishing Co.
Tversky, A. y Kahneman, D. (1974). Judgment under uncertainty. Heuristics and Biases. Science,
185, 1124-1131.
Vallecillos, A. (1996). Inferencia Estadística y enseñanza: un análisis didáctico del contraste de
hipótesis estadísticas. Granada: Comares.
Vallecilllos, A. (1999). Some empirical evidences on learning difficulties about testing hypotheses.
Ponencia invitada, Topic IPM 58. Proceeding of the 52nd Session of the International Statis-
tical Institute, Vol. 2, Tome LVIII, pp. 201-204. The Netherland: ISI.
Vallecillos, A. y Batanero, C. (1995). La inferencia estadística en la investigación experimental en
el campo educativo. Revista de Educación de la Universidad de Granada, 8, 5-16.
Vallecillos, A. y Moreno, A. (1997). Los profesores de matemáticas y la inferencia estadística en la
enseñanza secundaria. En I. Berenguer, B. Cobo y F. Fernández ( Eds.), Investigación en el
aula de Matemáticas: La tarea docente, (pp. 279-287). Granada: Universidad de Granada y
Sociedad Andaluza de Educación Matemática “Thales”.
Well, A., Pollatsek, A., y Boyce, S. (1990). Understanding the effects of sample size on the variabi-
lity of the mean. Organizational behavior and human decision processes, 47, 289-312.
White, A.L. (1980). Avoiding errors in educational research. Research in Mathematics Education.
47-65.

Selección de lecturas
LA CALCULADORA ALGEBRAICA: UNA HERRAMIENTA DIDÁCTICA PARA LA ENSE-
1
ÑANZA DE LAS MATEMÁTICAS EN EL BACHILLERATO

Santiago Inzunza Cázares *

INTRODUCCIÓN
El desarrollo de la tecnología computacional está modificando substancialmente
el entorno de la sociedad, y como consecuencia nuestras actividades cotidianas. El
ámbito educativo no es ajeno a este hecho, sin embargo, a diferencia de otras áreas
donde se tiene perfectamente claro el rol que juega la tecnología, en educación ma-
temática particularmente, aún es necesario profundizar en las discusiones acerca de
cómo ha de llevarse a cabo una adecuada implementación de estas herramientas en el
aula para transformarlas en instrumentos cognitivos, y ver cómo se ven alterados los
procesos de enseñanza y aprendizaje cuando se utilizan.

Además, dado que las matemáticas constituyen una ciencia estrechamente vinculada
con los avances tecnológicos, y que son parte esencial de este progreso, resulta espe-
cialmente importante analizar el papel que desempeña este tipo de instrumentos en la
formación matemática de los estudiantes.

La tecnología puede convertirse en una herramienta didáctica poderosa y coadyuvar en


el proceso de enseñanza de las matemáticas si se usa apropiadamente, sin embargo,
su introducción en el aula de matemáticas no es un proceso inmediato carente de
problemas y se requiere tener en cuenta diversos aspectos que implican un “uso efi-
ciente” de la tecnología, como es el hecho de preparar adecuadamente a los profesores
en su manejo y atender los resultados de investigaciones y experiencias que reportan
dificultades, logros y diferentes formas en que la tecnología puede ayudar en el proce-
so de enseñanza.

ANTECEDENTES
Diversos investigadores y organizaciones de educación matemática (Waits B. y Dema-
na F., 2000, Kutzler B. 1999, Pomerantz 1997, Cedillo T. 2001, NCTM, 2000) recono-
cen que un uso apropiado de las calculadoras en la enseñanza de las matemáticas
puede ser de gran ayuda en la comprensión de conceptos matemáticos. La NCTM (Na-
tional Council Teachers of Mathematics), una asociación de profesores de matemáticas
en los Estados Unidos que tiene un reconocido prestigio en la educación matemática,
en un documento titulado Principles and Standards for School Mathematics (2000),
identifica al uso de la tecnología como un principio que le debe dar soporte a las pro-
puestas curriculares y señala:

Las computadoras y calculadoras son herramientas esenciales para la en-


señanza, aprendizaje y desarrollo de las matemáticas. Generan imágenes
visuales de ideas matemáticas, facilitan la organización y análisis de datos,
y realizan cálculos de manera eficiente y precisa........ Cuando las herra-
mientas computacionales están disponibles, los estudiantes pueden enfocar
su atención en procesos de toma de decisiones, reflexión razonamiento y
resolución de problemas (p.24).

1
MEMORIAS DE LA OCTAVA REUNIÓN DE ANÁLISIS: La actividad experimental en
La enseñanza de las Ciencias Naturales y Exactas. Culiacán, Sinaloa, Marzo de 2002. Centro de Ciencias de
Sinaloa Disponible en www.redexperimental.gob.mx/descargar.php?id=228
*
Profesor de Tiempo Completo en la Escuela de Informática-Culiacán y de asignatura en la Preparatoria Dr.
Salvador Allende de la Universidad Autónoma de Sinaloa.
Didáctica de la Estocástica – 577 2

En países desarrollados se ha trabajado con esta herramienta desde hace años; en el


nuestro, cada vez se toma más conciencia acerca de su utilidad, prueba de ello son los
proyectos en nivel de enseñanza secundaria denominados EMAT (Educación Matemáti-
ca con Tecnología) y EFIT (Enseñanza de la Física con Tecnología), que son auspiciados
por la Secretaría de Educación Pública y en los cuáles participan en la etapa piloto,
cientos de secundarias en diversos estados del país. El propósito de estos proyectos es
mostrar la viabilidad de mejorar la calidad de la enseñanza de las matemáticas y las
ciencias en la escuela secundaria introduciendo los medios informáticos a las prácticas
escolares.

MITOS ACERCA DEL USO DE LAS CALCULADORAS EN LA CLASE DE MATEMÁTI-


CAS
Pomerantz (1997), señala que existen muchos mitos acerca del uso de las calculadoras
en la clase de matemáticas, señala algunos como el considerar que los estudiantes
pierden habilidades al usarlas y que las calculadoras hacen todo el trabajo por el estu-
diante y se vuelven dependientes de ellas. Considera que estos mitos únicamente sir-
ven para hacer más lento la inevitable implementación de la tecnología en los salones
de clase y poner a los estudiantes en desventaja en un mundo que está siendo cubier-
to por la tecnología. Es necesario que estos mitos sean redimensionados ya que las
calculadoras pueden ser apropiadamente incorporadas en el currículo de matemáticas
desde preescolar hasta universidad.

En nuestra opinión, las calculadoras simplifican tareas, pero no hacen realmente el


trabajo del estudiante, ya que es responsabilidad del estudiante leer el problema, en-
tenderlo y usar el modelo apropiado para resolverlo, más bien la calculadora constituye
un complemento en la enseñanza de las matemáticas, no reemplaza las habilidades
mentales ni las actividades de papel y lápiz, pero sí incrementan las habilidades de
resolución de problemas por medio de múltiples técnicas de solución.

LA CALCULADORA ALGEBRAICA

La primera calculadora con procesador algebraico (CAS, Computer Algebra System)


fue introducida por Texas Instruments en 1996. Recientemente, tanto Casio como
Texas Instruments han introducido calculadoras con ROM flash, lo cual tiene positivas
implicaciones para el futuro, ya que la tecnología flash permite optimizar la memoria
de tal manera que muchas clases de programas que antes sólo era posible usarlos en
una computadora, ahora puedan ser ejecutados en calculadoras, además de permitir
actualizar el software que contienen de una manera sencilla.

Las calculadoras algebraicas, son calculadoras graficadoras que poseen características


(procesador algebraico) que antes sólo estaban disponibles en software de computado-
ra. Estas calculadoras pueden simplificar y desarrollar expresiones, derivar, integrar,
graficar funciones, calcular límites, resolver ecuaciones y sistemas de ecuaciones, ope-
rar con matrices, hacer análisis estadísticos de datos, trabajar con construcciones ge-
ométricas, programar aplicaciones, etc. En pocas palabras; pueden hacer mucho más
de lo que se enseña de matemáticas a nivel bachillerato.

Dentro de las grandes ventajas que estas calculadoras tienen respecto a una computa-
dora propiamente dicha es son baratas, portátiles y fáciles de usar, y con ellas es
posible que cada salón puede llegar a ser un laboratorio de cómputo.

Selección de lecturas
Didáctica de la Estocástica – 577 3

Siguiendo las pantallas siguientes, las primeras dos muestran el cálculo de una integral
definida y su correspondiente interpretación como área bajo la curva, la tercera mues-
tra el cálculo de una derivada ordinaria, mientras que las últimas tres muestran la ob-
tención del límite de una función, su tabla de valores y su gráfica respectivamente.

En la enseñanza de las matemáticas es muy importante la representación de un con-


cepto matemático en más de un sistema de representación (por ejemplo, aritmético,
algebraico, gráfico); las calculadoras algebraicas permiten el uso de estos tres siste-
mas de representación y con gran facilidad se puede pasar de uno a otro, contribuyen-
do con ello a una comprensión más estable de los conceptos. Por citar un ejemplo po-
demos calcular el límite de una función en forma algebraica, representar gráficamente
la función y desplegar una tabla de valores cercanos al limite de la función para ver lo
que está ocurriendo conforme más se acerca la variable a un valor determinado.

Kutzler (1999), distingue cuatro tópicos especialmente importantes en educación ma-


temática y en los cuáles las calculadoras y computadoras son una herramienta valiosa
para atenderlos. Estos tópicos son: trivialización, experimentación, visualización y con-
centración.

En cuanto a la trivialización, señala que así como las calculadoras científicas volvieron
triviales las operaciones aritméticas, la calculadora graficadora trivializó la producción
de gráficas, la calculadora algebraica vuelve trivial las manipulaciones algebraicas.

Selección de lecturas
Didáctica de la Estocástica – 577 4

Por ejemplo, graficar la función lineal y = 2 x + 3 no requiere mucho tiempo ni pericia,


 x
sin embargo para graficar y = sen  + cos( x) es mucho más difícil y se requiere cierto
2
talento par graficarla. Con la calculadora algebraica, ambas se pueden graficar con el
mismo tiempo y talento.

Así, la trivialización de la aritmética, el álgebra y las graficas en la enseñanza, nos


permite abordar problemas más complejos y más reales (Kutzler, 1999)

En cuanto a la experimentación, podemos partir aplicando un algoritmo a cierto ejem-


plo, observar sus propiedades y establecer conjeturas. Esto llevado a cabo con papel y
lápiz puede en ocasiones requerir de mucho tiempo. Con la calculadora graficadora
esta experimentación se puede llevar a cabo en poco tiempo. Por ejemplo, con la cal-
culadora algebraica se puede llegar a conjeturar que la derivada de una constante es
igual a cero, derivando repetidas veces como se muestra en la figura.

La visualización como técnica para enseñar matemáticas, ha llegado a ocupar un lugar


importante en el currículo de muchos países donde las calculadoras son usadas am-
pliamente. Hoy es usada principalmente para observar la correspondencia entre repre-
sentaciones algebraicas y graficas. Un ejemplo típico para mostrar el poder de la visua-
lización en matemáticas es introducir un parámetro a una función, digamos y = ax 2 y
hacer variar dicho parámetro. La idea aquí, es que el alumno observe la relación entre
la gráfica y los cambios en el parámetro, tanto en su valor como en el signo. De igual
manera podemos introducir un parámetro a una función trigonométrica y observar su
comportamiento.

Selección de lecturas
Didáctica de la Estocástica – 577 5

La clave del éxito en una enseñanza apoyada en tecnología, radica en un buen entre-
namiento de los profesores y en un enfoque didáctico apropiado. La tecnología no
cambia la enseñanza por sí sola, pero la tecnología es un catalizador para que los pro-
fesores cambien sus métodos de enseñanza y se enfoquen hacia tópicos y habilidades
contribuyendo a una mejor enseñanza de las matemáticas (Kutzler, 1999).

Las calculadoras graficadoras están cambiando los tipos de problemas que son impor-
tantes en la clase de matemáticas. Los conceptos matemáticos pueden ser resueltos
desde diferentes enfoques (aritmético, algebraico, gráfico) y las calculadoras permiten
moverse fácilmente entre estas representaciones, reforzando su comprensión. Los es-
tudiantes pueden usar métodos para confirmar la respuesta obtenida por medios alge-
braicos o viceversa.

Por ejemplo un sistema de ecuaciones lineales, puede resolverse por métodos alge-
braicos y posteriormente interpretar su solución en términos gráficos, pudiendo así,
explicar porque la única, ninguna o múltiple solución.

En estadística y probabilidad la calculadora algebraica ofrece un gran potencial. Con las


calculadoras los estudiantes pueden analizar datos ya sea numéricamente o gráfica-
mente, comparar resultados esperados y resultados observados, crear modelos para
describir relaciones y generar simulaciones para entender situaciones probabilísticas de
una forma que sin tecnología no sería posible. En su más reciente avance que es el de
aplicaciones Flash, soporta un software de estadística que permite manejar tópicos de
estadística avanzada como análisis de regresión, correlación, análisis de varianza, dis-
tribuciones de probabilidad, prueba de hipótesis e intervalos de confianza entre otros.
Además que en el modo de programación se puede elaborar sencillos programas que
permiten simular fenómenos aleatorios tales como lanzamiento de monedas y dados
por citar un ejemplo.

Las primeras dos pantallas muestran algunas medidas descriptivas de un conjunto de


datos y la tercer pantalla muestra el área de la distribución normal (0,1) para una de Z
mayor a 0.75, mientras tanto las últimas tres pantallas muestran los resultados de un
programa que simula el lanzamiento de una moneda legal.

Selección de lecturas
Didáctica de la Estocástica – 577 6

¿CÓMO SE PUEDE HACER UN MEJOR USO DE LA TECNOLOGÍA?


Si deseamos desarrollar en nuestros estudiantes, tanto las habilidades básicas como
las habilidades para resolver problemas mediante el uso de la calculadora entonces
debemos hacer uno “uso apropiado” de ellas. En este sentido, somos de la idea que un
enfoque balanceado de uso de papel y lápiz y tecnología e esencial.

Se pueden seguir diferentes estrategias para llevar a cabo un uso apropiado de las
técnicas de papel y lápiz y la calculadora:
I. Resolver problemas usando papel y lápiz y verificar los resultados con tecnolog-
ía.
II. Resolver problemas usando tecnología y confirmar los resultados usando papel
y lápiz.
III. Resolver problemas para los cuales ellos elijan la técnica que más les guste,
papel y lápiz, calculadora o una combinación de ambas.

Otro enfoque es usar técnicas de papel y lápiz durante el desarrollo inicial del concepto
y usar calculadora para una extensión y generalización de los resultados.

REFERENCIAS BIBLIOGRÁFICAS
Waits, B. y Demana, F. (2000). El papel de la computadora portátil en el álgebra simbólica en la educación
matemática del siglo XXI: Un llamado para la acción. Documento presentado por invitación y pre-
sentación en la Conferencia de Tecnología de los Standards 2000, patrocinada por NCTM el 5-6 de
junio de 1998 en Washington D. C.
Waits, B. y Demana, F. (2000). Calculators in Mathematics Teaching and Learning, Past, Present and Future.
Kutzler, B. (1999). The Algebraic Calculator as a Pedagogical Tool for Teaching Mathematics. Investigating
with information technologies. Australian Association of Mathematics Virtual Conference.
Pomerantz, H. (1997). The Role of Calculators in Mathematics Education. Document prepared for the Urban
Systematic Initiative/Comprehensive Partnership for Mathematics and Science Achievement. Dallas
Texas.
Cedillo, T. (2001). La Calculadora en la clase de Matemáticas: Implicaciones hacia la Enseñanza. Conferen-
cia Internacional sobre uso de Tecnología en la Enseñanza de las Matemáticas. Universidad Mi-
choacana de San Nicolás de Hidalgo. Morelia Michoacán México.
Inzunza, S. (2001). Enseñando Estadística mediante la calculadora TI-92. Conferencia Internacional sobre
uso de Tecnología en la Enseñanza de las Matemáticas. Universidad Michoacana de San Nicolás de
Hidalgo. Morelia Michoacán México.

Selección de lecturas
Nivel Medio Superior y Superior

LAS HERRAMIENTAS COMPUTACIONALES EN LA ENSEÑANZA DE LA


PROBABILIDAD Y LA ESTADÍSTICA
Santiago Inzunsa Cazares1
Universidad Autónoma de Sinaloa
Estudiante de Maestría en Matemática Educativa, CINVESTAV-IPN

Resumen
El presente artículo pretende dar una visión general sobre las bondades que tiene el uso de
herramientas computacionales en la enseñanza de la probabilidad y estadística. Todos los ejemplos
se refieren al uso de la calculadora graficadora, como un tipo especial de tecnología que presenta
algunas ventajas como es costo y portatibilidad. Se trata de poner de manifiesto la potencialidad de
la herramienta computacional en la visualización de conceptos estadísticos. Se manejan tres grandes
áreas señaladas por Snell y Peterson, donde es factible su aplicación, como son, reducción de
cálculos manuales, análisis gráfico de datos y simulación.

Introducción
Es innegable la influencia que están teniendo tanto las computadoras como la nueva
generación de calculadoras graficadoras en la educación matemática y, en especial, en la
enseñanza de la probabilidad y estadística. En la actualidad se ha desarrollado software
computacional con características de simulación, visualización dinámica, múltiples formas de
representación y con alto grado de interactividad, que permite al estudiante obtener un acceso
más espontáneo a las ideas matemáticas que subyacen a muchos conceptos importantes en
probabilidad y estadística. Tales características no son exclusivas del software para
computadoras, también aparecen en las versiones más actualizadas de calculadoras graficadoras;
estas últimas con ventajas en cuanto al costo y accesibilidad en términos de portatibilidad, que
las hacen apropiadas para su uso en el salón de clases.

Las características citadas anteriormente permiten crear un ambiente donde la exploración


y la experimentación tienen lugar como actividades que pueden contribuir a un mejor
aprendizaje. Así, mediante la interactividad del software, es posible hacer manipulaciones a las
representaciones gráficas, hacer que los estudiantes experimenten con distribuciones haciendo
variar sus parámetros, cambiar datos y que el estudiante observe los efectos, proporcionando a
los estudiantes una inmediata retroalimentación. La visualización dinámica es otra característica
de gran utilidad, mediante ella es posible relacionar la forma de las gráficas y los valores como
medidas de tendencia central y variabilidad. En cuanto a la capacidad de simulación, podemos
decir que es posible generar datos en forma aleatoria que sigan una determinada distribución y
tomar muestras aleatorias repetidas un gran número de veces, para ilustrar conceptos importantes
como aleatoriedad, teorema de límite central, ley de grandes números, entre otros conceptos.
Además de la posibilidad de cambiar fácilmente entre representaciones tabulares,
representaciones gráficas y representaciones simbólicas de los datos, proporcionando con ello la
oportunidad de entender un concepto con base en sus diferentes formas de representación.

Existen diversas razones para integrar la tecnología a la enseñanza de las matemáticas,


Laborde (2000) destaca las siguientes:

1
Email: sinzunsa@mail.cinvestav.mx, sinzunza@uas.uasnet.mx

1
 Una razón social: el incremento del uso de la tecnología. Hoy la gente joven usa Internet,
teléfono celular, juegos electrónicos, etc. Entonces, la enseñanza de las matemáticas no
puede ignorar la tecnología.
 Hay tecnología útil para matemáticas y para enseñanza de matemáticas, la cual permite a los
estudiantes visualizar fenómenos matemáticos, hacer conexiones, efectuar experimentos; en
una palabra, hacer matemáticas como expertos. Esta habilidad antes de la era de la
tecnología, estaba restringida a estudiantes dotados que podían imaginar en su mente los
objetos matemáticos y sus relaciones. La posibilidad de manipulación real de la tecnología,
ofrece acceso a las matemáticas a la mayoría de los estudiantes.

Scheaffer (1992), dice que la estadística debe ser enseñada como una ciencia de
laboratorio. Los estudiantes deben adquirir los datos por su propia cuenta. En el laboratorio las
computadoras deben ser un requerimiento para que los estudiantes discutan, escriban acerca de lo
que entienden y sus interpretaciones de los problemas.

Una característica importante que es necesario agregar respecto a la forma en que se usa la
tecnología en la enseñanza de las matemáticas actualmente respecto a hace algunos años, es que
no requiere que el usuario sea un experto en programación como solía suceder. Hoy día existe
software con características muy “amigables” que puede ser usado en forma eficiente con un
mínimo de interacción. A este tipo de software se le ha dado el calificativo de educativo, dado
que es diseñado teniendo como objetivo su uso en el salón de clases, y teniendo en consideración
una didáctica que facilite el aprendizaje. De esta forma, la computadora no sólo es un recurso de
cálculo, sino también un potente recurso didáctico que nos puede ayudar en el aprendizaje de
conceptos matemáticos.

Snell y Peterson (1992), identifican tres grandes áreas en la enseñanza de la probabilidad y


estadística en las cuales la tecnología computacional puede resultar de gran utilidad.

 Reducción de cálculos manuales.


 Facilitación del análisis gráfico de datos.
 Ilustración de conceptos por medio de simulación.

Cálculos numéricos
Si le preguntamos a una persona que haya tomado un curso de estadística sobre su
impresión de la materia, seguramente nos dirá que se trata de una serie de fórmulas que tuvo que
memorizar y cálculos tediosos que debió efectuar para llegar a un resultado. Sin embargo, hoy
día con la ayuda de la tecnología, se puede descargar tanto al profesor como al alumno de una
parte de esa tarea que tanto tiempo requiere y que poco ayuda a la comprensión de un
determinado concepto. Mediante el uso de las computadoras es posible utilizar conjuntos de
datos más grandes y sobre todo relevantes para la experiencia de los estudiantes. Al respecto
Cobb (1992) enfatiza que los estudiantes deberían ver a la estadística como un proceso de
adquisición científica, descubriendo información con datos de la vida real. Si los estudiantes
pueden entender los datos, entonces tendrán una mejor retención de la información del ejemplo.
Además si los datos son recolectados por ellos mismos, los estudiantes participarán en forma
activa en el proceso.

2
Con el uso de herramientas computacionales, la destreza en el cálculo ya no es el punto
principal necesario para emplear estas técnicas; pero estas herramientas serán de poca ayuda en
la planificación del estudio, en la elección de la técnica apropiada y en la interpretación de los
resultados (Batanero, Godino, Holmes y Vallecillos, 1994).

Así, la computadora toma la parte de los cálculos, pero deja al estudiante actividades de
mayor trascendencia. Con esto, queremos decir es que sólo es una ayuda en el proceso mas no
quien resuelve el problema.

Con el apoyo de la herramienta computacional es posible obtener medidas que describen un


conjunto de datos, tales como medidas de tendencia central y de variabilidad. La Figura 1
muestra los resultados del análisis de una variable, y la Figura 2, muestra el análisis de dos
variables.

Figura 1 Figura 2

Análisis gráfico de datos


En cuanto al análisis gráfico de datos la tecnología nos puede ayudar mediante una
variedad de gráficas que permiten al estudiante investigar eficientemente conceptos claves
mediante la visualización.

Es posible construir en forma rápida histogramas, diagramas de caja, diagramas de puntos,


polígonos de frecuencia, distribuciones de probabilidad, distribuciones de muestreo, etc.
También es posible manipular los datos con la finalidad de observar los cambios en las
representaciones gráficas, logrando con ello quitar el carácter abstracto a muchos conceptos.

La Figura 3 muestra un histograma de una distribución de frecuencias y la Figura 4, un


polígono de frecuencias. Es posible analizar el comportamiento del polígono en base al
histograma, el cual muestra un comportamiento uniformizado de los datos, lo que explica el
comportamiento casi lineal del polígono. Una explicación sobre esta forma es útil ya que con
frecuencia los alumnos piensan que el polígono debe tener la apariencia de una S.

Figura 3 Figura 4

3
Es importante en estadística que el estudiante tenga claro el papel que juegan los
parámetros en una distribución de probabilidad, con la herramienta computacional es fácil
observar el efecto que se produce al variar dichos parámetros. Veamos el caso de dos
distribuciones muy conocidas, la binomial que pertenece al grupo de las discretas y la normal
que forma parte del grupo de las continuas. En la Figura 5 se ha fijado la media y variado la
desviación estándar, en la Figura 6, la desviación estándar permanece fija y la media varía,
mientras que en la Figura 7 corresponde a la distribución binomial para dos valores dados de sus
parámetros n y p.

Figura 5 Figura 6 Figura 7

Otra tarea que es frecuente en estadística inferencial es el cálculo de áreas en una


distribución de probabilidad. He visto que a muchos alumnos les causa dificultad manejar
apropiadamente las tablas que vienen al final de los libros, esto es fácil usando la calculadora. En
la Figura 8 mostramos el área bajo la distribución normal estándar para valores de Z entre –1 y 2.

En la Figura 9 aparecen la distribución normal estándar y la distribución t-student para 2


grados de libertad, se puede ir aumentando los grados de libertad de la t-student con el objetivo
de que el estudiante observe cómo se va acercando a la normal y a partir de ahí determinar en
cuántos grados de libertad se puede considerar que se obtienen prácticamente los mismos
resultados, siendo ésta una razón por la cual en los libros generalmente no aparecen valores para
más de 30 grados de libertad.

Figura 8 Figura 9

Simulación
La utilidad de la simulación es más evidente en probabilidad e inferencia estadística. Se
pueden extraer muestras repetidas de un tamaño determinado de una distribución de probabilidad
y representar gráficamente la distribución que siguen las medias de las muestras, es decir la
distribución de muestreo, logrando con ella que el estudiante visualice un teorema de vital
importancia y sobre el que descansa una buena parte de la inferencia estadística, como es el

4
Teorema del Límite Central. En una clase tradicional solo podríamos limitarnos a que el
estudiante imagine lo que pasa al aumentar el tamaño de la muestra mediante una explicación
verbal. Sabemos que no es posible que el estudiante entienda fácilmente una demostración de
este teorema, sobre todo en un primer curso de inferencia estadística; sin embargo mediante la
tecnología se puede tener una demostración visual.

A continuación se muestra la aproximación de la binomial a la normal que es un caso


particular del Teorema del Límite Central (Figura 10 y Figura 11).

Figura 10 Figura 11 Figura 12

Un concepto también de mucha aplicación en probabilidad es la Ley de los Grandes


Números. Es frecuente que en las primeras clases de probabilidad se elija el problema de lanzar
una moneda legal al aire y se pida al alumno su pronóstico sobre las probabilidades. Este
ejemplo es importante para mostrar la regularidad estadística que presentan los fenómenos
aleatorios cuando son llevados a cabo un número grande de veces. Es importante hacer ver al
alumno el parecido que tiene el ejemplo de las monedas con casos de mayor relevancia en la vida
real, como puede ser una votación, explicando las fluctuaciones que se tienen con los primeros
resultados, pero una vez que se estabilizan las tendencias resulta difícil que éstas cambien. La
Figura 12 muestra los resultados de una simulación del lanzamiento de una moneda, para cuyo
efecto se elaboró un pequeño programa.

Conclusiones
Es evidente la ayuda que nos ofrece la tecnología computacional en la enseñanza de la
probabilidad y estadística; por un lado, el apoyo que brinda en la reducción de cálculos tediosos
y que requieren mucho tiempo enseñarlos en forma tradicional, y por otro lado, la visualización
de conceptos -algunos de ellos de difícil acceso sin la tecnología- además del aspecto de la
simulación, de tan vital importancia en la generación de situaciones de enseñanza que no sería
posible efectuarlas en la clase por otros métodos. Podría parecer demasiado optimista en cuanto a
los resultados que se presentan en este artículo; no se pretende hacer todo mediante la tecnología,
más bien creemos que es una ayuda valiosa que el profesor debe considerar y usarla en forma
balanceada con otras técnicas de enseñanza.

Bibliografía
Cobb (1992) Teaching Statistics, in Heeding the Call for Change: Suggestions for Curricular Action. Ed. L. Steen.
MAA Notes, No. 22.
Godino J. (1995) ¿Qué aportan los ordenadores a la enseñanza de la estadística?. Revista de Didáctica de las
Matemáticas UNO. No. 5. España.
Batanero C., Godino J, Green R., Holmes P. y Vallecillos A. (1994) Errors and difficulties in understanding
elementary statistical concepts. International Journal of Mathematics Education and Science and
Technology. 25(4).

5
Snell L. and Peterson W. (1992). Does the computer help us understanding statistics? In Statistics for the Twenty-
First Century. Ed. Florence G. and Gordon S. MAA Notes, No. 26.
Laborde C. (2000) Why technology is indispensable today in the teaching and learning of mathematics Contribution
to the T3 World-Wide conference in Tokyo, August 2000.
http://www.math.ohio-state.edu/~waitsb/t3posticme2000.html
Kutzler, B. (1999) “The Algebraic Calculator as a Pedagogical Tool for Teaching Mathematics”.
http://www.kutzler.com/main.html
Hitt F. (1998) Visualización matemática, representaciones, nuevas tecnologías y curriculum. Revista Educación
Matemática, Vol. 10, No. 2. Editorial Iberoamérica. México.
Hitt F. (2000) Construcción de conceptos matemáticos y uso de calculadoras simbólicas. Contribution to The 4°
International DERIVE-TI89/92 Conference: Computer Algebra in Mathematics Education. Liverpool UK.
Burril G. (1996) Graphing calculators and their potential for teaching and learning statistics, in Research on the Role
of Technology in Teaching and Learning Statistics. Proceedings of the 1996 IASE Round Table Conference
in University of Granada Spain. July 1996.
Waits B. and Demana F. (2000) Calculators in Mathematics Teaching and Learning Past, Present and Future.
http://www.math.ohio-state.edu/~waitsb/papers.html
Smith E. (1998) Social Constructivism, Individual Constructivism and the Role of Computers in Mathematics
Education. Journal of Mathematical Behavior Vol. 17, No. 4.

6
La Ciencia en tu Escuela1
Módulo de Matemáticas
Sesión 4: Estadística
Felipe Alfaro Aguilar
Índice
1. Introducción
2. Organización y representación de datos
3. Correlación y regresión lineal simple
4. Inferencia estadística
Introducción
En el ámbito internacional, actualmente el interés por la enseñanza de la Estadística está
cobrando un auge cada vez más considerable, los investigadores pedagogos y prestigia-
das instituciones educativas están apoyando decididamente su impartición en las escuelas
desde los niveles educativos más básicos. La razón de este movimiento se debe a la gran
importancia que está adquiriendo, por su carácter instrumental, en prácticamente todas
las disciplinas del quehacer humano.
Investigadores de la educación han señalado la conveniencia de educar estadísticamente
a los futuros ciudadanos, ya que éstos se verán en la constante necesidad de leer e inter-
pretar eficientemente tablas y gráficos estadísticos, que con frecuencia aparecen en los
medios de comunicación. Además de la utilidad que, por supuesto, representa para el
futuro desarrollo profesional de los jóvenes estudiantes, pues gran parte de las actuales
opciones educativas requieren de ella un mínimo de conocimientos elementales (Holmes,
1980).
Dentro del ambiente docente la Estadística es necesaria al menos para llevar a cabo las
siguientes 4 tareas (ICE 2001):
1. "Lectura de literatura profesional. La investigación en ciencias de la educación emplea
la Estadística como una herramienta habitual en la realización de cualquier experimen-
to. Por lo tanto, el profesor que quiera estar al día respecto a la enseñanza de su disci-
plina debe estar en condiciones de poder comprender textos de investigación docente.
2. Conocimiento de la clase. El profesor se enfrenta a la tarea de la educación de unos
alumnos ubicados en una clase, centro escolar y contexto social concreto, que van a
interaccionar con sus características personales. El conocimiento profundo de este con-
texto en que está involucrado el alumno resulta de vital importancia para el educador y
no será posible sin el análisis estadístico de los datos individuales de los elementos del
contexto.
3. Diagnosis didáctica. El profesor, a la hora de tomar decisiones acerca de sus alumnos,
contará con el apoyo del análisis comparativo de la situación relativa de cada individuo
en su clase, distintas asignaturas y distintas variables psico-sociológicas. También la
propia actividad del profesor puede verse mejorada tras un análisis del rendimiento es-
colar del grupo en su conjunto. Estas tareas requieren tratamientos estadísticos sim-
ples de los datos de los alumnos.

1
http://www.amc.unam.mx/laciencia/matsec1.htm
Didáctica de la Estocástica – 577 2

4. Investigación y predicción. El profesor puede estar interesado en averiguar si una nue-


va técnica didáctica es realmente más efectiva para el rendimiento de sus alumnos,
que la usada por él hasta ahora. O en saber el efecto que producen variables familia-
res, rasgos psicológicos en la destreza del alumno en realizar tal o cual tarea. Este tipo
de trabajos requieren el uso de métodos estadísticos"
Organización y representación de datos.
Un estudio estadístico se desarrolla en las siguientes etapas:
1. Recolección de datos,
2. Presentación de resultados en tablas y gráficos,
3. Análisis matemático de los datos y
4. Conclusiones.
Vamos a comenzar a desarrollarlas con algunos ejercicios muy sencillos
ACTIVIDADES A DESARROLLAR
Ejemplo 1.
a. Frecuencia absoluta y relativa.
Se desea conocer qué recuerdan los profesores de algunos aspectos como son las
formas de representación gráfica (sectores, barras, líneas, frecuencia absoluta, la
media, la moda, etc.) Sería muy interesante realizar una encuesta sobre algunos
aspectos sociales, para después plasmarlo en una tabla de datos. Los aspectos a
preguntar pueden ser muy variados y se podrían decidir en grupo.
b. La media.
La media es un parámetro de centralización que sólo se da en conjuntos numéricos.
No todos los conjuntos de datos tienen media. Es una cantidad que representa un
conjunto de datos, pero no se debe olvidar que no tiene porqué ser real y, además
no nos aporta información sobre cómo se distribuyen los datos. Es interesante que
los profesores conozcan y comenten la conocida paradoja de que si una persona
come un pollo y otra persona no come ninguno, la media dirá que cada uno se ha
comido una mitad. Es bueno que practiquen, y para ello se pueden proponer mu-
chos cálculos de medias estadísticas deportivas, datos de prensa, espectadores de
televisión, estatura de la clase, temperatura diurna, etc.
c. La moda.
La moda existe en todos los conjuntos de datos, ya que es el valor que más se repi-
te. Incluso puede haber varias modas, si varios datos de repiten un mismo número
de veces.
d. Los gráficos de sectores.
Puede ser interesante acabar todas las encuestas y muestreos que hayan realizado
elaborando un gráfico de sectores de cada uno de ellos. Deben fijarse en que el sec-
tor que ocupa más superficie corresponde al dato que es moda de la muestra.

Selección de lecturas
Didáctica de la Estocástica – 577 3

Ejemplo 2.
Se les proporciona un texto a cada grupo. Tras la lectura del texto deberán elaborar una
serie de conclusiones que quedarán registradas en un cuadro de frecuencias. A partir de
estos datos, los profesores calcularán la media, moda y mediana. Posteriormente confec-
cionarán un gráfico (barras, sectores, lineal, etc.)
En el caso de los alumnos, esperamos que con todos estos datos y muchos más, éstos se
verán más familiarizados con el mundo estadístico de una forma fácil y amena. Los alum-
nos podrían debatir y comentar todos los aspectos que quieran en clase. Pueden comuni-
car datos al resto de los grupos. Al final de cada actividad se hará una puesta en común
de todos los grupos unificando los datos y los resultados obtenidos.
Tras estas actividades, los profesores pueden empezar ya a elaborar otros gráficos algo
más complicados: densidad de población, natalidad, mortalidad, migraciones... para cuya
elaboración se les proporcionarán datos actualizados de México.
También pueden realizar la lectura e interpretación de gráficos como el siguiente. Hacien-
do una valoración final de los aspectos más resaltados e importantes.

Ejemplo 3. Un estudio más completo


Con base a la siguiente pregunta:
¿Cuántas letras suelen tener las palabras en nuestro idioma?
Desarrollar los siguientes pasos:
Paso 1: Recogida de datos.
De un texto que les entregaremos elijan al azar una línea y empiecen a contar las
letras de cada palabra (sólo aquellas que no tengan mas de 15 letras) Cambia de
página y de línea de cuando en cuando. Toma nota en la tabla de abajo, haciendo
marcas de la forma: ////
Continuar hasta rellenar la tabla con 200 datos como mínimo.

Selección de lecturas
Didáctica de la Estocástica – 577 4

TABLA DE RECOLECCIÓN DE DATOS

# de letras Palabras encontradas


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Paso 2. Presentación de resultados en tablas y gráficos.


Escribe el número de marcas en cada renglón en la columna de la frecuencia:

Dato X Frecuencia
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
¿Qué te llama la atención de esta tabla?
Si no se te ha ocurrido nada, te ayudo con preguntas: Se llama MODA al valor más
frecuente:
¿Cuál ha sido la MODA de esta tabla?
¿La ves simétrica o asimétrica (es decir, no simétrica)?

Selección de lecturas
Didáctica de la Estocástica – 577 5

¿Por qué ha salido así?


¿Están los valores concentrados o dispersos?
GRÁFICO
En este caso el gráfico más adecuado es el de barras. Sigue estas instrucciones para
dibujar el gráfico en el hueco de abajo:
- En el eje X escribimos los números del 1 al 15 bien ordenados a intervalos iguales.
- Sobre cada número dibujamos una barra, que será proporcional a la frecuencia, a
mayor frecuencia, barra más alta. Si quieres hacerlo bien usa una proporción: "Si a
la frecuencia 10 le doy 2 centímetros, a la frecuencia 16 le daré X"
- Escribe bien los títulos en los dos ejes.
DIBUJO DEL GRÁFICO
Comenta lo que te llame la atención:
Debería haber salido como una campana asimétrica ¿Es así? Si no lo es, no importa,
porque a cada equipo le habrá salido con una forma distinta.
Compara tu gráfico con los equipos de al lado. ¿Se parecen?
Paso 3: Análisis Matemático
Ya hemos visto lo que es la MODA: el valor más frecuente. Ahora veremos la ME-
DIANA y la MEDIA:
MEDIANA en una tabla es el valor que está en el centro. ¿Cómo lo averiguamos? Si
tenemos 200 datos será el dato que ocupe el lugar entre el 100 y el 101. Razona
bien cuál sería.
Compara las tres cantidades y coméntalo:
MODA: _______ MEDIANA: __________ MEDIA: _______
Estas cantidades se llaman medidas centrales. ¿Por qué se llamarán así? Explícalo.
Ejemplo 4. Una escala de actitudes consta de 50 proposiciones ó ítems acerca de la en-
señanza de la Estadística. Hemos elegido dos de éstas:
1. Sólo deberían estudiarla los especialistas en Estadística
2. Es un instrumento imprescindible para un profesor.
Contestaron 80 personas en una escala de 1 a 5 (desde total desacuerdo hasta total
acuerdo) y se obtuvieron estos resultados:

Puntuaciones f1 f2
1 30 4
2 15 9
3 25 23
4 6 34
5 4 10

a. ¿Se debe preferir la media o la mediana como índice de tendencia central? ¿Por
qué?
b. Calcula la más adecuada para ambas proposiciones.

Selección de lecturas
Didáctica de la Estocástica – 577 6

c. Comenta a partir de ellas el grado de acuerdo de la muestra ante las dos proposi-
ciones.
Ejemplo 5. En la siguiente tabla aparecen las distribuciones de frecuencias de la variable
X: puntuación obtenida en una prueba de la asignatura de Química realizada en cuatro
grupos A, B, C y D de primero de Bachillerato de 100 alumnos cada uno. Compara estas
distribuciones visualmente, sin ningún tipo de cálculo, en cuanto a propiedades estadísti-
cas (tendencia central, variabilidad, simetría,...) y ofrece al profesor de cada grupo suge-
rencias didácticas para optimizar el funcionamiento de la clase.

Puntuación A B C D
10 5 2 1 6
9 10 5 2 8
8 15 8 3 9
7 22 10 6 10
6 16 15 8 11
5 12 20 12 12
4 8 15 16 11
3 6 10 22 10
2 3 8 15 9
1 2 5 10 8
0 1 2 5 6

3. Correlación y regresión lineal simple.


Un caso particular del campo de problemas del que emerge la asociación estadística es
realizar un juicio de asociación en una tabla de contingencia 2x2, como la que se muestra
en el ítem 1.
Ítem 1: En un centro médico se han observado a 250 personas para observar si el hábito
de fumar tiene alguna relación con los trastornos bronquiales, obteniendo los siguientes
resultados:

Fuma No fu- Total


ma

Padece trastornos bronquia- 90 60 150


les

No padece trastornos bron- 60 40 100


quiales

Total 150 100 250

Usando la información contenida en la tabla,


¿Se podría pensar que, para esta muestra, los trastornos bronquiales dependen de
fumar?
Razone la respuesta.

Selección de lecturas
Didáctica de la Estocástica – 577 7

Ítem 2: Al medir la presión sanguínea antes y después de haber efectuado un tratamien-


to médico a un grupo de 10 personas se obtuvieron los siguientes valores:

Presión sanguínea en cada mujer

Mujer Sra. Sra. Sra. Sra. Sra. Sra. Sra. Sra. Sra. Sra.
A B C D E F G H I J

Antes del trata- 115 112 107 119 115 138 126 105 104 115
miento

Después del trata- 128 115 106 128 122 145 132 109 102 117
miento
Usando la información contenida en esta tabla,
¿Piensa que la presión sanguínea en esta muestra depende del momento de que se
tome, antes o después del tratamiento?
Razone la respuesta.
Ítem 3: En un estudio sociológico, se han recogido datos relativos a la tasa de natalidad
y el consumo diario de proteínas animales en diferentes países representándolos en el
gráfico de la figura 1. ¿Cree que la relación entre el consumo diario de proteínas animales
y la tasa de natalidad en los diferentes países es directa, inversa o no existe relación en-
tre estas variables? Razone su respuesta.
Ítem 4: Numerosas investigaciones señalan que ver la televisión con asiduidad afecta al
rendimiento escolar de los niños. Se ha preguntado a 10 niños de 6º de Primaria el
número de horas semanales que dedican a ver la televisión (Variable X) Hemos llamado
variable Y a la nota media de la última evaluación. Los datos obtenidos son los siguientes:

X Y
9 5
10 6
4 10
10 7
8 4
6 6
4 9
9 8
5 8
3 9
a) ¿Compruebe gráficamente si hay relación lineal entre las dos variables?
b) ¿Qué conclusión se puede obtener de dicho resultado?
4.Inferencia estadística.
POBLACIÓN Y MUESTRAS
Distinguir entre una muestra y una población es fundamental en un estudio estadístico.
Lo siguiente ilustra esta diferencia a la perfección:

Selección de lecturas
Didáctica de la Estocástica – 577 8

Supongamos que se desea inspeccionar una nueva marca de cerillos. Encenderlos a


todos ellos para probar que funcionan bien, seria tan absurdo como intentar medir
la contaminación de un rio examinando toda el agua que pasa por él.
¿PARA QUE SIRVE LA INFERENCIA ESTADÍSTICA?
La inferencia estadística responde a preguntas como las siguientes:
¿Por qué una encuesta de 1000 o 1500 personas permite predecir bastante bien el
resultado de la elección con 8 millones de votantes?
¿Cómo se logra este resultado?
¿Cómo se mide la precisión del resultado?
EL EJEMPLO DEL TIMSS

Un ejemplo que encaja perfectamente por la relevancia y las repercusiones que ha tenido
es la evaluación internacional (TIMSS) en la que participó nuestro país en 1995, sobre
Matemáticas y Ciencia para estudiantes de la escuela primaria y secundaria. Dicha eva-
luación, por supuesto, no se realizó sobre todo el universo de estudiantes involucrados
que son varios millones, lo que resultaría muy costoso tanto en tiempo como económica-
mente; en su lugar, lo que se hace es seleccionar adecuadamente una muestra represen-
tativa de los estudiantes, y sólo a ellos se practican las evaluaciones. Posteriormente, las
evaluaciones obtenidas para esta muestra se extienden al conjunto completo de estudian-
tes.
PREGUNTAS EN UN MUESTREO
1. Imagina que de la población formada por todos los alumnos de tu escuela, extraes
aleatoriamente una muestra de 40 alumnos, y les preguntas por su edad, encon-
trando que la edad media obtenida es de 15,8 años. Pero,
¿Qué ocurriría, si extrajéramos otra muestra?
¿Coincidirían las medias?
¿Y coincidirían con la media de la población, es decir, con la media de toda la escue-
la?

Selección de lecturas
Didáctica de la Estocástica – 577 9

Lo cierto es que parece lógico pensar que aunque no tengan porqué coincidir, si de-
berían estar bastante próximas. Pero,
¿Cuán próximas?
¿Dependería esta proximidad del tamaño de las muestras que elegimos?
2. Un profesor quiere medir la eficacia del uso sistemático de la hemeroteca para la
enseñanza de la historia contemporánea. Este profesor no puede realizar un estudio
que involucre a todos los estudiantes de todo el país, así que decide realizar un ex-
perimento con los dos grupos de los cuales el mismo es profesor. En primer lugar
confecciona una prueba de conocimientos previos de un tema de la asignatura y la
pasa a sus alumnos. En la clase A, aparte de la clase habitual, pide a sus alumnos
que lean algunos periódicos que reflejen algún aspecto del tema. En la clase B, se
limita a dar su clase habitual. Cuando acaba de explica el tema examina a sus
alumnos. Ahora, con ayuda de la Estadística, puede responder algunas preguntas
como:
¿Obtienen mejores notas los alumnos de la clase A que los de la clase B?
¿Partían del mismo nivel de conocimientos previos?
¿Podría este hecho influir sobre los resultados del experimento?
¿Se pueden generalizar los resultados del experimento de este profesor?
ACTIVIDADES DE MUESTREO
1. Encuentra en un periódico o revista, un artículo o información en la que a tu juicio
se esté haciendo uso de una muestra.
2. Utilizando una tabla de números aleatorios, elige 15 elementos de una población
numerada del 1 al 89.
3. Dí de que forma elegirías una muestra de 50 alumnos de tu escuela, por muestreo
aleatorio simple, sistemático y estratificado (cada estrato una clase, o un nivel)
4. Establece un método para elegir una muestra de vecinos de una calle.
5. Si pretendieras hacer una encuesta a una muestra de tamaño 50, ¿cómo la tomar-
ías?, ¿Sería indiferente el aspecto estadístico que tuvieras que estudiar?
6. Un hospital dispone de un listado de los pacientes, organizados por áreas de aten-
ción (neurología, traumatología, etc.) Dí que tipos de muestreo podrían realizarse, y
como los harías.
7. Para realizar una encuesta sobre el consumo de un producto en una ciudad, se tomó
una muestra de forma que de cada barrio se consultaba a un número de personas
proporcional a la superficie ocupada por el barrio. ¿Te parece un método fiable? Es-
cribe un comentario.
8. Un mayorista de alimentos, quiere enviar muestras de sus productos, a una mues-
tra de supermercados. Elige de las 5 grandes cadenas de supermercados, una
muestra de cada una, y manda sus productos para ponerlos a prueba. ¿Qué tipo de
muestreo está utilizando?
BIBLIOGRAFÍA
Batanero, C. (1998) Recursos para la educación estadística en Internet. UNO, 15, 13-26.
Batanero C., Godino J., Estepa A., (1998) Construcción del significado de la asociación
estadística mediante actividades de análisis de datos. Proceedings of the 22nd Confe-

Selección de lecturas
Didáctica de la Estocástica – 577 10

rence of the International Group for he Psychology of Mathematics Education (Rese-


arch Forum), Vol 1: 221-236.
Batanero C. (2000) Controversias sobre el papel de los contrastes estadísticos de hipóte-
sis en la investigación experimental. Mathematical Thinking and Learning, 2(1-2), 75-
98. Número monográfico sobre Educación Estadística.
Batanero C. (2001) Presente y Futuro de la Educación Estadística. Jornadas europeas de
estadística.
http://www.caib.es/ibae/esdeveniment/jornades_10_01/doc/Bataneromallorca.doc
Cañizares J., Estepa A., Batanero C., (2000) Perspectiva de la investigación del grupo de
trabajo: Didáctica de la Probabilidad, Estadística y Combinatoria. IV Simposio SEIEM.
Cobo, B. (2001) Problemas y algoritmos relacionados con la media de los libros de texto
de secundaria. Jornadas europeas de la Estadística.
http://www.caib.es/ibae/esdeveniment/jornades_10_01/doc/artículobalearesdeBelénC
obos.doc
Crespo, S. (1997) Algunas consideraciones sobre el uso de tecnología para enseñar y
aprender matemáticas. Comité Interamericano de Educación Matemática. Boletín in-
formativo, año 5, No. 1.
Frankovic K., (1999) Encuestas de Opinión Publica. La Experiencia en Estados Unidos.
Boletín de la Asociación de Agencias de Investigación de Mercado y Opinión Publica.
Boletín 22.
Covarruvias A., (2000) Diez reglas prácticas de cómo leer Encuestas Electorales. AMAI
Asociación Mexicana de Agencias de Investigación de Mercado y Opinión Publica.
Garfield J., Ahlgren A., Dificultades en el aprendizaje de conceptos básicos de probabili-
dad y estadística. Implicaciones para la Investigación.
Holmes, P. (1980) Teaching Statistics 11-16. Sloug: Foulsham.
Huff, D. (1993) Como mentir con estadísticas. W.W Norton & Company
Lacourly N., (2001) Curso de Probabilidades y Estadística para profesores de matemática.
http://www.ideamas.cl/cursoProb/index.html
Molina M., (2001) La Estadística y Probabilidad en la formación de los Maestros de Educa-
ción Primaria. Jornadas europeas de la estadística.
http://www.caib.es/ibae/esdeveniment/jornades_10_01/doc/Art.Est_y_Prob..doc
Moreno A., Vallecilos A., La inferencia estadística básica en la enseñanza secundaria.
Schwarz C., (1997) StatVillage: Una ciudad hipotética, accesible a través de la web, ba-
sada en datos reales para su uso en clases introductorias de muestreo. Journal of Sta-
tistics Education v.5, n.2
Talens I., Unidad Didáctica: Probabilidad y Estadística. Elaboración de una Unidad Didácti-
ca desde la perspectiva intercultural.
http://www.cnice.mecd.es/interculturanet/archivos/ud_pb_es.doc

Selección de lecturas

S-ar putea să vă placă și