Sunteți pe pagina 1din 11

Texto: Numerical predictors of arithmetic success in grades 1–6

Predictores numéricos de éxito aritmético en grados 1-6

Ian M. Lyons, Gavin R. Price, Anniek Vaessen, Leo Blomert y Daniel Ansari (2014)

Abstract
Las matemáticas se basan en el dominio y la integración de una amplia gama de procesos y conceptos
numéricos más simples. El trabajo reciente ha identificado varias competencias numéricas que predicen
la variación en la capacidad matemática. Examinamos las relaciones únicas entre ocho habilidades
numéricas básicas y la capacidad aritmética temprana en una muestra grande (N = 1391) de niños en los
1
grados 1-6. En los grados 1-2, la capacidad de los niños para juzgar la magnitud relativa de los símbolos
numéricos fue más predictiva de las primeras habilidades aritméticas. La contribución única de la
capacidad de los niños para evaluar la ordinalidad en símbolos numéricos aumentó constantemente en
todos los grados, superando a todos los demás predictores para el 6. No se encontraron pruebas de que
la capacidad de los niños para juzgar la magnitud relativa de los números aproximados y no simbólicos
sea un factor predictivo exclusivo de la capacidad aritmética en cualquier grado. En general, el
procesamiento de números simbólicos fue más predictivo de la habilidad aritmética que el procesamiento
de números no simbólicos, aunque la importancia relativa de la capacidad del número simbólico parece
pasar del procesamiento cardinal al ordinal.

Introducción

La matemática, al ser una habilidad compleja, se basa en el dominio y la integración de una amplia gama
de hechos y conceptos numéricos más simples, tanto innatas como adquiridos (Butterworth, 1999;
Dehaene, 1997; Geary, 2013). Por lo tanto, es crucial tanto por razones prácticas como teóricas
identificar las habilidades básicas que son más predictivas del éxito en matemáticas durante los primeros
años escolares. La investigación reciente ha identificado una gama de competencias numéricas básicas
(por ejemplo, determinar cuál de dos cantidades es numéricamente más grande, véase también la Tabla
1) que predicen las diferencias individuales en las habilidades matemáticas (Bonny & Lourenco, 2013;
Booth & Siegler, 2006, 2008; Castronovo & Göbel, 2012; De Smedt, Verschaffel & Ghesquiére, 2009;
Desoete, Ceulemans, De Weerdt & Pieters, 2012; Durand, Hulme, Larkin & Snowling, 2005; Fuhs &
McNeil, 2013; Geary, Hoard, Nugent & Bailey, 2013; Gilmore, McCarthy y Spelke, 2010; Gunderson,
Ramirez, Beilock & Levine, 2012; Halberda, Mazzocco y Feigenson, 2008; Halberda, Ly, Wilmer, Naiman
y Germine, 2012; Holloway & Ansari, 2009; Kolkman, Kroesbergen y Leseman, 2013; Jordan, Kaplan,
Ramineni y Locuniak, 2009; Jordan, Glutting y Ramineni, 2010; Libertus, Feigenson y Halberda, 2011;
Libertus, Odic y Halberda, 2012; Libertus, Feigenson y Halberda, 2013; Lonnemanna, Linkersdörfera,
Hasselhorna y Lindberg, 2011; Lourenco, Bonny, Fernandez & Rao, 2012; Lyons y Beilock, 2011;
Mazzocco, Feigenson y Halberda, 2011a, 2011b; Mundy y Gilmore, 2009; Piazza, Facoetti, Trussardi,
Berteletti, Conte, Lucangeli, Dehaene y Zorzi, 2010; Price, Palmer, Battista & Ansari, 2012; Reeve,
Reynolds, Humberstone & Butterworth, 2012; Reigosa-Crespo, Valdés-Sosa, Butterworth, Estévez,
Rodríguez, Santos, Torres, Suárez y Lage, 2012; Sasanguie, De Smedt, Defever y Reynvoet, 2012;
Sasanguie, Göbel, Moll, Smets y Reynvoet, 2013b; Sasanguie, Defever, Maertens & Reynvoet, 2013a).
El descubrimiento de estos predictores a menudo ha sido seguido por una oleada de reclamos y
reconvenciones con respecto a su importancia relativa y primacía.
Tal divergencia y contradicción en la literatura actual puede deberse al hecho de que la importancia
relativa de los diferentes predictores varía en función de cuándo se evalúan en el desarrollo. Por
ejemplo, una habilidad puede ser de particular importancia cuando los niños aprenden por primera vez
los datos de suma en primer y segundo grado, mientras que en los años subsiguientes, otras habilidades
pueden ser más importantes para consolidar y vincular estos hechos con uno más de una comprensión
matemática más madura y más aritmética. La mayoría de los estudios previos se han centrado en
intervalos de edad relativamente limitados o en solo una o dos habilidades numéricas básicas, lo que
lleva a un mosaico incipiente de resultados de diferentes edades, medidas y tamaños de muestra. El
problema se complica aún más por el hecho de que muchas de estas habilidades básicas tienden a estar
fuertemente relacionadas entre sí, y los estudios han diferido sobre si evaluaron la contribución única de
una habilidad determinada.
Para proporcionar una investigación sistemática del papel de las habilidades numéricas básicas en la
competencia aritmética de los niños, evaluamos el rendimiento de los niños en ocho tareas numéricas
básicas diferentes y tres tareas de control no numérico que se han identificado como predictivas de las
habilidades aritméticas tempranas de los niños (ver Tabla 1 para el resumen resumen de tareas).
2
Recolectamos datos de 1391 niños en grados 1-6 (> 200 niños en cada grado). Este enfoque nos
permitió evaluar las contribuciones únicas de cada habilidad numérica básica dentro de cada grado, así
como en los seis niveles de educación. Nuestro objetivo fue caracterizar tanto el bosque como los
árboles al examinar la importancia relativa, en diferentes puntos temporales del desarrollo, de una serie
de habilidades numéricas básicas para la educación matemática temprana. Además, al centrarnos en
contribuciones únicas (en lugar de cero) al rendimiento aritmético, podemos identificar los bloques de
construcción numéricos verdaderamente fundamentales de la matemática temprana, en lugar de
simplemente destacar predictores relativamente incidentales que no guardan ninguna relación específica
con la habilidad matemática temprana.

Tabla 1 Las tareas recopiladas y una breve descripción de cada una

Tarea Breve descripción

Aritmética Medición estandarizada de la capacidad aritmética mental (suma y resta).

Conteo Conteo de objetos lo más rápido y preciso posible

Comparación de punto Comparar dos matrices de puntos para determinar cuál contiene más puntos
(Dotcomp)

Estimación de la Dar una estimación verbal (simbólica) del número de puntos en una matriz
cantidad de punto brevemente presentada
(DotEst)

Comparación numérica Comparar dos números simbólicos para determinar cuál representa la mayor
(NumComp) cantidad

Estimación de la línea Marcar en una línea horizontal etiquetada 0-100 donde debe caer un número
numérica simbólico
(NumLine)

Orden numérico Determinar si tres números simbólicos están en orden numérico creciente
(NumOrd) (izquierda-derecha)

Objeto de coincidencia Determina cuál de los dos conjuntos de objetos domésticos coincide con el número
(ObjtMatch) de objetos en un tercer conjunto (los conjuntos varían en la composición del objeto;
se permite el recuento)

Correspondencia Determina si una palabra de un número hablado y un número arábigo coinciden


visual-audio
(VisAud)

Ravens Medición estandarizada de razonamiento no verbal (espacial) /IQ

Lectura Medición estandarizada de la capacidad de lectura (holandesa)


(Reading)

Procesamiento básico Presione una de las cuatro casillas marcadas lo más rápido posible
de estímulo-respuesta
(StimResp)

Métodos
3
Participantes

El protocolo de recopilación de datos fue aprobado por la junta de revisión ética de la Universidad de
Maastricht. Se recogieron datos de 1463 niños holandeses en grados 1-6. El rendimiento casual es difícil
de interpretar, por lo que eliminamos a los niños que tuvieron suerte en cualquiera de las tareas para las
cuales se podía definir el azar (> 49% tasa de error en cualquiera de las tareas numéricas binarias de
elección forzada: NumComp, DotComp, NumOrd, VisAud, ObjMatch;> 24% tasa de error en la tarea de
cuatro opciones StimResp). Esto eliminó 37 niños del análisis (2.53%). Para eliminar valores atípicos,
verificamos si el puntaje de un niño en una tarea determinada era más o menos de 4 desviaciones
estándar de la media para esa tarea en ese grado. Si este fuera el caso en cualquier tarea, el niño fue
eliminado de un análisis posterior. Esto eliminó a 35 niños adicionales del análisis (2.39%). En resumen,
72 niños (4.92%) fueron eliminados del conjunto de datos. El tamaño total de la muestra final fue N =
1391 (722 mujeres); grado 1 n = 208 (97 mujeres), grado 2 n = 201 (104 mujeres), grado 3 n = 253 (133
mujeres), grado 4 n = 252 (134 mujeres), grado 5 n = 241 (126 mujeres), grado 6 n = 236 (128 mujeres).

Procedimiento

Los niños provenían de siete escuelas primarias diferentes en los Países Bajos. Los padres pueden
negar el consentimiento devolviendo el formulario apropiado. Los trabajadores capacitados del proyecto
administraron todas las medidas cognitivas a cada niño por separado en una habitación silenciosa en la
escuela. Todos los datos fueron recolectados en una sesión para los grados 1-2, 5-6; los datos se
recolectaron en dos sesiones que nunca se separaron más de 5 días para los grados 3-4.
Las pruebas de inteligencia no verbal (Ravens) y de rendimiento matemático (Tempo Test
Automatiseren, TTA) fueron pruebas de papel y lápiz. Todas las otras medidas cognitivas fueron
computarizadas. En todas las tareas, se instruyó a los niños a responder de la manera más rápida y
precisa posible. Se realizaron varios ensayos de práctica (3-6) para cada una de las tareas numéricas.
No se dieron comentarios para ninguna de las tareas durante los principales ensayos experimentales.
La lectura, Ravens y la aritmética se puntuaron como la cantidad total de elementos correctamente
completados. Consulte la sección de Calificación de tareas a continuación para obtener detalles sobre
las tareas restantes.

Tareas

Aritmética mental (Aritmética)

La tarea de Aritmética se operacionalizó utilizando TempoTest Automatiseren (TTA) estandarizado de la


capacidad aritmética básica (De Vos, 2010). Se administraron hojas de trabajo con 50 operaciones de
suma y 50 restas a niños de todos los grados. Los niños fueron instruidos para calcular mentalmente
tantas operaciones como sea posible dentro de los 2 minutos por hoja de trabajo. Los puntajes
aritméticos fueron la cantidad total de problemas correctamente respondidos en ambas hojas de trabajo.
La confiabilidad reportada para esta tarea es alta (.92; Janssen, Verhelst, Engelen y Scheltens, 2010).

Orden numérico (NumOrd)

En la tarea Orden numérico, los niños vieron tres números presentados horizontalmente como números
arábigos. La mitad del tiempo, los tres números estaban en orden numérico creciente (izquierda-
derecha). En los ensayos restantes, los números estaban en orden descendente o mixto. Los niños
fueron instruidos para presionar un botón con su mano izquierda si todos los números aumentaban ('en
4
orden') o un botón con su mano derecha si no estaban ('no en orden'). Los estímulos permanecieron en
la pantalla hasta que el niño respondió. Hubo 28 pruebas de un dígito y 28 pruebas de dos dígitos. Las
distancias entre los números se dividieron aproximadamente de manera uniforme entre los ensayos en
distancias de 1-3, donde la distancia absoluta siempre fue simétrica alrededor del número mediano y la
distancia para un ensayo dado se calculó como (max -min) / 2. Tenga en cuenta que los alumnos de
primer grado solo realizaron pruebas de un dígito; los resultados fueron muy similares si excluimos los
ensayos de dos dígitos en puntajes Orden numérico para los niños en los grados 2-6. La confiabilidad en
esta tarea fue alta, tanto para pruebas de un dígito (a = .938) como de dos dígitos (a = .960).

Comparación numérica (NumComp)

En la tarea Comparación numérica, los niños vieron dos números presentados horizontalmente como
números arábigos, y su tarea era decidir qué número representaba la cantidad más grande. Los niños
vieron 64 ensayos, 32 de los cuales fueron un dígito y 32 de los cuales fueron de dos dígitos. Para
ambos tamaños, los cocientes (R = min / max) cayeron en uno de 4 rangos: R ≤ .5, R = .5, .5 <R <.7, R ≥
.7, con ocho ensayos en cada rango en cada tamaño (uno versus dos dígitos). Los estímulos
permanecieron en la pantalla hasta que el niño respondió. La confiabilidad en esta tarea fue alta: a =
.977.

Comparación de punto (DotComp)

En la tarea Comparación de punto, los niños vieron dos conjuntos de puntos, uno a cada lado de la
pantalla, y su tarea era decidir qué matriz contenía más puntos. Las cantidades y ratios utilizados fueron
los mismos que los de la tarea Comparación numérica. Los estímulos permanecieron en la pantalla hasta
que el niño respondió (tenga en cuenta que las relaciones fuertes entre el rendimiento en esta tarea y la
capacidad matemática se han informado anteriormente al permitir respuestas a su propio ritmo, por
ejemplo, Piazza et al., 2010). La confiabilidad en esta tarea fue alta: a = .955.
Debido a restricciones geométricas, dentro de una prueba determinada, todas las versiones de una tarea
de comparación de puntos permitirán al menos algunos parámetros no numéricos (como área, perímetro,
densidad, etc.) covariar con el número. Este problema se ve agravado por el hecho de que los
participantes cambian los parámetros de los que dependen de una prueba a otra (Gebuis y Reynvo et,
2012), y que existe una relación lineal entre el número de parámetros incongruentes o congruentes con
el número y la magnitud de la efecto de congruencia Por lo tanto, los paradigmas que se basan
exclusivamente en cambiar la congruencia de los parámetros con el número entre los ensayos pueden
fallar en desviar a los participantes de confiar en parámetros no numéricos. En el conjunto de datos
actual, el área total y el tamaño de punto individual promedio siempre fueron incongruentes con el
número (el conjunto con menos puntos tenía un área total mayor y un tamaño de punto promedio mayor;
los tamaños de punto individuales variaban aleatoriamente). En otras palabras, la estrategia no numérica
disponible en nuestro estudio fue la más difícil porque confiar en ella obligaría a los niños a centrarse
esencialmente en variables no numéricas que eran incongruentes con el objetivo de la tarea. Por lo
tanto, nuestro paradigma se basó en la suposición de que los niños confiarían más en el parámetro
relevante (numerosidad) que era congruente con el objetivo de la tarea (identificar el conjunto
numéricamente más grande) que el que era incongruente (área total más pequeña y / o tamaño
individual ) Vimos esta suposición como menos problemática que la suposición (demostrada como
altamente cuestionable por Gebuis y Reynvoet) de que los participantes no cambiarían los parámetros
entre los ensayos.
Tenga en cuenta también que el trabajo reciente ha demostrado que el rendimiento en ensayos de
comparación de puntos donde el área general y el tamaño medio de puntos individuales son
incongruentes con el número (como fue el caso en nuestro estudio) es más predictivo del rendimiento
5
matemático que los ensayos congruentes (Gilmore, Attridge, Clayton, Cragg, Johnson, Marlow, Simms &
Inglis, 2013). Esto puede haber contribuido al efecto de orden cero relativamente grande que
observamos entre Comparación de punto y Aritmética (Tabla 3; tenga en cuenta que esta relación se
mantuvo altamente significativa incluso después de controlar los factores no numéricos, Ravens,
Reading, StimResp, Age: p <.001); sin embargo, no está claro cómo explica el resultado nulo observado
cuando se controlan los factores numéricos (cuadros 5-6, figura 1).

Objeto de coincidencia (ObjMatch)

En la tarea Objeto de coincidencia, a los niños se les mostró una matriz de muestra de objetos comunes
(varios animales y trozos de fruta) y dos matrices de prueba de objetos debajo de la matriz de muestra.
La tarea de los niños era determinar si la matriz de prueba izquierda o derecha contenía la misma
cantidad de objetos que la matriz de muestra. Los niños vieron 45 ensayos en total. En 15 ensayos,
todos los objetos en todas las matrices fueron iguales. En 15 ensayos, cada una de las tres matrices
contenía diferentes tipos de objetos, pero los objetos dentro de una matriz dada eran todos iguales. En
15 ensayos, todas las matrices contenían una mezcla de tipos de objetos. El número de objetos en las
matrices varió de 1 a 6, y la distancia numérica absoluta entre las dos matrices de prueba fue de 1 o 2.
Los estímulos permanecieron en la pantalla hasta que el niño respondió. La confiabilidad en esta tarea
fue alta: a = .956.

Conteo (conteo)

En la tarea de conteo, los niños vieron entre 1 y 9 puntos, y su tarea era contar la cantidad de puntos en
la pantalla de la manera más rápida y precisa posible. A los niños se les dieron cinco ensayos por cada
cantidad. Los ensayos se calificaron como correctos solo si la respuesta del niño era exactamente
correcta. El experimentador recogió las respuestas verbales por escrito. Los tiempos de respuesta se
estimaron haciendo que el niño presionara un botón mientras daba su respuesta verbal. La confiabilidad
en esta tarea fue alta: a = .946.

Estimación de la línea numérica (NumLine)

En la tarea Estimación de la línea numérica, a los niños se les mostró una línea horizontal marcada como
0 en el extremo izquierdo y 100 en el extremo derecho. En cada prueba, se les mostró un número
arábigo (presentado centralmente por encima de la recta numérica) en el rango 3-96 (el número se
presentó verbalmente al mismo tiempo a través de un par de auriculares). La tarea de los niños consistía
en hacer clic (con un mouse de computadora) en la recta numérica donde pensaban que el número
objetivo debía ubicarse en términos de la cantidad relativa que representaba. Los estímulos
permanecieron en la pantalla hasta que el niño respondió. Los niños vieron 26 ensayos en total. La
confiabilidad en esta tarea fue alta: a = .940.

Estimación de la cantidad de puntos (DotEst)

En la tarea Estimación de cantidad de puntos, a los niños se les mostró una única matriz de puntos
presentada demasiado rápido (750 mseg) para que los puntos se contaran individualmente, a lo que
siguió una máscara visual. La máscara permaneció en la pantalla hasta que el niño respondió. La tarea
de los niños fue estimar el número de puntos en la matriz dando una respuesta verbal. Estas respuestas
fueron registradas manualmente por el experimentador. Los niños completaron un total de 84 ensayos
(12 cada uno para las cantidades 1-4, 7, 11, 16). Tenga en cuenta que si solo se usaron ensayos con los
6
valores objetivo 4, 7, 11 y 16, los resultados fueron muy similares. La confiabilidad en esta tarea era
buena: a = .824.

Correspondencia Visual-audio (VisAud)

En la tarea Correspondencia visual-audio, los niños escucharon una palabra numérica pronunciada en
voz alta e inmediatamente después vieron un número arábigo en la pantalla. Tenga en cuenta que
aunque esta tarea no tiene precedentes importantes en la literatura de cognición numérica, la integración
audiovisual ha demostrado ser muy importante en la adquisición de otra habilidad compleja mediada
simbólicamente: la lectura (Blomert, 2011; Blomert y Froyen, 2010). La tarea de los niños era determinar
si el número y la palabra del número hablado eran la misma cantidad (al presionar uno de los dos
botones, el izquierdo indicaba "igual" y el derecho indicaba "diferente"). Los estímulos permanecieron en
la pantalla hasta que el niño respondió. Los niños completaron 64 ensayos, 32 en el rango de un dígito y
32 en el rango de dos dígitos. En los casos que no coinciden, ambos números estuvieron dentro de la
misma década. La relación entre los números en los casos que no coinciden oscila entre .25 y .89. La
confiabilidad en esta tarea fue alta: a = .973.

Inteligencia no verbal (Ravens)

La tarea de Ravens comprendía una batería de matrices progresivas de colores. Este es un examen de
razonamiento visuoespacial, no programado, a tiempo para niños (Raven, Court & Raven, 1995). Los
niños vieron un patrón de color y se les pidió que seleccionen la pieza que falta entre las seis opciones.
Los niños completaron 36 artículos; el puntaje de un niño fue la cantidad total de elementos
correctamente completados. Para la versión holandesa de esta tarea, Van Bon (1986) informó
confiabilidades de .80 o más.

Capacidad de lectura (Lectura)

La tarea de Lectura formó parte de la batería Normed Maastricht Dyslexia Differential Diagnosis (Blomert
& Vaessen, 2009) y constaba de tres subtareas. Las subtareas contenían palabras de alta frecuencia,
palabras de baja frecuencia o pseudopalabras. En cada subtarea, los participantes vieron una serie de
hasta cinco pantallas (avanzadas por el experimentador), cada una con hasta 15 elementos (75 artículos
en total por tarea). La tarea de los niños consistía en leer cada elemento en voz alta lo más rápido y
preciso posible. Un experimentador marcó manualmente la precisión de cada elemento. El puntaje de un
niño en una subtarea fue la cantidad total de elementos correctamente leídos en 30 segundos. Las
puntuaciones en las tres subtareas se sumaron para formar el puntaje final de lectura de un niño. La
confiabilidad de test-retest reportada para esta tarea es alta (.95; Blomert y Vaessen, 2009).
Procesamiento básico de estímulo-respuesta (StimResp)

En la tarea Procesamiento básico de estímulo-respuesta, los niños vieron cuatro cuadros dispuestos
horizontalmente en la pantalla. En cada uno de los 20 ensayos, apareció un pez en una de las cuatro
cajas. La tarea de los niños fue presionar la tecla correspondiente en el cuadro de respuestas de la
forma más rápida y precisa posible. Tenga en cuenta que el rendimiento aleatorio en esta tarea fue del
25% de errores, en comparación con el 50% de errores en las diversas tareas de respuesta binaria
descritas anteriormente. Los estímulos permanecieron en la pantalla hasta que el niño respondió. La
confiabilidad en esta tarea fue alta: a = .944.

Puntuación de la tarea
7
Nuestro objetivo fue evaluar sistemáticamente el poder predictivo único de nuestras tareas como
predictores simultáneos en un modelo de regresión múltiple. Para garantizar la compatibilidad, utilizamos
una medida de rendimiento que era común para la mayor cantidad posible de tareas. Para las tareas
NumComp, DotComp, NumOrd, VisAud, ObjMatch, Counting y StimResp, usamos un compuesto de
tasas de error y tiempos de reacción (solo pruebas correctas). La combinación de medidas proporcionó
una imagen más completa del rendimiento general en cada tarea, redujo el número de modelos y las
pruebas estadísticas necesarias para el análisis como un todo, reduciendo así el riesgo de falsos
positivos, y controlaba implícitamente cualquier variación en la velocidad. compensaciones de precisión
entre tareas. Las medidas se combinaron de acuerdo con la fórmula: P = RT (1 + 2ER), donde un valor
más alto indica un peor rendimiento. Las tasas de error se multiplicaron por 2 porque la mayoría de las
tareas eran de elección forzada binaria (ER = .5 indica probabilidad). Básicamente, se puede interpretar
esta medida como tiempos de reacción (mseg) después de haber sido penalizados por un rendimiento
inexacto. La escala se ejecuta entre el tiempo de respuesta promedio actual de un niño (donde P = RT)
para un rendimiento perfectamente preciso (0% de errores) y el doble de ese valor (P = 2RT) para el
rendimiento aleatorio (50% de errores). Tenga en cuenta que este método es bastante similar a la
eficiencia inversa (I = RT / Precisión), con la excepción de que la precisión no está ponderada en el caso
de la eficiencia inversa (los cambios en las tasas de precisión conducen a un mayor cambio en I las
tasas de precisión ) Además, no optamos por estandarizar RT y ER y promediarlos por la sencilla razón
de que el método adoptado aquí preserva las tendencias de desarrollo y las diferencias entre las tareas
de una manera ligeramente más transparente (ver, por ejemplo, la Tabla 2). Como la medida
dependiente (Aritmética) se calificó con un valor más alto que indica mejor rendimiento, para facilitar la
interpretación, las puntuaciones de rendimiento (P) se multiplicaron por -1 antes de entrar en análisis de
regresión, de modo que una relación positiva significaba un mejor rendimiento en una determinada
medida se relacionó con un mejor rendimiento aritmético. Para las tareas donde se utilizó una medida
compuesta, los tiempos medios de respuesta y las tasas de error se pueden encontrar en la Información
de soporte (Tabla S1).
Estimación de punto y Línea numérica involucraron muchos ensayos en los que se espera que las
respuestas correctas sean bastante raras, lo que hace que las tasas de error tradicionales sean
esencialmente imposibles de interpretar. En cambio, usamos el porcentaje de errores absolutos: PAE
[Est- Target]/Scale, donde Est es la estimación del niño, Target es el número objetivo y Scale es la
escala o el rango de los números objetivo. Para la tarea Línea numérica, Scale fue 100, y para DotEst
fue 16. Para un niño determinado, los puntajes finales se calcularon promediando en todos los ensayos,
con un número más alto que indica un peor rendimiento. Como la medida dependiente (Aritmética) se
calificó con un valor más alto que indica mejor rendimiento, las puntuaciones Estimación de punto y
Línea numérica se multiplicaron por -1 antes de entrar en los análisis de regresión, de modo que una
relación positiva significaba que un mejor rendimiento se relacionaba con un mejor rendimiento
aritmético.
Edad

Para controlar la variación de edad dentro de cada grado, se incluyó la edad de cada niño (años
fraccionarios, expresados en ciclos anuales reales desde el cumpleaños del niño hasta la fecha del
examen) como un predictor en el modelo. Evaluamos la edad dentro de cada grado para eliminar la
correlación entre la edad y el grado y al mismo tiempo preservar la variación de edad dentro de cada
grado.

Confiabilidad

La confiabilidad para las tareas numéricas se calculó en todos los grados (N = 1391) utilizando todos los
8
ensayos en una tarea determinada a través de a de Cronbach. Para las tareas en las que utilizamos una
medida compuesta, la confiabilidad se calculó sobre puntajes compuestos, de modo que los tiempos de
respuesta se duplicaron para los ensayos en los que un niño cometió un error.

Resultados

La Tabla 2 muestra los niveles medios de rendimiento para cada una de las medidas que se ingresaron
en el modelo de regresión inicial (estas se computan antes de invertir (-1x) variables relevantes, por lo
tanto, un número mayor indica un peor rendimiento, con la excepción de Aritmética, Lectura y Cuervos).
Tenga en cuenta que hubo un efecto significativo de Grade para cada variable (todos los ps <.001), de
modo que el rendimiento mejoró a medida que aumentaba el grado. La fila inferior de la Tabla 2 muestra
la edad promedio para cada grado. La Tabla 3 muestra las correlaciones de orden cero entre cada
predicción continua y las puntuaciones de Aritmética, que se muestran tanto para la muestra en general
(N = 1391) como para la calificación previa por separado. Dado el gran tamaño de la muestra, muchos
de los valores de p son infinitamente pequeños; por lo tanto, los tamaños de efecto (ds de Cohen)
también se dan en la Tabla 3. (Para correlaciones entre tareas numéricas, ver Información de apoyo,
Tabla S2).

Selección de modelo

Utilizamos el rendimiento en las ocho tareas numéricas básicas y tres tareas no numéricas para predecir
los puntajes aritméticos. La edad (centrada en la media dentro de cada grado) se incluyó como una
medida de control. También evaluamos si cada uno de estos 12 predictores interactuaron con Grado (6
niveles: 1-6). Los términos de interacción fueron probados para efectos de desarrollo al preguntar si la
pendiente de la relación entre el rendimiento en una determinada tarea (o edad) y el rendimiento
aritmético varió en función del Grado, controlando todos los demás efectos. Esto arrojó un conjunto
inicial de 25 predictores (12 efectos principales continuos, 1 efecto principal discreto (Grado) y 12
términos por los cuales cada predictor continuo interactuó con Grado). Nuestro objetivo fue una
estimación imparcial de la varianza aritmética única que representa cada predictor, por lo que
comenzamos por incluir los 25 predictores en el modelo inicial y luego trabajamos hacia atrás en forma
gradual para encontrar un ajuste modelo más parsimonioso. Modelo inicial ajustado R2 (R2) fue alto en
.8058; para evitar el sobreajuste, eliminamos el predictor menos significativo del modelo de forma
escalonada hasta que todos los predictores fueron al menos significativos (p <.05). (Consulte la Tabla 4
para obtener detalles sobre el proceso de reducción del modelo). La reducción del modelo dio como
resultado la eliminación completa de la comparación de puntos, el emparejamiento visual-audio, el
procesamiento estímulo-respuesta y una disminución de solo.0009 del (R)2 inicial. Tenga en cuenta que
el último predictor eliminado fue el efecto principal de la comparación de puntos. Debido al gran interés
en esta tarea generado en la literatura reciente, elegimos retener este predictor en el modelo final (el final
(R)2 se redujo en .0008 desde el ajuste inicial del modelo). El modelo final se resume en la Tabla 5.
Ocho de los 12 términos de interacción se eliminaron del modelo inicial. Las cuatro tareas que mostraron
una interacción con Grade fueron todas las tareas de procesamiento de números. Para examinar las
tendencias de desarrollo, evaluamos la capacidad predictiva única de los 10 prospectos continuos
retenidos en el modelo final (ver Tabla 5) en Aritmética en cada grado (es decir, se ejecutó un modelo de
regresión múltiple por separado en cada grado). Las correlaciones parciales (y las correspondientes ds
de Cohen) se muestran en la Tabla 5. Los tamaños de efecto únicos en todos los grados para las siete
tareas numéricas en el modelo final se representan en la Figura 1.

Comparación de punto (Dot-comparison)


9
Se puede argumentar que incluir las tareas DotEst y ObjMatch en el modelo nos sesgó hacia un efecto
nulo para la tarea DotComp porque las tres tareas representan la representación aproximada, no
simbólica de la numerosidad. Primero, cabe señalar que también incluimos varias características
simbólicas número de tareas, y sin embargo, la tarea NumComp (y varias otras tareas simbólicas)
mostraron una varianza predictiva única. Esto implica que la objeción es en sí misma parcial. No
obstante, volvimos a ejecutar el proceso de selección del modelo, pero esta vez omitimos las tareas
DotEst y ObjMatch (y sus términos de interacción correspondientes) si esto mejoraba la capacidad
predictiva única de la tarea DotComp. No lo hizo. En este caso, la tarea DotComp fue de hecho el primer
predictor eliminado durante la selección del modelo (p = .626; Grado 9 DotComp: p = .447). La
eliminación de DotComp y el correspondiente término de interacción aumentó ligeramente en todo el
ajuste del modelo (R)2 = .79933 o (R)2 = .79941. La contribución única de DotComp no fue significativa
en ningún grado (todos los ps> .15). Por lo tanto, la falla de la tarea DotComp, una tarea rutinariamente
utilizada para estimar la agudeza numérica aproximada, para predecir la varianza única en la capacidad
aritmética no puede atribuirse al hecho de que otras dos tareas (DotEst y ObjMatch) incluidas en el
modelo inicial también involucren números no simbólicos tratamiento. En una nota similar, los resultados
de la tarea de DotComp no fueron significativos incluso si eliminamos Num-Comp -que, aunque
simbólico, comparte al menos el aspecto de comparación de la cantidad con la tarea DotComp: del
modelo inicial. En resumen, incluso un enfoque diseñado para maximizar la influencia predictiva
potencial de la tarea DotComp no revela evidencia de que prediga una variación única en el rendimiento
aritmético de los niños. Además, para la tarea DotComp, si usamos solo tasas de error (en lugar de la
medida combinada de rendimiento) los resultados para esa tarea fueron más débiles: la significación de
la calificación parcial (ya no significativa) se redujo en cada grado. Esto es importante porque,
típicamente, solo las tasas de error de la tarea DotComp se usan para estimar la agudeza numérica
aproximada (obsérvese también que las tasas medias de error están altamente correlacionadas con esta
medida de la ecuación aproximada; Sasanguie et al., 2012; Szucs, Nobes, Devine, Gabriel y Gebuis,
2013; Inglis y Gilmore, 2013). En resumen, cómo calculamos el rendimiento en la tarea de DotComp es
poco probable que explique la falta de una relación única entre DotComp y Aritmética.

Correspondencia Visual-audio

Aplicando una lógica similar a la de la tarea DotComp, probamos si la tarea VisuAud sería rechazada del
modelo final, incluso si no incluimos otras tareas que también incluían la presentación visual de números
simbólicos (tareas NumComp, NumOrd, NumLine). VisAud obtuvo al menos un significado marginal (p =
.076) en el modelo final solo cuando se omitió NumOrd del modelo inicial, lo que indica que fue
rechazado del modelo en la Tabla 5 debido a la alta colinealidad con la tarea NumOrd (ver también
Información de Soporte) Tabla S2).
Discusión

Los resultados actuales muestran que el procesamiento de números simbólicos básicos representa la
mayoría de la varianza única en la capacidad aritmética de los niños en los grados 1-6, y que la
naturaleza de esta relación cambia dinámicamente en todos los grados. Las cinco tareas que mostraron
una interacción significativa con el grado fueron todas las tareas de procesamiento numérico
(ordenamiento numeral, concordancia de grupos de objetos, estimación de líneas numéricas, recuento,
estimación de puntos). La Figura 1 muestra que la estimación de la recta numérica fue un fuerte predictor
único de la capacidad aritmética en las graduaciones tempranas (1-2), aunque esta cayó desde el grado
3 en adelante. Un examen de la Tabla 6 muestra que la comparación numérica también fue un fuerte
predictor de Aritmética en los grados 1-2. De acuerdo con trabajos anteriores (Booth & Siegler, 2006,
10
2008; Castronovo y Gobel, 2012; De Smedt y otros, 2009; Desoete et al., 2012; Durand et al., 2005;
Gilmore et al., 2010; Gunderson et al., 2012; Holloway y Ansari, 2009; Jordan et al., 2009, 2010;
Kolkman et al., 2013; Lonnemanna et al., 2011; Mundy y Gilmore, 2009; Reeve et al., 2012; Reigosa -
Crespo et al., 2012; Sasanguie et al., 2012, 2013b), nuestros resultados indican que se evalúa la
magnitud relativa de los números simbólicos, tanto al compararlos directamente entre sí como al
mapearlos en una línea numérica visuoespacial. - es quizás la capacidad numérica básica más
importante en las primeras etapas de aprendizaje de habilidades aritméticas.
Por el contrario, el ordenamiento de los números, aunque es un pobre predictor de la capacidad
aritmética en el grado 1, mostró un aumento constante en la capacidad predictiva única hasta el 6 °
grado, punto en el que fue el más fuerte entre todos los predictores. Esta es la primera demostración de
que la capacidad simbólica de ordenar números es altamente predictiva de habilidades matemáticas más
complejas en los niños, y es consistente con el trabajo previo que muestra que el rendimiento en esta
tarea es un fuerte predictor de la capacidad aritmética mental compleja en adultos (Lyons & Beilock,
2011 ) A medida que el sistema numérico simbólico madura, es posible que el dominio de las habilidades
aritméticas básicas dependa cada vez más del acceso a la información ordinal en símbolos numéricos en
oposición a la información sobre la magnitud relativa (es decir, cardinalidad). Tenga en cuenta que es
poco probable que este cambio de procesamiento cardinal a ordinal se deba al hecho de que la tarea
Orden numérico fue simplemente más difícil que la tarea Comparación numérica. En primer lugar, Orden
numérico no fue la tarea más difícil en ningún grado (ver Tabla 2), y se convirtió en un predictor más
sólido incluso cuando el rendimiento general estaba mejorando. En segundo lugar, si la tarea Orden
numérico fuera más difícil por razones ajenas al procesamiento numérico (por ejemplo, porque se refería
a factores generales del dominio como memoria de trabajo o velocidad de procesamiento básica), el
control de Ravens y StimResp debería haber eliminado la relación entre Orden numérico y Aritmética.
Curiosamente, en los grados 3 a 5, es difícil identificar cualquier habilidad numérica básica que supere a
las demás. Una posibilidad de acuerdo con una sugerencia hecha por Kolkman et al. (2013) es que las
habilidades numéricas básicas están pasando por una especie de proceso de consolidación en este
punto. Es posible que las habilidades básicas dispares se realineen para apoyar un sentido más amplio
de comprensión matemática. Un resultado crítico del presente estudio es que el rendimiento de
Compración de punto (DotComp) no predijo la varianza aritmética única, ya sea al considerar los seis
grados a la vez (N = 1391, ver Tabla 5), o en cualquiera de los grados individuales (Tabla 6). Esto es
importante porque muchos estudios han demostrado que el rendimiento en las tareas de DotComp de
uno que administramos aquí es predictivo de diversas habilidades matemáticas (Bonny & Lourenco,
2013; Desoete et al., 2012; Gilmore et al., 2010; Halberda et al, 2008, 2012; Libertus et al., 2011, 2012,
2013; Lonnemanna et al., 2011; Lourenco et al., 2012; Lyons & Beilock, 2011; Mazzocco et al., 2011a,
2011b; Piazza et al, 2010). Ninguno de esos estudios controlaba el rango de otros factores numéricos y
no numéricos básicos que hacemos aquí; Además, solo un estudio consideró una muestra más grande
(Halberda et al., 2012), y ese estudio controló solo el autoreporte de CI general. Vale la pena señalar,
entonces, que las correlaciones de orden cero en la Tabla 2 muestran una relación significativa entre la
comparación de puntos y la aritmética mental en la mayoría de los grados en nuestra muestra. A partir
de esto, uno podría concluir, como muchos investigadores previos, que la capacidad de comparación de
punto (y, por extensión, el procesamiento aproximado del número) es de hecho un precursor importante
para el procesamiento matemático más complejo. Las correlaciones parciales en la Tabla 6 muestran
que esta conclusión es prematura. De acuerdo con el trabajo previo (Castronovo & Gobel, 2012; Fuhs &
McNeil, 2013; Holloway & Ansari, 2009; Kolkman et al., 2013; Sasanguie et al., 2012a, 2012b),
encontramos que, una vez que uno controla otras habilidades numéricas básicas, esta relación se
elimina. Además, incluso cuando las otras tareas no simbólicas relacionadas con el procesamiento
numérico aproximado (estimación de puntos y concordancia de grupos de objetos) se eliminaron del
modelo, la comparación de puntos siguió siendo un predictor no significativo de la capacidad aritmética
en todos los aspectos. Por lo tanto, nuestros resultados proporcionan una gran precaución a las
11
afirmaciones sobre la importancia del procesamiento aproximado de números para habilidades
matemáticas más complejas. Es importante tener en cuenta que nuestros datos no pueden referirse al
papel del procesamiento aproximado de números antes de la escolarización formal (aunque para
resultados similares en niños de hasta 4 años, ver Fuhs y McNeil, 2013; Kolkman et al., 2013; Sasanguie
et al., 2013a). De todos modos, al menos para la edad de aproximadamente 6-7 años, la importancia del
sistema numérico aproximado se ve ensombrecida en gran medida por otras habilidades numéricas y
cognitivas básicas. En un nivel cognitivo, esto implica que los procesos subyacentes o representaciones
involucradas en estas otras tareas numéricas están más vinculados de forma única y directa a los que
subyacen a la aritmética (en los niños de los grados 1-6). En un nivel práctico, si uno pudiera elegir solo
una o dos tareas, por ejemplo, para una batería de diagnóstico en un entorno educativo, las
correlaciones de orden cero (Tabla 3) indican que la tarea DotComp no sería una mala elección; pero en
base a los resultados de la regresión múltiple (por ejemplo, la Figura 1), otras tareas numéricas podrían
resultar más efectivas, aunque exactamente la tarea que uno podría elegir dependerá de la calificación
en cuestión.
Nuestros resultados demuestran por primera vez la relación dinámica entre las habilidades numéricas
básicas y las habilidades aritméticas tempranas en los primeros grados de primaria. Esto subraya la
importancia de considerar los cambios en el desarrollo al sacar conclusiones sobre los fundamentos
numéricos básicos de las matemáticas más complejas. Este trabajo puede ayudar a economizar y
enfocar los estudios longitudinales futuros sobre habilidades numéricas específicas y puntos de tiempo
de desarrollo para permitir inferencias causales más estrictas sobre la relación entre las habilidades
numéricas y matemáticas básicas específicas en diferentes momentos del desarrollo. Como tal, este
trabajo ofrece una perspectiva unificadora a través de la cual interpretar el panorama actual de
resultados inconexos y a veces contradictorios relacionados con los fundamentos cognitivos de la
aritmética. Este trabajo también puede ayudar a informar mejor los esfuerzos para cerrar las prácticas
educativas con la investigación cognitiva del desarrollo.

S-ar putea să vă placă și