Documente Academic
Documente Profesional
Documente Cultură
y la enseanza de lenguas
1. Introduccin
La llamada calidad de la escritura est integrada por una serie de factores, entre
los que destacan sin duda: la riqueza lxica, la madurez sintctica, los esquemas de
cohesin y la coherencia discursiva. La amplitud y variedad del vocabulario est muy
apoyado en la disponibilidad lxica del hablante, la madurez sintctica, en su grado de
entrenamiento combinatorial de oraciones simples en el discurso, los esquemas de co-
hesin y la coherencia discusiva dependen esencialmente del orden que quiera drsele
conscientemente a los elementos constitutivos del discurso.
Todo esto se aprende naturalmente desde los primeros aos de enseanza, si ha-
blamos de lengua materna, y desde el primer curso si nos referimos a segundas lenguas.
Pero para adquirir estas destrezas comunicativas se necesita un programa de enseanza
moderno y actualizado, que vaya mucho ms all de peticiones como subrayar en rojo
el sujeto de una oracin dada y en azul el predicado. Confundir la enseanza de la gra-
mtica de una lengua, con la enseanza-adquisicin de esa lengua es un grave error que,
por fortuna, va desapareciendo aunque lentamente1.
1 Hace ya casi 70 aos el germano-chileno Rudolf Lenz escribi lo siguiente: Querer aprender una
lengua por el estudio de su gramtica es como aprender a tocar el violn leyendo tratados de msica y mtodos
de violn sin tocar el instrumento, sin ejercitar los dedos, y una dcada ms tarde, Amrico Castro repeta
la idea, aunque acudiendo a otras comparaciones: Una primera confusin que conviene remover es la idea
absurda de que el idioma se ensea enseando gramtica [] La gramtica no sirve para ensear a hablar
y a escribir correctamente la lengua propia (podra aadirse que tampoco las extranjeras) lo mismo que el
estudio de la fisiologa o de la acstica no ensean a bailar o que la mecnica no ensea a montar en bicicleta
16 Humberto Lpez Morales
Un ejemplo ser suficiente para ilustrarlo. Se trata del texto de un alumno de cuar-
to grado de primaria de escuela pblica de Puerto Rico.
Aunque se puede ver de inmediato que estamos ante un texto muy deficiente y no
solo en cuanto a riqueza lxica, es asunto que ser analizado con detalle ms adelante.
Desde el punto de vista de la madurez sintctica es tambin muy pobre pues ninguna de
las 15 oraciones simples de que consta ha recibido el menor tratamiento combinatorial
del tipo La playa es muy bonita, azul y de agua salada, Nos divertimos, nos baamos
y brincamos y saltamos mucho o En la playa es bueno estar porque hace mucho fresco
y el ambiente es bueno. Aqu se trata de inhabilidad y falta de entrenamiento, no de
intencin expresa de simplificar el discurso como sello estilstico, como s es el caso de
Azorn frente a Unamuno, por ejemplo, segn han demostrado Mara Antonieta An-
din y Ana Mara Ruiz (1996) con estadsticas en la mano.
1, 2, 3, 0, 5, 0, 0, 0, 0, 9, 10, 0, 0, 0, 15 = 46,6%
Ante este resultado se estar casi convencido sin necesidad de efectuar ningn an-
lisis de que la coherencia del texto queda puesta en entredicho.
2. La Riqueza Lxica
El estudio del lxico, como es sabido, cuenta con diferentes vas de aproximacin;
las cualitativas y las cuantitativas. Dentro de las primeras caen los estudios de frecuen-
cias, los referenciales, muy unido a los campos semnticos, y los relacionales, que se
y aadira Eso es de tal vulgaridad, que avergenza tener que escribirlo una y otra vez Sin embargo, estos
deslindes entre lo terico, representado por las gramticas-reflexin, y el desarrollo de las destrezas comuni-
cativas, no han llegado a su fin, como cabra imaginar; todava se hace necesario seguir insistiendo en que la
enseanza de la gramtica terica tiene unos objetivos muy precisos que, desde luego, no son la base para la
adquisicin de estrategias y habilidades que permitan expresarse satisfactoriamente y comunicarnos con xito.
Vid. Lpez Morales (1984).
Los ndices de riqueza lxica y la enseanza de lenguas 17
La norma lexicolgica debe dar reglas para delimitar la palabra y el vocablo. Por
lo general se adopta la solucin de sentido comn que rige a los diccionarios, a pesar
de las objeciones lingsticas que se podran formular. De esta manera se obtienen los
ndices de formas, que indican las ocurrencias de las palabras, es decir, las caractersticas
estadsticas de las entradas, el lugar de aparicin en el texto, el vocabulario comn de
una lengua y la jerarquizacin por grupos de mayor a menor presencia en la lengua.
Para calcular la riqueza lxica Giraud tom en consideracin dos tipos de palabras
representadas en V: nocionales o palabras con contenido semntico (sutantivos, adjeti-
vos calificativos, verbos y adverbios) y gramaticales o palabras funcionales del discurso
(artculos, preposiciones, conjunciones, pronombres y adjetivos no calificativos). La ex-
tensin del texto se representa por N.
R=V R=V
N 2N
Cuando se toman en cuenta los dos grupos se utiliza la primera frmula. En cam-
bio el cmputo de las palabras nocionales exclusivamente requiere de la segunda fr-
mula en la que se duplica la extensin el texto (N), puesto que Giraud asuma que las
palabas nocionales representaban la mitad del texto. Giraud a su vez aadi la frmula
de concentracin de vocabulario para indicar la proporcin de frecuencia total de las
primas 50 palabras.
Tesitelov (1992), por su parte, elabora una interesante propuesta que recoge nue-
vos caracteres: repeticin de palabras de un texto, la fuerza de la zona de palabras en
baja frecuencia (1-10), la dispersin del vocabulario y la concentracin del vocabulario.
vila, por su parte, propone tres procedimientos comparativos para evaluar la ri-
queza lxica: el nmero de vocablos recogidos en el total de textos, la densidad promedio
para 100 palabras y el nmero de vocablos acumulados por deciles.
D=T
N
Este ndice se basa en la evaluacin individual de cada uno de los textos. Por lo
tanto, es posible observar el comportamiento de la muestra en su conjunto con el apoyo
de esta medida.
El tercer medio de valoracin aplicado por vila las frecuencias acumuladas por
deciles- requiere ordenar los vocablos en frecuencia descendente de frecuencias en con-
juntos de diez. Es decir, la lista de vocablos se inicia con el de frecuencia ms alta y
termina con los de ms baja. La lista de vocablos ordenados por frecuencias descendente
revela aquellos cuyas frecuencias acumuladas son suficientes para cubrir el 10%, 20%
o 100% del total de frecuencias de un conjunto de textos. vila utiliza este ndice para
analizar textos de diferente longitud. Este procedimiento permite evaluar comparati-
vamente el vocabulario de los conjuntos, ya que la extensin de cada uno de ellos, sus
respectivas frecuencias no condiciona el nmero de vocablos que obtienen determinados
deciles2.
Para calcular la riqueza lxica, Lpez Morales presenta dos frmulas interrela-
cionadas que representan dos medidas obtenidas a base de clculos empricos: por una
parte, toma en cuenta el porcentaje de vocablos (PV) del total de palabras de un texto
2 El procedimiento de evaluacin de la riqueza lxica de los textos que hace vila sigue parcialmente
a P. L. Baldi (1972). Una versin ms detallada del pensamiento de estos autores, en Pastor, 1998:6-16.
20 Humberto Lpez Morales
(N), y por otra, mide el intervalo de aparicin en el texto de palabras de contenido se-
mntico nocional (IAT).
Las palabras nocionales (PN) son aquellas unidades lxicas con contenido semn-
tico, es decir, sustantivos, verbos, adjetivos y adverbios, aunque con estos dos ltimos
se requiere de algunas especificaciones. La riqueza lxica se obtiene aqu al considerar
la cantidad de vocablos o unidades lxicas diferentes y el total de palabras de contenido
nocional (PN).
PV = V x 100
N
Este primer ndice (PV) nos ofrece una visin de diversidad lxica y sirve como
indicador grueso.
IAT = N
PN
Sin nimo de hacer aqu una revisin exhaustiva de estas propuestas, en particular
de la vila, solo dir que los objetivos difieren en tal magnitud que prcticamente se
trata de ejercicios diferentes e innecesariamente complejos para lo datos que quieren
obtenerse. El objetivo debe ser siempre el texto y no un conjunto de ellos, de diferente
extensin, adems. Si con varias trabajos y sus evaluaciones en la mano, el investigador
quiere sacar datos colectivos, las matemticas actuales le brinda frmulas de mucha
menor complejidad.
El texto que vimos al principio sobre La playa necesita ser analizado para obtener
los valores que nos permitan aplicar las frmulas.
De ellas, son vocablos: playa, es bonita, azul, agua, salada, mar, hay, peces, tiburo-
nes, pez espada, pez martillo, pap, mam, hermanos, fuimos, divertimos, mucho, baamos,
brincamos, saltamos, gusta, ir familiares, bueno, estar, hace, fresco, bueno, ambiente, her-
manos, juegan, gusta, primos, tos, abuelos
Son vocablos, pero repetidos en el texto: playa (6), es (4), mucho (3), hermanos (2),
yo (1)
Son palabras sin contenido semntico: a (4), con (2), el (3), de (1), en (2), la (7), me
(1), m (1), mi (2), mis (6), muy (1), nos (3), nuestros (1), tambin (1), y (4)
La primera frmula de Lpez Morales, la que calcula la proporcin entre las no-
cionales y las otras (nocionales pero repetidas y no nocionales) es as:
PV = 38 x 100
93 T: 40,9
IAT = 93
38 T: 2,4
cifras que indican que el ndice de riqueza lxica es de solo 40,9, muy baja como se
ver, y que en este texto es necesario esperar a 2,4 palabras para que haga su aparicin
una palabra de contenido semntico nocional.
Contrstese el texto anterior con este otro, producido por una alumna de segundo
curso de escuela secundaria pblica de Puerto Rico
Este texto est integrado por 122 palabras (sin contar la sigla AD, las cifras 45 y
48 y los nombres propios Rmulo [Betancourt] y [Hugo] Chvez), siempre entendiendo
por palabra cada una de las formas grficas entre espacios en blanco, como suele pro-
cederse en un primer nivel de anlisis. Como es habitual, es necesario que no se cuenten
las palabras grficas repetidas porque son el mismo vocablo (antes 2, fatiga 4, tengo 2
y partido 2) lo que deja un total de 110, cantidad muy cercana a las 100 sobre las que
suelen hacerse estas operaciones. Se observar que aqu como en todos los textos- hay
vocablos de dos tipos: aquellos que significan algo (pueblo, aos, pretensin, viajar, cuen-
Los ndices de riqueza lxica y la enseanza de lenguas 23
to, etc.) y los que solo ejercen una determinada funcin gramatical (cuando, de, lo, para,
una, en, etc.) que no hacen referencia a nada concreto o abstracto de mundo que nos ro-
dea. Los primeros son nombres, adjetivos, verbos y adverbios, y los segundos, artculos,
preposiciones, conjunciones, etc.
PV = V x 100 65 x 100
N 110 T: 59,1
Por lo tanto, el 59,1 del total de palabras de este texto son de contenido semntico
nocional no repetidas.
IA = N 120
PN 65 T: 1.8
Lo que significan estos nmeros y cmo pueden interpretarse necesitan, desde lue-
go, de elementos de comparacin. Siempre est a la mano la comparacin entre los
individuos del grupo, pero eso nos permite hacer comparaciones modestas. Lo ideal es
disponer de cifras ms generales, que respondan, por ejemplo, a lo consignado en textos
de escritores profesionales. Pero estos datos son muy escasos todava, al menos para los
ndices de riqueza lxica, no as, por ejemplo, para las investigaciones sobre madurez
sintctica3.
En efecto Ral vila (2001), director desde el Colegio de Mxico del proyecto de
estudio del espaol en los medios de comunicacin pblica del Mundo Hispnico dis-
pona de un importante conjunto de datos de riqueza lxica: de las radios locales, Radio
Almera contaba con un ndice de 66,6; de las nacionales, Radio Nacional de Espaa
67,2, XEB de Mxico, 67, las de Costa Rica, 67,1 y RCN de Colombia, 66,7. En cuanto
a las televisiones nacionales, Televisin Espaola arroj un ndice de 68,1, XEWTV de
Mxico, 66, y Telenoticiera CM& de Colombia, de 68,6. Las de carcter internacional
3 El nico ejemplo que conozco no est dedicado a la enseanza sino a comprobar los altos ndices
de riqueza lxica en los medios de comunicacin hispnicos de nuestros das.
24 Humberto Lpez Morales
CNN en espaol, 69,6 y ECO, 67,8. El promedio de estas cinco estaciones fue de 68,6.
Por ltimo, la prensa colombiana El Tiempo obtuvo unos ndices de riqueza lxica de
68,4.
Ante las constantes crticas de muchos sobre el pobre espaol de los medios de
todo el Mundo Hispnico, en los que no faltaban los reproches a la globalizacin que
haba conseguido empobrecer y uniformar esta lengua, vila analiz con cuidado un
ensayo de Carlos Fuentes tomado al azar desde el punto de vista de la riqueza lxica,
y el resultado fue de 69,7. Una dcima ms que CNN en espaol! Y por si fuera poco
esta comparacin, acudi a los corpora de lengua hablada de la Ciudad de Mxico y
comprob que entre los hablantes del nivel culto, el ndice general de riqueza lxica fue
de 68,5, dos dcimas menos que el ensayo de Fuentes. Ante estos datos tan contundentes
no cabe discusin alguna.
Pues, aunque el propsito que se persegua era otro, de momento podemos aprove-
char estos datos para establecer unos criterios provisionales. De manera que la chica de
segundo curso de escuela secundaria cuyo texto hemos ledo, que alcanza una puntua-
cin de 46 en riqueza lxica, y el posterior del artculo de prensa venezolano, que con-
sigue 59,1 son, en principio mejorables. Y digo en principio porque estos textos no son
iguales en extensin, y sabemos que los datos se desvirtan al pasar un texto de las 100
palabras. Tanto el ensayo de Carlos Fuentes como los textos de la norma culta tienen
caractersticas que conspiran contra una comparacin rgida: El ensayo tiene ms de 100
palabras, y los textos de la norma culta son orales y transliterados posteriormente, trans-
literacin sobre la que se llev a cabo el conteo. Necesitamos, pues, para tener metas
claras, exmenes de textos escritos que se consideren ilustrativos, de los que se pueden
tomar varias calas pero nunca superiores a las 100 palabras.
vila en su Lxico infantil de Mxico; palabra, tipos, vocablos, aplic estas medidas
a una seleccin de 4,500 textos de un corpus lxico de textos de tema libre escritos por
nios de tercero a sexto grado de primaria. Entre sus principales hallazgos se encuentran
diferencias porcentuales de vocablos que favorecen a las nias, y diferencias ms acen-
tuadas en relacin con la variable socieconmica. Sus resultados revelan una relacin
4 De nuevo remito a la tesis doctoral de Pastor (1998) para ampliar estas aqu breves consideraciones.
Los ndices de riqueza lxica y la enseanza de lenguas 25
estrecha entre la riqueza lxica y el nivel sociocultural. En su estudio vila prueba que
conforme se extiende el corpus se recogen proporcionalmente menos vocablos. Los ha-
llazgos sobre la densidad resultaron equiparables a los porcentajes de vocablos; las nias
obtuvieron una densidad superior a los nios. La tercera medida usada por este investi-
gador la acumulacin de frecuencias por deciles- demostr que la mayor o menor ex-
tensin de un corpus no condiciona el nmero de vocablos que se obtiene mediante estos
procedimientos en los primeros 8 o 9 deciles, lo que lo lleva a concluir que las diferencias
cuantitativas en la riqueza lxica son siempre menores en nios que en nias y siempre
relacionadas con el estrato sociocultural.
Otro estudio que aplica las frmulas de riqueza lxica de Lpez Morales fue reali-
zado por un equipo de investigadores de la Universidad de Chile y de la Universidad de
Concepcin. En esta ocasin, los investigadores hicieron ajustes a las frmulas a tono
con las necesidades especficas del proyecto; en particular, no utilizaron la frmula de
intervalo de aparicin de palabras de contenido semntico. Sus anlisis se elaboraron so-
bre los porcentajes de palabras nocionales (PN). Se llev a cabo esta investigacin sobre
la muestra de 308 sujetos. Concluy el estudio que no hay diferencias en el porcentaje de
palabras nocionales entre nios y nias. Los sujetos de nivel socio-econmico y cultural
alto presentaron un porcentaje levemente superior de palabras nocionales que los del
nivel medio y bajo. En esta investigacin, solo el rgimen de estudio mantiene algn gra-
26 Humberto Lpez Morales
En Puerto Rico se llev a cabo el estudio de riqueza lxica realizado por Filomena
Cintrn, Nuevos ndices de riqueza lxica en escolares de Barranquitas. En esta investiga-
cin, llevada a cabo sobre una muestra de estudiantes de los grados tercero, sexto, nove-
no y dcimo, se encontr un crecimiento asistemtico en el progreso lxico de los estu-
diantes segn la variable grado de ambas medidas. Los datos sobre la primera de ellas y
la variable sexo, mostraron una tendencia a favorecer a las nias tanto en el tercer grado
como en el sexto, hallazgo que coincide con las investigaciones de vila para el tercer
grado. Para esta mediad y la variable socio-econmica se encontr una relacin asociati-
va que tendi a favorecer al nivel socio-econmico alto, aunque muy ligeramente.
Los resultados sobre la segunda medida segn la variable sexo y nivel socio-econ-
mico no registraron diferencias palpables. Sin embargo, result sorprendente que el in-
tervalo aument a lo largo del nivel primario. Es decir, aparentemente la variable grado
de escolaridad no result del todo relevante para la segunda medida.
El tica es una regin griega. El tica es una regin antigua. El tica es una
pennsula triangular. El tica tiene montaas. Los helenos del tica extraan el
mrmol de las montaas. Esos mismos helenos del tica construan monumentos
fastuosos. Esos monumentos perduran hasta hoy.
Los ndices de riqueza lxica y la enseanza de lenguas 27
El tica es una antigua regin griega, una pennsula triangular con monta-
as de donde los helenos extraan el mrmol con el que construan monumentos
fastuosos que perduran hasta hoy.
Seleccione las palabras que crea adecuadas para cada espacio en blanco del
siguiente texto:
vimos contemplamos admiramos disfrutamos de
El bosque nacional ms importante del Caribe es el Yunque, y a l nos
llevaron de excursin. All helechos gigantes y palmas, orqudeas de
colores muy variados, enredaderas y musgos. tambin una gran cantidad de
animales: halcones, bhos, palomas, lagartijas, ciempis, tarntulas y hasta boas, y
sobre todo, la peculiar cotorra puertorriquea.
6. Final
bibliografa
vila, R. (1986): Lxico infantil de Mxico: Palabras, tipos, vocablos, en Actas del
Congreso del II Congreso Internacional sobre el espaol de Amrica, Mxico, D.F.:
Universidad Nacional Autnoma de Mxico, 510-517.
Pastor, M. (1998): Descripcin del lxico y de la sintaxis en textos producidos por nios
del nivel primario del sistema pblico, Ro Piedras: Universidad de Puerto Rico
(Tesis doctoral indita).
Tesitelov, J. (1992): The main areas of quantitative linguistics, New York: Planum Press.