Sunteți pe pagina 1din 36

[En Jos Mara Santos Rovira (ed.

) Ensayos de Lingstica Hispnica, Faculdade de


Letras: Universidade de Lisboa, 2014, pp. 177-216]

EL ESPAOL HABLADO COMO LENGUA
AGLUTINANTE Y POLISINTTICA
Juan Carlos Moreno Cabrera
Universidad Autnoma de Madrid


Resumen:
En este trabajo se analiza el espaol coloquial hablado desde el punto de vista de la
tipologa morfolgica que distingue entre lenguas aislantes, aglutinantes y flexivas. Se
compara el espaol coloquial espontneo con lenguas consideradas aislantes como el
chino, aglutinantes como el turco o el euskera y con las lenguas esquimales,
consideradas polisintticas. La conclusin del trabajo es que el espaol coloquial es una
lengua tan aglutinante como pueda serlo el turco, el vasco o el yup. Son las
convenciones ortogrficas tpicas de las lenguas europeas las que han llevado a los
lingistas a pensar que hay lenguas aglutinantes y polisintticas y no polisintticas. Para
apoyar el anlisis presentado en este artculo se recurre a propuestas recientes de Dahl
(2004) y W. J. de Reuse (2009).
Palabras clave: tipologa morfolgica, morfologa del espaol, aglutinacin, polisntesis

Summary:
In this paper spoken colloquial Spanish is analyzed from the point of view of the
traditional morphological typology that distinguishes isolating, agglutinative and
inflectional languages. Colloquial Spanish is compared with isolating languages such as
Chinese, agglutinative languages such as Turkish or Basque and with the so-called
polysynthetic languages such as the Eskimo languages. It is argued that colloquial
Spanish presents a degree of agglutination comparable to that of Turkish, Basque or
Yupi. The reason why Spanish and other European languages are not usually considered
as agglutinative lies in the fact that linguists rely on the orthographic conventions used
to write these languages. In order to support the arguments given in this paper some
recent proposals and analyses by . Dahl (2004) and W. J. de Reuse (2009) are
discussed and adopted.

Key words: Morphological typology, Spanish morphology, agglutination, polysynthesis

Contenido
1. La aglutinacin universal
2. El mito de las lenguas aislantes y monosilbicas
3. El turco y el espaol como lenguas aglutinantes
4. El ndice de aglutinacin en euskera y en espaol
5. Caracterizacin de la palabra natural en la lengua espaola
6. El espaol coloquial como lengua polisinttica
7. Conclusin: el espaol como lengua aglutinante y polisinttica
1 La aglutinacin universal
Al analizar la estructura morfolgica de las lenguas del mundo, desde principios
del siglo XIX se viene haciendo una tricotoma entre lenguas aislantes, lenguas
aglutinantes y lenguas flexivas. Un ejemplo de lengua aislante sera el chino o
vietnamita, un ejemplo de lengua aglutinante sera el turco y un ejemplo de lengua
flexiva sera el ruso.
En esta tipologa se tiene en cuenta fundamentalmente un factor decisivo: el grado de
fusin de los morfemas con las palabras. En las lenguas flexivas, hay un alto grado de
fusin, de forma que en una palabra latina como hominis a los hombres no podemos
asignar los morfemas de dativo, plural y masculino de forma analtica a la terminacin
-is. Dicho de otra forma, no podemos considerar que las determinaciones
morfolgicas dativo + masculino + plural se correspondan de forma biunvoca con cada
uno de los elementos de la slaba final -is. Por ello, se considera que la realizacin de
esa secuencia de morfemas se lleva a cabo de forma fusionada o sinttica.
Cuando observamos la palabra del hngaro que traduce esa palabra latina: embereknek
a los hombres podemos comprobar fcilmente que al morfema dativo le corresponde
la slaba nek y que al morfema de plural le corresponde la slaba ek (en hngaro no hay
morfema de gnero). Por tanto, a la secuencia morfolgica plural + dativo le
corresponde la secuencia ek + nek. De esta manera, obtenemos una bi-univocidad entre
morfema y morfo (realizacin fnica del fonema).
Como conclusin, vemos que hay dos tipos de lenguas segn el grado de fusin en la
realizacin fontica de los morfemas: las flexivas (fusionantes) y las aglutinantes.
El esquema general es el siguiente:

AGLUTINACIN
LEX+M1+M2+M3 L+X+Y+Z

FLEXIN
LEX+M1+M2+M3 L+X

En la aglutinacin, al lexema (LEX) le sigue una secuencia de morfemas (M1 + M2 +
M3) y esto se realiza fonolgicamente () a travs de la expresin fnica del lexema
(L) seguida de una secuencia de expresiones fnicas (X+Y+Z) que, analticamente,
realizan cada uno de los morfemas.
En la flexin, al lexema (LEX) le sigue una secuencia de morfemas (M1 + M2 + M3) y
esto se realiza fonolgicamente () a travs de la expresin fnica del lexema (L)
seguida de una expresin fnica (X) que expresa fonolgicamente la secuencia
morfemtica de forma sinttica.
El concepto de aglutinacin que estamos manejando es bastante tcnico: se refiere a la
relacin bi-unvoca entre una secuencia de morfemas y una secuencia de slabas.
Sin embargo, existe otro concepto de aglutinacin ms general que se deriva del
carcter lineal del significante y que consiste en que los elementos lingsticos se
disponen de forma sucesiva e inmediata en el habla normal espontnea. Este tipo de
aglutinacin se da, por consiguiente, en todas las lenguas y podemos denominarla
aglutinacin universal.
Este concepto de aglutinacin fue perfectamente descrito por un filsofo y lgico que
tambin se ocup del estudio de las lenguas naturales. Se trata de Hans Reichenbach
(1891-1953). El siguiente pasaje est extrado de su libro de introduccin a la lgica
simblica, que contiene un amplio estudio sobre la lgica de las lenguas naturales. Es
muy interesante porque pone de manifiesto la influencia nefasta que ha tenido la
escritura en la determinacin de la ndole de las lenguas naturales, tal como veremos a
continuacin:

La definicin gramatical de palabra como un grupo de letras separadas unas
de otras por un intervalo no es satisfactoria: lo que es una palabra en una
lengua puede ser expresado por varias palabras en otra, mientras que las
proposiciones siempre se traducen como proposiciones. La lengua alemana
es conocida por sus largas palabras compuestas, tales como
Eisenbahnknotenpunkt que significa railroad junction [cruce ferroviario]
en ingls. La regla que determina que las palabras rail y road se escriben
como una palabra, mientras que junction se escribe separadamente, es
puramente convencional. La lengua turca, que usa muchos sufijos, a veces
expresa una oracin completa en una palabra. As, la palabra turca
alableceim es una oracin y significa podr comprar. No deberamos
olvidar que en todas las lenguas la divisin entre palabras desaparece ms o
menos tan pronto como hablamos, ya que el hablar no hacemos pausas entre
la mayor parte de las palabras (Reichenbach 1947:5).

H. Reichenbach tiene toda la razn cuando critica, en este pasaje, que se tome como
base la palabra escrita para explicar cmo funcionan realmente las lenguas. Esta crtica
se basa en el hecho de que, en general, los sistemas de escritura son analticos, de forma
que se separa lo que en la lengua hablada normal se aglutina. He aqu un ejemplo del
espaol. Lo que habitualmente se pronuncia en la lengua coloquial espontnea como
[matoko lalotera] se escribe como me ha tocado la lotera: Es decir, se expresa como
una sucesin de cinco elementos lo que en el habla se expresa mediante dos elementos
que aglutinan diversos componentes (tres en el primer caso y dos en el segundo). De
todas formas, en el habla rpida lo que tendramos sera un solo elemento
[matokolalotera].
Sera absurdo decir que la expresin aglutinativa del espaol coloquial que acabo de
citar es una forma vulgar, defectiva o sumaria de la correspondiente forma escrita. El
uso coloquial de las lenguas no se realiza desde la escritura, dado que entonces los
analfabetos y las personas que an no han aprendido a leer y escribir no podran hablar.
Pero es claro que esa idea de la primaca de la escritura sobre el habla es imposible de
justificar cientficamente. Lo nico que podemos decir es que la versin escrita de esta
expresin se deriva de un anlisis a posteriori o secundario de carcter analtico de ella.
Por tanto, si decimos que el espaol no es una lengua aglutinante porque escribimos me
ha tocado la lotera lo que hacemos en realidad es caracterizar, no la lengua espaola,
sino la forma de escribir esta lengua, la ortografa vigente. Sabemos perfectamente que
la estructura de una lengua natural no est determinada por la estructura del sistema de
escritura que se emplee para transcribirla. Hay lenguas que han cambiado de escritura
sin experimentar ningn cambio lingstico decisivo.
2 El mito de las lenguas aislantes y monosilbicas
Todo lo expuesto en la seccin anterior sobre lo absurdo de partir de la escritura
para caracterizar tipolgicamente una lengua puede parecer evidente, pero no lo es en
absoluto, dado que durante mucho tiempo se ha caracterizado tipolgicamente algunas
lenguas casi exclusivamente a travs de su escritura. Un ejemplo de ello es la lengua
china, que se ha concebido como lengua aislante y monosilbica cuando en la realidad
lo que es aislante y monosilbico no es la lengua china sino la escritura china.
Siguiendo lo explicado en la seccin anterior, la lengua china natural hablada, como las
dems lenguas del mundo, es aglutinante (con algn caso aislado de afijo fusionante tal
como el sufijo er, Han, Ma y L 2002).
Veamos un ejemplo de cmo se parte de la escritura para caracterizar la lengua china.
En su libro sobre la escritura F. Coulmas (2003: 59) cita la siguiente oracin del chino
estndar:


zhonggu zhj nin de binhu dqu hn d
China ha experimentado ciertamente grandes cambios en los aos ltimos

En la escritura china, se separan mediante espacios en blanco cada uno de los caracteres,
independientemente de que formen o no una palabra. De este modo, en la forma escrita
tenemos doce caracteres chinos, pero no hay doce palabras. En efecto, las expresiones
zhonggu China, zhj estos varios, binhu cambio, dqu ciertamente son
palabras compuestas y constituyen unidades morfolgicas perfectamente delimitadas y
cohesionadas. Por tanto, en el ejemplo no hay doce palabras. Hay solo siete. Adems,
algunos de los elementos que aparecen a travs de los caracteres escritos son claramente
morfemticos y no lxicos: por ejemplo, de es una partcula relacional sin contenido
lxico y j es una partcula cuantitativa aproximativa que posee diferentes funciones
gramaticales.
La lengua china no se pronuncia como lengua coloquial espontnea separando por
breves silencios todas y cada una de las slabas tal como sugiere la escritura (dado que
cada carcter chino se corresponde con una slaba). Cualquiera que haya escuchado una
conversacin normal entre sino-hablantes, habr podido comprobar que las expresiones
que emiten no son un silabeado, sino un continuo fnico con algunas pausas
entonativas, tal como ocurre en las dems lenguas naturales del mundo.
Es cierto que en la lengua china estndar no hay morfologa flexiva, pero s hay y
mucha morfologa derivativa (Packard 2000). Por consiguiente, mantener que la
lengua china es aislante y monosilbica solo puede basarse en la lengua escrita y en
modo alguno en la lengua natural tal como se habla espontneamente. Se puede
caracterizar la lengua china escrita como monosilbica y aislante, pero la lengua china
hablada no es ni lo uno ni lo otro. La lengua china hablada no es una lengua flexiva
como el ruso o el griego, sino que es una lengua aglutinante, como todas las dems
lenguas del mundo, el ruso y el griego incluidos. Por tanto, obtenemos el esquema
siguiente:
Caracterizacin de la lengua china escrita
Es una lengua monosilbica porque a cada carcter chino le corresponde una
slaba.
Es una lengua aislante, porque cada carcter est separado del carcter siguiente
y anterior por espacios en blanco independientemente si dos o ms caracteres se
corresponden con una nica palabra del chino hablado espontneo.

Caracterizacin de la lengua china hablada espontnea
No es una lengua flexiva, pero tiene un desarrollado sistema de derivacin y
composicin morfolgicas (Packard 2000).
Es una lengua aglutinante, porque en el habla coloquial espontnea los diversos
elementos significativos se aglutinan formando expresiones complejas tpicas de
esa habla. En esto el chino es similar a los dems idiomas hablados.

Imaginemos qu ocurrira si las reglas ortogrficas del espaol nos obligaran a separar
las slabas por espacios en blanco, como ocurre con la escritura china. Entonces la
oracin espaola vista en la seccin anterior habra de escribirse de la siguiente manera:

me ha to ca do la lo te ri a

Una vez escrito as, el espaol resultara ser, si nos guiamos por la escritura como fuente
exclusiva de conocimiento lingstico, una lengua monosilbica y aislante tal como
muchos ven el chino. En la ortografa normativa se escribe me ha tocado, pero incluso
esta forma no hace completa justicia a la naturaleza de esta expresin, ya que me y ha
estn claramente aglutinados a tocado configurando una nica expresin unitaria. Esta
forma escrita aunque ms correcta que la que se dispone en slabas aisladas, no hace
justicia a la aglutinacin que se observa en la forma oral espontnea [mtoko].
Tanto el chino como el espaol son mucho ms aglutinantes que lo que se puede
deducir de la escritura que, en ambos casos, falsea las verdaderas unidades de las
lenguas respectivas.
3 El turco y el espaol como lenguas aglutinantes
Para que podamos comprobar cmo afecta la ortografa a las consideraciones
sobre la aglutinacin en las lenguas, comparemos las siguientes palabras del turco
(considerada como lengua aglutinante) proporcionadas por Nespor y Vogel (1994: 142),
con las correspondientes traducciones espaolas, tal como se dan en el libro de donde se
extraen los ejemplos:

TURCO ESPAOL
oda habitacin
odada en la habitacin
odadaki lo que est en la habitacin
odadakiler los que estn en la habitacin
odadakilerden de los que estn en la habitacin

Desde el punto de vista de las normas ortogrficas del turco y del espaol la impresin
que da esta comparacin es que el turco es una lengua aglutinante en la que una palabra
como oda habitacin puede ir seguida hasta de cuatro morfemas aglutinados:
oda+da+ki+ler+den. Lo que vemos en la traduccin espaola son sintagmas
compuestos de varias palabras. Por ejemplo, en la traduccin de la ltima palabra, lo
que tenemos es una secuencia de siete palabras ortogrficas.
Pero vamos a comparar ahora el turco con el espaol hablado coloquial espontneo sin
respetar las reglas ortogrficas de la lengua espaola. Podramos perfectamente obtener
algo como lo siguiente

TURCO ESPAOL COLOQUIAL INFORMAL
oda [abitasin]
odada [enlabitasin]
odadaki [lodelabitasin]
odadakiler [losdelabitasin]
odadakilerden [delosdelabitasin]

He realizado algunos cambios respecto a las traducciones dadas en el libro de Nespor y
Vogel, del que estn extrados los ejemplos del turco. Las expresiones espaolas
resultantes son perfectamente normales en el habla cotidiana y se pueden hacer
corresponder tambin con el significado de las expresiones turcas. En la transcripcin
he echado mano del seseo, dado que es abrumadoramente mayoritario entre los
hispanohablantes.
Observemos la ltima expresin del espaol. Podremos comprobar que est formada
por una secuencia de ocho elementos morfolgicos aglutinados (un lexema y siete
morfemas), a saber:

de +l + o + s + de + l + a + (a)bitasin
oda + da+ ki+ ler+ den

Como podemos comprobar, la palabra turca est compuesta de cinco elementos
morfolgicos aglutinados (un lexema y cuatro morfemas).
Por tanto, en este caso no cabe la menor duda de que en espaol es una lengua ms
aglutinante que el turco. Esto no significa que el turco y el espaol sean
morfolgicamente iguales, es evidente que no lo son: hay importantes diferencias entre
ellos. Una de las ms sobresalientes la acabamos de ver en el ejemplo anterior: la
aglutinacin en espaol es claramente pre-lexemtica, es decir, los morfemas aparecen
antes del lexema, mientras que la aglutinacin en turco es post-lexemtica, es decir, los
morfemas se concatenan pospuestos al lexema. Esta es una de las muchas diferencias
que se podran apuntar entre la morfologa del turco y la del espaol. Sin embargo,
desde el punto de vista de la aglutinacin, el turco y el espaol son muy similares, tal
como hemos visto. Lo nico que nos impide darnos cuenta de ello son las convenciones
ortogrficas del espaol.
4 El ndice de aglutinacin en euskera y en espaol
El afamado lingista Joseph Greenberg public en los aos cincuenta del siglo
pasado un influyente artculo (Greenberg 1954) en el que se propona una serie de
ndices numricos para calcular el tipo morfolgico de las lenguas. Entre estos ndices
est el de aglutinacin (Greenberg 1954: 12-13). En este ndice se mide el grado de
disposicin aglutinativa de los morfemas y lexemas en una lengua. A partir de las
explicaciones proporcionadas por Greenberg en el trabajo citado, propongo la siguiente
manera de calcular el ndice de aglutinacin de una lengua concreta. Utilizar la
siguiente frmula: UM/EM. Por UM entendemos el nmeros de uniones entre
elementos morfolgicos (lexemas y morfemas) y por EM el nmero de elementos
morfolgicos (lexemas y morfemas) implicados. Se trata de dividir el nmero UM por
el nmero EM. Este nmero ser siempre menor que 1 por la siguiente razn, aducida
por Greenberg en su artculo. Si tenemos una secuencia de dos elementos morfolgicos
aglutinados X+Y, entonces UM= 1, es decir, tenemos una unin entre dos elementos
morfolgicos y adems EM = 2, ya que tenemos dos elementos morfolgicos. En este
caso UM/EM = 1/2 = 05. Tenemos por tanto, un ndice de 05 de aglutinacin. Si
tenemos un solo elemento morfolgico (un lexema sin afijo aglutinado alguno, por
ejemplo), entonces UM= 0 y EM = 1, con lo cual UM/EM = 0/1 = 0. En este caso,
tenemos un ndice 0 de aglutinacin.
En un artculo en el que se utilizan sistemticamente los ndices numricos de
Greenberg para comparar diversas lenguas, el lingista espaol Antonio Tovar (Tovar
1981) da la siguiente tabla sobre el grado de aglutinacin de las lenguas siguiendo el
ndice propuesto por J. Greenberg (Tovar 1981: 190):

NDICE DE AGLUTINACIN
muy alto de 0,80 a 0,99
alto de 0,60 a 0,79
medio de 0,40 a 0,59
bajo de 0,20 a 0,39
muy bajo de 0,00 a 0,19

El propio Tovar da (Tovar 1981: 196) como ndice de aglutinacin del euskera 0,63, es
decir, un ndice alto y como ndice de aglutinacin del espaol 0,06, es decir, un ndice
muy bajo. Estos nmeros se obtienen del recuento hecho sobre tres textos breves en
cada una de las lenguas.
Sin embargo, si aplicamos lo que he dicho en las secciones anteriores sobre la necesidad
de erradicar la escritura de las consideraciones tipolgicas, los resultados del grado de
aglutinacin del euskera y del espaol pueden variar mucho.
Consideremos, por ejemplo, el ndice de aglutinacin que se deduce de una expresin
espaola como las casas, suponiendo una secuencia de cinco unidades morfolgicas: l
+ a+ s casa +s, podemos calcular el ndice UM/EM como 3/5, dado que hay tres
uniones de elementos morfolgicos: l+a, la+s y casa+s. Por tanto, como 3/5 = 0,6
obtenemos un nivel alto de aglutinacin. Pero este clculo est hecho sobre la forma
escrita de esa expresin; en la forma hablada coloquial espontnea tenemos [lasksas],
es decir, un solo elemento y, por tanto tenemos un unin de elementos morfolgicos
ms, la que se da entre las y casa+s. Por tanto, ahora el ndice es 4/5 = 0,8, con lo cual a
partir de este ejemplo el espaol cambiara de grado de aglutinacin: pasara de alto a
muy alto.
Para contrastar los datos de Tovar referidos a las diferencias respecto del ndice de
aglutinacin entre el euskera y el espaol, voy a continuacin a comparar diez frases del
euskera con sus correspondientes traducciones al espaol y a partir de ah voy a
comparar los ndices de aglutinacin obtenidos para las dos lenguas con el fin de extraer
conclusiones sobre el grado de aglutinacin morfolgica de ambas lenguas.
Las frases del euskera y sus respectivos anlisis las tomo de la gramtica de R. de Rijk
(2008) y adopto sin cambiarlos los anlisis de sus secuencias morfolgicas tal como
figuran en dicha gramtica. Al lado de cada frase calculo el ndice de aglutinacin. En el
caso del espaol incluimos la forma ortogrfica junto con la forma coloquial hablada y
calculo los ndices correspondientes.
I
Ni-rekin ez d-u-zu-e gehi-ago lan-ik iza-n-go (De Rijk 2008: 1228) [8/14 = 0,57]
No tend-rs ms problema-s con-migo [3/8 = 0,37]
no-tend-rs ms-problema-s con-migo [5/8 = 0,62]

II
Ni-k zu z-a-it-u-t maite-ago arraintxo-ek ur-a baino (De Rijk 2008: 1226) [8/15 = 0,53]
Te am-o ms que l-o-s pecec-it-o-s a-l agua [7/ 15 = 0,46]
te-am-o ms que-l-o-s-pecec-it-o-s a-l-agua [10/15 =0,66]

III
Ber-e irakasle-a adin-a iza-n-go da (De Rijk 2008: 1223) [5/10 = 0,50]
Ser- tan buen-o como su profesor [2/8 = 0,25]
Ser- tan-buen-o como su-profesor [4/8 = 0,50]

IV
Beste asko beza-la-ko egun bat (De Rijk 2008: 1219) [2/7 = 0,28]
Un da como tod-o-s l-o-s dems [4/10 = 0,40]
un-da como-tod-o-s l-o-s-dems [6/10 = 0,60]

V
Ni-k gazte-rik gorde-tze-n d-u-t bihotz-a (De Rijk 2008: 1214) [7/12 = 0,58]
Manteng-o mi corazn joven [1/5 = 0,2]
manteng-o mi-corazn joven [2/5 = 0,4]

VI
Daniel-ek ber-e indar guzti-a-z jo-a z-u-en (De Rijk 2008: 1212) [7/ 13 = 0,53]
Daniel le ha pega-do con tod-a su fuerza [2/9 = 0,22]
Daniel le-ha-pega-do con-tod-a su-fuerza [6/9 = 0,66]

VII
Auto-a konpon-du-a d-u-t (De Rijk 2008: 1211) [5/8 = 0,62]
Teng-o el coche arregla-d-o [3/7 = 0,42]
teng-o el-coche arregla-d-o [4/7 = 0,57]

VIII
Ezin-go n-a-i-z mutilzahar geldi-tu (De Rijk 2008: 1201) [5/9 = 0,55]
No ser- capaz de mantener-me solter-o [3/9 = 0,33]
No-ser- capaz de-mantener-me solter-o [5/9 = 0,55]

IX
Ezkon-du berri-a n-a-i-z eta ez n-a-i-te-ke j-oa-n (De Rijk 2008: 1194) [11/18 = 0,61]
Me acab-o de casar y no pued-o ir [2/10 = 0,20]
me-acab-o de-casar y-no-pued-o ir [6/10 = 0,60]

X
Asper-tu e-gi-n n-a-iz, bada bakarr-ik utz-i n-a-u-te (De Rijk 2008: 1191) [10/17 = 0,58]
S que me h-e aburri-do porque me ha-n deja-do sol-o [5/15 = 0,33]
s que-me-he-aburri-do porque me-h-a-n-deja-do sol-o [10/ 15 = 0,66]

En el siguiente cuadro vemos los resultados obtenidos en cada una de las diez
expresiones en los tres idiomas: euskera escrito, espaol escrito y espaol hablado.


EUSKERA
ESPAOL
ESCRITO
ESPAOL
HABLADO.
0,57 0,37 0,62
0,53 0,46 0,66
0,5 0,25 0,5
0,28 0,4 0,6
0,58 0,2 0,4
0,53 0,22 0,66
0,62 0,42 0,57
0,55 0,33 0,55
0,61 0,2 0,6
0,58 0,33 0,66
0,535 0,318 0,582

La ltima de las filas es la media aritmtica obtenida. Segn esto, el euskera escrito
tiene un ndice de aglutinacin medio (0,53), el espaol escrito tiene un ndice de
aglutinacin bajo (0,31) y el espaol hablado coloquial tiene un ndice de aglutinacin
tambin medio, pero superior al del euskera (0,58).
Para interpretar adecuadamente estos nmeros hay que tener en cuenta que comparamos
el euskera escrito con el espaol hablado coloquial y esto no es lcito, dado que la
ortografa euskrica tampoco refleja con total fidelidad la lengua coloquial. Por tanto, si
modificramos la ortografa euskrica (Moreno Cabrera 2007-2008: 207-214), como
hemos hecho con la del espaol, para ajustarla a la lengua hablada, el ndice de
aglutinacin obtenido sera idntico o mucho ms parecido an al del espaol.
La conclusin que cabe extraer de todo esto es que el espaol y el euskera tienen un
grado de aglutinacin semejante, contra lo que se podra pensar a partir de los datos que
aparecen en el artculo de A. Tovar.
Esta conclusin no es en absoluto sorprendente porque en este artculo defiendo que
todas las lenguas son aglutinantes en una medida similar y que algunas de ellas son
adems flexivas o fusionantes en distintos grados.
5 Caracterizacin de la palabra natural en la lengua espaola
A partir de lo explicado en la seccin anterior podramos preguntarnos si se
podra dar una descripcin ms fiel de las unidades que realmente se utilizan de forma
ms o menos autnoma en la lengua hablada espontnea, que sea totalmente
independiente de lo establecido por las reglas ortogrficas. En el caso del espaol, una
de las primeras cosas que tendramos que hacer sera incorporar al sustantivo los
artculos y las preposiciones, de forma que expresiones como lacasa, delacasa,
enlacasa deberan ser consideradas como unidades de la lengua hablada en las que se
observa un grado apreciable de aglutinacin. La razn de esto es que ni el artculo, ni la
preposicin son elementos autnomos en el habla: siempre aparecen en el habla normal
apoyados en un sustantivo o adjetivo (como en lablanca o deblanco). Por supuesto, en
una expresin como lablanca casa no se ha introducido ningn adjetivo entre la y casa
tal como acostumbran a decir algunos lingistas y gramticos para mantener que la
ortografa tiene razn y que la es un elemento separado de casa en una expresin como
lacasa. Lo que pasa es que los adjetivos pueden tambin servir de apoyo al artculo y a
la preposicin en espaol.
Incluso podemos tener expresiones como lossincasa o lasdecasa, en donde hay
aglutinados un artculo seguido de una preposicin ante el sustantivo. La prueba de que
una expresin como lossincasa funciona a todos los efectos como una unidad en el
habla normal es que no se puede deshacer la aglutinacin que presenta; por ello, de
entre las expresiones siguientes solo la primera es gramatical en espaol:

1. los sin casa merecen respeto
2. *los merecen sin casa respeto
3. *los sin merecen casa respeto
4. *los merecen casa sin respeto
5. *sin casa los merecen respeto
6. *sin casa merecen los respeto

Sin embargo, merecen y respeto pueden aparecen en diversos lugares de la oracin
siempre que no se destruya la indubitable unidad que representa la expresin los sin
casa, tal como podemos comprobar a continuacin:

7. Merecen respeto los sin casa
8. Respeto merecen los sin casa
9. Respeto los sin casa merecen
10. Los sin casa respeto merecen
11. Merecen los sin casa respeto

Quizs no todas estas expresiones sean igual de usuales o normales, pero no obtenemos
en ningn caso secuencias agramaticales tales como las enumeradas en la lista
inmediatamente anterior a sta.
Por tanto, si queremos vislumbrar cmo son las palabras de la lengua espaola coloquial
espontnea, lo que podemos denominar palabras naturales, tenemos que renunciar a
considerar como conformadas de tres palabras secuencias ortogrficas como los sin
casa. En efecto, esta secuencia en concreto consta de tres palabras ortogrficas: los, sin
y casa, pero no le debera ya caber la menor duda a quien est leyendo estas pginas que
esas tres palabras ortogrficas constituyen una nica palabra de la lengua espaola
coloquial espontnea: lossincasa. Alguien podra objetar que, si emitimos esta
expresin en una forma cuidadosa y sosegada podramos emitirla como tres palabras
independientes. Esto se puede hacer en la lengua coloquial por motivos de nfasis o
insistencia; por ejemplo, en un caso de mala comprensin por parte de nuestros
interlocutores, pero en todo caso sera una forma marcada o excepcional de
pronunciacin. Por supuesto y con objetivos similares, podramos tambin pronunciar
casa como dos slabas independientes: ca sa. Esto se puede hacer y a veces se hace
con propsitos de nfasis o de puntualizacin, pero basta reflexionar un poco para
percatarse de que ello no invalida en modo alguno que casa sea una unidad morfolgica
de la lengua natural tanto hablada como escrita (en este caso coinciden ambas formas de
concebir la lengua).
Pero disponemos de algunos criterios para decidir cmo identificar esas palabras
naturales que son unidades de la lengua hablada espontnea? Lamentablemente, los
lingistas se han dedicado sobre todo a la palabra ortogrfica, la que es reconocida en la
ortografa, y se han ocupado muy poco de las unidades de la lengua hablada espontnea.
Voy a considerar ahora las propuestas de un lingista que nos ha ofrecido algunos
criterios muy interesantes para caracterizar lo que denomino en este artculo palabra
natural; es decir, las unidades mximas con significado que son operativas en la lengua
oral espontnea y que son la base de los procesos de emisin y de interpretacin
lingsticos. Ese lingista es el sueco sten Dahl autor de un libro publicado en 2004
sobre la evolucin y mantenimiento de la complejidad lingstica (Dahl 2004). En el
captulo dcimo de este libro, el autor investiga el desarrollo y alcance de los procesos
de incorporacin, mediante la cual una palabra pasa a formar parte de otra como
elemento, tal como se puede ver en compuestos espaoles como sacapuntas o
buscachollos; el primer ejemplo est establecido en la lengua habitual y el segundo
ejemplo se da para mostrar que este proceso es productivo y que se pueden crear nuevos
compuestos por incorporacin de forma ms o menos libre o espontnea sin que esto
suponga una ruptura del sistema. Observa Dahl que este proceso est severamente
restringido en las diversas lenguas en las que se produce. La incorporacin se realiza
solo en ciertas condiciones. Por ejemplo, la palabra incorporada no puede ir provista de
determinantes: no hay sacalaspuntas o buscaloschollos, por ejemplo. La palabra
incorporada tiene un significado genrico y nunca especfico como en
*sacaestaspuntas, *buscaaquelloschollos. Para Dahl las restricciones que se imponen a
la incorporacin seran debidas al hecho de que hay unos lmites generales en la
creacin de las posibles unidades mximas de la lengua hablada que constituiran esas
unidades que denomino en este artculo como palabra natural. Estas unidades estn
determinadas por lo que Dahl denomina paquetes que son las unidades mximas en las
que puede realizarse de modo eficiente tanto la expresin lingstica por parte de la
persona hablante como la interpretacin lingstica por parte de la persona oyente (Dahl
2004: 257-259). Dadas las limitaciones de la memoria de trabajo a corto plazo de los
seres humanos, est claro que esas unidades mximas de produccin y procesamiento
lingsticos en el habla natural no pueden tener una extensin indefinidamente grande,
sino que van estar delimitadas de forma muy precisa para poder realizar con la mxima
eficacia y de acuerdo con las limitaciones de memoria y planificacin articulatoria, la
expresin lingstica natural en la lengua coloquial espontnea, caracterizada
precisamente por su automatismo y rapidez.
Para Dahl el paquete es una unidad muy integrada que se pronuncia en un segmento
prosdico que correspondera a una orden nica en la produccin y a un proceso
unitario en la recepcin de las expresiones lingsticas. Esa integracin y las
restricciones de espacio hacen que sea una unidad con una capacidad severamente
limitada para contener elementos significativos.
Las necesidades relativas a la rapidez, el aprovechamiento y la automatizacin del acto
lingstico comunicativo le obligan a la persona hablante a introducir en cada paquete o
unidad mxima del habla coloquial el mayor nmero posible de elementos. Los lmites
vienen propiciados tanto por las posibilidades articulatorias de los seres humanos como
por sus posibilidades de procesamiento rpido del lenguaje.
En su libro, Dahl nota tres constricciones fundamentales sobre los paquetes (Dahl 2004:
258), que en este artculo denomino palabras naturales (PN).

1. Las expresiones lxicas referenciales (ELR) no tienen cabida fcil en las palabras
naturales. Una ELR es un sintagma nominal que contiene al menos un elemento
lxico y que tiene una referencia especfica. Los nombres propios, por ejemplo, son
ELR tpicos; por su parte los pronombres no son ELR porque aunque se usen
referencialmente no son elementos con contenido estrictamente lxico. Por tanto, los
nombres propios son PN autnomas pero los pronombres en general no lo son.

2. Un elemento focalizado (EF) no puede integrarse en una palabra natural, sino que
constituye el mismo una PN completa en s.

3. Las expresiones dotadas de una estructura interna (EDEI) constituyen en s
mismas al menos una PN y no se pueden integrar en una PN mayor.

Vamos ahora a ver unos ejemplos de la aplicacin de estos principos propuestos por
Dahl para determinar las posibles PN que se pueden obtener.
Empecemos por la siguiente expresin:

12. Mara bebe t

En la lengua oral espontnea coloquial esta expresin se dira, por ejemplo, [Mara
bbet] y, por tanto, constara de dos PN (Mara y bebe t). Est en consonancia esto
con los criterios aducidos por Dahl? Lo est completamente. En efecto, Mara es una
ELR y, por tanto, en s misma constituye una PN. Por su parte, en bebe t tenemos un
objeto incorporado al verbo. La palabra t es no referencial en este caso y, por tanto, se
puede incorporar el verbo para obtener bebe t. Por consiguiente, bebe se te puede
considerar como una PN mxima, en la que no cabe, por ejemplo, Mara, por ser un
ELR. Por consiguiente tenemos el siguiente resultado:

13. Mara bebe t
Tres palabras ortogrficas (PO): Mara, bebe y t
Dos palabras naturales (PN): Maray bbet

Qu ocurrira si hiciramos la palabra te focal? Ocurrira que automticamente t
habra de salir de la PN en la que est para constituir una PN en s misma. De este
modo, obtendramos la expresin Mara bebe TE, en la que las letras mayscula
muestran que el trmino te est focalizado en la oracin. Este proceso de focalizacin se
puede expresar mediante estructura sintcticas especiales como las perfrasis de relativo
de las que lo que Mara bebe es t, sera un ejemplo relacionado con el anlisis que
estamos viendo en este pginas. Por tanto, en el caso de Mara bebe TE observamos que
el nmero de PN (tres) coincide con el nmero de palabras ortogrficas (PO), tres en
ambos casos.
Pasemos ahora a una expresin como Mara se lo bebe, en la que tenemos cuatro PO.
En el habla coloquial espontnea esta expresin se pronuncia como [mara selobbe]. Es
decir, como dos PN. La expresin [selobbe] se atiene perfectamente a los criterios de
Dahl, puesto que consta de dos elementos referenciales; se y lo, que no son ELR: tienen
contenido gramatical pero no lo tienen lxico. Por consiguiente, esta expresin puede
ser caracterizada perfectamente como una PN. De forma esquemtica:

14. Mara se lo bebe
Cuatro PO: Mara, se, lo, bebe.
Dos PN: Mara, selobebe

Las expresiones con clticos como selobebe se califican en ocasiones como grupo cltico
(Nespor y Vogel 1994: 169-189) y nunca como palabras naturales, tal como hago aqu,
probablemente por el peso que tiene la tradicin ortogrfica que, en muchos casos, hace
que los clticos se escriban separados de la palabra en la que se apoyan necesariamente,
aunque no puedan ser considerados como palabras, en trminos de Nespor y Vogel:

Debe advertirse, no obstante, que considerar estos clticos palabras
independientes iguales a cualquier otra palabra de la lengua, no deja de ser
problemtico, dado que los clticos manifiestan dependencias fonolgicas
bien conocidas que no comparten con otros elementos. En concreto, nunca
pueden aparecer solos; esto es, no pueden ser el nico elemento de un
enunciado. Adems, no pueden recibir acento contrastivo. (Nespor y Vogel
1994: 173)

Es interesante la ltima de las observaciones, que hace referencia al acento contrastivo.
Acabamos de ver que uno de los criterios propuesto por Dahl para que un elemento no
pueda pertenecer a un paquete o palabra natural compleja es precisamente que no pueda
estar dotado de acento contrastivo o focal.
Consideremos ahora la expresin Mara se bebe el t. Estamos antes cinco PO, pero
observamos que la forma habitual de pronunciacin de esta expresin es [mara sebbe
elt], con lo que tenemos solo tres PN. La cuestin clave aqu es que el t no cabe
dentro de la PN sebebe porque es una ELR, es decir, es una expresin referencial lxica
pues el artculo le da la referencialidad que le faltaba antes al sustantivo sin
determinante t. De este modo tenemos:

15. Mara se bebe el t
Cinco PO: Mara, se, bebe, el y t.
Tres PN: Mara, sebebe, elt

Consideremos ahora la expresin Mara bebe te y caf. En este caso, siguiendo el
criterio EDEI de Dahl, no podramos incluir te y caf dentro del paquete de bebe, dado
que presenta una estructuracin interna debido a una regla de conjuncin. Por ello
tendramos la siguiente situacin:

16. Mara bebe te y caf
Cinco PO: Mara, bebe, te, y caf
Tres PN: Mara, bebe, tycaf

Segn Dahl, su concepto de paquete se podra concebir como la unidad morfolgica
mxima, en palabras de este autor:

Aunque paquete no coincide con la nocin tradicional de palabra, se puede
decir que un paquete representa la mxima palabra posible. Esto es, los
elementos de un paquete pueden en principio integrarse en una palabra, pero
las palabras no van ms all habitualmente de un paquete. (Dahl 2004:
258).

Por tanto, cuando hablamos de PN estamos hablando de una unidad mxima de la
lengua hablada, que est constreida por los lmites impuestos por los procesos de
articulacin y de procesamiento lingsticos. Estos lmites son iguales para todos los
seres humanos y, por tanto, para todas las lenguas. Por consiguiente, lo que esperamos
encontrar es que las PN tengan en general una longitud y una complejidad similares en
todas las lenguas del mundo.
Es curioso que la lingstica tradicional se haya ocupado muy poco de averiguar cules
son las unidades de la lengua hablada y se haya limitado a estudiar las unidades
lingsticas tal cual aparecen en la escritura, segn unas convenciones ortogrficas
tradicionales. Esta despreocupacin va contra una de las ideas fundamentales de la
lingstica contempornea: la consideracin de la lengua hablada o seada como
elemento primordial del anlisis lingstico, dado que la escritura no es otra cosa que
una adicin cultural que, a diferencia con lo que ocurre respecto de la lengua hablada o
seada, no es universal y, por tanto, no puede figurar como ncleo bsico en las
investigaciones sobre las lenguas naturales.
Es lgico que las personas expertas en morfologa realicen una labor analtica que les
lleva a buscar cules son las unidades significativas mnimas de la primera articulacin
del lenguaje, en trminos de A. Martinet. Pero no tiene mucho sentido mantener que las
unidades que identifican a travs de su actividad analtica sean unidades de la lengua
natural. Esto se ve muy bien en el caso de la fonologa. Los fonemas se deducen
analticamente a travs de anlisis cientficos realizados de forma slida, tales como el
de N. Trubetskoy en sus principios de fonologa, por ejemplo. Pero los fonemas no son
una unidad de la lengua natural: las expresiones lingsticas naturales no son ni
articulatoriamente ni perceptualmente sucesiones de fonemas. Pero s que existe una
unidad natural, la slaba, que es la que da cuenta de las expresiones tal como se
construyen y perciben. Pero algo crucial es que una slaba no es una sucesin de
fonemas en modo alguno, sino un todo integrado y dotado de una estructura que es
cualitativamente distinto de una mera sucesin de fonemas. Este extremo fue notado
nada menos que por Aristteles en su Metafsica:

Puesto que lo que es compuesto de algo de tal modo que el todo constituye
una unidad, no como un montn, sino como una slaba, y la slaba no es, sin
ms, las letras b y a no es lo mismo que ba [] La slaba es,
ciertamente, algo, no es solo las letras, la vocal y la consonante, sino adems
algo distinto. [] Parecera, pues, que se trata de algo, y que no es un
elemento, y que es la causa [] de que esto sea una slaba. Y puesto que
algunas cosas no son entidades y, por su parte, las que son entidades estn
constituidas segn la naturaleza y por naturaleza, parecera que la entidad es
esa naturaleza que no es elemento sino principio. (Aristteles, Metafsica,
VII 1041b 11-31, versin espaola de Toms Calvo Martnez, Madrid:
Gredos, 1994, pginas 340-341).

Este pasaje de la Metafsica aristotlica es de suma importancia para lo que aqu estoy
tratando. Esta importancia ha sido puesta de relieve por un investigador en los
siguientes trminos:

En este importante fragmento del pensamiento aristotlico se expone su
teora de la causa formal como aquello que establece la naturaleza de una
entidad y que no es un elemento sino un principio explicativo de que la
esencia de muchos elementos compuestos no pueda entenderse como la
simple suma de sus componentes sino como algo distinto, como algo ms.
Para aclarar lo que quiere decir utiliza el caso de la slaba como ejemplo de
composicin de elementos cuya naturaleza y funcionamiento no puede
analizarse como simple concatenacin de una clase determinada de sonidos
sino como una combinacin que responde a una causa formal, a un principio
que da el valor de slaba a una secuencia fnica. (Gonzlez Pereira 2011:
180).

De forma anloga nos enfrentamos con la palabra natural (PN). La palabra natural no es
un mero agregado que surge de aadir elementos aglutinados a la palabra ortogrfica, de
manera que en los nios tenemos una aglutinacin de los a nios, considerada como la
unidad morfolgica adecuada. Es una unidad superior que no se puede reducir a una
mera concatenacin de elementos. Dicho de otra manera, losnios es una PN con una
estructuracin determinada que no surge de una simple concatenacin de elementos,
igual que la slaba natural pa no es una simple concatenacin de dos letras, sino un
fenmeno unitario complejo que no se puede reducir a una simple concatenacin.
La idea de que se aglutina los a nios viene de la suposicin de que la unidad
morfolgica propiamente dicha de la lengua es nios y a esta unidad se le aade un
artculo. Pero el problema es que los y nios son unidades de la lengua escrita que
proceden de un anlisis previo por parte de diversas personas o instituciones, que no
obedece a los procedimientos que usan las personas corrientes al hablar. Son unidades
del anlisis que se hace de la lengua, pero eso no significa que sean unidades de la
lengua natural. Considerar que en los nios tenemos dos palabras naturales es un
absurdo manifiesto desde el punto de vista de la lengua natural, dado que los no es un
elemento autnomo que se comporte como tal en el habla real.
Hay buenas razones para pensar que existen unidades morfolgicas mximas tales como
la PN que estoy caracterizando en este artculo. Estas razones estn en las limitaciones y
determinaciones de la naturaleza psico-fisiolgica de los seres humanos. La longitud y
complejidad de las PN estn necesariamente determinadas por las caractersticas
psquicas y fsicas de los seres humanos y tiene que ver con la longitud de lo que
podemos manejar articulatoriamente de forma rpida y automtica, como se usan las
lenguas naturales, y de lo que podemos analizar de forma rpida utilizando nuestra
memoria de trabajo a corto plazo, que nos limita de forma severa.
Por esa razn hay una unidad morfolgica de las lenguas naturales adaptada
precisamente a esos condicionamientos, que es la PN. Los condicionamientos que dan
lugar a las palabras ortogrficas (PO) nada tienen que ver con esos condicionamientos
naturales de la PN, sino que dependen de las habilidades intelectuales de quienes
realizan el anlisis y de las tradiciones culturales que les condicionan. Por eso es difcil
que coincidan los conceptos de PO y PN. Y tambin por esa razn no es legtimo
estudiar las unidades morfolgicas de las lenguas naturales sobre la base de las unidades
establecidas de modo convencional para las lenguas escritas, como ocurre normalmente.
6 El espaol coloquial como lengua polisinttica
El concepto de lengua polisinttica se reserva para aquellos idiomas que
presentan un alto grado de sntesis en sus unidades morfolgicas. El trmino fue
inventado en 1816 por P. S. Duponceau para una carta dirigida a John Heckewelder
(Mithun 2009: 3) en la que se refiere a la lengua groenlandesa como formada segn un
modelo polisinttico. Segn Duponceau (Mithun 2009: 4) la construccin polisinttica
se caracteriza porque un gran nmero de ideas se comprime en un mnimo nmero de
palabras utilizando la composicin morfolgica y mediante el verbo, en el que sus
diversas formas flexivas no solo expresan la accin principal sino el nmero ms amplio
posible de ideas y objetos conectados con ellas. A partir de entonces los lingistas hacen
referencia para ilustrar la polisntesis a las complejas palabras de algunas lenguas
amerindias y de otros continentes en las que se incluyen muchos afijos y que a veces se
traducen a otras lenguas con oraciones completas, por lo que en alguna ocasin se las ha
denominado palabras holofrsticas.
La familia esquimal de lenguas es considerada por los lingistas como una de las que
manifiesta ms polisntesis. He aqu un ejemplo del yup siberiano, una lengua de esta
familia (de Reuse 2009: 23):

17. Neghyaghtughyugumayaghpeteaa
negh-yaghtugh-yug -uma-yagh -pete -aa
comer-ir-querer-pasado-afijo frustrativo-afijo inferencial-3 persona
Resulta que quera ir a comerlo pero

Pero Realmente podemos considerar que expresiones como la que acabamos de citar
son unidades de una lengua natural, son palabras naturales? Esta pregunta se la ha hecho
una investigadora de las lenguas indgenas de Amrica del norte. Se trata de M. Mithun
(1996: 138-139). Esta autora cita la siguiente palabra del mohaqus (Mohawk), lengua
iroquesa, obtenida de una persona hablante nativa y que es un tipo de palabra bastante
normal en esta lengua

18. sahuwanhotukwahse
s-a-huwa-nho-tu-kw-ahse
de nuevo-PASADO-ella a l- puerta-cerrar-des-para-PERFECTIVO
Ella le abri la puerta de nuevo

Segn Mithun no cabe la menor duda de que esta expresin es una palabra en
mohaqus. Para demostrarlo utiliza los siguientes siete criterios.
En primer lugar, las personas hablantes nativas del mohaqus la consideran
como una unidad, independientemente de que la hayan escrito o no alguna vez
en su lengua.
En segundo lugar, estas expresiones se expresan de forma continua, sin hacer
ninguna pausa entre sus elementos.
En tercer lugar, este elemento no puede ser interrumpido por otros elementos: no
se puede entrometer ningn elemento adicional en la palabra.
En cuarto lugar, los componentes de esa palabra no se reconocen por parte de las
personas hablantes cuando se emiten aisladamente.
En quinto lugar, el orden de los elementos es fijo y no se puede cambiar: si se
cambia el orden, la palabra se vuelve irreconocible.
En sexto lugar, algunos de los morfemas poseen diferente forma segn
aparezcan en un lugar u otro de la palabra.
En sptimo lugar, hay un nico acento dominante en toda la palabra. Desde el
punto de vista prosdico es una unidad.

Analizaremos ahora una expresin de la lengua espaola coloquial informal parecida a
la del mohaqus y le aplicaremos los siete criterios para comprobar si se trata de una
unidad morfolgica mxima de la lengua espaola hablada, es decir, de una palabra
natural. La expresin es la siguiente e indico adems la forma ortogrfica estndar:

19. [eskenselando]
[es-ke-no-se-l(o)-a-n-da-o]
Es que no se lo han dado

Esta expresin contiene nueve elementos, dos ms que la del mohaqus que analiza
Mithun. Funciona de modo similar a la expresin mohaquesa segn los siete criterios
aducidos?
Segn el primer criterio, los hablantes deben reconocer esa expresin como
conformando una unidad. No cabe duda de que esto es as, porque toda persona de habla
nativa espaola identifica esa expresin y la analiza globalmente sin la menor dificultad.
El segundo criterio se aplica tambin a esta expresin porque se pronuncia de una sola
vez, sin hacer pausas entre sus elementos. Si se hiciera una pausa entre no y se
obtendramos dos oraciones yuxtapuestas: Es que no. Se lo han dado. Y si hiciramos
una pausa entre se y lo obtendramos otras dos oraciones yuxtapuestas: Es que no s. Lo
han dado. Las segmentaciones: *Esquenoselo. Han dado, *Esqueno. Selo. Han dado,
son imposibles. Por tanto este criterio tambin se puede aplicar a la palabra espaola.
El tercer criterio consiste en introducir algn elemento para interrumpir la palabra. Por
ejemplo la expresin adverbial claro. Este adverbio puede aparecer despus de es para
obtener Es claro que no se lo han dado, pero entonces obtenemos una construccin
diferente. Si introducimos claro como un parenttico: *Es, claro, que no se lo han dado,
la construccin es anmala. Si introducimos claro despus de esque: *Es que claro no
se lo han dado la construccin es anmala a no ser que interpretemos claro como
predicado, pero entonces es otra construccin distinta. La nica posibilidad es
introducirlo como parenttico: Es que, claro, no se lo han dado. Las dos comas indican
precisamente que se est interrumpiendo una unidad y que se trata de un elemento ajeno
a la palabra, que tiene carcter pragmtico. No se puede introducir claro despus de no,
ni siquiera como parenttico: *Es que no claro se lo han dado. Tampoco se puede
introducir despus de se: *Es que no se claro lo han dado, ni despus de lo; *Es que no
se lo claro han dado, ni despus de han: *Es que se lo han claro dado.
Alguien podra objetar que claro nunca puede aparecer dentro de un elemento
derivativo o flexivo de una palabra: *nio-claro-s o *cas-claro-itas. Esto es cierto en
general en el caso de los morfemas flexivos y derivativos; pero en este artculo estoy
manteniendo que la PN, frente a la PO, consta de esos morfemas flexivos y derivativos
ms otros elementos aglutinados como los clticos, que tienen una menor integracin
morfolgica con el tema lexemtico, pues son externos a l. Por tanto, el argumento no
es vlido en este caso porque solo vale para una parte de lo que se considera aqu
palabra natural (PN), pero no para toda ella.
El cuarto criterio consiste en el hecho de que algunos de los componentes de esa
expresin no son reconocidos por las personas hablantes cuando se emiten
aisladamente. En el caso que nos ocupa, vimos al hablar sobre el punto segundo
expresiones como esqueno, noselo, lohan, quenose, que no va a ser reconocidas como
unidades lingsticas por las personas hablantes nativas del espaol. Este criterio se
cumple perfectamente.
El quinto criterio se cumple tambin. No podemos cambiar el orden de los elementos si
no queremos obtener autnticos monstruitos morfolgicos. He aqu algunos ejemplos:
Es no se que le han dado, Le han no se dado es que, Es dado que no se le han, Han
dado se le es que no y otros muchos ms.
El sexto criterio se cumple tambin cuando observamos que algunos morfemas tienen
distinta forma segn su posicin, de manera que, en el ejemplo que nos ocupa, lo
aparece simplemente como l seguido de han.
El sptimo criterio tambin lo cumple la expresin [eskenselando], en donde el acento
dominante est en el elemento no. Tambin podra aparecer en el elemento dao:
[eskenselando], dependiendo del nfasis. En cualquier caso el otro elemento que
puede recibir acento lo recibe secundario. Qu ocurrira si en esta expresin hubiera
dos acentos principales, uno en no y otro en do? Pues simplemente que estaramos ante
dos unidades diferentes: Es que no. Se la han dado.
Por consiguiente, los mismos criterios que llevan a decir que la palabra del mohaqus es
una unidad morfolgica mxima de la lengua hablada, se pueden aplicar a la unidad
morfolgica del espaol coloquial hablado que acabamos de analizar.
Qu consecuencias puede tener esto para la determinacin del tipo morfolgico al que
pertenece el espaol hablado coloquial?
En el mismo artculo al que me refer anteriormente, Greenberg (1954: 12) propone un
ndice de sntesis para medir la complejidad morfolgica de la palabra. Este ndice se
obtiene mediante la divisin M/P donde M es el nmero de morfemas y P es el nmero
de palabras. El nmero ms bajo que se podra obtener es 0 si solo hay palabras lxicas
en una lengua y no hay morfemas, es decir si tenemos en un texto supongamos 10
palabras y cero morfemas (todas las palabras son lexemas), tendramos entonces 0/10 =
0. No existe ninguna lengua de este tipo, ya que todas las lenguas del mundo tienen
elementos morfemticos; ninguna lengua puede funcionar solo con elementos lxicos.
Hago una interpretacin ms estricta que la de Greenberg, ya que para este autor los
lexemas cuentan tambin como morfemas.
A. Tovar tambin usa este ndice (Tovar 1981: 186) y lo define en los mismos trminos
que Greenberg, segn los cuales en am-ba-mos hay tres morfemas, entendiendo
morfema como unidad significativa. Sin embargo, aqu considero que am-ba-mos
consta de solo dos morfemas (ba y mos) ms un lexema (ama). Sobre la cuestin de qu
ha de entenderse por palabra Tovar explica lo siguiente:

El difcil problema de definir la unidad palabra lo resolveremos
pragmticamente con el uso ortogrfico (con evidentes contradicciones,
como dganos/nos diga). (Tovar 1981: 186)

Este prrafo es muy revelador porque nos indica cmo se utiliza la ortografa para hacer
comparaciones tipolgicas, lo cual es nefasto, porque la palabra ortogrfica no es una
unidad lingstica natural sino inventada por una determinada tradicin cultural. Como
ya hemos visto en las secciones anteriores y como vamos a ver en esta, la utilizacin de
la PO en vez de la PN supone una grave distorsin de los datos y compromete
gravemente la comparacin tipolgica.
Tovar (1981: 190) da el siguiente cuadro sobre los grados observables del ndice de
sntesis:

NDICE DE SNTESIS
muy alto de 2,35 a 2,59
alto de 2,09 a 2,34
medio de 1,83 a 2,08
bajo de 1,58 a 1,82
muy bajo de 1,33 a 1,57

Segn esta determinacin, las lenguas cuyas palabras tengan una media de menos de un
morfema por palabra tienen un ndice de sntesis bajo, a partir de dos morfemas por
palabra, el ndice sube de alto a muy alto.
Tovar (1981: 197) toma el dato del ndice de sntesis del esquimal de Greenberg, que es
3,72, es decir, un ndice altsimo y lo contrasta con el del espaol, que segn su estudio
basado en tres textos espaoles, es 1,69. Es decir, mientras que el esquimal tiene segn
Greenberg un ndice de sntesis altsimo, el espaol, segn Tovar, tiene un ndice de
sntesis bajsimo. Es decir, las lenguas esquimales son polisintticas y el espaol no lo
es.
Pero voy a mostrar ahora mismo que el origen de esta diferencia tan grande est
precisamente, no en el carcter lingstico del espaol, sino en el carcter ortogrfico
del sistema utilizado en la ortografa estndar de nuestra lengua. Por consiguiente, voy a
mostrar que lo que tiene un grado bajo de sntesis no es la lengua espaola hablada, sino
la lengua espaola escrita segn las normas acadmicas reconocidas institucionalmente.
Para ello, voy a comparar un texto de una lengua de la familia esquimal, el groenlands,
una variedad inu. Berge (2009: 191) recoge un texto groenlands obtenido a finales del
siglo XIX. Aparece a continuacin y se consigna al final de l el ndice de sntesis.

Egede pigaar-tar-luni unnu-u-giar-toq angu-rpassuit igalaa-p silat-aanut pi-
sa-ler-mata ilaani unnua-mi aasiit, ataaseq silatangiu-mmat malik-kaluar-
sima-q-aa angu-ngajal-lugu-gooq sissa-mut tammaa-gamiuk killiga-lugu-
gooq takku-toq-qa-ssaar-poq. [28/18 = 1,55]

En este texto de la lengua oral encontramos 28 morfemas y dieciocho palabras, con lo
cual obtenemos un ndice de sntesis de 1,55; es decir, de un morfema y medio por
palabra. Si contramos tambin los lexemas como morfemas, entonces tendramos 46 y
el ndice sera 45/18 = 2,5, con lo que, segn la tabla de Tovar, el groenlands tiene un
nivel muy alto de sntesis y es por consiguiente una lengua polisinttica.
Vamos a usar para la comparacin, la traduccin al espaol escrito de este texto

Egede fue a vigil-ar por l-a noche. Haba much-o-s hombre-s situad-o-s
frente a l-a ventana. Un-a noche como de costumbre hab-a un hombre
delante de l-a casa. L-o sigu-i pero cuando l-o hab-a segui-do casi hasta l-a
playa, de repente dej- de ver-l-o; hab-a llega-do hasta all y no avanz-
ms. Nunca ms se le volvi- a ver. [23/58 = 0,39]

Hemos respetado las palabras ortogrficas y sealado los morfemas de cada una de esas
palabras. Hay 23 morfemas y 58 palabras, con lo que tenemos un ndice de sntesis muy
bajo, que no llega a 1 (0,39). Para situar el espaol en la graduacin dada por Tovar
tenemos que contar los lexemas como morfemas. Si lo hacemos as obtendremos 82/ 58
= 1,4; es decir, obtenemos un grado de sntesis muy bajo.
Pero si en vez de considerar las PO como unidades de la lengua espaola hablada,
consideramos las PN, es decir las palabras tal como aparecen en el habla coloquial
espontnea, los resultados van a ser radicalmente distintos. He aqu una transcripcin
del texto espaol muchsimo ms cercana al espaol hablado espontneo que la
realizada anteriormente segn las reglas ortogrficas vigentes:

Egede fue-a-vigil-ar por-l-a-noche. Haba much-o-s-hombre-s situad-o-s
frente-a-l-a-ventana. Un-a-noche como-de-costumbre hab-a un-hombre
delante-de-l-a-casa. L-o sigu-i pero-cuando l-o-hab-a segui-do casi-hasta-l-
a-playa, de-repente dej--de-verl-o; hab-a-llega-do hasta-all y-no-avanz-
ms. Nunca-ms se-l-e-volvi- a-ver. [45/ 27 = 1,66]

Si no contamos los lexemas como morfemas, obtenemos un ndice de 1,66. Para
encontrar la equivalencia de esta cifra con la de la tabla de Tovar, hay que contar
tambin los lexemas, con lo cual el ndice habra que calcularlo a travs de la divisin
82/27 = 3,03. El resultado que obtenemos es realmente sorprendente: el espaol tiene un
ndice de sntesis considerablemente mayor que el del groenlands (2,5), lo cual sita al
espaol hablado entre las lenguas polisintticas.
Este resultado muestra lo mucho que afecta la ortografa a la comparacin y tipologa de
las lenguas. En este caso, como en los dems, no es metodolgicamente correcto
comparar un texto oral como el del groenlands con un texto escrito como el de la
primera traduccin que se ha dado del texto groenlands. No lo es porque lenguas como
el groenlands y la mayor parte de las lenguas esquimales y de muchas otras familias
del mundo no tienen tradicin escrita y los lingistas que han transcrito esas lenguas
han intentado atenerse a lo que escuchaban y no a ningn modelo ortogrfico de la
lengua. Por eso, estos textos de lenguas no europeas deben ser comparados no con
textos escritos de las lenguas europeas, sino con textos orales de ellas, si es que
queremos hacer una comparacin mnimamente coherente.
De todas formas, el lingista que hace una transcripcin de un texto oral del esquimal o
de cualquier lengua de otra familia lingstica sin tradicin escrita, est condicionado al
hacer dicha transcripcin por las convenciones ortogrficas de su propia lengua. Esto
puede llevarle a que si, por ejemplo, identifica un elemento de la lengua que transcribe
como una preposicin pueda llegar a escribir ese elemento separado del elemento a que
dicha preposicin afecta, por influencia del sistema ortogrfico de su propia lengua.
Esta circunstancia, que puede pasar inadvertida en ms de una ocasin, puede ser la
responsable de que, en el caso que hemos visto, el espaol hablado resulte ser una
lengua ms polisinttica que el propio esquimal. Es posible que la inercia ortogrfica del
lingista o del estudioso que ha realizado la transcripcin haya hecho algunas
separaciones que no se producen en el habla. De aqu podra surgir el sorprendente
resultado que hemos obtenido en el pequeo pasaje analizado. Esto ya lo observamos en
la seccin anterior al comparar el euskera y el espaol. Si comparamos el espaol
hablado espontneo con el euskera escrito estndar, tendremos tambin unos resultados
sesgados ya que, como hice notar, el euskera escrito estndar tampoco refleja con total
fidelidad el euskera hablado realmente.
Convendra preguntarse si estamos, al describir las lenguas esquimales, ante un tipo de
lengua polisinttica diferente de otros tipos lingsticos o bien estamos ante la
explotacin de un procedimiento que existe en todas las lenguas del mundo y que cada
una de ellas aprovecha en mayor o menor medida. Ese procedimiento ha sido
identificado y estudiado por W. J. de Reuse (2009) quien lo ha denominado
concatenacin productiva no flexiva (CPN) (productive noninflectional concatenation,
PNC). Este autor (de Reuse 2009: 22) propone la siguiente tabla en donde se compara la
CPN con la flexin (F), la derivacin (D) y la sintaxis (S).

F D CPN S
Productividad s no s s
Recursividad no no s s
Concatenacin necesaria no no s s
Orden variable no no s s
Interaccin sintctica s no s s
Cambio categorial no s s s

De Reuse analiza, para ilustrar la primera propiedad, el ejemplo 17 de yup central
siberiano que hemos visto antes y que repito aqu para facilitar la lectura:

20. Neghyaghtughyugumayaghpeteaa
negh-yaghtugh-yug -uma-yagh -pete aa
comer-ir-querer-pasado-afijo frustrativo-afijo inferencial-3 persona
Resulta que quera ir a comerlo pero

La productividad se refiere al hecho de que se pueden obtener estas palabras naturales
como la vista de modo sistemtico y abierto. No existen como palabras en una lista
memorizada por las personas hablantes, sino que se crean de forma ocasional. Segn
observa de Reuse, en la expresin de 20 solo hay dos elementos obligatorios: negh y
aa; los dems elementos son opcionales y podran aparecer o no, con lo cual se pueden
obtener diversas palabras naturales ms breves en las que aparecen algunos de los afijos
morfolgicos, por lo que se pueden formar treinta palabras diferentes con distintas
combinaciones de afijos (de Reuse 2009: 23).
Consideremos desde este punto de vista la expresin de la lengua espaola coloquial
que comparbamos con la forma del yup aducida: eskenoselandao (es que no se lo han
dado, en forma ortogrfica). Es evidente que, como en el caso del ejemplo del yup, es
una palabra natural (PN) de formacin ocasional que no parece acertado considerar
como un elemento formado y almacenado en la memoria de las personas hablantes. Por
otro lado, como ocurre en el caso del yup, la forma andao sera el ncleo obligatorio
desde el punto de vista de la buena formacin como PN, los dems elementos son
concatenados de forma opcional. De hecho, podemos tambin obtener las siguientes
variantes segn los elementos que se aadan o se dejen de lado: noandao, nolandao,
noselandao, kelandao, kesalandao, eskelandao, eskeselandao. Todas estas formas son
ocasionales y libremente generadas y procesadas por las personas usuarias de la lengua
espaola. Por tanto, desde el punto de vista de la productividad, las dos expresiones se
comportan de modo anlogo.
En cuanto a la recursividad, De Reuse (2009: 24) ofrece el siguiente ejemplo ilustrativo:

21. iitghesqesaghtiisqaa
itegh-sqe-yaghtugh-sqeaa.
entrar-pedir-ir-pedir-3persona del singular
Lej pidi que lek pidiera entrar

En este ejemplo, el elemento sqe pedir aparece en dos ocasiones, por lo que se est
utilizando recursivamente.
Algo similar podemos ver en algunas PN espaolas como, por ejemplo, losdelosnios,
en donde el artculo los aparece en dos posiciones con referencias diferentes, tal como
ocurre en el ejemplo del yup que aporta De Reuse. Por tanto, en este aspecto las PN del
espaol se comportan como las PN del yup.
La concatenacin es tpica de todas las palabras que estamos viendo en este artculo; por
ello no hace falta ilustrar esta caracterstica de la CPN.
El orden variable lo ilustra de Reuse con los siguientes dos ejemplos del yup:

22. aananiitkaa
aane -nanigh -utke -aa
salir-dejar de- por ello-ind.3s.3s
Ha dejado de salir por ello.

23. aanutkenanighaa
aane -utke -nanigh -aa
salir-por ello-dejar de-ind.3s.3s
Ha dejado de salir por ello

En estas oraciones aparece el morfema utke en dos posiciones diferentes, aunque las
oraciones tienen el mismo significado.
En espaol coloquial no es infrecuente encontrar este tipo de movilidad. Por ejemplo, si
comparamos el vulgar mesecay con el culto se me cay, observamos dos rdenes
alternativos del mismo elemento. Tambin se pueden ver variaciones en el espaol
coloquial entre, por ejemplo, melod, frente al estndar dmelo para el imperativo.
Respecto a la interaccin con la sintaxis, de Reuse (2009: 26) aporta el siguiente
ejemplo de yup siberiano:
24. atan aangelghiimeng qikmilguuq.
ata -n aange-lghii -meng qikmigh-lgu uq
padre-posesivo .2s.abs.sg. ser grande-intr.ptcp-mod.sg. perro-tener -ind.3s
Tu padre tiene un perro grande

En este caso vemos que la atribucin del adjetivo aange (grande) se aplica a un
elemento que est en el interior de una PN, es decir a qikmigh (perro).
En espaol tambin podemos ver casos de interaccin la sintaxis, como por ejemplo el
regalo locompr ayer, donde la PN locompr contiene un elemento relacionado con el
objeto el regalo.
El cambio categorial lo aprecia de Reuse (2009: 27) en el siguiente ejemplo del yup
central siberiano:
25. yughaghvigllangyugtut
yughagh-vig-ghllag-nge -yug tut
rezar -lugar-grande-adquirir-querer-indicativo 3persona
Quieren adquirir una gran iglesia

Este autor observa que la expresin verbal yughagh- rezar cambia categorialmente a
nombre en la forma yughaghvig- iglesia y luego, a otro nombre yughaghvigghllag
iglesia grande y, por ltimo vuelve a convertirse en verbo en yughaghvigghllagnge
adquirir una gran iglesia.
En el ejemplo del espaol coloquial que vimos al ilustrar la recursividad losdelosnios
tambin puede verse este cambio categorial: losnios que es un nombre, pasa a
modificador nominal (delosnios) y luego otra vez a nombre (losdelosnios).
Como consecuencia de los anlisis precedentes y del concepto de CNP, de Reuse
plantea introducir el concepto de CNP entre los dos procedimientos fundamentales de la
morfologa:

Una consecuencia de aceptar el CNP como una rasgo caracterizador de la
polisntesis es una visin trinitaria de la morfologa. En vez de distinguir
entre flexin y derivacin, ahora hay que diferenciar entre morfologa
flexiva, CNP y derivativa. As que la CNP es un tipo de morfologa, al
mismo nivel que la flexin y derivacin. (de Reuse 2009: 27)

Esta introduccin supone una modificacin sustancial del tipo de morfologa clsica a
que alud al principio de este artculo en los siguientes trminos:

Otra consecuencia de este punto de vista es que no existe el tipo lingstico
polisinttico. Las lenguas denominadas polisintticas son idiomas con un
uso grande o notable de la CNP. La diferencia entre las lenguas polisintticas
y no polisintticas es, pues, de tipo cuantitativo, no cualitativo. (de Reuse
2009: 28).

Esta conclusin deja abierta la puerta a la idea de que todas las lenguas del mundo son
polisintticas en mayor o menor grado. Acabamos de ver en esta seccin que el espaol
coloquial, ajeno a las convenciones analticas de la lengua escrita, es una lengua tan
polisinttica como el yup siberiano central.
7 Conclusin: el espaol como lengua aglutinante y polisinttica.
En este artculo he examinado los supuestos tipos lingsticos aglutinante y
polisinttico desde el punto de vista de las lenguas habladas espontneas, entre ellas el
espaol coloquial. Primero, he puesto de manifiesto que existe una clara diferencia
lingstica entre los idiomas flexivos y no flexivos, o de flexin reducida. Por ejemplo,
el ruso tanto escrito como hablado en su forma coloquial es una lengua claramente
flexiva, frente al ingls escrito y hablado que es una lengua muy poco flexiva o el chino
escrito, que es una lengua no flexiva y el chino hablado, en el que hay unos pocos
indicios aislados de fusin morfolgica. Por tanto, s parece lcito distinguir las lenguas
flexivas de las no flexivas, tanto en el nivel de la lengua hablado como en el de la
lengua escrita.
He explicado, sin embargo, que los conceptos de lengua aislante, monosilbica y
aglutinante estn fuertemente influidos por la lengua escrita. En cuanto a los dos
primeros tipos, de los que me he ocupado en la segunda seccin del presente artculo, he
mostrado que su postulacin se basa exclusivamente en el anlisis de la lengua escrita;
respecto del tercero, la aglutinacin, he intentado mostrar que la diferencia entre lenguas
aglutinantes y no aglutinantes est en una gran medida determinada tambin por la
lengua escrita. En general, la lengua escrita es mucho ms analtica que la lengua
natural, es decir, la hablada. Por eso, la escritura no recoge el hecho de que el habla
coloquial normal espontnea es muy aglutinante y, por ello, considera como
aglutinantes propiamente hablando algunas lenguas cuyas convenciones ortogrficas
dejan pasar de forma ms clara ese carcter aglutinante universal. Como conclusin,
cabe decir que la aglutinacin es una de las caractersticas fundamentales de todas las
lenguas habladas naturales y no de un determinado tipo de lenguas.
En las secciones tercera y cuarta de este artculo he analizado con ms detalle la idea de
que hay lenguas de tipo aglutinante, como el turco, el hngaro, el fins o euskera.
Concretamente, en la seccin cuarta he analizado crticamente los resultados relativos al
ndice de aglutinacin del euskera comparado con el del espaol. Mediante una serie de
ejemplos, he intentado mostrar que esos resultados estn significativamente sesgados
por la representacin grfica normativa de las lenguas consideradas y que si corregimos
la fuente del problema, los ndices de aglutinacin que obtenemos del euskera y del
espaol son significativamente similares.
En la seccin quinta, he expuesto un concepto de palabra que no se basa en la palabra
escrita y, por tanto, en las convenciones ortogrficas, sino en la palabra oral como
unidad mxima de organizacin de las acciones de produccin y procesamiento de la
informacin en las lenguas naturales. He analizado una propuesta concreta para
caracterizar lingsticamente esa unidad mxima, que denomino palabra natural.
La seccin sexta se dedica a examinar el tipo lingstico denominado polisinttico. Se
analizan varias palabras-oracin del yup siberiano central, una lengua esquimal, y los
ndices de sntesis propuestos para el esquimal y el espaol. Vuelvo a mostrar que esos
ndices de sntesis se obtienen a partir de unos datos sesgados por las reglas ortogrficas
del espaol. Si se corrige ese sesgo, se llega a la inequvoca conclusin que el espaol
coloquial hablado informal es tanto o ms polisinttico que el yup y otras lenguas
consideradas tradicionalmente como pertenecientes a este supuesto tipo lingstico, tal
como muestro detenidamente en esa seccin al comparar un breve texto groelands, otra
lengua de la familia esquimal, con su traduccin espaola.
Examino tambin una propuesta reciente en la que se mantiene que tanto las lenguas
esquimales como las dems lenguas del mundo, incluido, claro es, el espaol, conocen
un procedimiento morfolgico denominado concatenacin productiva no flexiva que
hace posible que todas las lenguas del mundo puedan calificarse como polisintticas,
siendo las diferencias entre ellas de grado respecto de este parmetro. Por tanto, no
existe el tipo polisinttico de lengua y, adems, todas las lenguas del mundo son tanto
aglutinantes como polisintticas en mayor o menor grado.
Las conclusiones de este trabajo se basan en un postulado esencial de la lingstica
contempornea: las lenguas habladas o seadas espontneas han de ser la materia prima
fundamental de los datos y hechos lingsticos; las lenguas escritas son derivadas de las
primeras y no pueden constituir la base probatoria definitiva para la caracterizacin del
lenguaje humano. Por tanto, si vemos una caracterstica que se da solo en la lengua
escrita y no se da en la lengua hablada espontnea, entonces esa caracterstica no puede
ser utilizada para caracterizar las lenguas naturales tal como aparecen en toda
comunidad humana, conozca o no la escritura. La escritura es una elaboracin cultural
realizada a partir de la lengua natural y constituye un aspecto de lo que denomino
lengua cultivada. Sera absurdo estudiar las lenguas del mundo a travs de las
respectivas formas poticas, mgicas, rituales o religiosas de cada una de ellas. Todas
las comunidades humanas conocen variedades artificialmente modificada de sus lenguas
naturales, que se usan para fines como los que acabo de enumerar. Se trata de lo que
llamo lenguas cultivadas (Moreno Cabrera 2011, 2013). Dado que las lenguas
cultivadas, entre las que se encuentran las lenguas estndar escritas de algunas
sociedades occidentales y orientales, se obtienen mediante modificaciones
culturalmente determinadas de ciertos aspectos de las lenguas naturales espontneas, no
es lcito metodolgicamente caracterizar las lenguas naturales mediante las formas,
reglas y procesos que son propios de las lenguas cultivadas.
Las normas ortogrficas vigentes en una comunidad idiomtica son precisamente de
carcter cultural, no natural y, por tanto, no deberan formar parte ni tener repercusin
alguna en el estudio de las lenguas naturales, dado que no sirven para caracterizar las
propiedades, reglas y procesos de dichas lenguas naturales.
Sin embargo, la influencia de las convenciones ortogrficas es tan grande entre los
lingistas que incluso se respetan en aquellos estudios explcitamente dedicados a la
lengua coloquial espontnea, que no se basa ni se puede pasar en las convenciones
ortogrficas de una lengua. Un ejemplo de esto, entre los muchsimos que pueden
aportarse, lo tenemos en un estudio de un corpus de referencia integrado de las lenguas
romances habladas, denominado C-ORAL-ROM (Cresti y Moneglia 2005). Todos los
ejemplos de frases extrados de este corpus se dan siguiendo las normas ortogrficas de
cada lengua analizada. He aqu unos ejemplos:
espaol: la moto de mi abuelo (Cresti y Moneglia 2005: 153)
italiano: passiamo ad un altro argomento / via (Cresti y Moneglia 2005: 103)
francs: il est malade quoi (Cresti y Moneglia 2005: 118)
portugus. Ana lembrou a me da sua consulta mdica (Cresti y Mioneglia 2005: 185)

En estas expresiones, extradas del corpus de referencia de las lenguas habladas
coloquiales de cuatro lenguas europeas, se transcriben expresiones de ese corpus
utilizando las convenciones ortogrficas de cada una de las lenguas implicadas. Esto
supone falsear claramente los datos empricos, ya que puedo afirmar con rotundidad que
en ninguno de los cuatro ejemplos que acabo de mencionar las personas que los
emitieron hicieron las pausas que sugieren los espacios en blanco que hay entre las
palabras ortogrficas que aparecen, de modo que la persona galo-hablante es seguro que
no pronunci ilt est malade haciendo sendas pausas despus de il y despus de est, la
persona hispanohablante es seguro que no hizo una pausa entre la y moto tal como
sugiere la transcripcin del ejemplo, la persona italiano-hablante no hizo la pausa
sugerida por la escritura entre ad, un y altro y la persona luso-hablante seguro que no
hizo las pausas sugeridas por la ortografa al emitir a me da sua, ni, por supuesto,
pronunci nada que se pueda transcribir como una a mayscula (el nombre propio
Ana). Todas estas transcripciones sugieren unidades y agrupaciones que no son propias
de la lengua hablada espontnea sino de la lengua escrita. Por consiguiente, al hacer
estas transcripciones se estn desvirtuando gravemente los datos del corpus oral y, por
tanto, se est induciendo a conclusiones equivocadas sobre cmo es y cmo opera la
lengua hablada coloquial espontnea: no sabemos a ciencia cierta qu unidades son
operativas en la lengua natural hablada espontnea. Lo que s es seguro es que no son
las unidades reconocidas en las normas ortogrficas. Entonces, por qu recurrir a estas
normas cuando se est precisamente estudiando la lengua coloquial hablada y no la
lengua estndar escrita?
No hay justificacin cientfica plausible de este proceder. Qu inconveniente hay para
transcribir la moto como lamoto? Evidentemente, ninguno, sobre todo cuando se trata
de un estudio de la lengua coloquial hablada. Pero la cuestin es ms grave an, porque
precisamente una de las pocas cosas en las que se han puesto de acuerdo todos los
lingistas de modo universal es precisamente en la transcripcin del habla mediante el
Alfabeto Fontico Internacional (AFI, IPA 1999). La utilizacin del AFI en la
investigacin lingstica debera ser imprescindible, dado que como las normas
ortogrficas de las diversas lenguas que se escriben son diferentes y no todas son
conocidas por todos los lingistas (cuntos lingistas conocen, por ejemplo, las normas
ortogrficas del hngaro o del vasco?), la nica manera de no crear malos entendidos o
interpretaciones equivocadas de los datos es renunciado a las ortografas de las lenguas
que se escriben y recurriendo a la convencin universalmente aceptada del AFI. Esto
podra ser opcional cuando se trata la lengua escrita, pero debera ser obligatorio cuando
lo que estudiamos es la lengua oral. Adems, existen diversos niveles de transcripcin
fontica de las expresiones: hay transcripciones ms anchas y ms estrechas que se
pueden ajustar fcilmente a los propsitos que se persigan en cada caso. Por ejemplo, en
el caso de la expresin espaola la moto, bastara una transcripcin ancha como
[lamto] sin necesidad de incluir ms detalles fonticos que en el uso que se hace de
este ejemplo no vienen al caso.
Podra parecer que esta cuestin de la transcripcin de las expresiones es menor o
secundaria y que no afecta nada esencial de la tarea investigadora lingstica. Sin
embargo, he intentado demostrar en este artculo que la utilizacin de las convenciones
ortogrficas normativas para transcribir los ejemplos de las diversas lenguas tiene
efectos muy perniciosos en la disciplina de la tipologa lingstica (Moreno Cabrera
2008). De hecho, la clasificacin tipolgica en lenguas aislantes, aglutinantes y flexivas
se basa casi exclusivamente en la lengua escrita y, tal como he razonado en este trabajo,
dado que no existen los tipos aislante y aglutinante, todas las lenguas del mundo, en el
nivel oral espontneo, son claramente aglutinantes. El trmino polisinttico como
caracterizador de un supuesto tipo lingstico tampoco es acertado, dado que, desde el
punto de vista de la lengua hablada espontnea, una lengua no considerada polisinttica
como el espaol, lo es tanto como las lenguas esquimales, consideradas desde hace
mucho tiempo como el paradigma de este tipo de idiomas.
La conclusin que extraigo de estas pginas puede parecer muy espectacular pero en
realidad es casi una obviedad. La conclusin consiste en mantener que el espaol
coloquial es una lengua aglutinante (como el vasco o el turco) y polisinttica (como las
lenguas esquimales, algonquinas o iroquesas). Pero esto es realmente decir muy poco,
porque todas las lenguas habladas del mundo son aglutinantes y polisintticas en mayor
o menor medida.

REFERENCIAS BIBLIOGRFICAS

Berge, A. (2009) Tracking Topics. A comparison of topic in Aleut and Greenlandic
discourse, en Mahieu y Tersis 2009: 185-200.
Coulmas, F. (2003) Writing Systems. An introduction to their linguistic analysis. Cambridge:
Cambridge University Press.
Cresati, E. y M. Moneglia (2005) C-ORAL-ROM. Integrated Reference Corpora for Spoken
Romance Languages. Amsterdam: John Benjamins.
Dahl, (2004) The Growth and Maintenance of Linguistic Complexity. Amsterdam:
John Benjamins.
de Reuse, W. J. (2009) Polysynthesis as a typological feature: An attempt at a
characterization from Eskimo and Athabaskan perspectives en Mahieu y Tersis
2009: 19-34.
de Rijk, R. P. G. (2008) Standard Basque. A Progressive Grammar. Cambridge, Mass.:
The MIT Press.
Gonzlez Pereira, M. (2011) Signo lxico y signo gramatical en la antigedad clsica.
Races histricas de una distincin lingstica. Lugo: Axac.
Greenberg, J. (1954) A Quantitative approach to the Morphological Typology of
Language, en K. Denning y S. Kemmer (eds.) On Language. Selected Writings
of Joseph H. Greenberg, Stanford: Stanford University Press, 1990: 3-25.
Han, J., J. Ma y X. L (2002) Chinese er suffixed words without tears. Pekn:
Universidad de Pekn.
IPA (1999) Handbook of the International Phonetic Association. A guide to the use of
the Internationl Phonetic Alphabet. Cambridge: Cambridge University Press.
Mahieu, M.-A. y N. Tersis (eds.) (2009) Variations on Polysynthesis. The Eskaleut
Languages. Amsterdam: John Benjamins.
Mithun, M. (1996) Overview of general characteristics, en I. Goddard (ed.) Handbook
of North American Indians. Vol 17. Languages. Washington: Smithsonian
Institution, 1996: 137-157.
Mithun, M. (2009) Polysynthesis in the Arctic en Mahieu y Tersis 2009: 3-18.
Moreno Cabrera, J. C. (2007-2008) Sobre la complejidad y dificultad de las lenguas. El
caso del euskera en Revista de Lenguas y Literaturas catalana, gallega y
vasca XIII, UNED, 2007-2008: 199-216.
Moreno Cabrera, J. C. (2008) The Written Language Bias in Linguistic Typology,
Cuadernos de lingstica XV IUOG, 2008: 117-137
Moreno Cabrera, J. C. (2011) Diversidad lingstica y diversidad cultural. Tipologa,
evolucin y complejidad, en J. J. Martos, L. Trapassi, I. Garca y V. M. Borrero
(eds.) Dilogos interculturales: lenguas, literaturas y sociedad. Barcelona:
Anthropos, 2011: 11-41.
Moreno Cabrera, J. C. (2013) Cuestiones clave de la lingstica. Madrid: Sntesis.
Nespor, M. e I. Vogel (1994) La prosodia. Madrid: Visor Distribuciones.
Packard, J. L. (2000) The Morphology of Chinese. A Linguistic and Cognitive
Approach, Cambridge: Cambridge University Press.
Reichenbach, H. (1947) Elements of Symbolic Logic, New York, Dover.
Tovar, A. (1981) Comparacin: lxico-estadstica y tipologa, en A. Tovar Estudios
de Tipologa Lingstica. Sobre el euskera, el espaol y otras lenguas del Viejo y
el Nuevo Mundo. Madrid: Istmo, 1997: 173-204.

S-ar putea să vă placă și