Sunteți pe pagina 1din 16

Más sobre Co-locación [Collocation]

NOTA.- La información que sigue y amplía la anterior ha sido tomada y


traducida de la Ayuda en pantalla del paquete comercial WordSmith Tools;
software históricamente descendiente del MicroConcord.

¿Qué es una “co-locada”?

Las co-locadas [collocates] son palabras que aparecen en la vecindad [neighbourhood]


de una palabra-de-búsqueda [search word]. Las co-locadas de carta pueden ser
dirección postal, sello, sobre, etc. Sin embargo, las palabras realmente comunes
[common words] también serán co-locadas con carta.

Opciones

Podemos computar una concordancia [concordance] con o sin co-locadas: sin ellas es
ligeramente más rápido y ocupará menos espacio en nuestro disco duro. La
[configuración] por defecto es computar con co-locadas. El número de co-locadas
almacenadas dependerá de los horizontes de co-locación [collocation horizons].
Podemos re-computar las co-locadas después de editar nuestra concordancia.
Si deseamos filtrar nuestra lista de co-locadas [collocate list], utilizaremos una lista de
coincidencias [match list] o una lista de parada [stop list].
Reordenamos una lista de co-locadas [collocate list] con una variedad de modos.

Podemos ver la fuerza [strength] de las relaciones entre la palabra [word] y la palabra-
de-búsqueda [search-word] en la que se fundamenta la concordancia.
Las co-locadas se pueden visualizar después de que se haya computado la concordancia.

Nota técnica

La literatura sobre la co-locación [collocation] nunca ha distinguido, en realidad,


satisfactoriamente entre co-locadas que pensamos como “asociadas” [“associated”] con
una palabra (carta – sello), por un lado y, por otro, las palabras que de hecho [actually]
co-aparecen [co-occur] con la palabra (carta – mi, esta, un, etc.).
Podemos llamar al primer tipo “co-locadas de coherencia” ["coherence collocates"], y
al segundo “co-locadas de vecindad” ["neighbourhood collocates"] o “co-locadas de
horizonte” ["horizon collocates"]. Se ha sugerido que detectar las co-locadas de
coherencia es realmente difícil. En cuanto empezamos a mirar más allá de un horizonte
de unas 4 ó 5 palabras a cualquiera de los lados, obtenemos muchas palabras que son
más ruido [noise] que señales [signal] en el sistema.

Las Palabras-clave [KeyWords] nos permiten estudiar las Asociadas [Associates], que
son un puntero hacia las “co-locadas de coherencia” [“coherence collocates”].
Concord abastecerá “co-locadas de vecindad” ["neighbourhood collocates"]. WordList
nos permite también estudiar Información Mutua [Mutual Information].

Presentación de la co-locación
El sentido de todo esto es trabajar con patrones de características léxicas [characteristic
lexical patterns]. Puede resultar pesado ver las tendencias globales en nuestras líneas de
concordancia, especialmente si hay lotes de ellas. Examinando las co-locaciones de ese
modo, podemos ver patrones comunes de co-aparición [patterns of co-occurrence]
léxica y gramatical. Los vínculos de co-locación [collocational linkages] que implican
ítems gramaticales se mencionan también como coligación [colligation].

Presentación
La presentación de co-locación [collocation display] muestra inicialmente los co-
locados por orden de frecuencia.
Junto a cada palabra y la palabra-de-búsqueda (en la que está basada la concordancia),
veremos la fuerza [strength] de la relación entre las dos (ó 0.000, si no se ha
computado).
A continuación, el número total de veces que co-aparece [co-occurred] en nuestra
concordancia con la palabra-de-búsqueda [search word], y el total para la Izquierda
[Left] y la Derecha [Right] de la palabra-de-búsqueda. A continuación, un detallado
desglose [break-down] que muestra cuántas veces se cortan [cropped] hasta 5 palabras
por la izquierda, 4 palabras por la derecha, etc. hasta 5 palabras por la derecha. La
posición central [centre position] (donde puede aparecer la palabra-de-búsqueda) se
muestra con un asterisco.
El número de palabras por la izquierda y por la derecha depende de los horizontes de
co-locación [collocation horizons].

Los números son:

El número total de veces que la palabra aparece en la vecindad [neighbourhood]


de la palabra-de-búsqueda
El número total de veces que aparece a la izquierda de la palabra-de-búsqueda
El número total de veces que aparece a la derecha de la palabra-de-búsqueda
Un conjunto de frecuencias individuales para la izquierda de la palabra de
búsqueda (5L, e.d., 5 palabras para la izquierda, 4L … 1L).
Una columna de Centro, que representa la palabra-de-búsqueda
Un conjunto de frecuencias individuales para la derecha de la palabra-de-
búsqueda (1R, 2R, etc.)

El número de columnas dependerá de los horizontes de co-locación de palabras. Con 5,5


obtendremos cinco columnas por la izquierda y 5 por la derecha de la palabra-de-
búsqueda. De este modo, podemos ver exactamente cuántas veces está cada palabra en
el vecindario general [general neighbourhood] de la palabra de búsqueda, y cuántas
veces está exactamente 1 palabra a la izquierda o 4 palabras a la derecha, por ejemplo.

La presentación de la frecuencia [frequency display] se puede re-ordenar ( ) y


podemos recalcular las co-locadas [collocates] ( ) si zapeamos [zap] las entradas
desde la concordancia, o cambiamos los horizontes [horizons].

+++++++

3.2.2 Teclas rápidas y funciones

A) Función de las letras


B) Tabla de Funciones y teclas rápidas

A) Función de las letras:

C, P, S, V, Z.

C à Ventanilla de palabras co-locadas con la palabra-de-búsqueda (Collocationes).

P à Ventana de impresión (print).

Pulsando la letra P, obtenemos la página de configuración de la impresión en


papel:
S à Ventanilla de Guardar (Save):

V à ventanilla de ampliación del contexto:

Z à Zapeo:

Si previamente hemos desmarcado en un cierto número de líneas la palabra de


búsqueda; por ej.,
Cuando pulsemos Z, desaparecerán de la pantalla (y del archivo de
concordancias) dichas líneas.

+++++++

Tabla de Funciones y teclas rápidas

Tecla Función También

F1 Ayuda ?
F2 Guardar S
F3 Imprimir P
F4 Pre-borrar PalabraDeBúsqueda barra espaciadora
(conmutador)
F5 Retener archivos de lectura
F6 Ordenar por categoría marcada (conmutador)
F7 Ordenar todas las entradas en memoria
F8 Ordenar por aparición en el archivo (conmutador)
F9 Mayúsculas primero/ignorar mayúsculas (conmutador)
F10 Ver más contexto V

C Co-locadas
V Ver más contexto F10 [Intro sobre la línea]
P Imprimir [Print] F3
S Guardar [Save] F2
Z Zapear (borrado definitivo de la entrada)

Insert Seleccionar archivo o entrada


Supr Deseleccionar archivo o entrada

+ Seleccionarlas todas desde el cursor en adelante


- Deseleccionarlas todas desde el cursor en adelante

? Ayuda F1
Barra espaciadora Pre-Borrar PalabraDeBúsqueda F4 (conmutador)
Flecha derecha Más contexto a la derecha
Flecha izquierda Más contexto a la izquierda
Ctrl + flecha izquierda/derecha Cambiar primera prioridad L/R
Shift + flecha izquierda/derecha Cambiar segunda prioridad L/R
Esc Retroceder al estado previo
Alt + X Salir del programa

+++++++

3.2.3 Primer paseo por MicroConcord

A) Configuración mínima
B) Reordenación de la concordancia
C) Navegación por la concordancia
D) Guarda de la concordancia
E) Impresión de la concordancia
F) Desmarcar/Remarcar entradas
G) Zapear las entradas desmarcadas
H) Despejar la concordancia anterior
I) Clasificación por categorías

+++

A) Configuración mínima

La primera pantalla de MicroConcord, tras la de portada y la página de derechos:


trae tres campos (parámetros) configurables:

• Palabra(s)-de-búsqueda: aquí escribimos la palabra o palabras (separadas por


la barra invertida, “\”) cuya concordancia deseamos encontrar.

• Cambiar Opciones: Se refiere a las opciones para la sesión actual; distintas de


las opciones de configuración permanente.

• Cambiar Ajustes Permanentes: Se refiere a las opciones de configuración


permanente.
La opción de Cambiar Opciones nos trae una segunda pantalla, con siete parámetros
(campos) configurables:

• Palabra(s)-de-búsqueda: aquí escribimos la palabra o palabras (separadas por


la barra invertida, “\”) cuya concordancia deseamos encontrar.

+++
Formatos de búsqueda
En la búsqueda, podemos utilizar estos formatos:

1) Escribir una palabra completa; por ej., cristiano.


2) Escribir una lista de palabras, separadas por la barra invertida (\) y sin
espacios en blanco; por ej., cristiano\católico\moro\judío. La
barra invertida funciona como el operador de suma lógica del
álgebra de Boole (OR).
3) Utilizar el asterisco (*), para truncar una palabra por la izquierda y/o
por la derecha; por ej., cristian*.
4) Fijar la caja de una palabra, encerrándola entre signos dobles de
igualdad; por ej., = =cristian= =. De este modo, se respetarán
mayúsculas y minúsculas.

++++++
• Unidad: El camino (directorio o subdirectorio donde se encuentra) que lleva al
archivo o archivos en el/los que se buscará(n) la(s) concordancia(s).

• Especificación del/os archivo(s): expresión de la extensión del archivo o


archivos interesados. Se puede utilizar el comodín *.*

• Varios directorios: Tenemos la opción de escoger archivos de texto que se


encuentran en más de un directorio. Es preferible crear un directorio y copiar en
él todos los archivos interesados; caso en el que el parámetro que se mantendrá
será “NO”.

• Palabra(s) de contexto: Se expresa aquí el número de palabras que integrarán


el horizonte del contexto por la izquierda y por la derecha; separando los
números con una coma. La configuración por defecto es 3,3

+++

Fijación de horizontes
Las Palabras de Contexto [Context Words] son aquellas que preceden y
siguen a la Palabra-de-Búsqueda [Search Word], encontrándose a una
distancia de ella previamente estipulada. A esa distancia la llamamos
horizonte.
Nosotros podemos especificar cómo de cerca ha de estar una palabra p
respecto de la Palabra-de-Búsqueda, para que sea una Palabra-de-
Contexto.

Por defecto, el programa trae la opción “3/3”: Es decir, que el horizonte


hacia la izquierda es de tres posiciones de palabra, y otras tantas para el
horizonte hacia la derecha.

Pero podemos especificar el ‘horizonte izquierdo’ [‘left horizon’] y el


‘horizonte derecho’ [‘right horizon’], hasta 9 palabras en cada dirección;
aunque con 4/4 es bastante normalmente.
A modo de prueba, vamos a fijar el horizonte en “4,4”.
NOTA.- Podemos especificar la palabra-de-contexto del mismo modo
que especificamos la palabra de búsqueda, y MicroConcord puede
encontrar palabras en el contexto de una palabra de búsqueda.

+++

• Número máximo de entradas en esta ejecución: Por razones de espacio de


almacenamiento y de velocidad de procesamiento, la configuración por defecto
limita el número de entradas a 1.487. Obviamente. cuando trabajamos con
muchos archivos y/o se prevén muchas apariciones de la(s) palabra(s) cuya(s)
concordancia(s) se busca(n), podemos aumentar ese número.

• Mostrar entradas desde archivos : El programa lee los archivos, localizando


la(s) palabra(s)-de-búsqueda, hasta que no haya más archivos por leer, o bien
llegue hasta el número máximo posible. Si esto ocurre, puede haber leído sólo
parte de un archivo. Escogeremos YES, si deseamos retener las entradas de la
parte leída de ese archivo. Escribiremos NO, para descartar esa lectura parcial.
Una vez elegidos los parámetros de la configuración, con la flecha hacia abajo,

descendemos hasta el botón PROCESAR ( ):

Cuando el botón queda activado (= se pone amarillo), pulsamos Intro, y aparece la


tercera pantalla; de resumen de resultados:
Se nos informa ahí que:

- se ha buscado la palabra cristiano


- se han encontrado 69 aciertos de la palabra-de-búsqueda, distribuidos
en 38 archivos; que se enumeran…
- de unas 347.031 palabras examinadas, hubo aproximadamente una
aparición de cristiano (de media) por cada 5.029 palabras.

B) Reordenación de la concordancia

Pulsando F8, se dispone ese listado (alfabético) conforme al orden de aparición en los
archivos (File Order):
Conforme vamos bajando con el cursor de la flecha descendente (↓), en la ventanilla
superior izquierda se va mostrando la pertenencia de la línea a un determinado archivo
de texto:

Núm. de línea Cap. del Quijote Núm. de apariciones


1 1QUI_C06
2 1QUI_C06 2
3 1QUI_C08 1
4 1QUI_C12 1
5 1QUI_C13
6 1QUI_C13 2
7 1QUI_C19
8 1QUI_C19 2
9 1QUI_C20 1
10 1QUI_C21
11 1QUI_C21 2
12 1QUI_C25 1
13 1QUI_C26 1
14 1QUI_C27
15 1QUI_C27 1
16 1QUI_C28 1
17 1QUI_C29 1
18 1QUI_C32 1
19 1QUI_C33
20 1QUI_C33 2
21 1QUI_C36
22 1QUI_C36 2
23 1QUI_C37
24 1QUI_C37
25 1QUI_C37 3
26 1QUI_C40
27 1QUI_C40
28 1QUI_C40
29 1QUI_C40
30 1QUI_C40 5
31 1QUI_C41
32 1QUI_C41
33 1QUI_C41
34 1QUI_C41
35 1QUI_C41
36 1QUI_C41
37 1QUI_C41
38 1QUI_C41
39 1QUI_C41
40 1QUI_C41
41 1QUI_C41
42 1QUI_C41 12
43 1QUI_C47
44 1QUI_C47 2
45 2QUI_C03
46 2QUI_C03 2
47 2QUI_C11 1
48 2QUI_C17 1
49 2QUI_C21 1
50 2QUI_C22 1
51 2QUI_C24 1
52 2QUI_C26 1
53 2QUI_C27
54 2QUI_C27
55 2QUI_C27
56 2QUI_C27 4
57 2QUI_C34 1
58 2QUI_C41 1
59 2QUI_C45 1
60 2QUI_C48 1
61 2QUI_C51 1
62 2QUI_C53 1
63 2QUI_C54 1
64 2QUI_C55
65 2QUI_C55 2
66 2QUI_C68 1
67 2QUI_C63
68 2QUI_C63 2
69 2QUI_C74 1

Total ------------ 69
NOTA.- Observamos que el capítulo en el que, con creces, más abunda
en presencia la palabra buscada es el 41, de la I Parte (Donde todavía
prosigue el Cautivo su suceso; Cap. 40 Donde se prosigue la historia del
Cautivo; Cap. 39 Donde el Cautivo cuenta su vida y sucesos; Cap. 38
Que trata del curioso discurso que hizo Don Quijote de las armas y las
letras).

Pulsando de nuevo la tecla F8, volvemos a la disposición, por defecto, de la ordenación


alfabética:

S-ar putea să vă placă și