Español en América

agosto 28, 2015

DImensión de las restricciones léxicas

Filed under: Lengua española — Mercedes @ 9:41 pm
Tags: ,

Alrededor del fenómeno colocacional y su enseñanza

Las restricciones léxicas constituyen un fenómeno de enorme dimensión en las lenguas naturales.

Lamiroy, B. y Klein, J.R., en la revista Linx nº 53 de 2005, en el artículo “Le problème central du figement est le semi-figement”, expresan:

<le figement constitue un phénomène essentiel dans le fonctionnement du langage au point qu’on peut se demander s’il existe des assemblages vraiment libres. Dannell (1992 : 18) considère qu’environ 30% d’un texte est constitué d’expressions figées, ce qui correspond à l’observation de Senellart (1998) selon laquelle une phrase sur trois contient une expression figée>.

 

Los investigadores descubren que la suma de locuciones y colocaciones supera al 30% de las combinaciones léxicas. Nadie duda de su importancia y de la trascendencia no solo de su conocimiento en los hablantes no nativos sino también en los nativos. Los currículos oficiales de lenguas en especial los de la española tienden a prescindir de estos fenómenos. Las combinaciones restringidas forman parte del léxico y se puede decir que sin léxico la comunicación no es posible.

En el caso de los hablantes nativos su gramática interna les ayuda en la producción de discursos de forma automática pero los no nativos si desconocen locuciones y colocaciones no serán capaces de producirlas. De ahí la necesidad de su conocimiento.

Las dificultades de la enseñanza de las colocaciones tropiezan con innumerables obstáculos el primero la ignorancia por la Academia de la Lengua Española para determinar su existencia. Resulta sorprendente que el diccionario oficial carezca de definición para el fenómeno colocacional. La segunda dificultad es la falta de diccionarios de colocaciones en lengua española con alguna excepción que necesita una explicación.

Calificamos como restricciones cualquier limitación a la libertad de las palabras-forma de combinarse. Para explicarlas comenzamos por la propuesta de Haussman, Franz-Joseph denominada principio de composicionalidad. Una combinación de dos formas (las viejas palabras) A y B se dice que es composicional si el significado de AB coincide con la suma de los significados de A y de B de manera individual. En este caso las dos formas se combinan con absoluta libertad y sin restricción alguna.

Supongamos un segundo caso en el que las formas A y B al combinarse en AB el significado no coincide con la suma de los significados individuales de A y de B. Su significado global es muy diferente de los significados de sus componentes, se dice que AB es una locución o expresión. Para nosotros locución y expresión son términos sinónimos, no así para el diccionario DRAE.

El tercer caso es la combinación de A y de B para producir AB con un significado que se puede deducir de los significados de A y B pero que no coinciden con exactitud con la suma de A y de B. Se puede decir que la combinación es composicional pero la suma de A y de B presenta una restricción léxica ya que su significado global se acerca más al significado de uno de sus componentes, por ejemplo A que aporta la mayor parte del significado total y que se denomina base y el otro componente B pierde parte o una gran parte de su significado, es dijéramos un comparsa de la base y se denomina colocado o colocativo.

Vemos que hay combinaciones composicionales que no presentan ninguna restricción en su combinatoria y que se califican como libres. Otras que no son composicionales, locuciones o expresiones y cuyo significado es opaco, es decir que no coincide con la adición de sus componentes individuales. Y el tercer grupo que se encuentra a mitad de camino de unas y otras combinaciones que son composicionales pero uno de los componentes pierde una parte de su significado, el colocativo y el otro, la base expresa la mayor parte de la semántica de la composición.

Desde el prisma del lingüista no existen palabras despreciables que a priori intuimos que poco o nada aportan a la lengua. Cualquier palabra genera o puede generar pocas o muchas relaciones restringidas cuyas formas y significados es preciso conocer y, en el caso de los no nativos, memorizar.

Si focalizamos nuestro estudio y el diseño de actividades en las unidades lingüísticas restringidas, necesitamos para su localización, descripción y observación dos tipos de herramientas digitales:

  1. Diccionarios
  2. Corpus textuales/orales

Los diccionarios son la esencia y la descripción del léxico de la lengua. Más aún, los diccionarios monolingües posibilitan el acceso a una información casi completa tanto semántica como morfológica y de género sin olvidar la combinatoria.

Sin embargo, antes de usar una herramienta léxica – el diccionario – el usuario debería poseer un conocimiento exhaustivo del recurso y de cómo funciona.

En el caso del DRAE el olvido imperdonable del concepto de colocación constituye un hándicap para la descripción completa de las unidades léxicas y sus combinaciones más o menos restringidas.

Enlace Diccionario RAE (DRAE): http://www.rae.es/recursos/diccionarios/drae

El DRAE es un diccionario monolingüe de la lengua española cuya macroestructura es alfabética.

Su microestructura proporciona información:

1ª) Etimológica de cada lema. Así para la forma sol, se indica su origen latino (sol, solis).

2ª) Se proporcionan las acepciones del lema sol; en principio enumeradas según su frecuencia. Por tanto, se supone que la primera es la más empleada.

3ª) Se suministra la información gramatical (género; en el caso de sol, sustantivo).

4ª) A continuación de las acepciones se incluyen combinaciones del lema sol ordenadas alfabéticamente.

Al ignorar el diccionario DRAE el fenómeno colocacional estas combinaciones con la forma sol únicamente se califican con su género gramatical.

En la mayoría de los lemas estas series de combinaciones sin calificar son colocaciones.

5ª) Seriadas las colocaciones (sin expresar de forma alguna su calificación fraseológica), se relacionan las locuciones con su atribución gramatical. Así. A sol naciente, se le califica como locución adverbial.

Y 6ª) La última relación es una serie de colocaciones/locuciones en las que la base no es el lema por el que hemos entrado sino otro al que se remite la información.

Manejo del diccionario

El uso del diccionario es trascendente dentro de un método que pretenda ir más allá de las clases presenciales y proveer de autonomía a los aprendientes.

Los diccionarios digitales son la herramienta adecuada para desarrollar la pretendida autonomía y requieren de una explicación en la clase cara a cara.

Una metodología de autoaprendizaje basada en la lectura de textos auténticos (a poder ser también digitales) requiere para la comprensión lectora y la incorporación de nuevas unidades léxicas, la ayuda de un diccionario.

El diccionario no es solo una herramienta léxica sino que proporciona abundante información gramatical y, en el caso de los verbos, la conjugación es un elemento central de la enseñanza de idiomas.

Cuando mencionamos unidades léxicas no nos circunscribimos a las unidades monolexemáticas sino a las plurilexemáticas y, en especial a las que poseen un grado de fijación como son las colocaciones y las locuciones.

La inmensa mayoría de lingüistas son partidarios de introducir a los aprendientes desde los primeros niveles en el aprendizaje de estas combinaciones restringidas de las lenguas naturales.

Empleo de corpus

Si la utilización del diccionario es esencial para dotar de autonomía a los alumnos, el empleo de corpus camina de manera indisoluble con él y constituye la segunda herramienta esencial.

Un corpus es el testimonio de la corrección lingüística de una lengua y una inmensa gramática donde se comprueban los textos escritos y donde no se muestran ni reglas ni excepciones.

En el caso de la RAE los corpus más empleados son el CORDE y el CREA. El más reciente CORPES, Corpus de referencia del español del siglo XXI con unos 174 millones de formas se encuentra ya disponible para su consulta y comprende textos desde el año 2001 al 2012. En su presentación la RAE advierte de su provisionalidad y de la posibilidad de incurrir en fallos.

Recomendamos acudir a los anteriores CORDE y CREA, en especial a este último que es también del español actual.

Los enlaces para acceder a ellos:

CREA: http://corpus.rae.es/creanet.html

CORDE: http://corpus.rae.es/cordenet.html

Hay que tener en cuenta también el Corpus del Español de Mark Davies de la Brigham University cuyo acceso es:

http://www.corpusdelespanol.org/x.asp

y que a diferencia de los corpus de la RAE y al estar lematizado proporciona una información gramatical.

Utilización de los corpus CREA y CORDE:

La interfaz de los dos corpus académicos es la misma y la entrada o consulta se efectúa por el lema o la unidad léxica de la que pretendemos obtener información.

Así, la introducción puede ser por el lema sol o por sol naciente. En ambos casos la primera información que nos produce el CREA – por ejemplo – es el número de casos existentes o frecuencia de aparición de la unidad consultada en dicho corpus.

El primer objetivo de la consulta – aparte de cuantificar la frecuencia de la unidad léxica – es la obtención de líneas de concordancia.

Qué son y de qué nos informan las líneas de concordancia:

Estas líneas de concordancia presentan en su parte central y, en el caso del CREA, resaltado en color azul la forma solicitada y a ambos lados un contexto de uso.

Al introducir sol naciente nos aparecerán todas las apariciones de esta locución; en azul sol naciente y a sus lados la frase donde se encuentra contenida. Si en el centro de cada línea de concordancia clicamos, nos aparecerá a parte un contexto más completo con uno o más párrafos que contienen la locución sol naciente.

La principal búsqueda que pretendemos es, a partir de la observación de las líneas de concordancia con qué verbos se combina con mayor frecuencia sol naciente o si posee cualquier otro tipo de restricción con otras formas como pueden ser sustantivos o adjetivos.

Para el aprendiente la observación le sirve al renovar la lectura de párrafos que contienen sol naciente, por un lado la comprensión de nuevas unidades léxicas independientes de sol naciente y por otra parte la verificación de verbos y sustantivos que se combinan con la locución buscada. Todo ello en sus contextos de uso.

Si de nuestra consulta se deriva un número de casos muy elevado, podemos restringir la búsqueda por países – del corpus CREA – clicando en España o por géneros (periódicos, libros, ciencia, etc.). Por ejemplo, podemos restringir sol clicando en “España” y “periódicos”; nos aparecerán las veces que el lema solicitado sol se encuentra en los textos del CREA de periódicos españoles.

Una búsqueda en la interfaz del corpus de la forma sol pretende varios objetivos:

1ª) Conocer si la forma es poco o muy frecuente

2ª) Descubrir sus locuciones y colocaciones por observación de las líneas de concordancia

3ª) Seleccionar las colocaciones/locuciones que nos interesen en función de sus significados o de otra intención lingüística

4ª) Descubrir el uso de las preposiciones que acompañan a sol o a sus colocaciones/locuciones

5ª) Verificar si las colocaciones/locuciones formadas con el lema sol tienden a aumentar o disminuir comparando su aparición con el otro corpus CORDE.

En el empleo de los corpus y, nos centramos en CREA, surgen inconvenientes cuando realizamos búsquedas con formas de elevada frecuencia como casa en las que cualquier restricción resulta también inútil al aparecer miles de casos. Para conseguir que el número de casos aparecidos se reduzca debemos usar algunos trucos para que al final aparezcan las deseadas líneas de concordancia. Así, en el lema casa, le añadiremos cualquier adjetivo, por ejemplo, blanca. Así al solicitar casa blanca nos aparecerán las ansiadas líneas de concordancia para que podamos observar las relaciones léxicas de casa.

Tipos de usuarios de diccionarios/corpus

Los usuarios de diccionarios y corpus son de tres tipos: el público en general, los profesores y los estudiantes. Estos dos últimos grupos son el objeto de nuestras actividades al tener en común sus intereses lingüísticos.

En el caso de los alumnos el empleo del diccionario en papel les permite familiarizarse con el orden alfabético, adquirir el concepto de polisemia –central en las lenguas- y las ideas de sinonimia y antonimia. En lo que se refiere a los docentes tanto el diccionario como los corpus les permiten preparar mejor sus clases, periodizarlas e incrementar sus habilidades léxicas sobre todo en cuanto a la adquisición de locuciones y colocaciones y su entorno de uso.

Diseño de ejercicios/tareas/actividades

Sin entrar en la descripción terminológica y las diferencias entre ejercicios/actividades que según el MCER las califica como sencillas mientras que las tareas son o bien una concatenación de ejercicios/actividades o la suma de dos o más sub-tareas que requieren una mayor complejidad, el diseño de tasks[1] supone como primer objetivo la realización de ejercicios en contexto en la que la característica principal es que la palabra/forma se encuentra rodeada de otras formas que como indica Selva, T, (2002) permite conocer mejor el significado, su forma de empleo y funcionamiento en la cadena del discurso:

< Les exercices que nous cherchons à générer sont des exercices contextuels, c’est-à-dire des activités dans lesquelles le vocable est entouré de son contexte. Le contexte permet en effet de préciser le sens du vocable et d’étudier comment celui-ci s’emploie et fonctionne dans la chaîne discursive. Les différentes propriétés du vocable sont ainsi illustrées de manière plus complète et plus naturelle que lors d’activités hors contexte. D’autre part, le contexte facilite la pratique d’inférences, une stratégie essentielle en apprentissage des langues>[2].

Seguimos para el diseño y ejecución de ejercicios de autoaprendizaje en la adquisición de un conocimiento léxico centrado en el aprendizaje de colocaciones y locuciones las indicaciones de Selva, T. expuestas en el párrafo anterior y nuestro concepto de autoconstrucción de corpus en el que prevalece para aumentar la motivación de los aprendientes los intereses de estos de manera que los textos primeros escogidos y luego analizados/diseccionados son los que suscitan sus gustos y preferencias y no los textos recogidos en un corpus de referencia.

Si la motivación es el eje central de la idea de autoconstrucción de corpus referentes a textos elegidos por los aprendientes según sus intereses, otra de las ventajas que suponen los corpus es la lectura repetida: una lectura al escogerlos, seguida de más lecturas al efectuar la limpieza.

En la generación de ejercicios no olvidamos los corpus de referencia del español en especial el CREA.

A diferencia de Selva, T. nos inclinamos por un corpus autoconstruido por cada alumno de su interés personal y de una dimensión reducida pero suficiente para disponer de varios textos en los que las unidades léxicas se muestran en uso. El objetivo no es realizar actividades o tareas de morfología, o análisis de género sino de observación/investigación de las formas en su contexto y la comparación de determinadas unidades elegidas en el corpus autoconstruido con un corpus de referencia más nutrido de manera que en las líneas de concordancia[3] podamos observar el comportamiento de las unidades léxicas que nos interesen.

De la observación de las líneas de concordancia encontramos colocaciones y locuciones que posiblemente el diccionario DRAE no nos muestre. El interés de trabajar con textos autoconstruidos de una temática del interés del alumno al ser una lengua de especialidad consigue descubrir las muchas lagunas de los diccionarios generalistas como el académico.

Para la ejecución de tareas sobre colocaciones utilizamos un Corpus del Español de los Negocios construido en un curso para profesores celebrado en el ISFE de Burgos en 2014 y que comprende unas 267.000 tokens. Este pequeño corpus que denominamos CEN (Español de los negocios) es un raw corpus similar al CREA sin que esté lematizado pero sí se le ha sometido a una limpieza y desambiguación. El corpus cuenta con una sencilla indexación que permite recuperar los textos y/o unidades léxicas que nos interesen.

 

 

[1] En este caso la forma inglesa task comprende ejercicios y tareas

[2] Selva, Thierry (2002). Génération automatique d’exercices contextuels de vocabulaire. TALN 2002, Nancy, 2002

[3] Líneas de concordancia: recomendamos para los corpus autoconstruidos la confección de líneas de concordancias mediante el concordancer de www.lextutor.ca

Anuncios

Dejar un comentario »

Aún no hay comentarios.

RSS feed for comments on this post. TrackBack URI

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Blog de WordPress.com.

A %d blogueros les gusta esto: