Español en América

enero 24, 2011

Frecuencia léxica asociada

Filed under: Lengua española — Mercedes @ 6:07 pm

Introducción:
El Diccionario de frecuencias del español de Editorial Universitas publicado en 2.005 y cuyos autores Almela, R., Cantos, P., Aquilino Sánchez, Sarmiento, R y Almela, M. es no sólo un excelente y práctico diccionario de frecuencias del español sino en su “introducción” realiza una exposición de la obra, una justificación de la necesidad de este tipo de diccionarios desde una perspectiva científica.
Contrasta este trabajo de gran utilidad en la lingüística aplicada a la Didáctica de segundas lenguas con la escasa calidad del DRAE al que los autores de “Frecuencias del español, Diccionario y estudios léxicos y morfológicos” de los anteriores autores critican con benevolencia: “…el usuario debe leer primero seis acepciones, que actualmente o están en desuso o son raramente utilizadas”. Se refieren a la comparación entre el Gran Diccionario de Uso del Español Actual y el Diccionario de la Real Academia. El Gran Diccionario de Uso de Aquilino Sánchez es el primero en introducir el concepto de frecuencia en un diccionario de uso.
Como bien se explica en la introducción de “Frecuencias” el concepto se ha asociado durante mucho tiempo a una idea matemática de la lengua según sus críticos muy alejada de la realidad de la lingüística que es una “CIENCIA SOCIAL”. Sin querer polemizar entre filólogos que pretenden dirigir sus estudios e investigaciones hacia la lengua en estado “puro” olvidando que las ciencias no sociales nos pueden ayudar sobre todo en la parte de la lingüística que se denomina “aplicada” queremos resaltar la procedencia de estos diccionarios de frecuencias y su “aplicación” en la confección de manuales, glosarios, ejercicios y lecturas graduadas para los estudiantes sean del español lengua materna como del español lengua extranjera.
Nuestra experiencia como profesora de ELE nos reafirma en la extraordinaria utilidad de estos diccionarios de frecuencias que los convierten en herramientas de uso diario para los docentes. Nuestro parecer es que son imprescindibles para los profesores y no tanto por su estructura para los aprendientes.
La terminología lingüística:
La lingüística es una ciencia “social” poco o mucho alejada de las ciencias exactas, de la química, la física o las matemáticas que trabajan con el dos más dos que siempre son cuatro.
En lingüística se trata de describir, analizar, desmenuzar y modelizar un sistema natural que es la lengua que al ser un fenómeno discreto no es ni medible ni cuantificable.
La primera dificultad a la que nos enfrentamos es definir la terminología. Las múltiples escuelas existentes tampoco se ponen de acuerdo en las definiciones que ya en este estadio de las cosas, provocan los primeros enfrentamientos.
La lexicografía es una rama de la lingüística que pretende describir la lengua por medio de la construcción de diccionarios. Los diccionarios pueden ser de muchas clases pero nos vamos a referir a los de frecuencias poco extendidos en el ámbito del español pero que para las clases de español como lengua extranjera presentan ventajas como las de establecer qué vocabulario se va a enseñar según los niveles.
La clásica “palabra” sigue siendo el término más usado cuando hablamos de que un diccionario contiene “tantos miles de palabras”. Sin embargo, la tradicional “palabra” va siendo desplazada en lexicografía por vocablos más apropiados como “formas”. Alvar Ezquerra, M. en una comunicación al Congreso de ASELE (2004), emplea “palabras” para referirse al número de que consta un corpus determinado. Es habitual cuando mencionamos un corpus concreto determinar su dimensión con el vocablo “palabras”: tiene X millones de palabras.
Nosotros preferimos llamar “formas” a estas palabras. Si damos un paso más hacia los diccionarios, las “entradas” se llaman “lemas”. Cada “lema” posee una o varias acepciones o definiciones. Si son varias, el lema es polisémico. La tendencia de los modernos diccionarios es producir una entrada por acepción de manera que quedarían separados los significados de cada lema.
Así para “helado” existiría el helado, sustantivo, o postre delicioso de diferentes sabores, y el helado, adjetivo que indica el estado de frío de alguien, o el de un cuerpo sólido sometido a un intenso frío.
Unidad léxica es una unidad de significado y sirve para calificar ya sea una forma simple (la antigua “palabra”) o una unidad constituida por dos o más palabras pero que poseen un significado único. Es el caso de las colocaciones o combinaciones semitransparentes y las locuciones o expresiones opacas pero que también tienen un significado propio.
En principio, los diccionarios deberían otorgar a todas y cada una de las unidades léxicas de la lengua, una entrada. No parece lógico que “frío polar” unidad léxica que podemos designar como colocación no tenga el mismo derecho a disponer de una entrada y sí “frío” o “polar”.
La lematización de un corpus consiste en atribuir a las formas como indica Alvar Ezquerra, M. “mucho”, “mucha”, “muchos” y “muchas” una sola entrada, es decir, adjudicarle un solo lema. Así, las frecuencias de cada forma se sumarían y producirían la del lema correspondiente. Alvar menciona “paradigma” en lugar de “lema” y prefiere hablar de “formas” mientras nosotros preferimos “flexiones”.
De la misma manera cuando tratamos de lematizar los verbos, lo hacemos siempre en infinitivo. A las conjugaciones les seguimos llamando “flexiones” y, por supuesto, agrupamos todas las flexiones en una sola entrada o “lema”. Alvar, para la utilización de las frecuencias pretende utilizar sus “formas” verbales para determinar los tiempos que se deben enseñar en cada nivel. Nuestra opinión difiere de la de Alvar, ya que cada nivel de enseñanza debería tener sus tiempos verbales, aunque en una enseñanza plenamente comunicativa y oral, no deberíamos establecer ninguna barrera ni preferencia en la enseñanza de las conjugaciones verbales.
La semántica:
Si la terminología nos permite avanzar en los conceptos que vamos a emplear, la semántica en todo lo que se refiere a la lengua es trascendental. Todo lo que aprendemos tiene que pasar por la barrera del significado. Formas simples o unidades léxicas complejas para incorporarlas a nuestra mente, a nuestro lexicón deben ser comprendidas y definidas tanto aisladas como en combinatoria para añadirlas a esas redes complejas de significados que conforman el lexicón. Redes de conexiones o relaciones entre lexias en las que los nodos son las unidades simples y que, principalmente, por medio de la sinonimia, consiguen que la nueva forma que estamos aprendiendo por relación sinonímica con otra que ya poseemos, la añadimos a nuestro cerebro. En todo el proceso de adición de una nueva unidad léxica el significado juega un papel central. Sin conocer el significado la nueva forma aprendida no se sumará a nuestro particular diccionario cerebral y, por tanto, no la emplearemos.
En cualquier trabajo, estudio, investigación o confección de manuales, ejercicios, lecturas graduadas o diccionarios, el significado es el eje central de todo el proceso.
¿Qué es un corpus?
En lingüística la palabra corpus está de moda y pocos son los investigadores que trabajan tanto con las lenguas naturales como sus aplicaciones que no echen mano de un corpus para satisfacer sus necesidades.
Un corpus es un contenedor de palabras, Un recipiente que para ser válido para una finalidad determinada debe poseer el máximo número de formas que se refieran a ese fin.
Si queremos construir un glosario de términos financieros tendremos que confeccionar un corpus que contenga el máximo número de textos, artículos o comentarios sobre esa lengua de especialidad.
La segunda característica de un corpus es su antigüedad. Las investigaciones que realizamos tomando como base un corpus se refieren exclusivamente a ese corpus y nada más. Las conclusiones que obtengamos son sobre ese corpus. Al día siguiente de cerrada la investigación, la variación lingüística produce por desgracia que las conclusiones estén ya algo desfasadas.
Si nos referimos a las tensiones de liquidez que sufrieron los mercados financieros en los primeros días de diciembre del 2.010, aparece una nueva colocación léxica de doble uso metafórico, “barra libre”, refiriéndose a la liquidez monetaria facilitada sin límite por el Banco Central Europeo a las instituciones financieras de nuestro continente.
La innovación, creación léxica o incorporación de neologismos a las lenguas pueden convertir a los corpus en algo obsoleto al día siguiente de su formación.
Sin embargo, las necesidades de trabajo nos obligan a trabajar con ellos y a actualizarlos con frecuencia para que nos sirvan para nuestras intenciones.
Resulta evidente que la didáctica de una lengua materna difiere en gran medida de la de una segunda lengua.
Como especialistas en la enseñanza del léxico, actividad que es central tanto en lenguas maternas como segundas el concepto de frecuencia juega un rol también esencial.
El concepto tradicional de frecuencia léxica se utiliza en la confección de manuales y ejercicios de los distintos niveles del español como lengua extranjera. La actividad en lengua materna se encuentra olvidada tanto en currículos como en la metodología de manera que el léxico es el patito feo de la lengua española y los diccionarios de frecuencias –los pocos que existen- son unos absolutos desconocidos por los profesores.
El léxico se reduce al albur de la suerte que puedan tener los alumnos más allá de las recomendaciones de esas famosas lecturas de libros para las vacaciones escolares. La carencia de léxico lleva directamente a la incomprensión lectora y al fracaso escolar sin que nadie le preste la más mínima atención.
La situación es algo diferente en el español lengua extranjera en el que también estando olvidada y ninguneada la enseñanza del léxico, los alumnos procedentes de otros sistemas escolares distintos del español, llegan con un conocimiento léxico bastante desarrollado en su lengua materna.
Esta constatación de una base léxica importante en la lengua de origen, tiene que ser el punto de partida de cualquier estudio o investigación que tenga como finalidad la realización de manuales o actividades en las clases o fuera de ellas.
En algún trabajo nos referimos al último diccionario de frecuencias aparecido, el de Mark Davies que en nuestra opinión es el que mejor se adapta a las necesidades de los profesores. Es preciso aclarar que estos diccionarios son más útiles a los profesores y redactores de manuales, evaluaciones o exámenes, y no tanto, para los alumnos de español lengua extranjera.
En 2.005 se editó por Universitas el más moderno diccionario de frecuencias en España, “Frecuencias del español. Diccionario y estudios léxicos y morfológicos” de Almela, R., Cantos, Aquilino Sánchez, Ramón Sarmiento y Almela, M. El diccionario se confeccionó sobre el corpus “Cumbre” de veinte millones de formas de textos escritos y orales del castellano de España y América. El diccionario recoge además de los cinco mil lemas más usuales de nuestra lengua, 1.000 combinaciones de formas más frecuentes del español, lo cual es una novedad en la lengua española. Como indica “frecuencias”, “la fiabilidad dependerá del grado de representatividad del corpus del cual se han extraído los datos”.
El diccionario de Mark Davies es muy diferente al de Universitas y siendo en lo básico un diccionario de frecuencias únicamente de formas, contiene algo que en nuestra opinión es importante desde el punto de vista de la enseñanza del español, que es la traducción al inglés de cada lema.
Se nos objetará que en la enseñanza de segundas lenguas es necesario prescindir de la lengua de origen de los alumnos, pero preferimos esta solución a la de definir en castellano los lemas con otras palabras que en el caso de los primeros niveles –y los más frecuentes- un alumno iniciándose en el español no alcanzaría su significado.
Estos diccionarios son útiles para los primeros niveles A1 y A2, posiblemente el B1 y en estos casos los alumnos están dando los primeros pasos y sus conocimientos de vocabulario son escasos.

Manual Alvar en su comunicación al congreso de ASELE de 2.004, referencia los diccionarios de frecuencias publicadas hasta esa fecha, los de Juilland –inventor del concepto de frecuencia léxica-, el del español de Puerto Rico de Rodríguez Bou, de 1.952 y 1.967 y el antepenúltimo de los profesores de la Universidad de Oviedo, Alameda y Cuetos de 1.995.
Alvar repasa estos diccionarios mencionando la necesidad de su actualización por ser la lengua un sistema en continua variación y por su finalidad que no es otra que la de redacción de manuales y ejercicios destinados a alumnos y profesores de ELE.
Es evidente que no es lo mismo un manual cuyo destinatario sea un angloamericano que un chino. Las diferencias culturales, de alfabetos y de léxicos iniciales, impiden confeccionar los mismos libros para unos y otros.
Nuestro punto de vista es algo diferente al de Alvar en el sentido de que manteniendo los mismos principios que sostiene este autor, la trascendencia de los corpus elegidos en función de los fines, su dimensión, la actualización constante de los mismos, el objetivo del alumno en cada supuesto de aprendizaje-enseñanza, y la similitud o no de los dos sistemas lingüísticos de origen y destino.
Estamos de acuerdo con Alvar en su comunicación en el Congreso de ASELE, “… la frecuencia de uso no puede ser un valor rígido al que debamos sujetarnos pues hay otros factores que influyen en el aprendizaje de las palabras… como las relaciones formales y designativas que puedan tener”.
Otro hecho importante a tener en cuenta a la hora de la redacción de manuales y ejercicios es que los vocablos como bien indican Alvar y Polguère, no son “hechos aislados”, sino que se relacionan unos con otros de manera que la combinatoria hay que tenerla muy presente como lo hace la TST que prioriza la enseñanza de las relaciones léxicas ya sea como colocaciones o locuciones idiomáticas.
Si el concepto y los diccionarios de frecuencias son una ayuda inestimable en la redacción de manuales, tenemos una referencia también trascendente a tener en cuenta que es el Plan Curricular del Instituto Cervantes que necesitamos respetar.
El concepto de frecuencia, las “familias de palabras”, el principio de autenticidad y el Plan Curricular pueden chirriar si intentamos acomodar nuestros ejercicios a todos ellos.
Nuestra experiencia en la clase de ELE con alumnos de diferentes países, culturas y alfabetos nos lleva a pensar que en la confección de manuales debe primar, además de los “pies fijos” anteriores, la morfología de las palabras.
Hemos realizado una investigación sobre un corpus preparado por el “Molino de Ideas” extraído de los exámenes de DELE nivel A2 del Instituto Cervantes, formado por 5.515 formas individuales. Es un corpus muy reducido en el que el concepto de frecuencia al ser tan breve el texto objeto del trabajo no es lo suficiente extenso como para realizar hipótesis de partida. Sin embargo es una referencia consistente para apoyarse en la realización de cualquier texto o manual que tenga como objetivo la preparación de exámenes para la obtención de los certificados DELE A1 Y DELE A2.
La finalidad de este corpus es la redacción de un diccionario-manual que sirva para la preparación de los exámenes de DELE niveles A1 y A2.
Este Corpus de 5.515 formas lo hemos lematizado obteniendo aproximadamente 2.700 lemas.
La primera conclusión es que este número es enormemente exagerado si pretendemos confeccionar ese diccionario de preparación del DELE referido a los niveles A1 y A2 que debería constar como máximo de unos 1.500 lemas.
El objetivo es la redacción de un manual-diccionario destinado a profesores y alumnos angloparlantes , de manera que hemos buscado los puntos comunes de ambas lenguas, español e inglés desde el punto de vista morfológico y semántico.
Se trata de simplificar el diccionario reduciendo los 2.700 lemas iniciales de que consta el corpus de los exámenes del DELE nivel A y, además, conseguir por la vía de la morfología de las formas, disminuirlo aún más.
Así si nos referimos, por ejemplo a la forma comunicar, un anglófono percibe de manera inmediata su significado equivalente, communication. Tanto sus derivados morfológicos en español como en inglés son equivalentes, comunicar, to communícate, comunicado, communicated, etcétera.
Introducimos un nuevo concepto que hemos denominado “frecuencia asociada” que recoge las coocurrencias de una determinada derivación morfológica.
En el supuesto anterior de “comunicar” añadiríamos al número de veces que esta forma aparece en el corpus tratado, la de sus derivaciones morfológicas, comunicación y comunicado, de manera que la morfología de “comunicar” aparece conjuntamente a sus derivadas con una única cifra.
Primamos de esta manera la similitud fonética y semántica de los vocablos correspondientes en español e inglés de forma que para un alumno sea muy rápida la incorporación a su lexicón ya que en su lengua materna los tienen organizados. La ventaja para su adquisición en el español L2 es que tanto morfológica como en significado coinciden en ambas lenguas. Los lemas con estas características en español e inglés son muy numerosos, de elevada frecuencia y, por tanto de uso intenso. Su enseñanza rápida en estos primeros niveles es trascendental ya que en la enseñanza de segundas lenguas la motivación que provoca un avance rápido es muy amplia.
La ventaja que tenemos los profesores de segundas lenguas es que partimos de un bagaje adquirido en la primera lengua que tenemos que aprovechar para la motivación de los alumnos (cuanto más rápido aprenden existe una mayor motivación) y para la incorporación de un mayor número de formas por derivación morfológica.
Somos partidarios a ultranza de la semántica de los vocablos, pero utilizamos el significado desde el prisma de conseguir similitudes entre formas en ambos idiomas para su rápida comprensión.

Bibliografía:
Alameda, J. R. y Cuetos, F. (1996). Diccionario de frecuencias de las unidades lingüísticas del castellano. Oviedo. Universidad de Oviedo.
Almela, R. et Al. (2005). Frecuencias del Español. Diccionario y estudios léxicos y morfológicos. Madrid. Editorial Universitas.
Alvar Ezquerra, M. (2003). La enseñanza del léxico y el uso del diccionario. Madrid. Arco-Libros
Alvar Ezquerra, M. (2004). La frecuencia léxica y su utilidad en la enseñanza del español como lengua extranjera. ASELE, Actas XV. Centro Virtual Cervantes. Madrid-Alcalá de Henares.
Plan Curricular del Instituto Cervantes, Niveles de referencia para el español, Tomo I, A1 y A2- 2006. Madrid. Biblioteca Nueva, S. L.
Davies, M. (2.006). A frequency Dictionary of Spanish. Nueva York. Routledge.
Juilland, A. y Chang, E, (1964). Frequency Dictionary of Spanish Words. Londres-La Haya. Mouton.
Rodriguez Bou, I. (1952). Recuento de vocabulario español. Puerto Rico. Universidad de Puerto Rico.
Rodríguez Bou, I. (1967). Recuento de vocabulario español de preescolares. Puerto Rico. Universidad de Puerto Rico.

Blog de WordPress.com.