Español en América

mayo 26, 2013

A vueltas con la frecuencia: introducción a la frecuencia asociada

Filed under: Lengua española — Mercedes @ 9:33 am

Introducción a la frecuencia asociada

El Diccionario de frecuencias del español de Editorial Universitas publicado en 2005 cuyos autores son Almela, R., Cantos, P., Aquilino Sánchez, Sarmiento, R y Almela, M. es un excelente y práctico diccionario. En su introducción realiza una exposición de la obra y una justificación de la necesidad de este tipo de diccionarios desde una perspectiva científica.
Contrasta este trabajo de gran utilidad en la lingüística aplicada a la Didáctica de segundas lenguas con el DRAE al que los autores de “Frecuencias del español, Diccionario y estudios léxicos y morfológicos” citados antes critican con benevolencia: “…el usuario debe leer primero seis acepciones, que actualmente o están en desuso o son raramente utilizadas”. Se refieren a la comparación entre el Gran Diccionario de Uso del Español Actual y el Diccionario de la Real Academia. El Gran Diccionario de Uso de Aquilino Sánchez es el primero en introducir el concepto de frecuencia en un diccionario de uso.

Como bien se explica en la introducción de Frecuencias del Español el concepto se asocia durante mucho tiempo a una idea matemática de la lengua según sus críticos muy alejada de la realidad lingüística que es una “ciencia social”. Sin querer polemizar entre filólogos que pretenden dirigir sus estudios e investigaciones hacia la lengua en estado “puro” olvidando que las ciencias -no sociales- nos pueden ayudar sobre todo en la parte de la lingüística que se denomina “aplicada” hay que resaltar la procedencia de estos diccionarios de frecuencias y su “aplicación” en la confección de manuales, diccionarios, glosarios, ejercicios y lecturas graduadas tanto para estudiantes de español lengua materna o de español lengua extranjera.
Nuestra experiencia en ELE nos reafirma en la utilidad de estos diccionarios de frecuencias, herramientas de uso diario para los docentes. Son imprescindibles para los profesores, no siéndolo para los aprendientes debido a su estructura.

La terminología lingüística
La lingüística es una ciencia social poco o mucho alejada de las ciencias exactas, de la química, o la física que trabajan con el dos más dos que siempre son cuatro.
En lingüística se trata de describir, analizar, desmenuzar y modelizar un sistema natural que es la lengua que al ser un fenómeno discreto no es medible ni cuantificable.
La primera dificultad a la que nos enfrentamos es definir la terminología. Las múltiples escuelas existentes tampoco se ponen de acuerdo en las definiciones que ya en este estadio de las cosas, provocan los primeros enfrentamientos.
La lexicografía es una rama de la lingüística que pretende describir la lengua por medio de la construcción de diccionarios. Pueden ser de muchas clases pero nos vamos a referir a los de frecuencias poco extendidos en nuestro ámbito pero que para las clases de español como lengua extranjera presentan ventajas como las de establecer qué vocabulario se va a enseñar según los niveles.
La clásica palabra sigue siendo el término más usado cuando hablamos de que un diccionario contiene tantos miles de palabras. Sin embargo, la tradicional palabra va siendo desplazada en lexicografía por vocablos más apropiados como formas. Alvar Ezquerra, M. en una comunicación al Congreso de ASELE (2004), emplea palabras para referirse al número de que consta un corpus determinado. Es habitual cuando mencionamos un corpus concreto determinar su dimensión con el vocablo palabras: tiene X millones de palabras.

Preferimos llamar formas a estas palabras. Si damos un paso más hacia los diccionarios, las entradas se llaman lemas. Cada lema posee una o varias acepciones o definiciones. Si son varias, el lema es polisémico. La tendencia de los modernos diccionarios es producir una entrada por acepción de manera que quedarían separados los significados de cada lema.
Así para “helado” existiría el helado, sustantivo, o postre delicioso de diferentes sabores, y el “helado”, adjetivo que indica el estado de frío de alguien, o el de un cuerpo sólido sometido a un intenso frío.
Unidad léxica es una unidad de significado y sirve para calificar ya sea una forma simple (la antigua palabra) o una unidad constituida por dos o más palabras pero que poseen un significado único. Es el caso de las colocaciones o combinaciones semitransparentes y las locuciones o expresiones opacas que también tienen un significado propio.
Los diccionarios deberían otorgar a todas y cada una de las unidades léxicas de la lengua, una entrada. No parece lógico que “frío polar” unidad léxica que podemos designar como colocación no tenga el mismo derecho a disponer de una entrada y sí “frío” o “polar”.

La lematización de un corpus consiste en atribuir a las formas como indica Alvar Ezquerra, M. “mucho”, “mucha”, “muchos” y “muchas” una sola entrada, es decir, adjudicarle un solo lema. Así, las frecuencias de cada forma se sumarían y producirían la del lema correspondiente. Alvar menciona paradigma en lugar de lema y prefiere hablar de formas mientras nosotros preferimos flexiones.
De la misma manera cuando tratamos de lematizar los verbos, lo hacemos siempre en infinitivo. A las conjugaciones les seguimos llamando flexiones y, por supuesto, agrupamos todas las flexiones en una sola entrada o lema. Alvar, para la utilización de las frecuencias pretende utilizar sus formas verbales para determinar los tiempos que se deben enseñar en cada nivel. Nuestra opinión difiere de la de Alvar, ya que cada nivel de enseñanza debería tener sus tiempos verbales, aunque en una enseñanza plenamente comunicativa y oral, no deberíamos establecer ninguna barrera ni preferencia en la enseñanza de las conjugaciones verbales.

La semántica

Si la terminología nos permite avanzar en los conceptos que vamos a emplear, la semántica en todo lo que se refiere a la lengua es trascendental. Lo que aprendemos tiene que pasar por la barrera del significado. Formas simples o unidades léxicas complejas para incorporarlas a nuestra mente, a nuestro lexicón, deben ser comprendidas y definidas tanto aisladas como en combinatoria para añadirlas a esas redes complejas de significados que conforman el lexicón. Redes de conexiones o relaciones entre lexias en las que los nodos son las unidades simples y que, principalmente, por medio de la sinonimia, consiguen que la nueva forma que estamos aprendiendo por relación sinonímica con otra que ya poseemos, la añadamos a nuestro cerebro. En todo el proceso de adición de una nueva unidad léxica el significado juega un papel central. Sin conocer el significado la nueva forma aprendida no se sumará a nuestro particular diccionario cerebral y, por tanto, no la emplearemos.
En cualquier trabajo, estudio, investigación o confección de manuales, ejercicios, lecturas graduadas o diccionarios, el significado es el eje central de todo el proceso.

¿Qué es un corpus?

En lingüística la palabra corpus está de moda y pocos son los investigadores que trabajan tanto con las lenguas naturales como sus aplicaciones que no echen mano de un corpus para satisfacer sus necesidades.
Un corpus es un contenedor de palabras, Un recipiente que para ser válido para una finalidad determinada debe poseer el máximo número de formas que se refieren a ese fin.
Si queremos construir un glosario de términos financieros tendremos que confeccionar un corpus que contenga el máximo número de textos, artículos o comentarios sobre esa lengua de especialidad.
La segunda característica de un corpus es su antigüedad. Las investigaciones que realizamos tomando como base un corpus se limitan exclusivamente a ese corpus. Las conclusiones que obtengamos son sobre ese corpus. Al día siguiente de cerrada la investigación, la variación lingüística produce por desgracia que las conclusiones estén algo desfasadas.
Si nos referimos a las tensiones de liquidez que sufrieron los mercados financieros en los primeros días de diciembre del 2010, aparece una nueva colocación léxica de doble uso metafórico, barra libre, refiriéndose a la liquidez monetaria facilitada sin límite por el Banco Central Europeo a las instituciones financieras de nuestro continente.
La innovación, creación léxica o incorporación de neologismos a las lenguas pueden convertir a los corpus en algo obsoleto al día siguiente de su formación.
Sin embargo, las necesidades de trabajo nos obligan a trabajar con ellos y a actualizarlos para que sirvan para nuestras intenciones.

Resulta evidente que la didáctica de una lengua materna difiere en gran medida de la de una segunda lengua.
Como especialistas en la enseñanza del léxico, actividad que es central tanto en lenguas maternas como segundas el concepto de frecuencia juega un rol también esencial.
El concepto tradicional de frecuencia léxica se utiliza en la confección de manuales y ejercicios de los distintos niveles del español como lengua extranjera. La actividad en lengua materna se encuentra olvidada tanto en currículos como en la metodología de manera que el léxico es el gran olvidado de la lengua española y los diccionarios de frecuencias –los pocos que existen- son desconocidos por los profesores.
El léxico se reduce al albur de la suerte que puedan tener los alumnos más allá de las recomendaciones de esas famosas lecturas de libros para las vacaciones escolares. La carencia de léxico lleva directamente a la incomprensión lectora y al fracaso escolar sin que nadie le preste la más mínima atención.
La situación es algo diferente en el español lengua extranjera en el que también estando olvidada la enseñanza del léxico, los alumnos procedentes de otros sistemas escolares distintos del español, llegan con un conocimiento léxico bastante desarrollado en su lengua materna.

Esta constatación de una base léxica importante en la lengua de origen, tiene que ser el punto de partida de cualquier estudio o investigación que tenga como finalidad la realización de manuales o actividades en las clases o fuera de ellas.
En algún trabajo nos referimos al último diccionario de frecuencias aparecido, el de Mark Davies que en nuestra opinión es el que mejor se adapta a las necesidades de los profesores.
El diccionario de Universitas se confeccionó sobre el corpus “Cumbre” de veinte millones de formas de textos escritos y orales del castellano de España y América. El diccionario recoge además de los diez mil lemas más usuales de nuestra lengua, 1.000 combinaciones de formas más frecuentes del español, lo cual es una novedad en la lengua española. Como indica frecuencias, “la fiabilidad dependerá del grado de representatividad del corpus del cual se han extraído los datos”.
El diccionario de Mark Davies es muy diferente al de Universitas y siendo en lo básico un diccionario de frecuencias únicamente de formas, contiene algo que en nuestra opinión es importante desde el punto de vista de la enseñanza del español, que es la traducción al inglés de cada lema.
Se nos objetará que en la enseñanza de segundas lenguas es necesario prescindir de la lengua de origen de los alumnos, pero preferimos esta solución a la de definir los lemas con otras palabras que en el caso de los primeros niveles –y los más frecuentes- un alumno iniciándose en el español no alcanzaría su significado.
Estos diccionarios son útiles para los primeros niveles A1 y A2, posiblemente el B1 y en estos casos los alumnos están dando los primeros pasos y sus conocimientos de vocabulario son escasos.

Alvar en su comunicación al congreso de ASELE de 2004, referencia los diccionarios de frecuencias publicadas hasta esa fecha, los de Juilland –inventor del concepto de frecuencia léxica-, el del español de Puerto Rico de Rodríguez Bou, de 1952 y 1967 y el antepenúltimo de los profesores de la Universidad de Oviedo, Alameda y Cuetos de 1995.
Alvar repasa estos diccionarios mencionando la necesidad de su actualización por ser la lengua un sistema en continua variación y por su finalidad que no es otra que la de redacción de manuales y ejercicios destinados a alumnos y profesores de ELE.
Es evidente que no es lo mismo un manual cuyo destinatario sea un angloamericano que un chino. Las diferencias culturales, de alfabetos y de léxicos iniciales, impiden confeccionar los mismos libros para unos y otros.
Nuestro punto de vista es algo diferente al de Alvar en el sentido de que manteniendo los mismos principios que sostiene este autor, la trascendencia de los corpus elegidos en función de los fines, su dimensión, la actualización constante de los mismos, el objetivo del alumno en cada supuesto de aprendizaje-enseñanza, y la similitud o no de los dos sistemas lingüísticos de origen y destino, son factores a tener en cuenta.
Estamos de acuerdo con Alvar en su comunicación “… la frecuencia de uso no puede ser un valor rígido al que debamos sujetarnos pues hay otros factores que influyen en el aprendizaje de las palabras… como las relaciones formales y designativas que puedan tener”.
Otro hecho importante a considerar a la hora de la redacción de manuales y ejercicios es que los vocablos como bien indican Alvar y Polguère, no son hechos aislados, sino que se relacionan unos con otros de manera que la combinatoria hay que tenerla muy presente como lo hace la TST que prioriza la enseñanza de las relaciones léxicas ya sea como colocaciones o locuciones idiomáticas.
Si el concepto y los diccionarios de frecuencias son una ayuda inestimable en la redacción de manuales, tenemos una referencia también trascendente a tener en cuenta que es el Plan Curricular del Instituto Cervantes que necesitamos respetar, sin olvidarnos del MCER que marca las líneas generales de la enseñanza de lenguas bajo un enfoque comunicativo y una perspectiva accional que es lo mismo que decir centra los procesos en las tareas.

El concepto de frecuencia, las familias de palabras, el principio de autenticidad, MCER y el Plan Curricular pueden chirriar si intentamos acomodar nuestras tareas a todos ellos.
La experiencia en la clase de ELE con alumnos de diferentes países, culturas y alfabetos nos lleva a pensar que en la confección de manuales debe primar, además de los “pies fijos” anteriores, la morfología de las palabras.
Hemos realizado una investigación sobre un corpus preparado por el “Molino de Ideas” extraído de los exámenes de DELE nivel A2 del Instituto Cervantes, formado por 5.515 formas individuales. Es un corpus muy reducido en el que el concepto de frecuencia al ser tan breve el texto objeto del trabajo no es lo suficiente extenso como para realizar hipótesis de partida. Sin embargo es una referencia consistente para apoyarse en la realización de un texto que tenga como objetivo la preparación de exámenes para la obtención de los certificados DELE A1 Y DELE A2.
La finalidad de este corpus es la redacción de un diccionario-manual que sirva para la preparación de los exámenes de DELE niveles A1 y A2.

Este Corpus de 5.515 formas lo hemos lematizado manualmente obteniendo aproximadamente 2.700 lemas.
La primera conclusión es que este número es enormemente exagerado si pretendemos confeccionar ese diccionario de preparación del DELE referido a los niveles A1 y A2 que debería constar como máximo de unos 1.000 lemas si nos atenemos a la parte de lengua que cubre en el inglés el General Service List de West.
El objetivo es la redacción de un manual-diccionario destinado a profesores y alumnos angloparlantes , de manera que buscamos los puntos comunes de ambas lenguas, español e inglés desde el punto de vista morfológico y semántico. En otras palabras, conseguir el máximo número de cognados para avanzar lo más rápido que se pueda y motivando al mismo tiempo a los alumnos.

Se trata de simplificar el diccionario reduciendo los 2.700 lemas iniciales de que consta el corpus de los exámenes del DELE nivel A y, además, conseguir por la vía de la morfología, disminuirlo aún más.
Primamos para confeccionar lo que denominamos la Lista General del Español (a efectos de su enseñanza como L2) la similitud fonética y semántica de los vocablos correspondientes en español e inglés de manera que para un alumno sea muy rápida la incorporación a su lexicón ya que en su lengua materna los tienen organizados y conocen su semántica. La ventaja para su adquisición en el español L2 es que tanto morfológica como en significado coinciden en ambas lenguas. Los lemas con estas características en español e inglés son muy numerosos, de elevada frecuencia y, por tanto de uso intenso. Su enseñanza rápida en estos primeros niveles es trascendental ya que en la enseñanza de segundas lenguas la motivación que provoca un avance veloz es muy amplia.
Los profesores de segundas lenguas partimos de un bagaje adquirido en la primera lengua que tenemos que aprovechar para la motivación de los alumnos (cuanto más rápido aprenden existe una mayor motivación) y para la incorporación de un mayor número de formas por derivación morfológica.
Somos partidarios de la semántica de los vocablos, pero utilizamos el significado desde el prisma de conseguir similitudes entre formas en ambos idiomas para su rápida comprensión.

Bibliografía

Alameda, J. R. y Cuetos, F. (1996). Diccionario de frecuencias de las unidades lingüísticas del castellano. Oviedo. Universidad de Oviedo.
Almela, R. et Al. (2005). Frecuencias del Español. Diccionario y estudios léxicos y morfológicos. Madrid. Editorial Universitas.
Alvar Ezquerra, M. (2003). La enseñanza del léxico y el uso del diccionario. Madrid. Arco-Libros
Alvar Ezquerra, M. (2004). La frecuencia léxica y su utilidad en la enseñanza del español como lengua extranjera. ASELE, Actas XV. Centro Virtual Cervantes. Madrid-Alcalá de Henares.
Plan Curricular del Instituto Cervantes, Niveles de referencia para el español, Tomo I, A1 y A2- 2006. Madrid. Biblioteca Nueva, S. L.
Davies, M. (2006). A frequency Dictionary of Spanish. Nueva York. Routledge.
Juilland, A. y Chang, E, (1964). Frequency Dictionary of Spanish Words. Londres-La Haya. Mouton.
Rodriguez Bou, I. (1952). Recuento de vocabulario español. Puerto Rico. Universidad de Puerto Rico.
Rodríguez Bou, I. (1967). Recuento de vocabulario español de preescolares. Puerto Rico. Universidad de Puerto Rico.

Anuncios

Dejar un comentario »

Aún no hay comentarios.

RSS feed for comments on this post. TrackBack URI

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Blog de WordPress.com.

A %d blogueros les gusta esto: