Español en América

mayo 5, 2010

Mil palabras: frecuencia y disponibilidad léxica

Archivado en: Lengua española — Mercedes @ 9:19 am

Juan José Millás, escritor, plantea en la Universidad de Valladolid una “ecología de las palabras” ante la <constante desaparición de términos y vocablos>.

Continúa Millás: <Lo que tenemos que comunicar es tan pobre que nos bastaría con mil palabras>. Estoy de acuerdo al cien por cien con este escritor valenciano que constata – no es el único- la pobreza del léxico de la comunicación.

Disponemos de un <exceso de comunicación>, que se refleja en un bombardeo mediático de datos pero no de conocimientos.

El escritor comenta las pocas palabras usadas en el registro de todos los días de los hablantes y, la necesidad de una <ecología de las palabras>, es decir, de la misma manera que el concepto de ecología permite salvar especies animales y plantas de la desaparición, la ecología léxica conseguiría que muchas palabras no pasaran al baúl de los olvidos.

En líneas generales estoy de acuerdo con Millás en la pobreza del léxico que se manifiesta en los escolares de Eso y Bachillerato, y por supuesto, en los jóvenes que acceden a las universidades.

Millás propone una acción en la familia, en la escuela y en la universidad.

Me parece bien, pero el problema –como siempre- procede de más arriba. Los políticos, los que ordenan redactar los currículos de las enseñanzas oficiales, o son imbéciles o no les interesa que los alumnos de las enseñanzas obligatorias amplíen el léxico.

Por otro lado, los profesores de estas enseñanzas obligatorias, al no concretar los programas de la asignatura de lengua la necesidad de la ampliación léxica, como se dice vulgarmente “pasan” del tema y, los alumnos de lengua española se quedan como estaban, es decir, sin incrementar su léxico.

En estas modestas páginas dedico y seguiré dedicando mucha, muchísima tinta digital a la ampliación léxica.

Tampoco los manuales o libros de texto acompañan en este sentido del incremento de las palabras.

Una honrosa excepción es la de los autores de los cuatro excelentes libros o manuales de PARQUE LÉXICO, un considerable esfuerzo técnico y didáctico en esa línea de mejora de la comprensión de los SIGNIFICADOS de las palabras para aumentar el léxico.

También, es de justicia, añadir la excelente idea del INSTITUTO ESPAÑOL MURALLAS de ÁVILA, del Doctor Rainer Rutkowski que para este verano han programado varios cursos de AMPLIACIÓN LÉXICA destinados a profesores de lengua española sean de ESO, Bachillerato o de español como lengua extranjera.

El esfuerzo de Rainer y de José Luís cumple veinte años dedicados con intensidad, minuciosidad, técnica y cariño a la enseñanza de la lengua española. En su vigésimo aniversario han programado varios cursos de ampliación del léxico de una semana de duración a unos precios inmejorables. Los recomiendo como vía para aprender cómo se debe ampliar el léxico.

En los próximos días dedicará un post para comentar estos excelentes cursos del IEMA de Ávila. El enlace con este Instituto es: http://www.iema.com

Siguiendo cómo debe de ser el camino programado para la “ampliación léxica”, por supuesto, tiene que preverse una planificación organizada:

  • El primer paso tiene que ser el mencionarla en los currículos,
  • La obligatoriedad de unos textos específicos para el aumento de las palabras y su SIGNIFICADO (por ejemplo los de PARQUE LÉXICO- no piensen que es publicidad puesto que ni siquiera tengo el gusto de conocer a sus autores-),
  • La corrección de todos los manuales y libros de texto en los que figure en cada uno, un pequeño GLOSARIO en el que se explique el SIGNIFICADO de muchos términos que son incomprensibles para los jóvenes estudiantes,
  • La formación de los profesores de lengua española en esta actividad de la “ampliación léxica” justificada por la doble razón: el currículo y mentalizarlos en su necesidad como medio para mejorar la comunicación
  • La mentalización de los medios: tarea difícil ya que la influencia intelectual dirigida hacia su audiencia se apoya en que cuanto más tontos sean los espectadores más fácil es influenciarlos. Así se ve lo que se ve y se escuchan las tonterías a las que nos tienen acostumbrados.
  • Las enormes posibilidades de los medios se deberían aprovechar en relación con la “ampliación léxica”.
  • Incentivar las lecturas graduadas y dirigidas. El problema de la falta de comprensión lectora es un déficit de conocimiento del SIGNIFICADO de los vocablos. Los libros de lecturas graduadas para los jóvenes tendrían que ser específicos en ese sentido de aumentar el léxico, en definitiva, cada libro de lectura infantil debería ir acompañado de su GLOSARIO de explicación de las palabras, al estilo de –vuelvo a repetir- los manuales de PARQUE LÉXICO.

 

Como continuación a los post dedicados al léxico, y como orientación para los profesores que se inicien al incremento léxico, los conceptos de frecuencia y disponibilidad son necesarios para trabajar en todo lo que con anterioridad se ha comentado.

Frecuencia y disponibilidad léxica

El concepto de frecuencia es una creación de A. Juilland en 1.970

Juilland parte de un corpus significativo del francés compuesto por 3.078 libros y artículos de 513 autores. Divide este inmenso corpus en cinco categorías: Novela, Teatro, Ensayo, Prensa y Ciencias:

Categoría Autor/Título Libro/Artículo
Novela                  54               344
Teatro                 105               851
Ensayo                 108               805
Prensa                   34               435
Ciencias                 212               643
TOTALES                 513             3.078

 

Entre las cinco categorías establece un Índice de Aparición o índice de dispersión D (es el mismo concepto con diferente denominación).

El índice tiene un valor entre cero y uno.

Estos índices se calculan solamente para los LEMAS, con la siguiente fórmula:

(la fórmula se calcula para cada LEMA, es decir que cada uno lógicamente tiene un índice de dispersión diferente para un corpus o texto que vamos a analizar.

D =  1 – raíz cuadrada de N (Xi2 – F2) / 2xF

No se asusten por una doble razón: la primera que es una fórmula convencional inventada por Juilland y que pretende reflejar de la forma más ponderada posible la frecuencia de un determinado LEMA en una categoría i de las antes mencionadas cinco categorías Novela, Ensayo, …

La segunda razón es que mi teclado no tiene la raíz cuadrada. Tampoco se asusten porque hay software, el WORDSMITH, que producen la fórmula de manera automática.

En la fórmula anterior los 2 reflejan que hay que elevar al cuadrado tanto Xi como F, siendo Xi  el número de veces que aparece el LEMA considerado en la categoría i,

F es el número total de apariciones de un LEMA en todas las categorías y, N el número de categorías, que en el caso de este corpus de Juilland es cinco (el cuadro anterior).

Juilland define también un Coeficiente de Uso CU para cada LEMA, bajo la siguiente fórmula:

CU = F D / 100, en la que F es la suma de las apariciones de ese LEMA que hay que multiplicar por D, el índice de dispersión.

Vamos a explicar lo anterior porque cuando aparecen fórmulas matemáticas los que procedemos de letras nos entra el pánico o miedo cerval que nos impide la reflexión.

En el caso del artículo indeterminado un, y sus formas flexionadas, uno, una, unos, unas, el LEMA es un y su frecuencia sería la suma total de todas sus flexiones. El coeficiente de dispersión abarcaría a todas ellas, es decir, la aparición de un, uno, una, unos y unas (la suma de todas ellas).

De esto se deduce que el D se calcula para los LEMAS (incluyendo por tanto todas sus flexiones).

Dos LEMAS pueden tener el mismo CU por eso a Juilland se le ocurrió otro nuevo concepto el NCU o número de identificación del CU.

Las formas o vocablos más frecuentes son los que aparecen más veces y, tiene el CU más elevado

Alcanzado este nivel conceptual, se preguntarán a donde vamos a llegar. Lo que intentamos es siempre desde el prisma de la enseñanza del léxico y determinar para cada nivel de enseñanza A1, A2  el que sea el número de palabras que se necesita dominar para poseer el nivel pretendido. ¿Cuántas palabras necesitaremos enseñar y cuáles vamos a elegir? Este es el objetivo que nos mueve a los profesores de lengua.

Para acceder al objetivo de esas palabras y ya que no existen diccionarios de 500, 1.000, o las que necesitemos, estamos en la necesidad de confeccionarnos nuestros propios diccionarios. ¿Qué les parece si llegamos a conseguir este utópico fin?

Vayamos con la exposición: Juilland a partir de ese corpus anterior de 3.078 textos compuso un diccionario del francés de 25.000 palabras en total que comprendían LEMAS (5.083) y sus formas flexionadas (hasta alcanzar las 25.000 palabras). Como eran demasiadas, en 1.984 Catch compuso otro diccionario más reducido de 4.000 palabras de las cuales solamente 1.620 eran LEMAS (el resto hasta alcanzar las cuatro mil, sus formas flexionadas).

En el diccionario se introdujeron todas las formas, es decir los LEMAS y sus flexiones (en el caso de bonito sus flexiones serían bonita, bonitos, bonitas).

Si nosotros vamos a confeccionarnos nuestros propios diccionarios, es conveniente de poner al mismo nivel de los LEMAS y sus flexiones, a las colocaciones y a las expresiones, es decir que tanto unas como otras tendrían la consideración de entrada en nuestro diccionario. Es lo que propugna la TST en el sentido de que colocaciones y expresiones son combinaciones de las lenguas con un SIGNIFICADO único. Aparecerán con una frecuencia propia.

El diccionario de Catach de 1.620 LEMAS y 4.000 formas, que es un diccionario francés, permite cubrir el 90,5%  del léxico del corpus de Juilland. Esto se deduce del tratamiento del corpus de Juilland al que aplicamos informáticamente el diccionario de Catach.

De esto se deduce que para comunicarse en una lengua extranjera al nivel del 90% sólo son necesarios  1.620 LEMAS y sus formas flexionadas (que, en principio, no suponen un gran esfuerzo a nivel de adquisición del SIGNIFICADO).

Otra consecuencia importante de la comparación del corpus de las cinco categorías de Juilland y de los dos diccionarios el de éste último, más nutrido que el reducido de Catach, es que la incorporación de un número significativo de LEMAS a cualquier diccionario (a partir de esos 1.620 LEMAS) NO SUPONE un gran avance en el nivel de comprensión y comunicación por encima de ese apuntado 90,5%.

Es evidente que para confeccionar un diccionario de unos 1.600 significados y sus formas flexionadas, incluyendo colocaciones y expresiones usuales, necesitaremos el software apropiado. Existe en el mercado y es el WORDSMITH que no es muy caro y se encuentra disponible en poco más o menos cien euros.

Lo más difícil no es acceder al tratamiento de textos sino la segunda parte que consiste en determinarlas palabras que estimemos necesarias para constituir nuestro diccionario. No hay más remedio que actuar por tanteos sucesivos, a partir de textos de periódicos (es un criterio muy personal) que serán nuestro corpus particular. Cargaremos en la memoria del ordenador un corpus del español que sea significativo, por ejemplo el CREA de la Real Academia y, por otra parte un diccionario previo nuestro de LEMAS elegido de cualquier diccionario disponible. Se trata de constituir a partir de un diccionario existente otro particular mucho más reducido y que estimemos que va a ser suficiente; más o menos 1.600 LEMAS. Es importante que a estos LEMAS incorporemos sus formas flexionadas para que de esta manera el programa informático no produzca errores.

Nuestro diccionario con sus LEMAS y flexiones, en forma de lista de palabras se coloca en un archivo de nuestro ordenador.

Si al corpus elegido y a nuestro particular diccionario le aplicamos el WORDSMITH nos dará la frecuencia de cada LEMA elegido por nosotros de nuestro diccionario en el corpus seleccionado como referencia. El software permite calcular la frecuencia total de nuestro diccionario. Si alcanzamos el famoso 90,5% quiere decir que nuestra elección es correcta y nuestro diccionario es el adecuado para la comunicación de los estudiantes incluso para un nivel B2 del MCER.

Si incorporamos a nuestro diccionario más LEMAS y sus formas derivadas (son importantes las flexiones), veremos que –con el mismo corpus- el avance sobre el 90,5% no es significativo.

En mi modesta opinión el programa WORDSMITH es imprescindible para cualquier investigación sobre el léxico, su frecuencia y para organizar actividades en el aula de ELE que se refieran al incremento léxico.

About these ads

Dejar un comentario »

Aún no hay comentarios.

RSS feed para los comentarios de esta entrada. TrackBack URI

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

El tema Rubric Blog de WordPress.com.

Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

%d personas les gusta esto: