Español en América

mayo 27, 2013

Lista General del Español, Spanish Word Families List

Filed under: Lengua española — Mercedes @ 1:29 pm
Tags: ,

Cómo confeccionar la Lista General del Español

Días pasados describimos un panorama sobre el concepto de frecuencia, su relación con los corpus y con el léxico e introducíamos un nuevo añadido que denominamos frecuencia asociada.

El concepto de frecuencia asociada lo innovamos como una necesidad para motivar a los alumnos de español del primer nivel.
Los docentes conocen las preocupaciones y la dificultad de los que se inician en nuestra lengua.
Los primeros niveles son los más complicados y se necesita una motivación elevada para superar esos momentos en los que los aprendices se preguntan dónde se han metido o quien les ha metido en semejante lío.
Intentamos ayudar a nuestros colegas con algunas recetas sencillas como esta idea de la frecuencia asociada.
Son dos conceptos que unificamos para facilitar la enseñanza del nivel A1-A2 y por otro lado para motivar a los alumnos.
Este trabajo pretende mostrar las similitudes entre la lengua española y una gran mayoría de lenguas indoeuropeas.
Es conocido que el inglés y el alemán toman prestadas infinidad de formas derivadas del latín y del griego que están omnipresentes en las lenguas latinas como el francés, portugués, italiano y español.
Algunos estudiosos han calculado que la presencia en la lengua inglesa de formas (las viejas palabras) procedentes o calcadas del latín y/o del griego es del orden del 60% del diccionario británico.
Nos encaminamos en esa dirección pero nuestro interés no es buscar esas miles o decenas de miles de palabras que los súbditos de su graciosa majestad y los seguidores de Obama más allá del charco han copiado a nuestras lenguas latinas.

La motivación de los alumnos

Cuando estamos en clases en las que los británicos son mayoría, les animamos diciendo que su elección con la lengua española ha sido un acierto: nuestra lengua es fácil y, además muy parecida al inglés. Por otra parte los aprendices de español en su inmensa mayoría dominan o por lo menos conocen bastante bien la lengua de Shakespeare y se puede suponer que su nivel es un B1 lo cual es una inestimable ayuda para nuestro propósito.
A continuación les mostramos el asombroso parecido de una multitud de palabras que se escriben y casi casi se pronuncian de la misma manera en inglés y español.
Además, esas palabrejas que presentan increíbles parecidos son muy frecuentes y usuales.
Para ayudarnos en la elección de formas españolas acudimos al Diccionario de Frecuencias de Mark Davies que nos parece una excelente herramienta para docentes y alumnos de español como lengua extranjera.
El Diccionario A frequency Dictionary of Spanish publica la lista de las palabras más empleadas en español según un Corpus de 20 millones de palabras elaborado por el mismo Davies de la Universidad de Brigham en USA. Está editado por Routledge en 2006.
En su prólogo Mark Davies subraya que los mil primeros lemas de mayor uso o frecuencia de una lengua cubren el 85% del discurso de los hablantes (se entiende de su corpus).
Los esfuerzos de los profesores deben encaminarse a esas mil entradas del diccionario para facilitar a sus aprendices de nivel A1-A2 la comunicación en español.

Damos un paso más hacia adelante intentando cribar o seleccionar más aun esas mil palabras con esa doble intención antes apuntada de mostrar las enormes similitudes entre el español y el inglés y que esas formas son además, muy frecuentes y se encuentran dentro del objetivo de los mil lemas.
Si conseguimos reducir por la vía de agrupar las formas por su morfología y por su parecido con el inglés, entonces la receta puede ser magnífica.
Comenzamos, por ejemplo, con comunicación que en la lengua de Shakespeare se escribe communication y el verbo comunicar que se grafía como to communicate.
En el diccionario de Davies, comunicación ocupa el puesto 659 de las palabras más frecuentes con un número de casos de 2.303 en el Corpus de 20 millones de palabras. Comunicar se encuentra en la posición 952 con 1.124 casos en el anterior corpus. En el diccionario no figuran comunicado ni comunicativo que a buen seguro poseen en el corpus bastantes ocurrencias.
Entre ambas forman totalizan 3.427 apariciones lo que representa en su conjunto o como lo denominamos, su frecuencia asociada a la forma o a la morfología consigue mejorar en el ranking de frecuencias de Davies hasta el puesto 470.
De esta manera la combinación de ambas formas, comunicar y comunicación las presentamos como palabras morfológicamente muy parecidas en español e inglés y con una frecuencia más baja.

Al hilo de lo expuesto antes como Formas de Frecuencia Asociada en la que describíamos la necesidad de los aprendices de español de motivarlos avanzando con rapidez en nuevas palabras que sean de morfología similar en su lengua de origen y en la española, continuamos la exposición con la descripción de las palabras más frecuentes entre las mil primeras del diccionario de Frecuencias de Mark Davies.
Entre esas 1.000 formas más frecuentes del A frequency dictionary of Spanish words encontramos nada menos que 402 lemas cuya similitud español-inglés es sorprendente (la sorpresa no es la morfología ni su número del que preveíamos hasta un 60%, sino las posibilidades que nos ofrece) esta extracción.
A continuación referenciamos esos 402 lemas (es posible que la cifra no sea exacta), sus derivados morfológicos en español y la traducción al inglés extraída del A Frequency dictionary of Spanish words de Davies y Routledge.
Deseo a los profesores de español que este sencillo y laborioso trabajo les sea de utilidad.
Por supuesto que se puede extender las similitudes semánticas y morfológicas al español-francés, al español-alemán, al español-portugués y a las demás lenguas.
Ni que decir tiene que el trabajo se encuentra inconcluso y se puede completar modificando las nuevas frecuencias asociadas a un lema.
También al asociar frecuencias algunos lemas que no están entre eso mil primeros lemas, pasarían a engrosar el listado de esos top-thousand del español.

Nota 1ª:

A las ocurrencias de comunicación, 2.303 y de comunicar con 1.124 casos, vamos a añadir las ocurrencias de comunicado y comunicativo mediante el recurso del corpus CREA de la RAE.
Disponible en línea: http://corpus.rae.es/creanet.html, introducimos la forma comunicado y nos ofrece 6.083 casos, mientras que comunicativo produce 454.
Para la aproximación y que sea comparable (más o menos) necesitamos solicitar, además, los casos de comunicación que resultan 22.791. Podríamos realizar el “ajuste” con el lema comunicar pero al requerir sus flexiones resultaría en la práctica imposible efectuar una comparación fiable.
El ajuste lo realizamos mediante una regla sencilla: si en Davies comunicación posee 2.303 ocurrencias y en el CREA 22.791 (por su mayor dimensión), comunicado que dispone de 6.083 casos lo homologaremos en el corpus de Davies con 614 casos; lo misma operación con comunicativo que quedaría en Davies con 46 casos que coincide con una apreciación intuitiva nuestra ya que comunicativo posee un menor uso que comunicado.
SI a nuestro lema central o head word comunicación le añadimos las ocurrencias de comunicar, comunicado y comunicativo, obtendremos el número de casos correspondientes a nuestro lema central.

Este cálculo de frecuencia para el lema central nos hará obviamente avanzar la frecuencia colectiva o central de la familia sobre otros lemas del ranking de Davies.
Resultará para la familia de comunicación un número total de casos: 2.303 + 1.124 + 614 + 46 =
Totalizando: 4.087 que representa un aumento del 19,26% sobre las ocurrencias de la familia “inicial”.
No tenemos en cuenta formas de la misma familia como comunicativamente por poseer muy escasas ocurrencias pero que aumentarían la posición de la familia en el orden de frecuencias de Davies.
Así, si volvemos a consultar el diccionario de Davies para comprobar dónde queda la familia de comunicar con sus 4.087 casos: ocuparía una nueva posición en el puesto 531 donde ahora se encuentra mayoría y por delante de escuela.
En el diccionario de Davies comunicación ocupa el puesto 659 (teniendo en cuenta únicamente el lema comunicación).
La introducción del concepto de familia central consigue por medio del concepto de frecuencia asociada que el lema adelante muchas posiciones y que merezca enseñarse antes que otros. Todo ello sin tener en cuenta el significado que tanto en inglés como en español son coincidentes.

Comprobemos otros lemas como método y metodología cuya traducción inglesa method y methodology se corresponden morfológicamente. Método se encuentra en el puesto 1.129 de Davies con 2.541 ocurrencias mientras que metodología no dispone de cifra alguna. Acudimos al CREA para adjudicarle unas ocurrencias y comprobamos que método posee 9.369 casos y metodología 1.890 de manera que si le adjudicamos sus ocurrencias en el corpus de Davies resultarían 512. La suma de ambos lemas nos daría un total de 3.053 y comprobamos la posición nueva de la familia método-metodología en la lista de frecuencias de Davies que le haría avanzar nada menos que al puesto 739.
La introducción de las familias morfo-sintácticas y el cómputo de su frecuencia asociada consigue reformular la lista de frecuencias del Diccionario de Davies (o de cualquier otro) facilitando dos hechos: uno el de introducir nuevos lemas dentro de esos mil primeros necesarios en los niveles A1-A2 y motivar con rapidez a los usuarios al mostrarle que un muy elevado número de palabras antes de comenzar a estudiar la lengua española ya las conocen.

Investigación a completarPublicamos en el Blog El Español en América un trabajo con 402 lemas agrupándolos en familias con sus nuevos números de ocurrencias a efectos de reclasificarlos en una Lista de Lemas que denominamos Lista General de Lemas del Español cuya finalidad es que los alumnos de los niveles iniciales los aprenden con rapidez y consigna la motivación necesaria para continuar con el aprendizaje del español.
El trabajo a realizar es señalar dentro de los, por ejemplo, 1.200 lemas del diccionario de Davies con los dos criterios ya avanzados:

• Cuáles son las formas/lemas que poseen la misma semántica en inglés y español, y
• Además su morfología es idéntica o casi idéntica
Repetimos que el trabajo está hecho con 402 lemas dentro de esos 1.000 del A Frequency Dictionary de Mark Davies.
Se trataría de completar los lemas siempre respetando los criterios establecidos de semántica y morfología para completar una lista de 1.000 familias de lemas en las que, además, excluiríamos las partículas como preposiciones, artículos, conjunciones por carecer de semántica y cuyo aprendizaje viene dado al combinar los lemas más usuales.

Dejar un comentario »

Aún no hay comentarios.

RSS feed for comments on this post. TrackBack URI

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Crea un blog o un sitio web gratuitos con WordPress.com.

A %d blogueros les gusta esto: