Español en América

septiembre 17, 2012

Ejercicios con software de corpus: el Familizer

Filed under: Lengua española — Mercedes @ 11:21 am

Desgranamos los diferentes analizadores léxicos o, si prefieren denominarlos como software de corpus que nos ofrece de manera gratuita el portal canadiense Lextutor.

Los casi cien programas que nos permiten infinidad de filigranas lingüísticas y tareas investigadoras muy motivadoras para los estudiantes de lenguas se encuentran disponibles en la web: http://www.lextutor.ca

Nos toca explicar el Familizer que se localiza desde la página de inicio y clicando en ese nombre.

Nos aparecerá el 20k Familizer Proto que nos servirá para los profesores de inglés lengua segunda o materna.

Como siempre, existe una versión demo o de demostración que nos ilustra las posibilidades de este software.

Hay dos opciones la “A” para textos breves hasta unas 10.000 formas o palabras y una opción “B” para Corpus de alrededor de un millón de formas.

Recomendamos para ensayos comenzar con la versión “A” y la demo cuyo texto aparece al abrir el programa.

Con estos antecedentes podemos actuar:

A) headwords only en la que el software, después de clicar en submit_window nos producirá los lemas del texto, un total de 74 lemas que el software denomina families.

B) La siguiente posibilidad es, con el mismo texto, obtener a partir de la lematización anterior, las familias morfológicas de los lemas obtenidos. Esta opción es muy interesante para los profesores de inglés porque, a partir de un texto breve se pueden trabajar estas familias morfológicas y aprender infinidad de palabras a partir de unos pocos lemas.

C) El tercer resultado que podemos conseguir es la family in tabs que al clicar en submit_window nos origina un listado vertical con los lemas o families y en las que las familias morfológicas se consiguen también en vertical pero en una segunda columna.

¿Tiene interés este software para alumnos de español?
Con sinceridad al ser un programa específico para la lengua inglesa NO produce buenos resultados para el español.

Si se animan a probar con un texto español, la lematización produce extraños resultados ya que el objetivo es el inglés y empleemos las opciones A), B) o C) el resultado es que aparecen las familias morfológicas en lengua inglesa.

Si para nuestra lengua tiene escaso interés para los profesores del idioma de Shakespeare puede resultar muy útil.
Recordamos en un trabajo nuestro reciente sobre la innovación del Español en América, la frecuencia asociada y con precisión formas de frecuencia asociada en la que describimos sobre el Diccionario de Frecuencias de Mark Davies y referido a sus 1.000 primeros lemas más frecuentes de la lengua española las similitudes morfológicas y semánticas que, para los primeros niveles A1 y A2 su enseñanza es fuertemente motivadora.

Si recuerdan, podemos empezar la clase diciendo que existen varios cientos de palabras que se asemejan en español e inglés (extensible al francés, portugués o italiano) de manera que en muy pocas clases se pueden incorporar a nuestro acervo cultural y lingüístico infinidad de formas que por su morfología y significado son casi idénticas.

Los aprendices del español necesitan de esa motivación para superar las dificultades de los primeros pasos en la nueva lengua.

Un inciso final:

Con el familizer inglés es factible un sencillo ejercicio.
Si introducimos un texto en español en la opción “C” nos va a aparecer el listado en vertical de lemas o families y abajo del todo una relación completa de las palabras del texto.

Esa relación alfabética, que en nuestro caso es de 2.963 formas (el corpus introducido es muy corto) produce todas las palabras del corpus de forma que si queremos lematizarlo se efectúa con rapidez ya que sólo hay que suprimir las formas repetidas.

De esta manera obtendremos los lemas de este minicorpus de 2.963 formas. Es preciso explicar que previamente lo hemos limpiado con el software The Compleat Stripper que lo deja en condiciones para someterlo al Familizer.

Al utilizar este Stripper con bastante frecuencia, no recordamos si en estas páginas lo hemos explicado, porque pensamos que es muy útil y pedagógico ya que la limpieza aunque en un 90% es automática, queda ese porcentaje residual que requiere de la “lectura” del texto para terminar la “faena”.
Insistimos que estas actividades buscan la “lectura” y la “lectura” que si la hacemos mediante las fichas léxicas conseguiremos que los alumnos de español lengua materna o extranjera aprendan léxico, unidades léxicas con sus formas y significados.

Y es la única manera de ejercitar la comprensión lectora y alcanzar unos niveles satisfactorias de expresión escrita.

Anuncios

Dejar un comentario »

Aún no hay comentarios.

RSS feed for comments on this post. TrackBack URI

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Crea un blog o un sitio web gratuitos con WordPress.com.

A %d blogueros les gusta esto: