Español en América

septiembre 18, 2012

The Compleat Lister: ejercicios con software de Corpus

Filed under: Lengua española — Mercedes @ 9:49 am

Durante las últimas fechas describimos el funcionamiento de diverso software de Corpus procedentes de la web canadiense Lextutor.
Uno de los que tenemos pendientes es el The Compleat Lister que nos proporciona numerosos y fiables datos sobre las frecuencias de los Corpus que introducimos para su análisis.

Nuestra metodología de enseñanza de lenguas maternas y segundas persigue una finalidad de aumento del léxico y no sólo de unidades monolexemáticas sino de las combinaciones de varias formas o plurilexemáticas.

También pretendemos que la lectura organizada –no sólo ocio- con el objetivo léxico y el trabajo con nuestras fichas léxicas vaya incorporando nuevas unidades con sus correspondientes significados de manera que vayamos construyendo el diccionario del alumno.

En nuestra plataforma Moodle colgamos numerosos relatos, microrrelatos y la última innovación, el twitrelato con no más allá de 140 caracteres. Este conjunto de minicorpus disponibles en el Moodle se cuelga para que los alumnos con más tiempo, ganas y motivación prosigan sus trabajos de autoaprendizaje apoyados en el análisis sencillísimo de los microrrelatos que instalamos en cada ficha léxica.

Si la lectura es trascendental y una y otra vez nuestra metodología obliga a los alumnos a leer y a releer los textos, también el diccionario en línea es central para descubrir significados y la combinatoria.

Alternamos el trabajo con las fichas léxicas y la construcción de Corpus personales de cada estudiante.
Entrecruzamos pequeñas y sencillas investigaciones como calcular las frecuencias de los Corpus personales de manera que la utilización del software del Lextutor nos ofrece una ayuda inestimable por su facilidad y, simplicidad.

The Compleat Lister:
Este programa informático se encuentra disponible en el Lextutor desde la página de inicio, elegimos Frequency y desde ésta el The Compleat Lister.

Tenemos dos posibilidades.
A) La primera para minicorpus de menos de 2.000 palabras y la

B) Para Corpus de unos 4MB

En la parte superior del programa podemos elegir varias opciones. Nosotros recomendamos ensayar, antes de introducir nuestros Corpus, con la versión demo y una vez manejado el software con soltura trabajar con los Corpus propios.

Por supuesto que al ser un programa gratuito, no nos pasa nada si desde el inicio, manejamos nuestros propios Corpus. La ventaja de los corpus demo del programa es, que al ser muy breve, los resultados se pueden ver con mayor facilidad en la pantalla que si introducimos textos más largos.

Vayamos al Lister:
Posibilidades:
En todas las opciones este software nos producirá listados de formas (palabras) y en algunos casos acompañados de su frecuencia (el número de veces que una forma aparece en nuestro texto).

A : Natural: nos lista el orden natural del texto, comenzando por la primera forma y terminando por la última. (En este caso no nos facilita la frecuencia)

B: Natural Freq: nos lista el orden natural del texto en la primera columna, acompañada cada forma por su frecuencia y en la segunda columna o la de la derecha, la relación de las formas con sus frecuencias desde la más frecuente a la menos frecuente.

C: Alpha order: Relación natural alfabética del texto (cuando una forma se repite, por ejemplo, tres veces, aparecerá: below, below, below.

D: Finalmente la última opción es la Alpha Freq: en la primera columna aparece la relación alfabética con sus repeticiones y en la segunda columna el orden de formas más frecuentes. Es decir que en la segunda columna las formas vienen ordenadas desde la más frecuente a la menos frecuente.

¿Cuál de estos programas nos puede interesar?

Depende de nuestros gustos, de las intenciones e intereses de los alumnos y también, por qué no de los profesores.
Si los docentes pretendemos enseñar a un primer nivel elegiremos textos actuales, sencillos extraídos de diarios digitales y para elegir las palabras o formas iremos, en nuestra modesta opinión, la última opción “D” ( Alpha Freq).

Si trabajamos con Corpus de no más alla de diez mil palabras, son manejables para trabajarlos de manera individual o en grupo. Si lo hacemos de esta última forma, cada alumno puede encargarse de un mini Corpus de unas 2.500 formas (si son cuatro totalizarán las 10.000). Cada uno individualmente puede aplicar la opción “D” del The Compleat Lister, lematizarlo a mano (que es otra tarea gramatical que obliga a la reflexión y estamos dando Gramática sin expresarlo) y calcular y relacionar las formas que aparecen en casa texto personal.

A continuación “fusionar” los cuatro minicorpus personales en uno solo con el Corpus Builder y luego, en grupo lematizarlo y calcular de nuevo el listado de lemas cada uno con su frecuencia, acudiendo al The Compleat Lister, opción “D” Alpha Freq

Podemos, además comparar este Maxi Corpus con los lemas producidos en los Mini Corpus individuales y ver que la diferencia léxica no es muy grande en los casos de que estén construidos con los mismos criterios e idéntica procedencia.

Anuncios

Dejar un comentario »

Aún no hay comentarios.

RSS feed for comments on this post. TrackBack URI

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Crea un blog o un sitio web gratuitos con WordPress.com.

A %d blogueros les gusta esto: