Español en América

junio 19, 2013

Representatividad frente a actualidad en Corpus

Filed under: Lengua española — Mercedes @ 9:28 am

La cuestión de la representatividad preocupa a muchos investigadores que trabajan con corpus sean textuales u orales. Al dedicarnos a los corpus textuales no nos atrevemos a generalizar nuestras observaciones/investigaciones en la construcción, análisis e investigación sobre corpus textuales que desarrollamos desde hace tres años de manera empírica.
Nuestro trabajo se centra en la construcción de corpus uno del Español General que denominamos Corpus Cultural del Español que actualizamos a diario, de la misma manera que compilamos otro específico de los Negocios en Español que bautizamos como Corpus CEN (siglas de Corpus, Español y Negocios).
De forma simultánea construimos otros dos corpus de menor tamaño del Inglés de los Negocios y del Inglés cultural con fines de enseñanza como lenguas segundas para usuarios no nativos del inglés.

Los dos corpus del Español se dirigen con prioridad a la enseñanza de Negocios en Español que se completa con el Corpus Cultural para el aprendizaje del Español General a alumnos de Negocios con la finalidad de equilibrar la enseñanza.
Empleamos los corpus textuales como herramienta digital exclusiva en una metodología diseñada para cursos (en plural) desde formaciones breves de dos o tres semanas a profesionales no nativos interesados en un aprendizaje rápido y específico de la especialidad comercial/financiera/empresarial o de cursos tipo MBA en los que TODOS los alumnos son NO NATIVOS, de uno o dos años en los que la versatilidad de los corpus permite impartir las diferentes asignaturas o materias del Máster en español o inglés o unos temas en español y los demás en inglés.
Los resultados conseguidos son excelentes y los alumnos aprenden simultáneamente español e inglés y, por supuesto los contenidos económico-financieros del Máster.
La ventaja de la compilación diaria de corpus es la percepción de los alumnos de trabajar con temas, textos o artículos ACTUALES que extraemos de diarios digitales de información económica/financiera/empresarial de la web.

A partir del corpus BASE CEN, los alumnos van añadiendo a diario y para cada asignatura del currículo (dirigidos por sus profesores), los temas solicitados por cada docente y los que tienen interés personal. Es lo que el MCER califica como ESPECIFICIDAD y que pone al usuario en el centro del proceso de enseñanza.
Los alumnos comprueban por un lado que el temario es actual con artículos útiles que se ajustan a los contenidos curriculares y por otro lado que pueden añadir los asuntos de su gusto individual o colectivo en el caso de preferir la construcción de un determinado tema colectivamente con otros estudiantes de idénticos intereses.
La representatividad del corpus:
Para muchos investigadores la representatividad es crucial y debe primar –según ellos- sobre la cantidad o el tamaño del corpus.
En la enseñanza de lenguas sean maternas o segundas debe prevalecer la autenticidad de muestras de lenguas que resulta evidente los contenidos de los corpus lo son. Completamos la autenticidad con conceptos trascendentes como son la actualidad y la utilidad.

En principio los corpus que utilizamos van destinados a usuarios que perciben la actualidad y la utilidad. No estamos en la época de la diligencia o del pony express donde la rapidez no eran el centro de las preocupaciones. Nos situamos en la segunda década del siglo XXI donde la aparición de Internet marca la diferencia. Cuando pensamos que los mensajes sms son lo último, surgen los WhatApps que revolucionan la comunicación móvil y escrita.

En estas circunstancias la representatividad en la enseñanza de lenguas y en el supuesto de lenguas de especialidad donde la innovación es una referencia, la actualidad y la utilidad de los textos debe prevalecer sobre la representatividad.
En cuanto al “tamaño” y en los lenguajes específicos creemos que cuanto mayores son los corpus, pueden aportar una gran información sobre la lingüística del texto en el sentido de la aparición más frecuente de construcciones lexicalizadas o semilexicalizadas como locuciones o colocaciones.
La existencia en estas lenguas que contienen un número muy elevado de chunks y, además con un carácter denotativo muy fuerte, obliga a los compiladores de corpus a conseguir un tamaño lo más amplio posible para que cada vez que solicitamos una línea de concordancias, que dispongamos de un elevado número.
En estos corpus de especialidad su compilación motivada por su empleo debe dirigirse a conseguir artículos en cantidades suficientes y de temas que completen el currículo, que sean actuales y útiles.
Sentimos con enorme dolor que el corpus CREA de la RAE se quede anclado en el lejano 2004 y pensamos que las lenguas naturales como el español o el inglés varían a una enorme velocidad que obligan a la construcción de corpus con muestras actuales.

1 comentario »

  1. Más allá de las aplicaciones en el ámbito de la lingüística del texto y de la variación, es preciso mencionar que la lingüística de corpus es útil en variadas áreas de la lingüística que tienen importantes campos de aplicación, como por ejemplo, la lexicografía, la terminología, los estudios sobre lenguas para propósitos específicos (conocidos como LSP, la sigla del inglés Languages for Special Purposes) y la enseñanza de lenguas (ver lenguajes para propósitos específicos ).

    Comentario por Colby Mack — junio 23, 2013 @ 5:52 pm | Responder


RSS feed for comments on this post. TrackBack URI

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Blog de WordPress.com.

A %d blogueros les gusta esto: