Español en América

junio 25, 2013

Filosofando sobre corpus, su construcción, sus objetivos

Filed under: Lengua española — Mercedes @ 6:03 pm

Solemos recomendar, de ramos a pascuas, hacer un alto en el camino, cuando estamos escribiendo, investigando o algo mucho más complicado que es el dar una clase, detenerse para reflexionar lo que coincide con filosofar.
Repetimos que casi siempre enfrascados en nuestra labor cotidiana las hojas de los árboles nos impiden ver el bosque. En estos casos en un claro de la floresta apartamos las ramas con sus hojas para ver el cielo y los árboles.
También nos gusta leer y sobre todo releer los escritos de investigadores que van por delante nuestra y de los que extraemos esas ideas que nos faltan.

Decimos que aunque de un texto extraigamos una única idea es suficiente y merece la pena su lectura.
En el caso que nos ocupa conseguimos muchos conceptos. Se trata de un escrito de Mayafre,
Damon,(2002), « Les corpus réflexifs : entre architextualité et hypertextualité » y, del que vamos a exponer sus conceptos que más nos interesan desde nuestro prisma de enseñanza de lenguas, segundas y maternas por medio de corpus textuales.
Comienza su “paper” con la definición de corpus:

« Un rassemblement de textes ou une collection de textes regroupés sur la base d’hypothèses de travail en vue de les interroger. »La RAE, mucho más elemental nos produce otra definición de este lema:
(Del lat. corpus; propiamente ‘cuerpo’).
“Conjunto lo más extenso y ordenado posible de datos o textos científicos, literarios, etc., que pueden servir de base a una investigación”.
La RAE opina que un corpus es un conjunto “lo más extenso y ordenado posible” de textos mientras que Mayafre explica la problemática y obtiene dos consecuencias que, para nosotros no tenían trascendencia.
La primera la idea de “serie”: desde el primer momento en que compilamos un corpus, la mera constitución de textos unos detrás de otros supone que obedece a una “cierta serie” o como la denomina Mayafre “perspectiva serial”.
Explica que esto sucede siendo el constructor del corpus consciente o inconsciente de la “serie”. Preguntas como qué relaciones existen entre dos textos o entre varios y que puntos en común pueden tener los textos que componen un corpus; de la misma manera si entre los artículos de un corpus existe un patrón de coherencia, continuidad, divergencia o convergencia.

Mayafre indica: ¿qué pasaría si comparamos dos de los artículos de un corpus?
Pueden ser preguntas que podemos plantearnos antes o después de construir un corpus; un corpus es una composición de textos que Mayafre explica como “adición” o “suma” y esa misma suma supone una “serie de textos”.
Considera que un corpus es un “cuerpo complejo” por su origen y constitución de manera que la complejidad supone un obstáculo añadido a su análisis o disección lingüística.
La segunda dificultad derivada de la característica “serial” de un corpus procede de su cierre. Es decir, dónde acaba la serie de textos. Se trata de saber dónde y cómo se inicia un corpus y cómo y por qué se finaliza.
En nuestro caso que nos gusta el formato de corpus monitor, actualizable a diario, nunca los cerramos sino que añadimos nuevos artículos o textos al corpus “base”.
Por una parte el concepto de representatividad se encuentra reñido con la dimensión o tamaño según varios investigadores. Según Mayafre la cuestión se plantea si construimos un corpus de un autor, literario, científico o filósofo dónde nos detenemos o qué textos deben incorporarse o qué artículos deben quedar fuera de la obra de un autor para que el corpus sea “pertinente”, representativo o eficaz para nuestros objetivos.

Desde el prisma de la LC se pretende explicar que una muestra puede representar al todo. Lo que puede ser cierto en algunos casos y en nuestra opinión sólo desde el punto de vista del análisis léxico o lexicométrico pero nunca desde el análisis textual.
Nuestros lectores comprenderán que Mayafre, y nosotros también empleamos los corpus no de manera exclusiva del conocimiento lingüístico sea cuantitativo o cualitativo sino avanzamos un paso más en búsqueda de las aplicaciones para enseñanza de lenguas, desde el enfoque comunicativo y, por supuesto del conocimiento cognitivo que representan.
La incorporación de un texto o artículo a un corpus supone una elección y como no siempre podemos compilar todos los existentes, realizamos un descarte al despreciar unos artículos.

Mayafre se vuelve a preguntar sobre las cuestiones de textos útiles o necesarios y donde y con qué criterios se cierra un corpus en función de los criterios y objetivos de compilación.
La segunda cuestión aparte de la problemática serial es, siempre según Mayafre, que un corpus es un objeto o colección arbitraria y cuya validez viene dada por las preguntas que le vamos a hacer o lo que es lo mismo en qué va a consistir el análisis final. La compilación de un corpus no tiene ningún sentido sino es en base (con independencia de los objetivos) a la disección que vamos a realizar. Un corpus es un objeto heurístico ya que el contenido de un corpus no pertenece a las ciencias sociales sino a la intención del investigador que lo construye con una finalidad determinada que es lo que dota al corpus de sentido.

Pone como ejemplo un corpus dedicado al filósofo Nietzsche cuya finalidad para un cierto investigador es determinar si las ideas de este personaje influido por la ideología judeo-cristiana pudieron influir en la ideología del nacional socialismo alemán. Un lingüista jamás pensaría en tal cosa sino que pondría como fin los marcadores textuales en Nietzsche o cualquier interrogatorio lingüístico.
La heurística como metodología mitad empírica mitad de raciocinio. Para Mayafre para “tratar” un corpus se requiere:

• Un protocolo metodológico

• Un procedimiento intelectual (que podemos incluirlo en la metodología) y

• Los programas tecnológicos para el tratamiento o análisis

Seguiremos con este tema muy bien tratado por el investigador galo.

Anuncios

Dejar un comentario »

Aún no hay comentarios.

RSS feed for comments on this post. TrackBack URI

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Crea un blog o un sitio web gratuitos con WordPress.com.

A %d blogueros les gusta esto: