Translate

quinta-feira, 12 de dezembro de 2013

CORPES XXI



Consulta
El Corpus del Español del Siglo XXI (CORPES XXI) es, al igual que CREA, un corpus de referencia. En lingüística, se llama corpus a un conjunto formado por miles de textos (novelas, obras de teatro, guiones de cine, noticias de prensa, ensayos, transcripciones de noticiarios radiofónicos o televisivos, transcripciones de conversaciones, discursos, etc.) y cientos de millones de formas. Son empleados habitualmente para conocer el significado y características de palabras, expresiones y construcciones a partir de los usos reales registrados. Dado el tamaño que poseen, los corpus tienen que estar en formato electrónico.

Un corpus general (llamado de referencia) tiene como propósito básico el de servir para obtener las características globales que presenta una lengua en un momento determinado de su historia. En el caso del español actual, el corpus debe contener textos de todos los tipos y también de todos los países que constituyen el mundo hispánico.
Para ello, los textos que integran el CORPES se seleccionan de acuerdo con una serie de parámetros y son tratados con un sistema de codificación especialmente diseñado para este corpus y para la recuperación de sus datos desde cualquiera de esos parámetros.
Para continuar y desarrollar las líneas seguidas anteriormente, en el congreso celebrado en Medellín en marzo de 2007, las academias de la lengua española acordaron encomendar a la Real Academia Española la construcción del Corpus del Español del Siglo XXI (CORPES XXI), que constará de textos de todos los tipos y todos los países con un volumen de 25 millones de formas por año.
En la primera fase del proyecto, que finalizará en diciembre de 2014, los textos procederán del período comprendido entre 2001 y 2012. Por tanto, la primera fase del CORPES constará de un total de 300 millones de formas.
En el momento actual (diciembre de 2013) de desarrollo del proyecto, el CORPES consta de algo más de 160 millones de formas. La versión provisional se presentó en el VI Congreso Internacional de la Lengua Española (Panamá, octubre de 2013). Desde el mes de diciembre se encuentra disponible para las personas interesadas a través de la aplicación de consulta, que permite recuperar los casos contenidos en el corpus de una palabra o expresión.
Con el asesoramiento y la colaboración de las academias de la lengua española.
Con el patrocinio de Banco Santander | Vídeo de la firma del convenio.
Con la colaboración de grupos editoriales y autores.
Con la participación de equipos de codificación pertenecientes a diferentes instituciones españolas y americanas.
Dosier informativo

Acceso al Corpus del Español del Siglo XXI http://rae.es/recursos/banco-de-datos/corpes-xxi
Descripción del sistema de codificación

Nenhum comentário:

LA RECOMENDACIÓN DIARIA:

  LA RECOMENDACIÓN DIARIA sabelotodo ,  plural   La voz  sabelotodo  tiende a mantenerse invariable en plural ( los sabelotodo ), aunque tam...