Recurso lingüísticoInfoling 11.32 (2016)

Nombre del recurso:Corpus del Español: 2.000 millones de palabras
DescripciónYa se puede acceder a la nueva versión del Corpus del Español en http://www.corpusdelespanol.org . Tanto la interfaz como los archivos de ayuda están disponibles en español como en inglés.

- El nuevo corpus contiene 2.000 millones de palabras, lo que supone 100 veces más que la sección del siglo XX del Corpus del Español original.
- Las búsquedas que producían entre 15 y 20 resultados al consultar el antiguo corpus pasarían a ofrecer ahora entre 1.500 y 2.000 resultados.
- Además, los textos son más recientes (tomados de los últimos tres o cuatro años).
- Es posible comparar frecuencias de palabras, sintagmas y construcciones sintácticas entre los 21 países hispanohablantes incluidos en el corpus.
- También es posible hacer uso de los potentes corpus virtuales para crear y consultar corpus personalizados a partir del corpus principal (subcorpus sobre un ámbito específico de las ciencias, un deporte determinado o cualquier otra área de interés).
- Hemos implementado una nueva interfaz para este nuevo corpus, que también funciona con el Corpus del Español original. Esta interfaz tiene una apariencia mucho más limpia, con mejores archivos de ayuda y funciona muy bien con dispositivos móviles (tabletas e incluso celulares).
- Ambos corpus están ahora disponibles con la interfaz y los archivos de ayuda tanto en inglés como en español. (Gracias a Gerardo Cruz por su ayuda con las traducciones).

El nuevo corpus goza de grandes ventajas en relación con otros grandes corpus del español, como el CORPES (RAE) y otros corpus grandes online (se puede consultar una comparativa en nuestra web).

Les invitamos a utilizar estos nuevos corpus y esperamos que les sean de utilidad en tanto en sus investigaciones como en sus clases.

Mark Davies
Professor of Linguistics / Brigham Young University
http://davies-linguistics.byu.edu/

Información de: Corpora List http://mailman.uib.no//public/corpora/20...
Área temática:Lingüística de corpus
Remitente:Infoling
Correo-e: <infolinginfoling.org>
Fecha de publicación en Infoling:12 de noviembre de 2016

Recursos lingüísticos: desde 2010