Recurso lingüístico
[Texto basado en la información de Corpora-List: con algunos cambios, traducido al español por DeepSeek y revisado por Infoling]
Opera Latina Adnotata (v0.2.0) es un corpus latino con anotación lingüística de múltiples niveles. Opera Latina Adnotata (OLA) incluye 736 textos, que están integrados por 18.000.000 (dieciocho millones) de formas (tokens).
Se pueden realizar búsquedas en OLA en relación con los siguientes niveles de información lingüística:
1. formas léxicas
2. lemas
3. morfología (clases de palabras y propiedades morfológicas)
4. sintaxis (sintaxis de dependencias, que sigue el esquema de anotación del AGDT[1]
5. CTS URN[2] para la obra, el autor y la edición
6. CTS structure (p. ej., "libro", "sección", etc.)
7. nombre de autor
8. título de la obra
9. experimental: transcripción IPA [Alfabeto Fonético Internacional] de las formas léxicas (la correspondiente al 'latín clásico')
- Los datos de OLA se encuentran en Zenodo y se pueden consultar en línea a través de ANNIS[3].
- Más informacion sobre OLA en este repositorio.
Este proyecto ha sido desarrollado por Giuseppe G. A. Celano (Universidad de Leipzig, Instituto de Ciencias de la Computación, Alemania).
NOTAS
[1] AGDT (Ancient Greek Dependency Treebank) es un esquema de anotación específico, desarrollado originalmente para el griego antiguo, que posteriormente se extendió al latín y a otras lenguas clásicas.
[2] CTS (Canonical Text Services [Servicios de Texto Canónico]) y URN (Uniform Resource Name [Nombre Uniforme de Recurso]) son sistemas de referencia estandarizados para identificar y recuperar textos con precisión.
[3] ANNIS es una plataforma para consultar corpus anotados (morfología, sintaxis, URNs, etc.), con visualización multinivel.
<infoling
