Class, Degree Program, or Certification

Infoling 4.33 (2025)
Title:Filología Digital en español: corpus, estilometría y análisis de datos
Organizing Institution:Universidad Internacional Menéndez Pelayo (UIMP)
City:Santander
Country:España
Start Date:4 de August de 2025
Fecha de finalización:8 de August de 2025
Contact Information:Andrés Enrique Arias, andres.enrique@uib.es
Description:

DESTINATARIOS

 

Estudiantes de estudios hispánicos de último año de grado, posgrado o doctorado; profesores de lengua y literatura españolas e investigadores con un interés por profundizar en el conocimiento de la filología digital y el empleo de datos a partir de textos de diferentes épocas y variedades.

 

OBJETIVOS

  • Familiarizarse con los principios básicos de la transcripción paleográfica y de la edición de textos hispánicos asistidos con los nuevos desarrollos en las humanidades digitales, reconocimiento automático de escritura manuscrita (HTR) y procesamiento del lenguaje natural (NLP).
  • Adquirir las nociones de ecdótica del manuscrito, necesarias para la selección de materiales adecuados para obtener datos lingüísticos.
  • Entender las técnicas para el estudio de la variación lingüística en textos de diferentes épocas.
  • Aprender a evaluar la fiabilidad filológica de los corpus del español más conocidos y empleados.
  • Adiestrarse en las técnicas para controlar la variación cronológica, geográfica y diastrática en el análisis de datos de textos de diferentes épocas.
  • Reflexionar sobre el papel actual de las humanidades digitales en relación con las disciplinas lingüísticas y literarias.

CONVOCATORIA DE BECAS

 

Desde el 3 hasta el 25 de abril, está abierta la convocatoria para la solicitud de becas de alojamiento y manutención por parte de la UIMP para este curso. Se deben pedir a través del siguiente enlace: 

https://www.uimp.es/actividades-academicas/secretaria-de-alumnos/becas.html

Program Details

1. Introducción. Taller de buenas prácticas en la edición de textos medievales y clásicos (Andrés Enrique-Arias).

 

2. Los corpus lingüísticos del español: definición, criterios de clasificación, tipología (Andrés Enrique-Arias, Francisco Gago-Jover)

 

3. Del documento antiguo al hipertexto digital: teoría y prácticas de transcripción, edición y conformación de corpus documentales (Francisco Gago-Jover, José Manuel Fradejas Rueda).

 

4. Los corpus lingüísticos paralelos: tipología, creación y aprovechamiento (Andrés Enrique-Arias). Taller de variantes textuales y variación lingüística (Marina Gomila Albal).

 

5. Explotación de corpus para estudios lingüísticos: frecuencia léxica, variantes, colocaciones, estilometría, etc. (José Manuel Fradejas Rueda, Francisco Gago-Jover). Taller de utilización del Old Spanish Textual Archive.

 

6. Explotación y visualización de datos de corpus lingüísticos: primer acercamiento a R, creación de gráficos y mapas. Presentación del Atlas Histórico del Español (Marina Gomila Albal)

Profesorado

Andrés Enrique Arias (Universidad de las Islas Baleares)
Francisco Gago Jover (College of the Holy Cross)
José Manuel Fradejas Rueda (Universidad de Valladolid)
Marina Gomila Albal (Universidad de las Islas Baleares)

Certificación

Los estudiantes que cumplan los requisitos exigidos, recibirán un certificado por parte de la UIMP.

Área temática:Humanidades digitales, Lingüística de corpus, Lingüística histórica, Variedades del español


Fecha de publicación en Infoling:11 de April de 2025
Remitente:
Andrés Enrique Arias
Universitat de les Illes Balears
<andres.enriqueuib.es>