Curso

Infoling 5.30 (2021)
Título:Análise avanzada de textos e corpus textuais
Universidad o entidad organizadora:Grupo Gramática do español, Universidade de Santiago de Compostela
Ciudad:Santiago de Compostela
País:España
Fecha de inicio:28 de junio de 2021
Fecha de finalización:2 de julio de 2021
Contacto:Victoria Vázquez Rozas, victoria.vazquez@usc.es
Descripción

O obxectivo principal do curso é familiarizar aos asistentes coas técnicas básicas da análise lingüística de textos e corpus textuais, combinando a exposición teórica coa práctica inmediata do introducido previamente.

 

O primeiro módulo céntrase nos aspectos teóricos e prácticos da anotación morfosintáctica, tomando como base as experiencias no procesamento de corpus como CORGA, ESLORA e CAES.

 

No segundo módulo trátase de profundizar nas aplicacións de consulta xa construídas dos corpus anteriores e tamén do CORPES e máis o CORDE, insistindo na creación de corpus virtuais, buscas de proximidade e emprego de operadores booleanos.

 

No terceiro bloco, introduciranse ferramentas de análise de textos procedentes do mundo Unix / Linux, coa intención de facilitar a obtención de información lingüísticamente relevante en textos ou corpus construídos polos asistentes.

 

Duración: 30 horas lectivas

 

Matrícula:

Taxa xeral: 120 € 

 

Taxa reducida: 70 € (aplicable a estudantes universitarios, de bacharelato ou de formación profesional, pensionistas, desempregado/as, socios da Asociación de Antigos alumnos da USC e PDI e PAS da USC)

Programa

28 de Xuño

 

Inauguración do curso

9:00 – 9:30

 

Codificación non lingüística (extratextual e intratextual)

9:30 – 11:30

Mario Barcala Director executivo de NLPgo

Guillermo Rojo Profesor emérito da USC

 

Anotación morfosintáctica de corpus

12:00 – 14:00

María Paula Santalla del Río Profesora contratada doutora da USC

Eva Domínguez Investigadora do Centro Ramón Piñeiro para a investigación en humanidades

 

Prácticas: Preparación das computadoras persoais para o traballo do curso

Prácticas de codificación cun editor XML

16:00 – 18:00

Todos os profesores

 

29 de Xuño

 

Revisión de aspectos básicos e traballo con diferentes parámetros de recuperación

9:30 – 11:30

Victoria Vázquez Rozas Profesora titular de Lingua española da USC

Marta Blanco Profesora contratada doutora da USC

Montserrat Recalde Profesora contratada da USC

 

Combinación de características e creación de subcorpus virtuais

12:00 – 14:00

Sol López Martínez Profesora titular de Filoloxía galega da USC

Eva Domínguez Investigadora do Centro Ramón Piñeiro para a investigación en humanidades

 

Prácticas: Buscas dirixidas sobre os corpus CORGA, CORPES, ESLORA e CAES

16:00 – 18:00

Todos os profesores

 

30 de Xuño

 

Buscas complexas en corpus

9:30 – 11:30

Victoria Vázquez Rozas Profesora titular de Lingua española da USC

Marta Blanco Profesora contratada doutora da USC

Montserrat Recalde Profesora contratada da USC

 

Utilización de operadores booleanos e metacaracteres (‘comodíns’)

12:00 – 14:00

Sol López Martínez Profesora titular de Filoloxía galega da USC

Eva Domínguez Investigadora do Centro Ramón Piñeiro para a investigación en humanidades

 

Prácticas: Buscas dirixidas sobre os corpus CORGA, CORPES, ESLORA e CAES

 16:00 – 18:00

Todos os profesores

 

1 de Xullo

 

Introdución ao CLI (Command Line Interface)

9:30 – 11:30

Mario Barcala Director executivo de NLPgo

Uso de grep

12:00 – 14:00

Guillermo Rojo Profesor emérito da USC

 

Prácticas cos comandos estudados, con especial atención a grep

16:00 – 18:00

Todos os profesores

 

2 de Xullo

 

Uso de sed

9:30 – 11:30

María Paula Santalla del Río Profesora contratada doutora da USC

Expresións regulares

12:00 – 14:00

Mario Barcala Director executivo de NLPgo

 

Prácticas con expresións regulares con grep e sed

16:00 – 18:00

Todos os profesores

Profesorado

María Paula Santalla del Río, Universidade de Santiago de Compostela

 

María Sol López Martínez, Universidade de Santiago de Compostela

 

Eva María Domínguez Noya, Centro Ramón Piñeiro para a investigación en humanidades

 

Mario Barcala, NLPgo Technologies

 

Montserrat Recalde, Universidade de Santiago de Compostela

 

Marta Blanco, Universidade de Santiago de Compostela

 

Victoria Vázquez Rozas, Universidade de Santiago de Compostela

 

Guillermo Rojo, Universidade de Santiago de Compostela

 

Certificación

Créditos e diploma:

 

A USC recoñece o curso a efectos de 2 créditos ECTS (titulacións de Grao) para o seu alumnado, que recibirá a tal efecto un certificado de crédito, sempre e cando cumpran coa asistencia ao 80% das horas lectivas do curso.

Área temática:Humanidades digitales, Lingüística de corpus


Fecha de publicación en Infoling:13 de mayo de 2021
Remitente:
Alba Fernández Sanmartín
Universidade de Santiago de Compostela
<alba.fernandezusc.es>