Curso

Infoling 5.53 (2023)
Título:Corpus lingüísticos: recursos y métodos para su explotación
Universidad o entidad organizadora:Universidade de Santiago de Compostela, Grupo de investigación Gramática del español
Ciudad:Santiago de Compostela
País:España
Fecha de inicio:10 de julio de 2023
Fecha de finalización:14 de julio de 2023
Contacto:Victoria Vázquez Rozas, victoria.vazquez@usc.es
Descripción

El curso presenta los fundamentos y aplicaciones de la Lingüística de corpus a través del uso de diferentes tipos de corpus de español y de gallego. Se abordan los aspectos más relevantes del diseño y construcción de corpus, así como la descripción de los procesos de codificación y anotación para el enriquecimento de los textos. Incluye también sesiones dedicadas a algunas técnicas estadísticas simples y a utilidades de Unix para el procesamiento de los datos textuales.

 

El curso combina la presentación de contenidos y técnicas de la lingüística de corpus con sesiones prácticas en las que los participantes aplicarán los conocimientos adquiridos a la resolución de problemas lingüísticos y al diseño de proyectos de investigación sobre diferentes corpus textuales.

 

Plazo de matrícula: hasta el 30 de junio.

Tasa general: 120 € 

Tasa reducida: 70 € (aplicable a estudiantes universitarios, de bachillerato o de formación profesional, pensionistas, desempleados/as, socios de la Asociación de Antiguos Alumnos de la USC y PDI y PAS de la USC)

Formalización de la matrícula: https://www.usc.gal/gl/servizos/area/cultura/formacion/universidade-veran/corpus-linguisticos-recursos-metodos-sua-explotacion-13271

Programa

Día 10.7.2023

9:00 - 9:30
Inauguración del curso

 

9:30 - 11:30
Codificación de corpus

 

12:00 - 14:00
Utilización avanzada de aplicaciones de consulta de corpus. Aspectos básicos.

 

16:00 - 18:00
Preparación de los ordenadores personales para el trabajo del curso
Prácticas de codificación con un editor XML
Búsquedas dirigidas en corpus (CORGA, CORPES, Corpus del Español, ESLORA, CAES y PRESEEA)

Día 11.7.2023

9:30 - 11:30
Creación dinámica de subcorpus (subcorpus virtuales). Combinación de parámetros

 

12:00 - 14:00
Búsquedas complejas. Utilización de operadores booleanos y metacaracteres.

 

16:00 - 18:00
Búsquedas dirigidas en corpus (CORGA, CORPES, Corpus del Español, ESLORA, CAES y PRESEEA)

Día 12.7.2023

9:30 - 11:30
Técnicas estadísticas. Enfoque cualitativo y enfoque cuantitativo. Nociones básicas en estadística descriptiva: frecuencias generales y normalizadas; medidas de tendencia central; medidas de dispersión; variables categóricas y continuas  

 

12:00 - 14:00
Nociones básicas de estadística inferencial: variables dependientes e independientes; hipótesis nula e hipótesis alternativa. Pruebas de correlación simples

 

16:00 - 18:00
Casos prácticos de aplicación de las técnicas estudiadas

Día 13.7.2023

9:30 - 11:30
Herramientas informáticas para la obtención de datos textuales. Texto plano. Editores de texto. Codificación de caracteres. Uso básico de utilidades para trabajo con textos (wc, grep, cut, sort, uniq, etc.)

 

12:00 - 14:00
Profundización en el uso de utilidades para textos (sed, redireccionamientos, tuberías, operadores de disyunción, etc.). Expresiones regulares

 

16:00 - 18:00
Instalación de utilidades
Prácticas con los comandos estudiados

Día 14.7.2023

9:30 - 11:30
Explotación de corpus: Metodología. Determinación de las características de los corpus que pueden ser de utilidad en los distintos campos de trabajo

 

12:00 - 14:00
Estudio de un caso. Hipótesis y preguntas de investigación; selección de corpus y análisis de los datos obtenidos

 

16:00 - 18:00
Desarrollo de un caso práctico por grupos de trabajo

Profesorado

- Mario Barcala, NLPgo

- Eva María Domínguez Noya, Universidade de Santiago de Compostela

- María Sol López Martínez, Universidade de Santiago de Compostela

- María Paula Santalla del Río, Universidade de Santiago de Compostela

- Victoria Vázquez Rozas, Universidade de Santiago de Compostela

- Guillermo Rojo, Universidade de Santiago de Compostela

Certificación

La organización de la Universidad de Verano remitirá por correo electrónico a las personas asistentes que consten como “aptas” en las actas del curso tanto los diplomas de participación como, en su caso, los certificados de crédito*, en formato digital con firma electrónica.

 

* La Universidad de Santiago de Compostela reconoce el curso con 2 créditos ECTS (titulaciones de Grao). Para recibir el correspondiente certificado de crédito, los participantes deben asistir al menos al 80% de las horas lectivas del curso. 

Área temática:Lingüística de corpus


Fecha de publicación en Infoling:26 de mayo de 2023
Remitente:
Victoria Vázquez Rozas
Universidade de Santiago de Compostela
<victoria.vazquezusc.es>