CursoInfoling 5.61 (2019)

Título: Curso intensivo de aplicaciones de las tecnologías lingüísticas
Universidad o entidad organizadora: Universidad Autónoma de Madrid
Ciudad: Madrid     País: España

Fecha de inicio: 3 de junio de 2019
Fecha de finalización: 12 de julio de 2019

Contacto: Antonio Moreno Sandoval <antonio.msandovaluam.es>

Descripción

Las tecnologías del lenguaje, rama aplicada de la lingüística computacional, tienen múltiples aplicaciones en la industria y en la investigación. Las empresas tecnológicas, y en especial las dedicadas a la inteligencia artificial, demandan profesionales con conocimientos y experiencia en desarrollo de sistemas de procesamiento del lenguaje natural. En este contexto, se ofrece un curso de formación continua que dote a sus alumnos de las competencias y destrezas que les posibiliten la integración inmediata y efectiva en un contexto profesional dinámico y cada vez más maduro.

Este curso intensivo de 120 horas (80 presenciales + 40 de trabajo individual tutorizado) tiene como objetivo preparar a sus estudiantes con fundamentos teóricos, tanto lingüísticos como informáticos, complementados con un desarrollo práctico de diferentes aplicaciones de lingüística computacional (como anotadores o chatbots, empleando la plataforma IBM Watson). El programa está especialmente dirigido a lingüistas, filólogos, traductores y humanistas que busquen una formación en modelos lógicos y estadísticos, así como en programación informática. La parte central del curso está dedicada a la creación de recursos lingüísticos (corpus, lexicones computacionales, anotadores morfológicos, sintácticos y semánticos).

El curso tiene un carácter muy profesionalizante, puesto que, junto a los evidentes objetivos formativos, el objetivo funcional del curso es que algunos alumnos puedan incorporarse a empresas o laboratorios participantes. El curso está orientado a estudiantes de grado, o que solo tengan pendientes los créditos correspondientes a la defensa del trabajo de fin de grado. Se requieren conocimientos sólidos de análisis lingüístico y su aplicación a diferentes lenguas. También es importante una familiaridad con programas informáticos de uso general y diferentes sistemas operativos. Algunas sesiones se impartirán en inglés. Se realizará una entrevista personal a los candidatos preinscritos para valorar su adecuación.


Programa

- Asignatura 1: Formación teórica en tecnologías lingüísticas: Este módulo pretende nivelar los conocimientos de los estudiantes de diferentes procedencias. En concreto, los temas serán:
(1) La lingüística general y la lingüística computacional: Confluencias y diferencias (4 horas);
(2) Los modelos simbólicos y su aplicación a la lingüística computacional (4 horas);
(3) Los modelos probabilísticos y su aplicación a la lingüística computacional (8 horas).

- Asignatura 2: Informática práctica para lingüistas computacionales: En este módulo se ofrecerá una introducción a la programación para nivelar conocimientos previos:
(1) Informática básica para lingüistas computacionales: Unix/Linux, XML y JSON, expresiones regulares, github (10 horas);
(2) Introducción a la programación en Python (10 horas);
(3) Introducción al aprendizaje automático (machine learning) (4 horas).

- Asignatura 3: Desarrollo de recursos lingüísticos:
(1) Creación y gestión de corpus textuales: diseño, compilación, limpieza, indexación y manejo de programas de gestión de corpus (10 horas);
(2) Creación y anotación de bases de datos acústicas: grabación, transcripción, alineamiento de audio y transcripción (8 horas);
(3) Lexicones y terminología computacional: ontologías, extracción terminológica, lexicones especializados (4 horas);
(4) Anotadores y parsers: reconocedores de entidades, anotación morfosintáctica, sintáctica, semántica (10 horas);
(5) Creación de agentes conversacionales (chatbots): diseño del árbol de diálogo, intenciones y palabras clave (8 horas).

El horario será de lunes a viernes, de 15:30 a 19:30 hs. Se impartirán 2 asignaturas de 2 horas cada tarde, entre las cuales se realizará una pausa.


Profesorado

Leonardo Campillos Llanos, Universidad Autónoma de Madrid
Mahmoud El-Haj, Lancaster University
Marta Guerrero Nieto, Instituto de Ingeniería del Conocimiento
Pablo Haya Coll, Antonio Moreno Sandoval, Universidad Autónoma de Madrid / Instituto de Ingeniería de Conocimiento
Francisco Izquierdo, IBM
Antonio Moreno Sandoval, Universidad Autónoma de Madrid
Scott Piao, Lancaster University
Paul Rayson, Lancaster University
Doroteo Torre Toledano, Universidad Autónoma de Madrid


Certificación

Se expedirá un certificado de formación continua de la Universidad Autónoma de Madrid.

Área temática: Lingüística computacional, Lingüística de corpus

Remitente: Leonardo Campillos Llanos
Institución: Universidad Autónoma de Madrid
Correo-e: <leonardo.campillosuam.es>

Fecha: 17 de mayo de 2019

Información publicada en Infoling: http://www.infoling.org/informacion/Curso1256.html



Con la ayuda de:
Editorial Arco Libros

© Infoling 1996-2019. Reservados todos los derechos.
ISSN: 1576-3404
Logo image by Hay Kranen / CC-BY