Recurso lingüísticoInfoling 9.38 (2020)

Nombre del recurso:Observatorio Lázaro: los anglicismos en la prensa española
Descripción
Qué es Observatorio Lázaro


 


Es un observatorio de los anglicismos que se encuentran en la prensa española. El objetivo del proyecto es estudiar el uso de anglicismos, es decir, préstamos del inglés, en la prensa española a lo largo del tiempo y de forma empírica, masiva y sistemática. El nombre del observatorio es un homenaje al filólogo español Lázaro" target="_blank">https://es.wikipedia.org/wiki/Fernando_L... Carreter.


 


La motivación tras Observatorio Lázaro no es defender una supuesta pureza lingüística del español, sino estudiar el fenómeno del préstamo léxico en la prensa de forma empírica y desde una perspectiva basada en datos.


 


Cómo se detectan los anglicismos


 


Cada día, Lázaro se conecta a distintos medios de comunicación españoles, analiza las últimas noticias publicadas y extrae los anglicismos aparecidos en las noticias del día. Actualmente Lázaro analiza los artículos publicados en ochos medios españoles: elDiario.es, El País, El Mundo, ABC, La Vanguardia, El Confidencial, 20minutos y EFE.


 


El núcleo del proyecto es un modelo de aprendizaje automático, que detecta posibles extranjerismos, fundamentalmente anglicismos, en la prensa en español. Si bien el modelo ha sido entrenado para extraer anglicismos, también aparecen  ocasionalmente préstamos de otras lenguas. El modelo de extracción de anglicismos de Lázaro es un https://en.wikipedia.org/wiki/Conditiona... target="_blank" rel="noopener">conditional random field. El código del modelo y el corpus de entrenamiento están disponibles en el repositorio" target="_blank">https://github.com/lirondos/lazaro">repo... de GitHub.


 


Los anglicismos nuevos que Lázaro encuentra, es decir, aquellos que el modelo no ha visto previamente, son tuiteados a diario por el bot" target="_blank">https://twitter.com/lazarobot">bot de Twitter @lazarobot. Asimismo, cada domingo @lazarobot" target="_blank">https://twitter.com/lazarobot">@lazarobo... publica el ranking con los diez anglicismos más frecuentes de la semana.


 


Se puede encontrar más información sobre el modelo y sobre el corpus de entrenamiento en las siguientes publicaciones:



 


Créditos


 


Observatorio Lázaro es un proyecto de Elena" target="_blank">https://lirondos.github.io/">Elena Álvarez Mellado. El germen del proyecto fue desarrollado en el Computational Structure of Language Lab de la Universidad de Brandeis (MA, EE.UU) bajo la supervisión de Constantine" target="_blank">https://lignos.org/">Constantine Lignos.


Área temática:Lexicografía, Lexicología, Lingüística computacional, Lingüística de corpus
Remitente:Elena Álvarez Mellado
Institución: Brandeis University (MA, EE.UU)
Correo-e: <ealvarezmelladobrandeis.edu>
Fecha de publicación en Infoling:18 de septiembre de 2020