Recurso lingüísticoInfoling 7.23 (2024)
Spanish-BFF-2: el primer diccionario de uso del español generado con modelo generativo de inteligancia artificial
Índice
1. Presentación
2. Descargas
3. Antecedentes
4.1. Referencias
4.2. Publicación relacionada
5. Anexo
5.1. Entradas monosémicas extraídas de la versión https://es.wikipedia.org/wiki/JSON" target="_blank" rel="noopener">.json del Spanish-BFF-2
5.2. Entradas polisémicas extraídas de la versión https://es.wikipedia.org/wiki/JSON" target="_blank" rel="noopener">.json del Spanish-BFF-2
-------------------------------------------------------------------------
1. Presentación
El diccionario https://huggingface.co/datasets/MMG/span... target="_blank" rel="noopener">Spanish-BFF-2 (Spanish Built Factual Freectianary 2.0) es el primer diccionario de uso del español producido con modelos generativos de https://es.wikipedia.org/wiki/Inteligenc... target="_blank" rel="noopener">inteligencia artificial (IA), concretamente, con https://es.wikipedia.org/wiki/GPT-4" target="_blank" rel="noopener">GPT-4. La creación de Spanish-BFF-2 se ha llevado a cabo en el marco de un programa de investigación, centrado en la aplicación de modelos de inteligencia artifical a la generación de diccionarios (Ortega-Martín et al. https://arxiv.org/pdf/2406.11218" target="_blank" rel="noopener">2024 y https://arxiv.org/pdf/2302.12746v2" target="_blank" rel="noopener">2023).
Las entradas del Spanish-BFF-2 están integradas por los siguientes componentes:
(1) un lema,
(2) su categoría o clase de palabras, p. ej., nombre, verbo, etc., y el género de los nombres y adjetivos,
(3) la definición de cada acepción vinculada al lema, y
(4) un ejemplo de uso, que ilustra el uso de la acepción correspondiente.
Observemos, p. ej., la entrada retransmisión en el Spanish-BFF-2:
Lema: retransmisión
Categoría: Nombre femenino
Definición: Acción y efecto de retransmitir un evento, generalmente por televisión o radio.
Ejemplo de uso: La retransmisión del partido de fútbol fue vista por millones de personas.
2. Descargas
- Descarga del diccionario https://huggingface.co/datasets/MMG/span... target="_blank" rel="noopener">Spanish-BFF-2 (Spanish Built Factual Freectianary 2.0)
3. Antecedentes
El https://huggingface.co/datasets/MMG/span... target="_blank" rel="noopener">Spanish-BFF-2 se desarrolló con el objetivo de mejorar las características del Spanish-BFF-1, el primer diccionario generado automaticamente con modelos de IA (cf. la información sobre el Spanish-BFF-1 en https://infoling.org/index.php?p=informa... target="_blank" rel="noopener">Infoling 3.7 (2023)). El Spanish-BFF-2 tiene más de 10.000 entradas más que el Spanish-BFF-1, incluye ejemplos de uso asociados a las acepciones de cada lema, por lo que constituye, como hemos señalado alnteriormente, el primer diccionario de uso del español generado por modelos de IA.
Diccionarios | Año | Nº de entradas | Ejemplos de uso | Entradas polisémicas |
Spanish-BFF-2 | 2024 | 76.963 | SÍ | SÍ |
Spanish-BFF-1 | 2023 | 66.353 | NO | NO |
Diferencias basicas entre el Spanish-BFF-2 y el Spanish-BFF-1
Las características del diccionario Spanish-BFF-2, su proceso de generación con GPT-4, las mejoras con respecto a su versión inicial y las comparaciones sobre su rendimiento, están descritas en https://arxiv.org/pdf/2302.12746v2" target="_blank" rel="noopener">Ortega-Martín et al. (2024). Las características de la versión inicial, Spanish-BFF-1, se pueden encontrar en https://arxiv.org/pdf/2302.12746v2" target="_blank" rel="noopener">Ortega et al. (2023).
- Miguel Ortega-Martín; Óscar García-Sierra; Alfonso Ardoiz; Juan Carlos Armenteros; Ignacio Garrido; Jorge Álvarez; Camilo Torrón; Iñigo Galdeano; Ignacio Arranz; Oleg Vorontsov; Adrián Alonso. 2024. https://arxiv.org/pdf/2302.12746v2" target="_blank" rel="noopener">Building another Spanish dictionary, this time with GPT-4. [Artículo accesible también desde https://arxiv.org/abs/2406.11218" target="_blank" rel="noopener">https://arxiv.org/abs/2406.11218]
- Descargas:
- Acceso a todos los distintos formatos de descarga del diccionario https://huggingface.co/datasets/MMG/span... target="_blank" rel="noopener">Spanish-BFF-2
- https://huggingface.co/datasets/MMG/span... target="_blank" rel="noopener">Enlace directo a versión Spanish-BFF-2.json
- Miguel Ortega-Martín; Óscar García-Sierra; Alfonso Ardoiz; Juan Carlos Armenteros; Jorge Álvarez; Adrián Alonso. 2023. https://arxiv.org/pdf/2302.12746v2" target="_blank" rel="noopener">Spanish Built Factual Freectianary (https://arxiv.org/pdf/2302.12746v2" target="_blank" rel="noopener">Spanish-BFF-1https://arxiv.org/pdf/2302.12746v2" target="_blank" rel="noopener">): the first AI-generated free dictionary. [Artículo accesible también desde https://arxiv.org/abs/2302.12746v2" target="_blank" rel="noopener">https://arxiv.org/abs/2302.12746v2]
- Descarga del diccionario https://huggingface.co/datasets/MMG/Span... target="_blank" rel="noopener">Spanish-BFF-1 (Spanish Built Factual Freectianary 1.0)
- Carlos Subirats. 2023. Spanish Built Factual Freectianary (Spanish-BFF-1): el primer diccionario generado automáticamente. https://infoling.org/index.php?p=informa... target="_blank" rel="noopener">Infoling 3.7
4.2. Publicación relacionada
- Miguel Ortega Martín. 2021. https://eprints.ucm.es/id/eprint/69387/" target="_blank" rel="noopener">Grafos de vinculación semántica a partir del definiens del DUE [Diccionario de uso del español de María Moliner]. Tesis doctoral, Universidad Complutense, Madrid (España) (cf. información en https://infoling.org/index.php?p=informa... target="_blank" rel="noopener">Infoling 7.5 (2023))
5. Anexo
5.1. Entradas monosémicas extraídas de la versión https://es.wikipedia.org/wiki/JSON" target="_blank" rel="noopener">.json del Spanish-BFF-2.
La versión íntegra del diccionaro en formato .json se puede descargar desde https://huggingface.co/datasets/MMG/span... target="_blank" rel="noopener">Spanish-BFF-2.json
"aclamar":
[ { "pos_tag": "Verbo",
"definition": "Manifestar aprobación o entusiasmo por alguien o algo con gritos o aplausos.",
"example": "La multitud aclamó al héroe de la ciudad." } ],
"aclamatorio":
[ { "pos_tag": "Adjetivo masculino",
"definition": "Perteneciente o relativo a la aclamación.",
"example": "El discurso aclamatorio del líder fue recibido con entusiasmo por sus seguidores." } ],
"aclamídeo":
[ { "pos_tag": "Adjetivo masculino",
"definition": "Dicho de una planta, que no tiene clámide, es decir, que carece de perianto o envoltura floral.",
"example": "Observamos una especie aclamídea durante la excursión botánica." } ],
"aclaración":
[ { "pos_tag": "Nombre femenino",
"definition": "Acción y efecto de aclarar o aclararse.",
"example": "Necesito una aclaración sobre las instrucciones del juego." } ],
"aclarado":
[ { "pos_tag": "Adjetivo masculino",
"definition": "Que ha sido objeto de aclaración, más claro o transparente.",
"example": "El agua del estanque está más aclarada después de la limpieza." } ],
"aclarador":
[ { "pos_tag": "Adjetivo masculino",
"definition": "Que aclara, que hace más claro o comprensible algo.",
"example": "El profesor dio una explicación aclaradora sobre el tema." } ],
"aclaramiento":
[ { "pos_tag": "Nombre masculino",
"definition": "Acción de aclarar o limpiar algo, especialmente un líquido.",
"example": "El aclaramiento del agua se logró con un nuevo filtro." } ],
"aclarar":
[ { "pos_tag": "Verbo",
"definition": "Hacer claro o más claro algo, iluminar o explicar algo para que se entienda mejor.",
"example": "Voy a aclarar el malentendido que ocurrió ayer." } ],
"aclaratorio":
[ { "pos_tag": "Adjetivo masculino",
"definition": "Que sirve para aclarar, explicativo.",
"example": "El documento incluía una nota aclaratoria al final de la página." }
5.2. Entradas polisémicas extraídas de la versión https://es.wikipedia.org/wiki/JSON" target="_blank" rel="noopener">.json del Spanish-BFF-2.
"oído":
[ { "pos_tag": "Nombre masculino",
"definition": "Órgano del sentido de la audición.",
"example": "El oído humano es capaz de percibir una amplia gama de sonidos." },
{ "pos_tag": "Nombre masculino",
"definition": "Sentido mediante el cual se perciben los sonidos.",
"example": "Tiene un oído muy fino para la música." } ],
[...]
"pabellón":
[ { "pos_tag": "Nombre masculino",
"definition": "Estructura arquitectónica que forma parte de un conjunto mayor, a menudo destinada a un uso específico.",
"example": "El pabellón de oncología fue inaugurado el año pasado." },
{ "pos_tag": "Nombre masculino",
"definition": "Bandera nacional de un país.",
"example": "El pabellón mexicano ondeaba en la cima del edificio." },
{ "pos_tag": "Nombre masculino",
"definition": "Cada una de las divisiones de un hospital, destinadas a albergar pacientes con condiciones similares.",
"example": "Fue ingresado en el pabellón de cirugía." } ],
[...]
"paciente":
[ { "pos_tag": "Adjetivo",
"definition": "Que tiene paciencia.",
"example": "Es muy paciente con sus alumnos." },
{ "pos_tag": "Nombre masculino o femenino",
"definition": "Persona que recibe atención médica.",
"example": "El paciente fue dado de alta después de tres días en el hospital." }
[...]
"padre":
[ { "pos_tag": "Nombre masculino",
"definition": "Varón o macho que ha engendrado o que ejerce funciones propias de la paternidad.",
"example": "Mi padre siempre me ha apoyado en mis decisiones."},
{ "pos_tag": "Nombre masculino",
"definition": "Sacerdote en algunas confesiones cristianas.",
"example": "El padre Juan oficiará la misa de hoy." },
{ "pos_tag": "Nombre masculino",
"definition": "Fundador o inventor de algo.",
"example": "Se considera a Gutenberg el padre de la imprenta moderna."
Institución: Infoling
Correo-e: <infolinginfoling.org>