Tesis doctoral en la redInfoling 2.8 (2019)

Autor/ra:Rodríguez-Tapia, Sergio
Fecha de lectura o defensa:21 de diciembre de 2018
Título de la tesis:El grado de especialización textual: caracterización a partir de la percepción sociocognitiva de la terminología y las relaciones discursivas
Director/a de la tesis:Alfonso Zamorano Aguilar
Universidad:Universidad de Córdoba
Departamento:Departamento de Ciencias del Lenguaje
País:España
Descripción de la tesisEste trabajo es un estudio empírico descriptivo correlacional, que tiene por objetivo principal caracterizar el grado de especialización textual, particularmente, su léxico y relación emisor-destinatario, a partir de un corpus de textos analizados por cuatro grupos de informantes, usando como base la teoría sociocognitiva de la percepción y el aprendizaje automático.

Esta tesis doctoral viene motivada por la escasez de estudios que pretenden estudiar el grado de especialización textual, en concreto, sus condicionantes y límites y, especialmente, el grado intermedio: el texto semiespecializado. Las hipótesis esbozadas están relacionadas con:
(1) la posibilidad de encontrar pruebas lingüísticas que se ajusten a cada uno de los grados de especialización;
(2) la relación de similitud entre texto semiespecializado y texto no especializado;
(3) la relevancia del tema o el tipo textual en la discriminación del grado de especialización;
(4) la similitud perceptiva de los usuarios a la hora de distinguir el grado; y
(5) la relevancia de la relación emisor-destinatario y la terminología como factores de distinción del grado de especialización.

En este trabajo tomamos como marco de estudio la teoría de la comunicación para estudiar elementos diversos como son el texto, la tipología textual, el campo de la terminología, el término como objeto de estudio, la noción de valor especializado, el conocimiento especializado, los procedimientos de reformulación y las características vinculadas hasta ahora al discurso especializado, así como las propuestas de clasificación binaria y continuum. Nuestro material de trabajo está compuesto por un corpus que cuenta con 315 textos y medio millón de palabras. Su representatividad cualitativa para estudiar el grado de especialización textual reside en que parte de tres temas diferentes, reconocidos socialmente, como son el derecho, la informática y la medicina. Posteriormente, hemos seleccionado siete tipos textuales posibles en los tres temas :
- el artículo en revista científica,
- la entrada de blog, la revista o web de divulgación especializada,
- la noticia,
- la entrevista,
- la participación en foro y
- la tesis doctoral.

De esta combinación de tipo textual y tema se han recopilado 15 textos. En dicho corpus se estudian diversas variables, tanto cuantitativas como cualitativas. Entre las variables cualitativas encontramos las variables nominales: el tipo de texto y el tema del texto. Entre las variables cualitativas ordinales, encontramos el emisor, el destinatario, y la clase de texto. Entre las variables cuantitativas, se analizan el número de formas léxicas, la ratio estandarizada entre tipos de formas léxicas y el total de formas léxicas, el índice de densidad terminológica, el número de procedimientos de reformulación y el índice de reformulación.

Parte de estas variables son proporcionadas por el investigador, mientras que otra parte es proporcionada por cuatro grupos de informantes, estudiante, usuario medio, traductor e investigador, lo que arroja una base de datos con 1.260 patrones, que es analizada mediante la correlación manual de dos o más variables y mediante aprendizaje automático. El análisis mediante técnicas de aprendizaje automático emplea los algoritmos de red bayesiana, de regresión logística, el árbol de decisión J48 y el algoritmo de agrupamiento no supervisado k-means mediante el software WEKA.

Las principales conclusiones sugieren la relevancia de las formas léxicas semicrípticas y crípticas en la discriminación de los polos opuestos del grado de especialización, así como el destinatario como factor regulador de la configuración discursiva de los textos cuando se atiende al grado. También se han identificado las similitudes del texto semiespecializado con los otros dos grados, principalmente con el texto divulgativo, desde un punto de vista formal, y con el texto especializado, desde un punto de vista semántico.
Área temática:Ciencia cognitiva, Lingüística de corpus, Pragmática, Semántica, Terminología, Tipología
Tesis completa en el Archivo de Infoling: http://www.infoling.org/repository/ID/261
ÍndiceI. Preliminares y justificación

1. Supuestos de partida y planteamiento del problema

2. Objeto

3. Hipótesis

4. Objetivos

5. Estructura de la tesis doctoral

II. Fundamentos teóricos

1. La lingüística aplicada
1.1. Definición y objetivos de la lingüística aplicada
1.2. Objetos de trabajo y problemas
1.3. Lingüística (teórica), lingüística aplicada y aplicaciones de la lingüística
1.4. Recapitulación

2. La comunicación como objeto y problema
2.1. Definiciones, propuestas y elementos definitorios de la comunicación
2.2. La comunicación especializada
2.3. Relación discursiva entre los interlocutores
2.4. Competencia cognitivo-comunicativa de los interlocutores
2.5. La función lingüística

3. El texto
3.1. Definiciones y propuestas
3.2. Los tipos textuales
3.2.1. Utilidad teórica de los tipos textuales
3.3. Conceptos en torno al texto: clase, tipo, género y secuencia
3.4. Las tipologías textuales
3.4.1. Clasificación de las tipologías textuales (I): problemas teóricos
3.4.1. Clasificación de las tipologías textuales (II): criterios de tipologización

4. La terminología como campo científico
4.1. Teorías de corte normativo: la teoría general de la terminología (TGT)
4.2. Teorías de corte comunicativo
4.2.1. La socioterminología
4.2.2. La teoría comunicativa de la terminología (TCT)
4.3. Teorías de corte cognitivo
4.3.1. La teoría sociocognitiva de la terminología (TSCT)
4.3.2. La terminología basada en marcos (TbM)

5. Fundamentos para analizar el término como objeto de estudio
5.1. Punto de partida
5.2. La teoría de puertas, el principio de poliedricidad y el principio de variación
5.3. Fundamentos discursivistas para el análisis del léxico especializado
5.4. Perspectivas de estudio del término
5.5. Modelos de relación entre discurso común y discurso especializado
5.5.1. El modelo de Baldinger (1952)
5.5.2. El modelo de Reindhardt (1966)
5.5.3. El modelo de Heller (1970)
5.5.4. El modelo de Hoffmann (1985)
5.6. Definición y caracterización del término
5.7. Criterios para diferenciar término y unidad léxica no especializada
5.8. Variación especializada: diferencias entre situaciones de uso del léxico

6. El valor especializado (I)
6.1. Nuevas aproximaciones: valor léxico y relevancia de la situación discursiva
6.2. Dificultades para la identificación del término: denominación, comprensión y coste de procesamiento
6.3. Denominaciones de la terminología en torno al valor especializado
6.4. Fronteras del conocimiento especializado
6.5. Aproximación a su definición
6.6. Criterios para la distinción teórica del conocimiento especializado

7. Relaciones denominación-concepto-situación discursiva
7.1. Fundamentación en el principio de variación
7.2. La terminologización
7.3. La transterminologización
7.4. La banalización
7.4.1. La banalización efímera
7.4.2. La banalización perenne o crónica
7.5. La variación denominativa y conceptual
7.5.1. La variación conceptual a través de la polisemia parcial interdominio
7.5.2. La variación denominativa a través de la sinonimia intradominio
7.6. La desterminologización
7.7. Esquema de relaciones
7.8. Los términos crípticos y délficos

8. El valor especializado (II): conclusión
8.1. Criterios para determinar el valor especializado
8.2. El principio de activación del valor especializado en el discurso común

9. El texto especializado y el grado de especialización
9.1. Primera definición y aproximaciones al texto especializado
9.2. Características del texto especializado
9.2.1. Características pragmáticas
9.2.2. Características cognitivas
9.2.3. Características lingüísticas
9.2.4. Características superestructurales
9.3. Principio de variación y eje vertical
9.4. Clasificación binaria y continuum
9.5. Modelos y métodos de clasificación del grado de especialización textual

10. Los procedimientos de reformulación formal en terminología
10.1. La reformulación lingüística
10.1.1. La reformulación parafrástica
10.1.2. La reformulación no parafrástica
10.1.3. Los constituyentes de la reformulación
10.2. La reformulación en el texto especializado
10.3. Los procedimientos de reformulación formal en el texto especializado
10.4. Nuestra postura teórica y metodológica

III. Fundamentos metodológicos

1. La lingüística de corpus como instrumento de trabajo
1.1. Objeto de la lingüística de corpus
1.2. Fundamentos teóricos de la lingüística de corpus

2. La percepción sociocognitiva del término
2.1. Fundamentos de variación lingüística
2.2. La cognición lingüística
2.3. Variación no funcional vs. variación funcional y variación intraindividual vs. variación extraindividual
2.4. Conceptos relacionados: captación, atención, fijación, subjetividad, valoración y actitud
2.5. Fases y funcionamiento de la percepción
2.6. Tipos de percepciones y selección de información
2.7. Implicaciones teóricas y metodológicas de la percepción en nuestro estudio

3. Corpus para analizar el grado de especialización
3.1. Criterios de confección del corpus
3.2. Disciplinas y campos temáticos
3.3. Tipos textuales
3.4. Representatividad, selección de muestras y problemas de compilación
3.5. Representatividad cualitativa
3.6. Tipo de corpus compilado
3.7. Representatividad cuantitativa: características estadísticas

4. Tipo de estudio y método

5. Variables de estudio
5.1. Diversidad léxica: la relación tipos de formas léxicas y formas léxicas
5.2. Índice de densidad terminológica: cálculo y problemas
5.3. Índice de reformulación: cálculo y problemas
5.4. Relación discursiva emisor-destinatario
5.5. Las clases de los textos del corpus

6. Grupos de informantes
6.1. Criterios de selección de los grupos de informantes
6.1.1. Género
6.1.2. Edad
6.1.3. Clase: nivel educativo y profesión
6.2. Materiales de trabajo
6.3. Grupo 1: estudiantes
6.4. Grupo 2: usuario medio de la lengua
6.5. Grupo 3: traductor profesional
6.6. Grupo 4: investigador
6.7. Datos que proporcionan los grupos de informantes
6.7.1. Tipos de términos y cómputo
6.7.2. Perfil de emisor y destinatario
6.7.3. Clase textual
6.7.4. Resumen
6.8. Datos que proporciona el investigador

7. Aplicación de la inteligencia artificial
7.1. El aprendizaje automático
7.2. Red bayesiana
7.3. Regresión logística
7.4. Árbol de decisión j48
7.5. Agrupamiento mediante clasificación no supervisada: simple k-means

IV. Análisis y resultados
1. Análisis correlacional descriptivo global
1.1. Análisis del tema
1.1.1. Relación con la clase
1.1.2. Relación con el emisor y el subemisor
1.1.3. Relación con el destinatario y el subdestinatario
1.1.4. Relación subemisor-subdestinatario
1.1.5. Relación subemisor-clase
1.1.6. Relación subdestinatario-clase
1.1.7. Relación con las formas léxicas especializadas
1.1.8. Relación con los procedimientos de reformulación formal
1.1.9. Conclusiones parciales sobre el tema
1.2. Análisis de la clase
1.2.1. Relación con el tipo de texto
1.2.2. Relación con el emisor y el subemisor
1.2.3. Relación con el destinatario y el subdestinatario
1.2.4. Relación subemisor-subdestinatario
1.2.5. Relación con las formas léxicas especializadas
1.2.6. Relación con los procedimientos de reformulación formal
1.2.7. Conclusiones parciales sobre la clase
1.3. Análisis del tipo de texto
1.3.1. Relación con el emisor y el subemisor
1.3.2. Relación con el destinatario y el subdestinatario
1.3.3. Relación subemisor-subdestinatario
1.3.4. Relación con las formas léxicas especializadas
1.3.5. Relación con los procedimientos de reformulación formal
1.3.6. Conclusiones parciales sobre el tipo de texto
1.4. Análisis del índice de densidad terminológica
1.4.1. Relación con el tema
1.4.2. Relación con la clase
1.4.3. Relación con el tipo de texto
1.4.4. Relación con el emisor y el subemisor
1.4.5. Relación con el destinatario y el subdestinatario
1.4.6. Relación subemisor-clase-IDT
1.4.7. Relación subdestinatario-clase-IDT
1.4.8. Relación subemisor-subdestinatario-IDT
1.4.9. Conclusiones parciales sobre la densidad terminológica
1.5. Análisis del índice de reformulación
1.5.1. Relación con el tema
1.5.2. Relación con la clase
1.5.3. Relación con el tipo de texto
1.5.4. Relación con el emisor y el subemisor
1.5.5. Relación con el destinatario y el subdestinatario
1.5.6. Relación subemisor-clase-IR
1.5.7. Relación subdestinatario-clase-IR
1.5.8. Relación subemisor-subdestinatario-IR
1.5.9. Relación tipo de texto-clase-IDT-IR
1.5.10. Conclusiones parciales sobre la reformulación
1.6. Análisis de la variedad léxica
1.6.1. Según tema e IDT
1.6.2. Según tema e IR
1.6.3. Según clase e IDT
1.6.4. Según clase e IR
1.6.5. Según tipo de texto e IDT
1.6.6. Según tipo de texto e IR
1.6.7. Conclusiones parciales sobre la variedad léxica
1.7. Resumen de análisis correlacional descriptivo global

2. Análisis correlacional descriptivo según los informantes
2.1. Análisis de la clase
2.1.1. Vinculación con el tipo de texto
2.2. Análisis del emisor y del subemisor
2.2.1. Vinculación con el tipo de texto
2.3. Análisis del destinatario y del subdestinatario
2.3.1. Vinculación con el tipo de texto
2.4. Análisis de las formas léxicas especializadas
2.4.1. Vinculación con el tipo de texto
2.5. Análisis del índice de densidad terminológica
2.5.1. Vinculación con el tema
2.5.2. Vinculación con el tipo de texto
2.5.3. Vinculación con la clase
2.5.4. Vinculación con el emisor y el subemisor
2.5.5. Vinculación con el destinatario y subdestinatario
2.6. Conclusiones parciales sobre los informantes
2.7. Resumen de análisis correlacional descriptivo según los informantes

3. Análisis correlacional a partir de aprendizaje automático
3.1. Probabilidades de clasificación en clases según variables
3.2. Relevancia de los atributos
3.3. Árboles de decisión
3.4. Grupos identificados según el aprendizaje automático

V. Summarization and conclusions
1. Summarization
2. Conclusions
3. Contribution of this thesis to theoretical and applied linguistics
4. Future lines of research

VI. Referencias bibliográficas
1. Referencias bibliográficas

VII. Índice de ilustraciones, gráficos y tablas
1. Índice de ilustraciones, gráficos y tablas
Número de págs.:548
Remitente:Sergio Rodríguez-Tapia
Institución: Universidad de Córdoba
Correo-e: <sergio.rodriguezuco.es>
Fecha de publicación en Infoling:5 de febrero de 2019

Tesis doctorales: desde 2010