Tesis doctoral en la red
Esta tesis aborda uno de los problemas textuales y de autoría más fascinantes de la poesía española, el que afecta a los textos poéticos de Fernando de Herrera (1534- 1597), y que se centra en el estudio de la plena autoría de la edición póstuma de su poesía a cargo de Francisco Pacheco, Versos (Sevilla, 1619). A través de los últimos avances en el campo de las Humanidades Digitales, y, especialmente, de la Estilística Digital y de la Estilometría, se presentan nuevos análisis obtenidos aplicando técnicas computacionales al corpus de autoría segura y a los poemas de la edición póstuma, previamente digitalizados para esta tesis a partir de la edición más autorizada.
Los resultados apuntan con gran consistencia a la autoría de mano del Divino de las variantes y de los poemas nuevos publicados en 1619, al mismo tiempo que recogen similitudes y diferencias estilísticas entre estos y el resto de la poesía de Herrera, mostrando que las Humanidades Digitales y la Estilometría pueden realizar nuevas e importantes aportaciones a la investigación en literatura española, y arrojando nueva luz sobre una polémica que no sólo afecta a la obra de uno de los poetas áureos más importantes, sino a la propia transición poética del Renacimiento al Barroco.
TOMO I
1. Introducción
2. Humanidades Digitales y nuevas tecnologías para el estudio de la literatura española
2.1. El panorama internacional de las Humanidades Digitales
2.1.1. Breve repaso histórico
2.1.2. ¿Qué son las Humanidades Digitales?
2.2. Las Humanidades Digitales en el ámbito hispánico
2.2.1. Los orígenes (1970-2011)
2.2.2. Hacia la institucionalización (2011-2015)
2.2.3. Consolidación y nuevos retos (2015-hoy)
2.3. La Estilometría
2.3.1. La huella autorial (‘a stylistic fingerprint’)
2.3.2. Repaso histórico: orígenes, fundadores y principales hitos
2.3.3. Aplicaciones de la Estilometría a la literatura española
3. Los textos poéticos de Fernando de Herrera
3.1. La transmisión de los textos poéticos de Herrera
3.1.1. Conjuntos textuales
3.1.1.1. Manuscritos
3.1.1.2. Impresos
3.1.2. Poemas sueltos
3.1.2.1. En obras propias
3.1.2.2. En obras ajenas
3.1.2.2.1. Manuscritos
3.1.2.2.2. Impresos
3.1.2.3. Poemas sueltos en cancioneros de poesías varias
3.1.2.3.1. Manuscritos
3.1.2.3.2. Impresos
3.1.2.4. Un caso singular: dos sonetos autógrafos
3.2. El drama textual herreriano
3.2.1. Textos preliminares de P
3.2.2. De Quevedo a Coster
3.2.3. 1948-1975
3.2.4. 1975-hoy
3.2.5. Conclusión provisional
4. Digitalización de la obra poética de Herrera y Pacheco
4.1. Digitalización de textos literarios hispánicos
4.2. Digitalización del corpus poético herreriano
4.2.1. El sistema gráfico de la escritura herreriana
4.2.2. Proceso de digitalización, revisión y corrección del corpus original
4.2.2.1. Creación del corpus en formato DOC
4.2.2.2. Creación del corpus en formato de texto plano
4.2.3. Creación del corpus paralelo modernizado
4.2.3.1. Planteamiento
4.2.3.2. Normas de modernización
4.2.3.3. Proceso de modernización
4.2.3.4. Comparación del texto final con la ortografía de ADSO
4.2.3.5. Texto final
4.2.3.6. Copias paralelas del texto final adaptadas a FreeLing y stylo
4.3. Digitalización del corpus de poemas de Pacheco
5. Creación de Litcon. Literary Concordances
5.1. Herramientas y software de análisis textual: estado de la cuestión
5.1.1. Herramientas procedentes de la Lingüística de corpus
5.1.2. Herramientas procedentes de las comunidades de Humanidades Digitales
5.1.3. Herramientas procedentes de la Textometría francesa
5.1.4. Herramientas para Estilometría y atribución de autoría
5.1.5. Conclusión provisional
5.2. Litcon. Literary Concordances
5.2.1. Presentación y motivación
5.2.2. Herramientas y funcionalidades
5.2.2.1. Visor
5.2.2.2. Concordancias
5.2.2.3. Listado de concordancias
5.2.2.4. Wordlist (lista de palabras)
5.2.2.5. Contraste
5.2.2.6. Palabras clave (keywords)
5.2.2.7. Etiquetado (morfosintáctico)
5.2.2.8. Etiquetado (morfosintáctico) II
5.2.2.9. POS (Part-of-Speech)
5.2.2.10. POS (Part-of-Speech) II
5.2.2.11. POS (Part-of-Speech) III
5.2.2.12. Corpus
5.2.3. Conclusión
6. Estudios con métodos de corpus y computacionales
6.1. La Estilística de corpus y la aplicación de los estudios de corpus a textos literarios
6.2. Estudios con corpus no etiquetado
6.2.1. Densidad léxica
6.2.2. Análisis léxicos contrastivos
6.2.2.1. Contraste de palabras tipo
6.2.2.2. Palabras clave
6.2.3. Variantes ortográficas: el caso de los signos diacríticos
6.3. Estudios con corpus etiquetado morfosintácticamente
6.3.1. Motivación
6.3.2. Preparación del corpus etiquetado morfosintácticamente
6.3.2.1. Programas de PLN
6.3.2.2. Etiquetado morfosintáctico con FreeLing
6.3.3. Análisis realizados
6.3.3.1. Categorías morfológicas
6.3.3.2. Patrones morfosintácticos
6.3.3.2.1. Bigramas
6.3.3.2.2. Trigramas
6.4. Conclusión provisional
7. Análisis con métodos estilométricos
7.1. Métodos supervisados de atribución de autoría: Cross-validation atendiendo al tamaño de las muestras del corpus
7.2. Evaluación de parámetros estilométricos
7.2.1. Parámetros testados
7.2.2. Análisis y resultados
7.3. Análisis de grupos y árbol de consenso con otros poetas del Siglo de Oro
7.3.1. Análisis de grupos
7.3.2. Árboles de consenso
7.3.3. Análisis con muestras aleatorias
7.4. Principal Component Analysis (PCA)
7.4.1. Aplicación sobre Herrera, Pacheco, Juan de Arguijo y P2
7.4.2. Aplicación sobre Herrera, Pacheco, Góngora y P2
7.4.3. Análisis con muestras aleatorias
7.5. Rolling Classify
7.5.1. A modo de prueba: Rolling Classify sobre textos en español
7.5.2. Primeros análisis sobre P y P2
7.5.2.1. Análisis con textos completos
7.5.2.2. Análisis con corpus reducido de forma aleatoria
7.5.3. Análisis con autores de control
7.5.3.1. Análisis con textos completos
7.5.3.2. Análisis con corpus reducido de forma aleatoria
7.6. Oppose con Zeta
7.7. Verificación de autoría: impostores
7.7.1. Resultados con la Delta de Eder
7.7.2. Resultados con Cosine Delta
7.7.3. Resultados con la Delta de Burrows
7.8. Un mapa de la evolución de la poesía áurea: análisis de redes
7.8.1. Introducción
7.8.1.1. Conformación del corpus
7.8.1.2. Proceso de generación de la red
7.8.2. Resultados
7.8.2.1. Exploración de una posible señal cronológica
7.8.2.2. Evolución poética y modularidad
7.8.2.3. Evolución estilística frente a cambio lingüístico
8. Final conclusions
9. Bibliografía
Apéndice: poemas en B, H y P
TOMO II
Anexo I: Digitalización de la obra poética de Fernando de Herrera editada por Blecua en DOC y PDF
Anexo II: Corpus de la poesía herreriana con su ortografía original en texto plano Unicode UTF-8
Anexo III: Corpus de la poesía de Herrera y de Pacheco modernizado en Unicode UTF-8
Anexo IV: Corpus de la poesía de Herrera y de Pacheco etiquetado morfosintácticamente
Anexo V: Scripts en R
Anexo VI: Palabras de H que no aparecen en P desglosadas. Lista de lemas de H que no pasan a P desglosados
Anexo VII: Bigramas morfosintácticos en P2, Herrera y Pacheco
Anexo VIII: Trigramas morfosintácticos en P2, Herrera y Pacheco
Anexo IX: Descripción del corpus de Siglo de Oro utilizado
Anexo X: Resultados completos de la atribución de autoría del capítulo 7.1
<infolinginfoling.org>