Novedad bibliográficaInfoling 6.41 (2017)

Título:Lingüística de corpus: génesis y bases metodológicas de los corpus (históricos) para la investigación en lingüística
Autor/a:Torruella Casañas, Joan
Año de publicación:2017
Lugar de edición:Frankfurt
Editorial:Peter Lang
DescripciónLa intención del libro es aportar algunas directrices sobre cómo utilizar las nuevas tecnologías para la confección de corpus y para el estudio de la lengua a partir de su empleo, mostrando métodos científicos que hagan posible llegar más allá en las investigaciones académicas de lo que se ha podido llegar con el método tradicional. A pesar de que en la segunda parte del libro se hace hincapié en los corpus históricos —y los ejemplos que se aportan siempre están referidos a la lengua del pasado—, ello no invalida la obra para que sus reflexiones y propuestas sean útiles para los corpus en general, puesto que, si bien los corpus históricos tienen unas características propias, también contemplan toda la casuística de los corpus en general.
Para ello, la primera parte del libro trata sobre qué es la lingüística de corpus y qué es lo que esta exige y puede ofrecer a los lingüistas y filólogos para el estudio de la lengua. A continuación, se expone qué son los corpus y en qué se diferencian de otros tipos de recopilaciones textuales. Por último, se da cuenta de los principales tipos de corpus que existen según diversos parámetros clasificatorios y se defiende la utilidad de acompañar cualquier corpus textual con un subcorpus de lectura.

En la segunda parte, se abordan ya cuestiones más concretas y prácticas referidas a cómo se debe diseñar y construir un corpus para que los resultados de su explotación sean el máximo de fiables y representativos. Con esta intención, en primer lugar, se expone cómo han de estructurarse los corpus y, por tanto, cuáles han de ser los ejes en que se deben clasificar los textos que en él se incluyan. Después se trata de la composición textual de estos —la selección de obras y de documentos— y, por último, se considera la necesidad de preparar los textos para que puedan ser tratados informáticamente y sean lo más rentables posible cuando se interroguen a través de los programas de gestión de corpus.

En la tercera parte, ya no se argumenta sobre el corpus en sí sino sobre cómo trabajar con él a partir de métodos empíricos, siguiendo las premisas de la investigación científica y de la utilización de la estadística que ello comporta, ya que, en realidad, la lingüística de corpus es una disciplina cuantitativa, basada en los números, las frecuencias y su distribución en el corpus. Con ello se evita que una mala utilización del corpus derivada de no tener en cuenta las condiciones de la experimentación científica ofrezca resultados a las consultas poco fiables, lleve a falsas predicciones o, en el mejor de los casos, a la obtención de resultados anecdóticos.
Temática:Lingüística de corpus, Lingüística histórica
ÍndicePrólogo (Johannes Kabatek)

Presentación

Parte I. Los corpus y la lingüística de corpus

1. Lingüística de corpus
2. Corpus textuales
3. Parámetros clasificatorios de los corpus
3.1. Modalidad
3.2. Temática
3.3. Época
3.4. Temporalidad
3.5. Magnitud
3.6. Evolución
3.7. Distribución
3.8. Número de ediciones
3.9. Número de lenguas
3.10. Tipo de edición
3.11. Muestras
3.12. Marcaje
4. Corpus de lectura

Parte II. Diseño de la estructura del corpus y post-edición de los textos

5. Fases en la construcción de un corpus

6. Estructura y ejes principales
6.1. Eje temporal
6.1.1. Límites
6.1.2. Periodización
6.1.3. El eje diacrónico en los corpus históricos informatizados iberorrománicos
6.2. Eje diatópico
6.2.1. Organización
6.2.2. El eje diatópico en los corpus históricos informatizados iberorrománicos
6.3. Eje tipológico
6.3.1. Clasificaciones tipológicas para textos antiguos
6.3.1.1. Propuestas de clasificación
6.3.1.2. Postulados teóricos
6.3.2. Propuesta de indicadores para una clasificación tipológica
6.3.3. Nivel de formalidad y grado de oralidad
6.3.3.1. Nivel de formalidad
6.3.3.2. Grado de oralidad
6.3.4. El eje tipológico en los corpus históricos informatizados iberorrománicos
6.4. Traducciones

7. Composición del corpus
7.1. Representatividad y equilibrio
7.1.1. Representatividad cualitativa
7.1.2. Representatividad cuantitativa
7.1.2.1. Equilibrio externo
7.1.2.2. Equilibrio interno
7.1.3. Cantidad de textos que deben configurar un corpus
7.1.4. Tamaño de las muestras
7.2. Corpus provisional versus corpus definitivo
7.3. Selección de las obras
7.4. Selección de los documentos
7.5. Filiación de los documentos (Metadatos)
7.5.1. Título
7.5.2. Autor
7.5.3. Fecha
7.5.4. Tipo textual
7.5.5. Dialecto
7.6. Principios básicos en la composición de un corpus

8. Preparación de los textos
8.1. Preparación de los ficheros
8.1.1. Codificación de caracteres
8.1.2. Formato de los ficheros
8.1.3. Nombre de los ficheros
8.2. Edición textual
8.2.1. Tipo de edición
8.2.1.1. Edición facsímil
8.2.1.2. Edición diplomática o paleográfica
8.2.1.3. Edición diplomático-interpretativa
8.2.1.4. Edición normalizada
8.2.1.5. Edición crítica
8.2.1.6. Multiedición
8.2.2. Normas de edición
8.2.2.1. Unidades léxicas
8.2.2.2. Estructuras oracionales
8.3. Edición filológica digital
8.3.1. Marcaje de las obras
8.3.2. SGML
8.3.3. XML
8.3.4. Estructura de las etiquetas
8.3.5. Definición del tipo de documento (DTD)
8.3.6. TEI
8.3.6.1. La estructura de un documento TEI
8.3.6.2. Cabecera (Header)
8.3.6.3. Cuerpo (Body)
8.3.6.4. La edición filológica digital en el sistema TEI
8.4. Edición lingüística
8.4.1. Lematización
8.4.1.1. Lexicón
8.4.1.2. Lematización y categorización
8.4.1.3. Análisis morfológico
8.4.1.4. Desambiguación
8.4.2. Estandarización de las categorías (EAGLES)

Parte III. Bases científicas de la investigación a partir de corpus

9. Elementos base en la investigación científica

10. Método comparativo

11. Bases estadísticas en la investigación con corpus
11.1. Análisis
11.2. Las variables
11.3. El muestreo

12. El valor de la estadística

13. Epílogo

Referencias bibliográficas
ColecciónStudien zur romanischen Sprachwissenschaft und interkulturellen Kommunikation, 117
Formato:Hardback
Págs.:279
ISBN-13:9783631717189
Precio: 46,70 EUR      USD 46.70
Remitente:Joan Torruella Casañas
Institución: Institució Catalana de Recerca i Estudis Avançats (ICREA-UAB)
Correo-e: <joan.torruellauab.cat>
Fecha de publicación en Infoling:11 de junio de 2017

Novedades bibliográficas: desde 2010