Seminarios de investigación para doctorandos en Lingüística Aplicada

SEMINARIO 1:
TalkBank-CHILDES, el formato CHAT y los programas CLAN: transcripción, codificación y análisis de muestras de habla espontánea

Fecha: Viernes, 17 de marzo de 2017

Sede: Departamento de Lenguas Aplicadas, Facultad de Lenguas y Educación, Universidad Nebrija.

Destinatarios: Estudiantes del Máster y del Doctorado en Lingüística Aplicada.

Duración: 10 horas certificadas (2h de lecturas previas + 6 horas presenciales + 2 de trabajo individual)

Ponente:

Raquel Fernández

Raquel Fernández Fuertes

Es profesora titular del departamento de filología inglesa de la Universidad de Valladolid y directora del grupo de investigación reconocido UVALAL (University of Valladolid Language Acquisition Lab). Está especializada en adquisición bilingüe tanto de lenguas primarias (bilingüismo simultáneo, bilingüismo de lenguas de herencia) como no primarias (lenguas segundas). Su investigación se centra en cómo la teoría lingüística de corte generativista y la gramática comparada pueden dar cuenta de los fenómenos que surgen en situaciones de lenguas en contacto, como son la influencia interlingüística, la adquisición de categorías léxicas y funcionales, la alternancia de códigos o la interpretación natural. Para llevar a cabo sus estudios, utiliza y compara datos espontáneos y datos experimentales on-line y off-line. Ha sido IP en varios proyectos de investigación financiados en convocatorias regionales, nacionales e internacionales. En 2009, y junto con Juana Liceras, puso a disposición de la comunidad científica el corpus FerFuLice que recoge la producción espontánea de dos niños gemelos bilingües inglés-español a lo largo de un período de casi 6 años (desde el año de edad hasta los 7 años). Se trata del corpus longitudinal más extenso que existe hasta la fecha y que está disponible a través del proyecto CHILDES (Child Language Data Exchange System) (MacWhinney 2000).

Descripción

Este seminario está centrado en los métodos de investigación basados en la transcripción y análisis de datos lingüísticos. Parte de una presentación del proyecto TalkBank y de uno de sus principales componentes, CHILDES (Child Language Data Exchange System) (MacWhinney 2000), para centrarse en cómo se utilizan dos de las herramientas fundamentales para el tratamiento de nuevos datos y que están disponibles en CHILDES: el sistema de transcripción y codificación CHAT (Codes for the Human Analysis of Transcripts) y los programas CLAN (Computerized Language Analysis).
Más concretamente, se hará un estudio de TalkBank-CHILDES a través de las opciones principales que presentan cada uno, tanto desde el punto de vista de los datos que contienen y que son de uso abierto (p. ej. datos espontáneos y experimentales, datos monolingües y bilingües, datos de lenguas primeras y de lenguas segundas), como los diferentes manuales que ayudan a organizar la información y a saber trabajar con las herramientas disponibles (p. ej. manuales sobre la base de datos, manuales sobre los diferentes córpora organizados por lenguas y tipos de datos, manuales sobre la transcripción CHAT y los programas CLAN). Tras esta presentación general, pasaremos a ver de manera práctica y trabajando con datos reales cómo pueden utilizarse CHAT y CLAN para el tratamiento de esos nuevos datos. De esta forma, empezaremos con las nociones básicas de la transcripción en CHAT (p. ej. encabezamientos, líneas principales y líneas dependientes, códigos más frecuentes) y seguidamente nos centraremos en los programas CLAN que permiten realizar una serie de análisis automáticos sobre los datos (p. ej. frecuenta de palabras, búsqueda de contextos, cálculo de la LME, análisis morfosintácticos).

Bibliografía

Lecturas de preparación

Recurso necesario