La representación fonética suprasegmental de corpus orales

Bookmark and Share


Problemas y requisitos de los sistemas de representación de los elementos suprasegmentales
La transcripción de los elementos suprasegmentales mediante el AFI
Sistemas de transcripción prosódica para el intercambio electrónico
Las propuestas de SAM (Speech Assessment Methodologies)
El sistema de representación del IPO (Center for Research on User Interaction, Eindhoven)
INTSINT (International Transcription System for Intonation)
ToBI (Tone and Break Index)

 Representación fonética suprasegmental de corpus orales


Problemas y requisitos de los sistemas de representación de los elementos suprasegmentales

Los elementos suprasegmentales

Los elementos suprasegmentales

Problemas en la representación de los elementos suprasegmentales

Necesidad de abstracción para determinar: Las categorías deben representarse mediante un sistema de notación.

Requisitos de un sistema de representación de los elementos suprasegmentales:

La representación de los elementos suprasegmentales puede realizarse a distintos niveles, según el grado de abstracción o la orientación teórica del investigador.

Independientemente del sistema, pueden definirse tres niveles de representación en lo que se refiere a la entonación:

arrow_up_gray

La transcripción de los elementos suprasegmentales mediante el Alfabeto Fonético Internacional (AFI/IPA, International Phonetic Alphabet)

El Alfabeto Fonético Internacional (AFI) ofrece un conjunto de símbolos para la representación de los elementos suprasegmentales.

Grupo de trabajo sobre categorías suprasegmentales (Kiel, 1989) surgido de la necesidad de representar las categorías suprasegmentales de un modo más adecuado, especialmente en lo que se refiere a la entonación.

El conjunto actual de símbolos del AFI (Alfabeto Fonético Internacional) para los elementos suprasegmentales permite transcribir el tono, la duración y el acento.

IPA

IPA

IPA, International Phonetics Association
Cuadro de símbolos del Alfabeto Fonético Internacional

arrow_up_gray

Sistemas de transcripción prosódica para el intercambio electrónico

Las propuestas de SAM

ESPRIT 1541 SAM (Speech Assessment Methods) (1987-1989)

Desarrollo de sistemas de transcripción prosódica compatibles con las necesidades de anotación de bases de datos en soporte electrónico: PROSPA, SAMSINT, SAMPROSA.

PROSPA

Concebido por M. Selting y D. Gibbon para el análisis de la conversación y del discurso.

Basado en criterios auditivos.

Recoge únicamente los elementos necesarios para sus objetivos.

SAMSINT ( SAM System for Intonation Transcription)

Transcripción de contornos melódicos en el interior de unidades entonativas.

Basado en INTSINT, con algunas modificaciones adicionales.

SAMPROSA ( SAM Prosodic Alphabet)

Propuesto inicialmente por D. Gibbon y desarrollado por J. Wells.

Conjunto de caracteres correspondientes a códigos ASCII (American Standard Code for Information Interchange).

Permite la transcripción de:

Presenta rasgos característicos de la tradición británica de análisis de la entonación como la codificación de tonos nucleares, pero es adecuado para la transcripción prosódica de diversas lenguas.

SAMPROSA
Cuadro de símbolos de SAMPROSA

El sistema de representación del IPO (Center for Research on User-System Interaction, Eindhoven)

Teoría sobre la entonación basada en el modelado de contornos entonativos en forma de representaciones estilizadas perceptivamente equivalentes al contorno original.

Formalización de un sistema de representación de la curva melódica.

El sistema permite una representación de la curva melódica adecuada a la transcripción prosódica.

IPO

Curva estilizada y anotada según el sistema de Garrido (1996, 2001) correspondiente a la oración 'Una vez en el interior, los agentes encontraron a tres de los niños', pronunciada por un locutor femenino.

Garrido, J. M. (1996). Modelling Spanish intonation for text-to-speech applications. PhD Thesis, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona.Consultado en http://www.tdx.cat/TDX-0428108-155145

Garrido, J. M. (2001). La estructura de las curvas melódicas del español: Propuesta de modelización. Lingüística Española Actual, 23(2), 173-210.

INTSINT (International Transcription System for Intonation)

Características generales de INTSINT

El objetivo de INTSINT ( International Transcription System for Intonation) es proporcionar un sistema para la comparación interlingüística de sistemas prosódicos.

Desarrollado por D. Hirst en el marco de un proyecto de análisis automático de la entonación.

Baqué, L., y Estruch, M. (2003). Modelo de Aix-en-Provence. En P. Prieto (Ed.), Teorías de la entonación. (pp. 123-53). Barcelona: Ariel. Consultado en http://sites.google.com/site/lorrainebaqueuab/publis/ModeloAix-en-ProvenceV3.pdf

Hirst, D., Di Cristo, A., y Espesser, R. (2000). Levels of representation and levels of analysis for the description of intonation systems. En M. Horne (Ed.), Prosody: Theory and experiment. Studies presented to Gösta Bruce. (pp. 51-88). Dordrecht: Kluwer. Consultado en http://aune.lpl.univ-aix.fr/~hirst/articles/2000%20Hirst&al.pdf

Hirst, D. (2007). A Praat plugin for MOMEL and INTSINT with improved algorithms for modelling and coding intonation. En ICPhS 2007. Proceedings of the 16th international congress of phonetic sciences. (pp. 1233-6). Saarbrücken, Germany, 6-10 August, 2007. Consultado en http://www.icphs2007.de/conference/Papers/1443/1443.pdf

Basado en la estilización de la curva melódica realizada a partir de una interpolación entre puntos en los que se produce un cambio significativo en el valor de la frecuencia fundamental (puntos de inflexión o target points).

Los puntos de inflexión - combinación de un valor temporal y un valor frecuencial - pueden codificarse automáticamente mediante los símbolos de INTSINT.

Se trata de un sistema para la representación simbólica -transcripción- de la entonación.

La transcripción mediante INTSINT

La transcripción requiere un proceso en tres etapas:

Cálculo de la curva de F0

Momel

Estilización de la curva de F0

Detección en la curva de F0 de un conjunto de puntos de inflexión que conservan la información macroprosódica original. La curva estilizada debe ser perceptivamente equivalente a la original.

MOMEL

MOMEL

Oscilograma (ventana superior) y curva melódica y estilizada (ventana inferior) correspondientes al enunciado "Una vez en el interior, los agentes encontraron a tres de los niños", pronunciado por un locutor femenino.

Codificación

Anotación de la curva de F0 mediante los símbolos de INTSINT.

Representación mediante un alfabeto de símbolos -etiquetas- que convierte la curva estilizada en una secuencia de categorías discretas que pueden utilizarse para regenerar la curva original.

INTSINT

Proceso implementado inicialmente en el programa MES (Motif Environement for Speech) constituido por dos módulos:

Existe también la posibilidad de emplear MOMEL en conjunción con el programa Phonédit o, actualmente, con el programa Praat usando scripts

D. Hirst, Momel-Intsint, Laboratoire Parole et Langage, Aix-en-Provence
Disponible en la sección "Files" en los grupos de Yahoo Praat Users Group [última versión] y Momel-Intsint (es necesario ser miembro de los grupos para acceder a los ficheros; el registro es gratuito).

Hirst, D. (2007). A Praat plugin for MOMEL and INTSINT with improved algorithms for modelling and coding intonation. En ICPhS 2007. Proceedings of the 16th international congress of phonetic sciences. (pp. 1233-6). Saarbrücken, Germany, 6-10 August, 2007. Consultado en http://www.icphs2007.de/conference/Papers/1443/1443.pdf

Momel-Intsint, C. Auran, Laboratoire "Savoirs, Textes, Langage", Université Charles de Gaulle - Lille3

INTSINT

Momel-Intsint, C. Auran, Laboratoire "Savoirs, Textes, Langage", Université Charles de Gaulle - Lille3

Representación de la melodía en INTSINT

Baqué, L., y Estruch, M. (2003). Modelo de Aix-en-Provence. En P. Prieto (Ed.), Teorías de la entonación. (pp. 123-53). Barcelona: Ariel. Consultado en http://sites.google.com/site/lorrainebaqueuab/publis/ModeloAix-en-ProvenceV3.pdf

Representación fonológica del contorno melódico, simbolizando los diferentes niveles tonales de la curva original.

INTSINT

INTSINT

Oscilograma (ventana superior), curva melódica original, curva estilizada (sistema MOMEL) y anotación INTSINT (ventana inferior) correspondientes al enunciado "Una vez en el interior, los agentes encontraron a tres de los niños", pronunciado por un locutor femenino.

Representación de secuencias tonales:

Tonos absolutos

Perspectiva global en función del rango de variación tonal del hablante.

T (Top)altura tonal máxima del locutor
M (Mid)etiqueta inicial correspondiente a un valor medio del locutor
B (Bottom)altura tonal mínima del locutor

Tonos relativos

Punto de vista local en relación con la altura tonal de puntos de inflexión anteriores y posteriores.

Tonos relativos iterativos
Puntos intermedios en secuencias ascendentes o descendentes.

U (Up)punto en una secuencia ascendente
D (Down)punto en una secuencia descendente

Tonos relativos no iterativos
Puntos de inflexión que no corresponden a tonos absolutos ni a puntos en secuencias.

H (Higher)punto más alto que los dos puntos adyacentes
L (Lower)punto más bajo que los dos puntos adyacentes
S (Same)punto igual que su precedente

Aplicación de INTSINT

Modelado prosódico multilingüe.

Anotación prosódica de parte del corpus EUROM en francés, inglés, alemán, suceo y español en el proyecto LRE 62-050 MULTEXT (Multilingual Text Tools and Corpora).

Campione, E., y Véronis, J. (1998). A multilingual prosodic database. En ICSLP 1998. Proceedings of the 5th international conference on spoken language processing. Vol. 7. (pp. 3163-6). Sydney, Australia. 30 November - 4 December, 1998. Consultado en http://sites.univ-provence.fr/~veronis/pdf/1998icslp-database.pdf

Aplicación de INTSINT a niveles de análisis como el párrafo.

INTSINT, International Transcription System for Intonation

INTSINT, International Transcription System for Intonation

ToBI (Tone and Break Index)

Características generales de ToBI

Desarrollado para cubrir al mismo tiempo las necesidades de descripción fonética y de anotación de corpus adecuados al desarrollo de sistemas de tecnologías del habla.

Basado en el inglés americano.

Transcripción de patrones entonativos partiendo de un análisis de la curva melódica representada como evolución temporal de la frecuencia fundamental.

Uso de herramientas de análisis y etiquetado basadas en el programa Waves en una primera etapa. Actualmente se emplean programas como PitchWorks y existe la posibilidad de anotar siguiendo las convenciones de ToBI mediante el programa Praat utilizando scripts.

Gravano, A. (2008). ToBI annotation environment on Praat. ToBI annotation environments [Página web]. New York: Spoken Language Processing Group, Department of Computer Science, Columbia University. Consultado en http://www1.cs.columbia.edu/~agus/tobi/tobi-praat/manual.php

Winters, S. (2010). Making text grids for ToBI labeling in Praat: A beginners' guide . Linguistics 411 [Página web]. Calgary: Department of Linguistics, University of Calgary. Consultado en http://www.basesproduced.com/441/TOBIlab/makingtextgrids.pdf

Convenciones para la anotación de textos representados ortográficamente.

Niveles de transcripción en ToBI

Representación ortográfica del enunciado

Nivel de índice de disyunción (break index)

Indicadores de límite que marcan las fronteras entre las unidades melódicas estableciendo cuatro grados de cohesión entre las mismas.

Nivel tonal

Dos niveles tonales:

"Eventos tonales" (pitch events) divididos en tonos de frase al principio y al final de las unidades melódicas.

Los tonos de frontera, alto y bajo, pueden presentar en español los contornos siguientes:

"Acentos tonales" (pitch accent) en la sílabas en las que se produce un movimiento de la frecuencia fundamental.

Para el español, se distinguen tres tipos de acentos tonales:

Nivel misceláneo

Incorpora los comentarios del transcriptor.

Para cada uno de los niveles de se define un conjunto de símbolos, alineados temporalmente con los fenómenos entonativos transcritos.

PitchWorks

ToBI

Oscilograma, curva melódica y anotación mediante el sistema ToBI del enunciado "Una vez en el interior, los agentes encontraron a tres de los niños", pronunciado por un locutor femenino.

Problemas y ventajas de ToBI

Problemas:

Ventajas:

ToBI

Guidelines for ToBI labelling (American English)
http://www.ling.ohio-state.edu/~tobi/ame_tobi/annotation_conventions.html
http://www.ling.ohio-state.edu/research/phonetics/E_ToBI/singer_tobi.html http://www.ling.ohio-state.edu/~tobi/ame_tobi/labelling_guide_v3.pdf

Spanish ToBI

Catalan ToBI

arrow_up_gray

 Representación fonética de los elementos suprasegmentales en los corpus orales

line_red

La representación fonética suprasegmental de corpus orales
Joaquim Llisterri, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/language_resources/spoken_res/Repres_fon_supraseg.html
Last modified: 23/11/11 20:15

Bookmark and Share

Creative Commons License
This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 License.