La representación fonética suprasegmental de corpus orales
Problemas y requisitos de los sistemas de representación de los elementos suprasegmentales
La transcripción de los elementos suprasegmentales mediante el AFI
Sistemas de transcripción prosódica para el intercambio electrónicoLas propuestas de SAM (Speech Assessment Methodologies)
El sistema de representación del IPO (Center for Research on User Interaction, Eindhoven)
INTSINT (International Transcription System for Intonation)
ToBI (Tone and Break Index)
Los elementos suprasegmentales
Independientemente del sistema, pueden definirse tres niveles de representación en lo que se refiere a la entonación:
- la representación de la curva melódica original.
- la representación estilizada de la curva melódica.
- la representación simbólica de la curva melódica.
Grupo de trabajo sobre categorías suprasegmentales (Kiel, 1989) surgido de la necesidad de representar las categorías suprasegmentales de un modo más adecuado, especialmente en lo que se refiere a la entonación.
El conjunto actual de símbolos del AFI (Alfabeto Fonético Internacional) para los elementos suprasegmentales permite transcribir el tono, la duración y el acento.


IPA, International Phonetics Association
Cuadro de símbolos del Alfabeto Fonético Internacional
Desarrollo de sistemas de transcripción prosódica compatibles con las necesidades de anotación de bases de datos en soporte electrónico: PROSPA, SAMSINT, SAMPROSA.
Basado en criterios auditivos.
Recoge únicamente los elementos necesarios para sus objetivos.
Basado en INTSINT, con algunas modificaciones adicionales.
Conjunto de caracteres correspondientes a códigos ASCII (American Standard Code for Information Interchange).
Permite la transcripción de:
SAMPROSA
Cuadro de símbolos de SAMPROSA
Formalización de un sistema de representación de la curva melódica.

Curva estilizada y anotada según el sistema de Garrido (1996, 2001) correspondiente a la oración 'Una vez en el interior, los agentes encontraron a tres de los niños', pronunciada por un locutor femenino.
Garrido, J. M. (1996). Modelling Spanish intonation for text-to-speech applications. PhD Thesis, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona.Consultado en http://www.tdx.cat/TDX-0428108-155145
Garrido, J. M. (2001). La estructura de las curvas melódicas del español: Propuesta de modelización. Lingüística Española Actual, 23(2), 173-210.
Desarrollado por D. Hirst en el marco de un proyecto de análisis automático de la entonación.
Baqué, L., y Estruch, M. (2003). Modelo de Aix-en-Provence. En P. Prieto (Ed.), Teorías de la entonación. (pp. 123-53). Barcelona: Ariel. Consultado en http://sites.google.com/site/lorrainebaqueuab/publis/ModeloAix-en-ProvenceV3.pdf
Hirst, D., Di Cristo, A., y Espesser, R. (2000). Levels of representation and levels of analysis for the description of intonation systems. En M. Horne (Ed.), Prosody: Theory and experiment. Studies presented to Gösta Bruce. (pp. 51-88). Dordrecht: Kluwer. Consultado en http://aune.lpl.univ-aix.fr/~hirst/articles/2000%20Hirst&al.pdf
Hirst, D. (2007). A Praat plugin for MOMEL and INTSINT with improved algorithms for modelling and coding intonation. En ICPhS 2007. Proceedings of the 16th international congress of phonetic sciences. (pp. 1233-6). Saarbrücken, Germany, 6-10 August, 2007. Consultado en http://www.icphs2007.de/conference/Papers/1443/1443.pdf
Los puntos de inflexión - combinación de un valor temporal y un valor frecuencial - pueden codificarse automáticamente mediante los símbolos de INTSINT.
Se trata de un sistema para la representación simbólica -transcripción- de la entonación.



Oscilograma (ventana superior) y curva melódica y estilizada (ventana inferior) correspondientes al enunciado "Una vez en el interior, los agentes encontraron a tres de los niños", pronunciado por un locutor femenino.
Representación mediante un alfabeto de símbolos -etiquetas- que convierte la curva estilizada en una secuencia de categorías discretas que pueden utilizarse para regenerar la curva original.

Proceso implementado inicialmente en el programa MES (Motif Environement for Speech) constituido por dos módulos:
D. Hirst, Momel-Intsint, Laboratoire Parole et Langage, Aix-en-Provence
Disponible en la sección "Files" en los grupos de Yahoo Praat Users Group [última versión] y Momel-Intsint (es necesario ser miembro de los grupos para acceder a los ficheros; el registro es gratuito).
Hirst, D. (2007). A Praat plugin for MOMEL and INTSINT with improved algorithms for modelling and coding intonation. En ICPhS 2007. Proceedings of the 16th international congress of phonetic sciences. (pp. 1233-6). Saarbrücken, Germany, 6-10 August, 2007. Consultado en http://www.icphs2007.de/conference/Papers/1443/1443.pdf
Momel-Intsint, C. Auran, Laboratoire "Savoirs, Textes, Langage", Université Charles de Gaulle - Lille3
Momel-Intsint, C. Auran, Laboratoire "Savoirs, Textes, Langage", Université Charles de Gaulle - Lille3
Baqué, L., y Estruch, M. (2003). Modelo de Aix-en-Provence. En P. Prieto (Ed.), Teorías de la entonación. (pp. 123-53). Barcelona: Ariel. Consultado en http://sites.google.com/site/lorrainebaqueuab/publis/ModeloAix-en-ProvenceV3.pdf
Representación fonológica del contorno melódico, simbolizando los diferentes niveles tonales de la curva original.


Oscilograma (ventana superior), curva melódica original, curva estilizada (sistema MOMEL) y anotación INTSINT (ventana inferior) correspondientes al enunciado "Una vez en el interior, los agentes encontraron a tres de los niños", pronunciado por un locutor femenino.
Representación de secuencias tonales:
![]() | T (Top) | altura tonal máxima del locutor |
![]() | M (Mid) | etiqueta inicial correspondiente a un valor medio del locutor |
![]() | B (Bottom) | altura tonal mínima del locutor |
![]() | U (Up) | punto en una secuencia ascendente |
![]() | D (Down) | punto en una secuencia descendente |
![]() | H (Higher) | punto más alto que los dos puntos adyacentes |
![]() | L (Lower) | punto más bajo que los dos puntos adyacentes |
![]() | S (Same) | punto igual que su precedente |
Anotación prosódica de parte del corpus EUROM en francés, inglés, alemán, suceo y español en el proyecto LRE 62-050 MULTEXT (Multilingual Text Tools and Corpora).
Campione, E., y Véronis, J. (1998). A multilingual prosodic database. En ICSLP 1998. Proceedings of the 5th international conference on spoken language processing. Vol. 7. (pp. 3163-6). Sydney, Australia. 30 November - 4 December, 1998. Consultado en http://sites.univ-provence.fr/~veronis/pdf/1998icslp-database.pdf
Aplicación de INTSINT a niveles de análisis como el párrafo.
INTSINT, International Transcription System for Intonation
INTSINT, International Transcription System for Intonation
Basado en el inglés americano.
Transcripción de patrones entonativos partiendo de un análisis de la curva melódica representada como evolución temporal de la frecuencia fundamental.
Uso de herramientas de análisis y etiquetado basadas en el programa Waves en una primera etapa. Actualmente se emplean programas como PitchWorks y existe la posibilidad de anotar siguiendo las convenciones de ToBI mediante el programa Praat utilizando scripts.
Gravano, A. (2008). ToBI annotation environment on Praat. ToBI annotation environments [Página web]. New York: Spoken Language Processing Group, Department of Computer Science, Columbia University. Consultado en http://www1.cs.columbia.edu/~agus/tobi/tobi-praat/manual.php
Winters, S. (2010). Making text grids for ToBI labeling in Praat: A beginners' guide . Linguistics 411 [Página web]. Calgary: Department of Linguistics, University of Calgary. Consultado en http://www.basesproduced.com/441/TOBIlab/makingtextgrids.pdf
Convenciones para la anotación de textos representados ortográficamente.
Los tonos de frontera, alto y bajo, pueden presentar en español los contornos siguientes:
Para el español, se distinguen tres tipos de acentos tonales:
Para cada uno de los niveles de se define un conjunto de símbolos, alineados temporalmente con los fenómenos entonativos transcritos.


Oscilograma, curva melódica y anotación mediante el sistema ToBI del enunciado "Una vez en el interior, los agentes encontraron a tres de los niños", pronunciado por un locutor femenino.
Guidelines for ToBI labelling (American English)
http://www.ling.ohio-state.edu/~tobi/ame_tobi/annotation_conventions.html
http://www.ling.ohio-state.edu/research/phonetics/E_ToBI/singer_tobi.html
http://www.ling.ohio-state.edu/~tobi/ame_tobi/labelling_guide_v3.pdf
Representación fonética de los elementos suprasegmentales en los corpus orales
La representación
fonética suprasegmental de corpus orales
Joaquim Llisterri, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/language_resources/spoken_res/Repres_fon_supraseg.html
Last modified: 23/11/11 20:15
This
work is licensed under a
Creative Commons Attribution-Noncommercial-Share Alike 3.0 License.