La representación fonética segmental de corpus orales
Alfabetos fonéticos convencionales
Alfabetos fonéticos para el intercambio electrónico
Transcripción fonética segmental en español
El Alfabeto Fonético Internacional (IPA, International Phonetic Alphabet)
El alfabeto fonético de la Revista de Filología Española (RFE)
Las equivalencias entre símbolos, números AFI y códigos ASCII forman parte de las convenciones conocidas como CRIL (Computer Representation of Individual Languages).
Actualmente, si se dispone de un navegador y de un sistema operativos compatible con UNICODE y se instalan las fuentes adecuadas, es posible visualizar los símbolos del AFI (Alfabeto Fonético Internacional).
The International Phonetic Alphabet in Unicode
Sistema desarrollado para la transcripción del corpus multilingüe EUROM y adoptado para la transcripción de corpus orales para las tecnologías del habla en el contexto europeo.
Conjunto de equivalencias entre los símbolos del AFI (Alfabeto Fonético Internacional) y códigos ASCII (American Standard Code for Information Interchange), restringido al uso de caracteres de 7 bits.
En algunas lenguas se introducen símbolos para la representación de alófonos:
SAMPA ( SAM Phonetic Alphabet)
Incluye diacríticos y marcas tonales.
X-SAMPA Extended SAM Phonetic Alphabet
"any spectrally and temporally distinct speech
sound (not including pitch) which is phonemic
in some language should have a separate base
symbol"
Hieronymus, J. L. (1994). ASCI phonetic symbols for the world's languages: Worldbet. Murray Hill, NJ: AT&T Bell Laboratories. Consultado en http://www.ling.ohio-state.edu/~edwards/WorldBet/worldbet.pdf
Posibilidad de representación de una gran variedad de alófonos presentes en los inventarios fonéticos de las lenguas del mundo, incluyendo símbolos inexistentes en el AFI (Alfabeto Fonético Internacional): 209 símbolos compuestos de dos caracteres ASCII (American Standard Code for Information Interchange).
Utilizado en la transcripción de bases de datos multilingües que incluyen lenguas asiáticas, indias y africanas, además de europeas.
Utilizado en la transcripción de los corpus distribuidos por el CSLU (Center for Spoken Language Understanding, Oregon Graduate Institute).
Worldbet
http://dipaola.org/stanford/facade/lipsync/refbet.pdf
http://byuh.doncolton.com/courses/cs441/9504.refbet.pdf
UNIBET: alfabeto fonético que permite una transcripción estrecha
Descripción fonética y fonológica del español
Consonantismo del español peninsular
Vocalismo del español peninsular
Caracterización acústica de los elementos segmentales del español
Descripción fonética y fonológica del español
El alfabeto fonético de la Revista de Filología Española (RFE)
Enríquez, E., y Casado, C. (1991). Hacia un algoritmo para la conversión automática de fonema en grafema en español. Anuario de Lingüística Hispánica, 7, 151-204.
Uso en la transcripción de corpus para aplicaciones a las tecnologías del habla.
Uso en algoritmos de transcripción fonética automática.
Wells, J. (1996). SAMPA for Spanish [Página web]. London: Division of Psychology and Language Sciences, University College London. (Primera edición: 20/09/1995) Consultado en http://www.phon.ucl.ac.uk/home/sampa/spanish.htm
Llisterri, J., y Mariño, J. B. (1993). Spanish adaptation of SAMPA and automatic phonetic transcription . SAM-A/UPC/001/v1. ESPRIT project 6819 (SAM-A Speech Technology Assessment in Multilingual Applications). Consultado en http://liceu.uab.cat/~joaquim/publicacions/SAMPA_Spanish_93.pdf
Cuadro de símbolos empleados en SAMPA para la transcripción del español
Realizada en el marco del proyecto SALA (Speech Dat across Latin America), orientado a la creación de corpus orales para el desarrollo de las recnologías del habla.
Mariño, J. B., y Moreno, A. (2000). Spanish SAMPA set. SALA (SpeechDat across Latin America) Doc 2. February 2000. Barcelona: Universitat Politècnica de Catalunya.
Cuadro de símbolos empleados en SALA
La transcripción alofónica:
Hieronymus, J. L. (1997). Worldbet phonetic symbols for multilianguage speech recognition and synthesis. AT&T Bell Labs Technical Report. Murray Hill, NJ: AT&T Bell Laboratories.
Cuadro de símbolos empleados en Worldbet para la transcripción del español
Sistema de transcripción basado en la adaptación del sistema de la RFE (Revista de Filología Española) al ALEA (Atlas Lingüístico y Etnográfico de Andalucía).
Entorno de transcripción asistida que permite crear símbolos fonéticos rasgo a rasgo mediante macros que introducen diracríticos, diseñado para permitir la transcripción de las hablas meridionales.
Futuro método de transcripción automática por reglas: utilización de SAMPA (SAM Phonetic Alphabet) para la transcripción ancha, manteniendo el alfabeto fonético del ALEA (Atlas Lingüístico y Etnográfico de Andalucía) para la transcripción estrecha.
León, L. (1994). Transcripción fonética asistida por ordenador. En M. Alvar, y J. A. Villena (Eds.), Estudios para un corpus del español. (pp. 145-85). Málaga: Universidad de Málaga.
Ríos, A. (1999). La transcripción fonética automática del diccionario electrónico de formas simples flexivas del español: Un estudio fonológico en el léxico. Estudios de Lingüística Española, 4. Consultado en http://elies.rediris.es/elies4/
Representación fonética de corpus orales
Transcripción fonética automática
La representación
fonética segmental de corpus orales
Joaquim Llisterri, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/language_resources/spoken_res/Repres_fon_segment.html
Last modified: 12/11/11 23:27
This
work is licensed under a
Creative Commons Attribution-Noncommercial-Share Alike 3.0 License.