La representación fonética de corpus orales
La representación fonética
Niveles de representación y etiquetado fonético
La representación fonética de los elementos segmentales
La representación fonética de los elementos suprasegmentales
Etiquetado y transcripción automática de corpus orales
Transcripción y codificación de corpus de lengua oral
La transcripción fonética puede acompañarse del etiquetado fonético de la señal sonora.
Mediante el etiquetado (labelling) fonético se asigna a cada segmento de la onda sonora una etiqueta que lo define en términos fonéticos (acústicos o articulatorios).
La alineación (alignment) es una operación que sincroniza las etiquetas fonéticas con la señal sonora.
Barry, W. J., y Fourcin, A. J. (1992). Levels of labelling. Computer Speech & Language, 6(1), 1-14. doi:10.1016/0885-2308(92)90041-2
Propiedades acústicas presentes en la señal sonora.
Propiedades de los segmentos en términos de categorías fonéticas (oclusión, fricción, nasalización, sonoridad, etc.).
Caracterización de los segmentos utilizando los símbolos del AFI o sus equivalentes computacionales.
Se transcriben únicamente los elementos funcionalmente distintivos que se encuentran en la palabra pronunciada aisladamente en estilo cuidado (citation form).
Se utilizan los símbolos correspondientes a los elementos fonológicos en una lengua dada para transcribir realizaciones alofónicas condicionadas por el contexto.
El etiquetado prosódico se considera de forma independiente.
Se utiliza la representación ortográfica convencional.
Se representa la forma de pronunciación aislada de las palabras en estilo cuidado.
Se utilizan los símbolos que representan elementos fonológicos en una lengua dada, pero se transcriben aquellos fenómenos predictibles propios de la fonética sintáctica. El sistema de representación recomendado es SAMPA (SAM Phonetic Alphabet).
Se basa en una representación alofónica de las realizaciones fonéticas de los hablantes. El sistema de representación recomendado es X-SAMPA (Extended SAM Phonetic Alphabet).
Se distinguen características acústicas de los segmentos observables en una representación de la onda sonora.
Representado en términos de parámetros acústicos o articulatorios.
Sonidos de naturaleza comunicativa o introducidos por el hablantes; información paralingüística; ruidos externos a la grabación.
Representación ortográfica convencional del texto.
Representación fonológica de las palabras en su forma canónica. El sistema de representación recomendado es SAMPA (SAM Phonetic Alphabet).
Representación simbólica discreta de la realización del enunciado tal como es percibido por el transcriptor. El sistema de representación recomendado es X-SAMPA (Extended SAM Phonetic Alphabet).
Niveles de etiquetado de corpus orales
Representación fonética de los elementos segmentales
Representación fonética de los elementos suprasegmentales
Kiesling, S., Diller, L., y Raymond, W. D. (2006). The Variation in Conversation (ViC) project: Creation of the Buckeye corpus of conversational speech. Columbus, OH: Department of Pyschology, Ohio State University. Consultado en http://buckeyecorpus.osu.edu/BuckeyeCorpusmanual.pdf
Lander, T. (1997). The CSLU labeling guide. Beaverton, OR: Center for Spoken Language Understanding, Oregon Graduate Institute. Consultado en http://cslu.bme.ogi.edu/corpora/docs/labeling.pdf
Croot, C., y Taylor, B. (1995). Criteria for acoustic-phonetic segmentation and word labelling in the Australian national database of spoken language. Sydney: Speech, Hearing and Language Research Centre, Department of Linguistics, Macquarie University. Consultado en http://www.shlrc.mq.edu.au/projects/andosl/
Criterios de etiquetado de corpus orales
Requieren el establecimiento de un procedimiento de validación de la transcripción y el etiquetado.Un procedimiento habitual para validar los criterios de etiquetado es el cálculo del grado de acuerdo entre diferentes transcriptores.
Validación del etiquetado de corpus orales
El etiquetado automático requiere una serie de operaciones:
El problema de la naturaleza no discreta de la señal, resultado de la coarticulación.El problema de la variabilidad de realizaciones fonéticas entre hablantes y en un mismo hablante.
- Alineación de la señal con las fronteras de las palabras ortográficas.
- Alineación de la señal con los puntos en los que se encuentran las sílabas acentuadas.
Herramientas para el etiquetado de corpus orales
Transcripción y codificación de corpus de lengua oral
La representación
fonética de corpus orales
Joaquim Llisterri, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/language_resources/spoken_res/Repres_fon_corp_oral.html
Last modified: 16/11/11 14:04
This
work is licensed under a
Creative Commons Attribution-Noncommercial-Share Alike 3.0 License.