La representación fonética de corpus orales

Bookmark and Share


La representación fonética
Niveles de representación y etiquetado fonético
La representación fonética de los elementos segmentales
La representación fonética de los elementos suprasegmentales
Etiquetado y transcripción automática de corpus orales
Transcripción y codificación de corpus de lengua oral

La representación fonética

La representación fonética de un corpus oral supone pasar de una señal continua a una representación discreta y simbólica como es la transcripción fonética.

La transcripción fonética puede acompañarse del etiquetado fonético de la señal sonora.

Mediante el etiquetado (labelling) fonético se asigna a cada segmento de la onda sonora una etiqueta que lo define en términos fonéticos (acústicos o articulatorios).

La alineación (alignment) es una operación que sincroniza las etiquetas fonéticas con la señal sonora.

arrow_up_gray

Niveles de representación y etiquetado fonético

Las propuestas del proyecto SAM (Speech Assessment Methodology)

Niveles de etiquetado fonético de un corpus oral.

Barry, W. J., y Fourcin, A. J. (1992). Levels of labelling. Computer Speech & Language, 6(1), 1-14. doi:10.1016/0885-2308(92)90041-2

Propiedades acústicas presentes en la señal sonora.

Propiedades de los segmentos en términos de categorías fonéticas (oclusión, fricción, nasalización, sonoridad, etc.).

Caracterización de los segmentos utilizando los símbolos del AFI o sus equivalentes computacionales.

Se transcriben únicamente los elementos funcionalmente distintivos que se encuentran en la palabra pronunciada aisladamente en estilo cuidado (citation form).

Se utilizan los símbolos correspondientes a los elementos fonológicos en una lengua dada para transcribir realizaciones alofónicas condicionadas por el contexto.

El etiquetado prosódico se considera de forma independiente.

Las propuestas del proyecto EAGLES (Expert Advisory Group on Language Engineering Standards)

La propuesta del Grupo de Trabajo sobre Lengua Oral (Spoken Language Working Group) de EAGLES

Se utiliza la representación ortográfica convencional.

Se representa la forma de pronunciación aislada de las palabras en estilo cuidado.

Se utilizan los símbolos que representan elementos fonológicos en una lengua dada, pero se transcriben aquellos fenómenos predictibles propios de la fonética sintáctica. El sistema de representación recomendado es SAMPA (SAM Phonetic Alphabet).

Se basa en una representación alofónica de las realizaciones fonéticas de los hablantes. El sistema de representación recomendado es X-SAMPA (Extended SAM Phonetic Alphabet).

Se distinguen características acústicas de los segmentos observables en una representación de la onda sonora.

Representado en términos de parámetros acústicos o articulatorios.

Sonidos de naturaleza comunicativa o introducidos por el hablantes; información paralingüística; ruidos externos a la grabación.

La propuesta del Subgrupo de Trabajo sobre Textos Orales (Spoken Texts Subgroup)

Representación ortográfica convencional del texto.

Representación fonológica de las palabras en su forma canónica. El sistema de representación recomendado es SAMPA (SAM Phonetic Alphabet).

Representación simbólica discreta de la realización del enunciado tal como es percibido por el transcriptor. El sistema de representación recomendado es X-SAMPA (Extended SAM Phonetic Alphabet).

Las formas canónicas y la transcripción fonotípica

Formas canónicas (citation form):

Transcripción fonotípica:

Niveles de etiquetado de corpus orales

arrow_up_gray

La representación fonética de los elementos segmentales

Representación fonética de los elementos segmentales

arrow_up_gray

La representación fonética de los elementos suprasegmentales

Representación fonética de los elementos suprasegmentales

arrow_up_gray

Etiquetado y transcripción automática de corpus orales

Transcribir y etiquetar fonéticamente un corpus oral representa un considerable esfuerzo, tanto en términos de tiempo como de recursos económicos.

Etiquetado manual

Requiere el desarrollo de convenciones detalladas para asegurar la coherencia entre diversos transcriptores.

Kiesling, S., Diller, L., y Raymond, W. D. (2006). The Variation in Conversation (ViC) project: Creation of the Buckeye corpus of conversational speech. Columbus, OH: Department of Pyschology, Ohio State University. Consultado en http://buckeyecorpus.osu.edu/BuckeyeCorpusmanual.pdf

Lander, T. (1997). The CSLU labeling guide. Beaverton, OR: Center for Spoken Language Understanding, Oregon Graduate Institute. Consultado en http://cslu.bme.ogi.edu/corpora/docs/labeling.pdf

Croot, C., y Taylor, B. (1995). Criteria for acoustic-phonetic segmentation and word labelling in the Australian national database of spoken language. Sydney: Speech, Hearing and Language Research Centre, Department of Linguistics, Macquarie University. Consultado en http://www.shlrc.mq.edu.au/projects/andosl/

Criterios de etiquetado de corpus orales

Requieren el establecimiento de un procedimiento de validación de la transcripción y el etiquetado.

Un procedimiento habitual para validar los criterios de etiquetado es el cálculo del grado de acuerdo entre diferentes transcriptores.

Validación del etiquetado de corpus orales

Etiquetado semi-automático o automático

La transcripción de formas canónicas y la transcripción fonotípica pueden obtenerse automáticamente a partir de la representación ortográfica si se dispone de un conjunto de reglas que establezcan las correspondencias entre la representación ortográfica y la fonética.

El etiquetado automático requiere una serie de operaciones:

El problema de la naturaleza no discreta de la señal, resultado de la coarticulación.

El problema de la variabilidad de realizaciones fonéticas entre hablantes y en un mismo hablante.

Herramientas para el etiquetado de corpus orales

arrow_up_gray

Transcripción y codificación de corpus de lengua oral

Transcripción y codificación de corpus de lengua oral

arrow_up_gray

La representación fonética de corpus orales
Joaquim Llisterri, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/language_resources/spoken_res/Repres_fon_corp_oral.html
Last modified: 16/11/11 14:04

Bookmark and Share

Creative Commons License
This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 License.