La conversión de texto en habla
Esta página ha dejado de actualizarse
CTH, Conversión de texto en habla.
CTP, Conversió de text en parla.
TTS, Text-to-Speech Synthesis
Un sistema de conversión de texto en habla transforma cualquier texto escrito en formato digital en su correspondiente realización sonora.
AcapelaGroup. (2014, 28 de febrero). How does Text to Speech (TTS) work – by Acapela voices [Documento en vídeo]. Consultado en http://www.youtube.com/watch?v=TykwDARmVIU
La estructura de un conversor suele ser modular.
Cada módulo se ocupa de un aspecto de la transformación de la cadena de caracteres inicial hasta llegar a la señal sonora final.
Módulos de un sistema de conversión de texto en habla.
Módulos de un sistema de conversión de texto en habla.
Dutoit, T. (1997). An introduction to text-to-speech synthesis. Dordrecht: Kluwer. (p. 17)
Reglas para el procesamiento previo del texto que contemplen la expansión de los signos de puntuación sin valor lingüístico, las expresiones numéricas, las siglas y las abreviaturas.
❯ El módulo de procesamiento previo del texto en la conversión de texto en habla
Reglas para el procesamiento morfológico y sintáctico en los casos en que en el conversor se realiza un análisis lingüístico automático del texto de entrada.
Módulo de análisis lingüístico de un sistema de conversión de texto en habla.
Dutoit, T. (1997). An introduction to text-to-speech synthesis. Dordrecht: Kluwer. (p. 63)
Reglas de transcripción fonética automática, que establecen la correspondencia entre grafías y alófonos, la silabación y la acentuación, complementadas por diccionarios de pronunciación para el tratamiento de las excepciones.
❯ El módulo de transcripción fonética automática en la conversión de texto en habla
Establecimiento del inventario de fonemas y alófonos de la lengua para la constitución del diccionario de unidades de síntesis o del corpus para la síntesis.
Diseño del corpus de unidades de síntesis teniendo en cuenta las restricciones fonotácticas de la lengua y la frecuencia de aparición de unidades.
Selección del locutor y supervisión de la calidad lingüística de la grabación del corpus de síntesis.
❯ La síntesis basada en corpus
Modelos de duración segmental que consideren los diversos factores que influyen en la duración, basados en datos procedentes de corpus representativos.
Modelos de intensidad segmental que consideren los factores que inciden en la intensidad y que se basen en corpus representativos.
Modelos de asignación de pausas que contemplen tanto las marcadas mediante signos de puntuación como las no marcadas y que establezcan diferencias de duración entre los distintos tipos de pausas.
Modelos de entonación que permitan generar una curva melódica natural, teniendo en cuenta factores fonéticos, sintácticos, semánticos y pragmáticos.
❯ El módulo prosódico en la conversión de texto en habla
Conjunto de reglas que tiene como objetivo:
Transforma la información de la secuencia de unidades de síntesis y de los parámetros prosódicos en una onda sonora.
La conversión de texto en habla