Corpus orales para la fonética y las tecnologías del habla en español
Albayzín, Base de datos para el reconocimiento del habla en español
EUROM
SpeechDat
ACCOR, Articulatory-Acoustic Correlations in Coarticulatory Processes - A Cross-Linguistic Investigation
MULTEXT, Multilingual Text Tools and Corpora
MATE, Multilevel Annotation, Tools Engineering
Grup de
Processament de la Veu, Departament de Teoria del
Senyal i Comunicacions,
Escola Tècnica Superior d'Enginyers de
Telecomunicació, Universitat
Politènica de Catalunya.
Departamento
de Señales, Sistemas y
Radiocomunicaciones, Escuela Técnica
Superior de Ingenieros de
Telecomunicación, Universidad
Politécnica
de Madrid.
GPySC, Grupo
de Investigación en Procesamiento de
Señales y Comunicaciones,
Departamento de Electrónica y
Tecnología de Computadores,
Facultad de Ciencias, Universidad de
Granada.
Grup de Fonètica, Departament de Filologia Espanyola,
Facultat de Filosofia i Lletres, Universitat
Autònoma de Barcelona.
GTH, Grupo
de Tecnología del Habla, Departamento de
Ingeniería Electrónica,
Escuela Técnica Superior de Ingenieros de
Telecomunicación,
Universidad Politécnica de Madrid.
RFIA, Grupo
de Reconocimiento de Formas y Tecnologías del Lenguaje Humano, Departamento de
Sistemas Informáticos y
Computación - Instituto Tecnológico de Informática,
Universidad Politécnica de Valencia.
Entrenamiento y evaluación de sistemas de procesado y reconocimiento de habla.
Comparación de resultados de diversos sistemas de reconocimiento de habla sobre un mismo corpus.
Desarrollo de sistemas de comprensión de habla.
Obtención de información acústica para la síntesis del habla.
Desarrollo de estudios fonéticos:
Contextos fonéticos relevantes:
Acentuación.
Restricciones estadísticas:
- Mínimo de 50 apariciones de cada alófono en el subcorpus.
- Mínimo de 224 realizaciones de cada alófono.
Eliminación de los segmentos con una frecuencia de aparición inferior al 0.1%.
Inventario final: 24 fonemas y 7 alófonos.
Corpus oral fonéticamente equilibrado y con restricciones que permite el estudio de la variabilidad.
Corpus para el entrenamiento y la evaluación de sistemas de reconocimiento de habla.
Hablantes de la variedad central del castellano.
Sin rasgos específicos de una zona geográfica o de un grupo social restringido.
Distribución en CD-ROM.
Disponibilidad:
Base de datos oral del español Albayzín. Universitat Politècnica de València, Universidad Politécnica de Madrid, Universidad de Granada, Universitat Autònoma de Barcelona, Universitat Politècnica de Catalunya. 5 CD-ROM. 1999.
ELDA, Evaluations and Language resources Distribution Agency:
http://catalog.elra.info/product_info.php?products_id=746&osCsid=7a272af9a54b96add9f69ac305a7ed28
Miembros de ELRA: Investigadores 1000 Euros / Empresas 10000 Euros / Investigadores españoles 100 Euros
Investigadores 2000 Euros / Empresas 12000 Euros / Investigadores españoles 120 Euros
Grup de
Processament de la Veu, Departament de Teoria del
Senyal i Comunicacions,
Escola Tècnica Superior d'Enginyers de
Telecomunicació, Universitat
Politènica de Catalunya.
Grup de Fonètica,
Departament de Filologia Espanyola,
Facultat de Filosofia i Lletres, Universitat
Autònoma de Barcelona.
EUROM1 - Multilingual Speech Corpus
Corpus común para el desarrollo de las tecnologías del habla en Europa.Uso de materiales comunes para la evaluación y entrenamiento de sistemas.
Desarrollo de materiales equivalentes en complejidad en los niveles segmental, léxico, oracional y textual.
Logatomos en 5 frases marco diferentes.
40 párrafos de 5 frases cada uno.
50 frases para aumentar la cobertura fonética.
10 locutores: 75 frases, 5 x 100 dígitos, logatomos CVC.
4 locutores: logatomos CVC aislados y en frase marco x 10 veces.
Disponibilidad:
EUROM1 (The multilingual European speech database) (ELDA-S0014). Paris: ELDA, Evaluations and Language Resources Distribution Agency.
http://catalog.elra.info/product_info.php?products_id=528&osCsid=e682925cbc0378057a1cb911c485ad67
Grup de
Processament de la Veu, Departament de Teoria del
Senyal i Comunicacions,
Escola Tècnica Superior d'Enginyers de
Telecomunicació, Universitat
Politènica de Catalunya.
Grup de Fonètica,
Departament de Filologia Espanyola,
Facultat de Filosofia i Lletres, Universitat
Autònoma de Barcelona.
Creación de una infraestructura para la producción y distribución de recursos lingüísticos.
Desarrollo de bases de datos en 7 lenguas.
Números del 1 al 10.
Cadenas de números.
Fechas.
Expresiones relacionadas con la aplicación.
Dígitos aislados.
Letras.
Cantidades de dinero.
Números naturales.
Nombres de lugar.
Respuesta "sí" o "no".
Frases fonéticamente ricas.
Horas.
Palabras complementarias.
Disponibilidad:
2 CD-ROM distribuidos por ELRA, European Language
Resources Association:
Spanish SpeechDat(M) - DB1 y Spanish SpeechDat(M) - DB2
http://catalog.elra.info/product_info.php?products_id=721&osCsid=9289223575b55f27c187a5a97951476a
http://catalog.elra.info/product_info.php?products_id=722&osCsid=6b68023ac61990e6b690d6f0f41fa9c9
Servicios de información:
Grup de Processament de la Veu, Departament de Teoria del Senyal i Comunicacions, Escola Tècnica Superior d'Enginyers de Telecomunicació, Universitat Politènica de Catalunya.
Creación de bases de datos para el entrenamiento de sistemas de reconocimiento de habla.Aplicaciones telefónicas.
Estándares desarrollados en SpeechDat.
Argentina, Chile, Colombia, Cuba, Ecuador, México, Perú, Venezuela.
RFIA, Grupo
de Reconocimiento de Formas y Tecnologías del Lenguaje Humano, Departamento de
Sistemas Informáticos y
Computación, Facultad de
Informática,
Universidad Politécnica de Valencia.
Laboratori de Fonètica
Institut d'Estudis Catalans.
7 lenguas europeas.
12.5 Gb.
Datos fisiológicos:
Marchal, A., Hardcastle, W. J., Hoole, P., Schmidbauer, O., Galiano, I., Engstrand, O., y Recasens, D. (1991). The design of a multichannel database. En ICPhS 1991. Actes du 12ème congrès international de sciences phonétiques. Vol 5. (pp. 422-5). Aix-en-Provence: Université de Provence, Service des Publications.
Marchal, A., y Hardcastle, W. J. (1993). ACCOR: Instrumentation and database for the cross-language study of coarticulation. Language and Speech, 36, 137-153.
Grup de Fonètica, Departament de Filologia Espanyola, Facultat de Filosofia i Lletres, Universitat Autònoma de Barcelona.
MULTEXT, Multilingual Text Tools and Corpora
Etiquetado prosódico mediante el sistema INTSINT de los párrafos de EUROM_1.
Hirst, D., Ide, N., y Véronis, J. (1994). Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project. En SSW2-1994. Proceedings of the second ESCA/IEEE workshop on speech synthesis. (pp. 77-80). Mohonk Mountain House, New Paltz, NY, USA, September 12-15, 1994. Consultado en http://www.isca-speech.org/archive_open/ssw2/ssw2_077.html
Llisterri, J. (Ed.). (1996). Prosody tools efficiency and failures. (WP 4 Corpus. T4.6 Speech Markup and Validation. Deliverable 4.5.2. Final version. 15 October 1996. LRE Project 62-050 MULTEXT. Consultado en http://liceu.uab.cat/~joaquim/publicacions/Prosody_tools_96.pdf
CD-ROM distribuido por ELRA, European Language
Resources Association:
ELRA-S0060 MULTEXT Prosodic Database. http://catalog.elra.info/product_info.php?products_id=530
Grup de
Fonètica, Departament
de Filologia Espanyola, Facultat de Filosofia i
Lletres, Universitat Autònoma
de Barcelona.
Telefónica
I+D, Madrid.
MATE, Multilevel Annotation, Tools Engineering
Anotación prosódica de diálogos para el desarrollo de sistemas de comunicación persona - máquina.
Corpus orales para la fonética y las tecnologías del habla en español
Corpus orales y corpus de lengua oral en español
Corpus orales para la fonética y las
tecnologías del habla en español
Joaquim Llisterri,
Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/language_resources/spoken_res/Corp_oral_esp.html
Last modified: 12/11/11 20:24
This
work is licensed under a
Creative Commons Attribution-Noncommercial-Share Alike 3.0 License.