La grabación
Las condiciones técnicas de la grabaciónObjetivos de la grabaciónLos informantes y la grabación
Condiciones ambientales
Los aparatos de grabación
Situaciones de grabaciónRecogida de datos personales
Instrucciones para la grabación y presentación del corpus
Familiarización con el corpus
Control de la grabación
Realización de las grabaciones en entornos acústicamente controlados.
Sistemas de aire acondicionado.
Ruido del informante al pasar las hojas del texto que esté leyendo.
Movimientos del informante.
Producida por la reflexión del sonido en las paredes y en los diversos obstáculos que el sonido encuentra en el entorno.
Se reduce si se facilita la absorción del sonido.
A un mayor tiempo de reverberación corresponde una menor inteligibilidad del habla.
Habitación pequeña como una sala de estar con moqueta o alfombra en el suelo y sofás.
Evaluación auditiva de los resultados.
Una ausencia total de reverberación no es deseable para el habla.
Suele haber unos 50 dB de diferencia entre las intensidades más altas y las más bajas que produce una persona al hablar.
Relación señal-ruido (SNR, signal-to-noise ratio)
Diferencia entre la amplitud de las señales más altas y las más bajas que pueden registrarse sin que se produzcan distorsiones.En una buena grabación, la relación entre señal y ruido debe situarse en los 50 dB.
Respuesta frecuencial
Margen de frecuencias que puede recoger un sistema de grabación.Se recomienda normalmente una respuesta frecuencial desde 45 Hz hasta 18.000 Hz, procurando que sea uniforme en toda la gama de frecuencias.
Para una buena grabación, debe ajustarse el control de la intensidad (recording level o gain) de modo que en las partes de mayor intensidad, la aguja del voltímetro llegue a la zona de 0 dB, sin sobrepasarla.
La conversión analógico-digital
En la actualidad las grabaciones suelen realizarse en formato digital empleando sistemas como el DAT (Digital Audio Tape), el Minidisk o la grabación directa sobre un soporte informático.La ventaja de una grabación digital es que la señal puede almacenarse directamente en un soporte electrónico -por ejemplo, el disco duro de un ordenador- sin tener que realizar la conversión de analógico a digital necesaria cuando se emplea un magnetófono o un casete.
Para la grabación en un laboratorio o en un estudio profesional existen sistemas que permiten recoger la señal digital directamente en un CD-ROM o en una memoria, de modo que el investigador puede disponer de modo inmediato de los datos.
No utiliza ningún procedimiento de compresión de la señal sonora.
Soporte más difundido.
Facilidad para identificar y marcar las partes de una grabación.
Diferencias acústicas entre la grabación en DAT y en Minidisk, especialmente en las frecuencias situadas hacias los 5,5-6 kHz.
"We concluded that while there are
undeniably differences in the speech signal between DAT
and MD recordings, the derived estimates of formants,
fundamental frequency, and glottal parameters reveal only
small differences, and we maintain that the two recording
media can be considered as equivalent for the purposes of
prosodic analysis. Informal listening tests, switching
between the two sources, confirmed that the recorded
speech of both media sounds the same to the ear even
when played over high quality headphones."
Campbell, N. (2002). Recording and storing of speech data. En International workshop on resources and tools in field linguistics (LREC 2002. 3rd International Conference on Language Resources and Evaluation). (pp. 6.1-3). Las Palmas de Gran Canaria, Spain, May 26-27, 2002. Consultado en http://www.mpi.nl/lrec/2002/papers/lrec-pap-06-nick-speech.pdf

Nick Campbell (1948)
"Although the numerical data of our comparison reveal
differences, presumably arising as a result of the
perceptually-masking-based compression used in the
MiniDisc, the derived estimates of formants, fundamental
frequency, and glottal parameters reveal only small
differences and the two recording media can be
considered equivalent for the purposes of prosodic
analysis."
Campbell, N. (2002). Recording techniques for capturing natural every-day speech. En LREC 2002. Proceedings of the 3rd International Conference on Language Resources and Evaluation. Las Palmas de Gran Canaria, Spain, May 29-31, 2002. Consultado en http://www.speech-data.jp/nick/pubs/lrec2002.pdf

Nick Campbell (1948)
"[...] whereas the MP3 encoding
potentially offers considerably more compression of the
data than MD recorders (1:11 for MP3), we find the
differences in quality to be unacceptable for our purposes."
Campbell, N. (2002). Recording and storing of speech data. En International workshop on resources and tools in field linguistics (LREC 2002. 3rd International Conference on Language Resources and Evaluation). (pp. 6.1-3). Las Palmas de Gran Canaria, Spain, May 26-27, 2002. Consultado en http://www.mpi.nl/lrec/2002/papers/lrec-pap-06-nick-speech.pdf

Nick Campbell (1948)
"[...] MP3 compression may have an advantage in
media-streaming, over poor-quality or low-bandwidth
lines. It has good potential for wide distribution of sample
speech data, such as from a web-page, in situations where
the listener is more concerned with listening to the content
of the speech than with an analysis of its characteristics."
Campbell, N. (2002). Recording and storing of speech data. En International workshop on resources and tools in field linguistics (LREC 2002. 3rd International Conference on Language Resources and Evaluation). (pp. 6.1-3). Las Palmas de Gran Canaria, Spain, May 26-27, 2002. Consultado en http://www.mpi.nl/lrec/2002/papers/lrec-pap-06-nick-speech.pdf

Nick Campbell (1948)
Puede aparecer en la grabación el ruido del propio aparato.
Se mantiene una distancia adecuada respecto a la fuente sonora.
Ruidos provocados por los propios informantes al moverse excesivamente.
Roce con la ropa.
Evitan parcialmente los ruidos provocados por los movimientos del informante.
Requieren una adecuada colocación para evitar los efectos de la salida de aire por la cavidad nasal y los ruidos de explosión en las oclusivas.
"Yet to date, we have not noticed a
drop in recording quality that has been serious enough to
prevent acoustic-prosodic analysis of the speech signal.
Formant and pitch extraction is unaffected, and even
voice-quality estimation from the derived glottal
waveform appears to be effective."
Campbell, N. (2002). Recording and storing of speech data. En International workshop on resources and tools in field linguistics (LREC 2002. 3rd International Conference on Language Resources and Evaluation). (pp. 6.1-3). Las Palmas de Gran Canaria, Spain, May 26-27, 2002. Consultado en http://www.mpi.nl/lrec/2002/papers/lrec-pap-06-nick-speech.pdf

Nick Campbell (1948)
Favorecen la aparición del ruido ambiental en las grabaciones.
Cuando disponemos de una cámara sorda un micrófono omnidireccional puede ser utilizado con ventajas.
Son menos sensibles a los cambios de orientación de la fuente sonora derivados de los movimientos de cabeza del informante.
Colocándolos en la dirección de los labios del informante se consigue captar adecuadamente la señal sonora, eliminado al máximo los sonidos indeseados del entorno.
Un buen complemento a una habitación acústicamente aislada es un micrófono direccional.
No recoge los sonidos que le llegan desde atrás o de los lados.
Entre los (50 -) 75 Hz y los 12.000 (- 15.000) Hz.
Respuesta plana, sin modificaciones en ninguna de las frecuencias comprendidas entre el máximo y el mínimo.
Preferiblemente entre 10 y 40 cm de los labios del informante.
Micrófono no situado directamente en el canal de salida del aire.
Capuchón de espuma que atenua la fuerza con la que la corriente de aire llega al micrófono.
Inclinación suficiente colocándolo fuera del canal de salida del aire.
Conectado cada uno a un canal distinto del sistema de grabación.
Micrófonos bidireccionales que pueden usarse colocando los interlocutores a cada uno de los lados del micrófono.
Micrófono alejado de la fuente de sonido.
Atenuación de la intensidad de la señal en micrófonos ocultos.
Recogida de los datos relativos a su historia lingüística.
Estudios más específicos requieren otro tipo de información.
Aumenta la confianza del informante.
Si se presentan por escrito se garantiza que, sea cual sea la persona encargada de realizar las grabaciones, todos los informantes hayan recibido las mismas consignas.
Permite prever problemas en el momento del análisis.
Puede pedírsele que tras decir "repito" repita el elemento del corpus en el que se ha equivocado (con todo su contexto) y siga adelante.
Error detectado por el investigador:
Si se trata de un corpus corto es mejor que el experimentador tome nota para realizar una repetición una vez acabada la grabación.
Listas de palabras o frases marco.
Tiempo de hacer preguntas al experimentador sobre su forma o su contenido.
Indicaciones generales sobre el objeto de la investigación, sin mencionar las variables objeto de estudio.
Impiden que el informante descubra las variables analizadas y focalice su atención en ellas.
Requieren un comentario sobre cómo debe realizarse la lectura.
Anotación de los errores que comete el informante para repetir posteriormente los fragmentos necesarios.
La grabación
Joaquim Llisterri, Universitat Autònoma de
Barcelona
http://liceu.uab.cat/~joaquim/phonetics/fon_met_exper/grabac.html
Last modified: 8/11/11 22:44
This
work is licensed under a
Creative Commons Attribution-Noncommercial-Share Alike 3.0 License.