Textos orales y corpus de lengua oral


La noción de corpus
La lingüística de corpus
Corpus orales y corpus escritos
El texto oral

La noción de corpus

Conjunto estructurado y documentado de textos recogidos en función de criterios explícitos.

“A collection of pieces of language that are selected and ordered according to explicit linguistic criteria in order to be used as a sample of the language.”

Sinclair, J. (1996). Preliminary recommendations on corpus typology. EAGLES Document EAG-TCWG-CTYP/P. May 1996. Retrieved from http://www.ilc.cnr.it/EAGLES96/corpustyp/corpustyp.html

“A corpus is a collection of pieces of language text in electronic form, selected according to external criteria to represent, as far as possible, a language or language variety as a source of data for linguistic research.”

Sinclair, J. (2005). Corpus and text - basic principles. En M. Wynne (Ed.), Developing linguistic corpora: A guide to good practice. Oxford: Oxbow Books. Consultado en http://www.ahds.ac.uk/creating/guides/linguistic-corpora/chapter1.htm

John Sinclair

John Sinclair (1933-2007)

“a corpus typically implies a finite body of text, sampled to be maximally representative of a particular variety of a language, and which can be stored and manipulated using a computer” (p. 59).

McEnery, T. y Wilson, A. (2001). Corpus linguistics (2nd. ed.). Edinburgh: Edinburgh University Press. (Primera edición: 1996)

McEnery-Wilson

La anotación (annotation) o etiquetado (labelling)

La codificación (encoding)

arrow_gray_up

La lingüística de corpus

“Corpus linguistics is perhaps best described (. . .) as the study of language based on examples of ‘real life’ language use” (p. 1).

McEnery, T. y Wilson, A. (2001). Corpus linguistics (2nd. ed.). Edinburgh: Edinburgh University Press. (Primera edición: 1996)

McEnery-Wilson

“Corpus linguistics, like all linguistics, is concerned primarily with the description and explanation of the nature, structure and use of language and languages” (p. 8).

Kennedy, G. (1998). An introduction to corpus linguistics. London: Longman.

Kennedy

Manuales de lingüística de corpus

Actas de congresos y compilaciones

Publicaciones periódicas

Compilación de corpus

Diseño y compilación de colecciones de textos; preparación y almacenamiento de los textos para su explotación.

Desarrollo de herramientas

Desarrollo de herramientas computacionales para el análisis de los corpus y de herramientas para la anotación.

Análisis de los corpus

Uso de corpus en la descripción lingüística.

Lingüística “empirista” basada en corpus y lingüística “racionalista” basada en la introspección.

McEnery, T. y Wilson, A. (2001). Corpus linguistics (2nd. ed.). Edinburgh: Edinburgh University Press. (Primera edición: 1996) Consultado en http://www.lancaster.ac.uk/fss/courses/ling/corpus/Corpus1/1FRA1.HTM

“Armchair linguistics does not have a good name in some linguistic circles. A caricature of the armchair linguist is something like this. He sits in a deep soft comfortable armchair, with his eyes closed and his hands clasped behind his head. Once in a while he opens his eyes, sits up abruptly shouting, ‘Wow, what a neat fact!’, grabs his pencil, and writes something down. Then he paces around for a few hours in the excitement of having come still closer to knowing what language is really like. (There isn’t anybody exactly like this, but there are some approximations.)”

“Corpus linguistics doesn’t have a good name in some linguistic circles. A caricature of the corpus linguist is something like this. He has all the primary facts that he needs, in the form of approximately one zillion running words, and he sees his job as that of deriving secondary facts from his primary facts. At the moment he is busy determining the relative frequencies of the eleven parts of speech as the first word of a sentence. (There isn’t anybody exactly like this, but there are some approximations.)”

Fillmore, C. J. (1992). ‘Corpus linguistics’ or ‘computer-aided armchair linguistics’. En J. Svartvik (Ed.), Directions in corpus linguistics. Proceedings of Nobel Symposium 82. Stockholm, 4-8 August 1991. (pp. 35-66). Berlin - New York: Mouton de Gruyer.

Fillmore

Charles Fillmore (1929-2014)

Aplicaciones de los corpus

Teoría y descripción lingüística

Investigación en lingüística aplicada

Desarrollo de tecnologías lingüísticas

Productos en el campo de las tecnologías lingüísticas

Aplicaciones de los corpus escritos

Aplicaciones de los corpus orales

arrow_gray_up

Corpus orales y corpus escritos

Corpus escritos o corpus textuales

Written corpora, text corpora

Formado por textos procedentes de la lengua escrita.

Los corpus escritos

Corpus orales

Speech corpora

Constituido por grabaciones o por transcripciones de la lengua hablada.

Los corpus orales

arrow_gray_up

El texto oral

Spoken language corpora

Spoken text – “texto hablado”

Muestra de la producción sonora de un hablante o de un grupo de hablantes transcrita en ortografía convencional.

Analizado en tanto que “texto” con los métodos del análisis del discurso, el análisis de la conversación o la lingüística del texto.

Analizado en tanto que “muestra de lengua” en todos los niveles del análisis lingüístico: morfológico, léxico, sintáctico, semántico y pragmático.

Posibilidad de un análisis fonético –segmental y suprasegmental– o fonológico si se dispone de una transcripción fonética o fonológica.

Posibilidad de un análisis fonético acústico –segmental y suprasegmental– si se dispone de la grabación original realizada en condiciones acústicas adecuadas.

arrow_gray_up


Textos orales y corpus de lengua oral
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/language_resources/spoken_res/Texto_oral.html
Last updated: 25/2/14 12:45

Creative Commons License
This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 License.