line_red

Corpus de lengua oral en español

line_red

CORLEC, Corpus Oral de Referencia del Español Contemporáneo
Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico
Subcorpus Oral del Corpus de Referencia del Español Actual (CREA)
Corpus de conversación coloquial - Grupo Val.Es.Co
C-ORAL-ROM, Corpus integrado de referencia en lenguas romances
PRESEEA, Proyecto para el Estudio Sociolingüístico del Español del España y de América

Corpus orales y corpus de lengua oral en español

line_red

CORLEC, Corpus Oral de Referencia del Español Contemporáneo

Laboratorio de Lingüística Informática, Departamento de Lingüística, Lenguas Modernas, Lógica y Filosofía de la Ciencia, Universidad Autónoma de Madrid
http://www.lllf.uam.es/ESP/Corlec.html

Contenidos

Información y descripción del corpus

Fenómenos codificados

Información y descripción del corpus

Información contenida en la cabecera

Información y descripción del corpus

Referencias

Disponibilidad:
Laboratorio de Lingüística Informática, Departamento de Lingüística, Lenguas Modernas, Lógica y Filolofía de la Ciencia, Universidad Autónoma de Madrid
http://www.lllf.uam.es/ESP/Corlec.html

arrow_up_gray

Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico

Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico (MC-NLCH). Preparado por José Antonio Samper Padilla, Clara Eugenia Hernández Cabrera y Magnolia Troya Déniz. Edición en CD-ROM. Las Palmas de Gran Canaria: Servicio de Publicaciones de la Universidad de Las Palmas de Gran Canaria, 1998.

Contenidos

Formato de los textos y estándares de codificación

Referencias

Disponibilidad:
Servicio de Publicaciones de la Universidad de Las Palmas de Gran Canaria
Alfonso XIII, 2, 35003 Las Palmas de Gran Canaria

arrow_up_gray

Subcorpus Oral del Corpus de Referencia del Español Actual (CREA)

Recursos Lingüísticos, Banco de Datos, Real Academia Española
http://www.rae.es/

Contenidos

Formato de los textos y estándares de codificación

Fenómenos codificados

<div>

Cada entrevista o conversación constituye una unidad <div>

Se indica el nivel jerárquico (<div1>, <div2>, <div3>, ... <div8>) si se encuentran entrevistas o conversaciones dentro de entrevistas o conversaciones más amplias

<s>

Secuencia separada del resto del texto por un punto, exclamación o interrogación

<u>

Segmento precedido y/o seguido de un cambio de hablante

Atributo who: código identificador del participante

<u>

Atributo trans

smooth cuando <u> empieza con una pausa normal

overlap cuando <u> empieza antes de que la anterior haya finalizado

<pause>

<event>

Atributo desc: describe el tipo de evento del que se trata

<kinesic>

Atributo desc: describe el tipo de gesto del que se trata

<vocal>

Atributo type: recoge la transcripción del fenómeno vocal

tos, respiración, estornudo, risa

aha, tch tch, e..., risa

Atributo desc: describe la intención comunicativa del fenómeno vocal

asentimiento, negación

<q>

Atributo rend: indica el tipo de resalte empleado en la transcripción

<writing>

<foreign>

Atributo lang: especifica la lengua según el código ISO 639

<num>

<distinct>

Atributo type

dele

<abbr>

Atributo type: especifica el tipo de abreviatura

normal

acronym

<hi>

Atributo rend: especifica el tipo de resalte

cdob: comillas dobles

curs: cursiva

mayu: mayúscula

<unclear>

Atributo cert: recoge el grado de certeza

unclear: fragmento poco claro, que se reproduce de la manera más ajustada posible

unintelligible: fragmento ininteligible, que no se reproduce

<sic>

<distinct>

Atributo type

titu: palabra fragmentaria por titubeo

repe: palabra repetida por titubeo

PINO, M. (1997) Transcripción, codificación y almacenamiento de los textos orales del corpus CREA. Versión 2.0. Instituto de Lexicografía, Real Academia Española. En: Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico (MC-NLCH). Preparado por José Antonio Samper Padilla, Clara Eugenia Hernández Cabrera y Magnolia Troya Déniz. Edición en CD-ROM. Las Palmas de Gran Canaria: Servicio de Publicaciones de la Universidad de Las Palmas de Gran Canaria, 1998.

PINO, M.- SÁNCHEZ, M. (1999) "El subcorpus oral del banco de datos CREA-CORDE (Real Academia Española): Procedimientos de transcripción y codificación", Oralia. Análisis del discurso oral 2: 83-138.

Información contenida en la cabecera

Referencias

Disponibilidad:
Consulta a través de Internet en las páginas de la Real Academia Española
http://www.rae.es/

arrow_up_gray

Corpus de conversación coloquial - Grupo Val.Es.Co

Grupo Val.Es.Co (Valencia Español Coloquial), Departamento de Filología Española, Universidad de Valencia - Universidad de Alicante
http://www.valesco.es/

Contenidos

Muestra del corpus

Muestra de audio

Fenómenos codificados

Sistema de transcripción

Referencias

Disponibilidad:

BRIZ, A. (Coord.) (1995) La conversación coloquial (Materiales para su estudio). València: Universitat de València, Facultad de Filología, Departamento de Filología Española (Lengua Española) (Cuadernos de FIlología, Anejo XVI).

BRIZ, A. (Coord.) (2001) Corpus de conversaciones coloquiales. Anejo 1 de Oralia. Madrid: ArcoLibros.

arrow_up_gray

C-ORAL-ROM, Corpus integrado de referencia en lenguas romances

LABLITA, Laboratorio Linguistico, Dipartimento di Italianistica, Università di Firenze
http://lablita.dit.unifi.it/coralrom/

Laboratorio de Lingüística Informática, Departamento de Lingüística, Lenguas Modernas, Lógica y Filosofía de la Ciencia, Universidad Autónoma de Madrid
http://www.lllf.uam.es/ESP/Coralrom.html

Contenidos

Muestras del corpus

Formato de los textos y estándares de codificación

Fenómenos codificados

Referencias

Disponibilidad:

CRESTI, E.- MONEGLIA, M. (Eds.) (2005) C-ORAL-ROM. Integrated Reference Corpora for Spoken Romance Languages. Amsterdam: John Benjamins (Studies in Corpus Linguistics 15) (including DVD).

arrow_up_gray

PRESEEA, Proyecto para el Estudio Sociolingüístico del Español del España y de América

Preseea.gif

Coordinación: Departamento de Filología, Universidad de Alcalá de Henares

Equipos: Alcalá de Henares, México, Valencia, Madrid, San Juan de Puerto Rico, Las Palmas de Gran Canaria, Lérida, Cádiz, Zaragoza, Barranquilla, Cipolletti, Málaga, Culiacán, Guatemala, Miami, Bogotá, Pereira, Palma de Mallorca, Caracas, Granada

http://www.linguas.net/Default.aspx?alias=www.linguas.net/portalpreseea

Contenidos

Fenómenos codificados

<(hh)><(m:)><(ts)><(e:)><(pf)>

<ininteligible> </ininteligible>

<interrupción de la grabación>

<silencio>

Pausa larga; incluye lo que en pragmática se identifica como "lapso" y como "silencio"

<risas=R/todos>

<ruido>

<simultáneo></simultáneo>

<suspensión voluntaria>

<palabra cortada>

<corrección>

<vacilación>: repetición de palabra

<expresivo></expresivo>: admiración, exclamación

<interrogativo></interrogativo>

<estilo directo></estilo directo>

Referencias

Disponibilidad:
Muestras de los materiales en
http://www.linguas.net/Default.aspx?alias=www.linguas.net/portalpreseea

arrow_up_gray

Corpus de lengua oral en español

Corpus orales y corpus de lengua oral en español

line_red

Corpus de lengua oral en español
Joaquim Llisterri, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/language_resources/spoken_res/Corp_leng_oral_esp.html
Last modified: 12/12/09 18:28

Creative Commons License
This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 License.

line_red