Proyecto de creación de un corpus oral de interlengua

Ponentes

Nombre: Jorge

Apellidos: Agulló Covés

Institución: Instituto Cervantes de Brasilia

País: BRASIL

Resumen

Para investigar los procesos de adquisición del español como lengua extranjera es necesario contar con datos que se puedan analizar de una forma fiable y significativa. De esta forma obtendremos información crítica para mejorar nuestras metodologías de enseñanza.

Con tal objetivo, un grupo de profesores del IC de Belgrado, nos hemos
propuesto elaborar un corpus oral de interlengua, entrevistando a aprendices de origen exclusivamente serbio, los cuales serán posteriormente clasificados en niveles de dominio de la lengua. Estas entrevistas serán transcritas y publicadas en la red para que estén a disposición de la comunidad ELE.

En la ponencia se explicarán los detalles de este corpus, cuya elaboración ya se ha puesto en marcha.

Ver vídeo-resumen

Comentarios

Enviado por info5 el Mié, 23/11/2011 - 15:11.

Los corpus

Gracias, compañero, por esta ponencia, ha sido de gran ayuda identificar y conocer los corpus.

responder

Enviado por Teresa de Santos el Mar, 22/11/2011 - 19:41.

Un proyecto interesantísimo

Solo proyectos así justifican a los equipos docentes en su vertiente institucional. Lo demás, ya lo sabemos.

responder

Enviado por Jorge Agulló Coves el Mar, 22/11/2011 - 14:47.

Respuesta para todos

Estimados compañeros, ante todo muchas gracias por vuestros comentarios y preguntas, a los que me dispongo a responder ahora. Me gustaría explicaros que la videoconferencia fue grabada y enviada hace ya unos meses y que en este periodo han ocurrido varias cosas que han retrasado la elaboración y publicación del corpus. Les pido paciencia. Yo ya no estoy en Belgrado, de manera que ya no soy el responsable del mismo. Pueden ustedes ponerse en contacto con Guillermo Menéndez (prof2bel@cervantes.es) y con Sandra Rivas (acbel@cervantes.es) para más detalles sobre el punto en que se encuentra el proyecto. Es más que probable que el corpus no se publique finalmente en el CVC, pero la intención es publicarlo de todos modos en otro lugar. El corpus no está diseñado tanto para su uso en clase sino para la investigación de la interlengua, es decir, de los procesos de adquisición del español como una segunda lengua. Yo no sé muy bien qué utilidad podría tener en la clase este tipo de muestras. Pensad que los informantes son estudiantes serbios de español, con lo que su constructo no es precisamente un modelo de lengua... Los corpus con hablantes nativos, como el C-Or-DiAL del que nos habla Carlota, son mucho más adecuado para ello. De todas formas, agradecería que si alguno de vosotros tuviera alguna idea de cómo usar un corpus de interlengua como material didáctico, la compartiera con los demás. Paso ahora al tema de los .cha y el programa CLAN. ".cha" es la extensión de los documentos que crea y con los que trabaja el programa CLAN. Este es un programa de análisis lingüístico, que permite la localización y contabilización estadística de todo tipo de elementos y fenómenos lingüísticos que hayan sido debidamente marcados en el corpus. Por ejemplo, se puede con él muy fácilmente contabilizar el número de apariciones de una palabra, digamos por ejemplo la aparición de "abrir" en los informantes de nivel A2 y compararlo con su frecuencia en otro nivel. Se pueden, por ejemplo, hacer estadísticas por niveles de frecuencia de errores morfológicos o de uso con el pretérito imperfecto, siempre y cuando estos hayan sido marcados previamente. Pues bien, este programa precisa para hacer este tipo de análisis de una cuidadosa transcripción que sigue unas convenciones muy bien definidas por el proyecto CHILDES. Aquí tenéis un ejemplo del aspecto que tiene una transcripción: *JDC: vale, y hablas otros idiomas? *S07: sí, inglés. *JDC: sólo inglés. *S07: sólo@g inglés@g. *JDC: vale, perfecto. *JDC: y, dime, ¿tienes una familia grande o [>]? *S07: no [<]! *S07: pequeña. *S07: &eh mi familia está compuesta por tres miembros : mis padres y yo, única hija de mis padres (.) y +... Una vez realizada la transcripción, se puede volcar en el programa CLAN, que crea un archivo .cha (basta con copiar de Word, pegar en CLAN y guardar el documento como .cha). Este archivo vendría a ser un documento de texto con un formato especial con el que CLAN puede hacer los análisis estadísticos que le solicitemos. Si estáis interesados en saber más sobre el asunto, podéis investigar en estos vínculos: http://www.splloc.soton.ac.uk/ http://childes.psy.cmu.edu/manuals/CLAN.pdf http://childes.psy.cmu.edu/manuals/CHAT.pdf Escogimos seguir el ejemplo del corpus Splloc porque nos pareció el más completo y porque pone a disposición de todos un programa de análisis lingüístico (CLAN) y unas convenciones de transcripción claras y utilizables (CHILDES) con ese programa, que además parecen tener una amplia aceptación internacional. Por último, si alguno de vosotros quisiera colaborar con la elaboración del corpus, os sugiero que os pongáis en contacto contacto con los responsables del proyecto en Belgrado. Una forma de colaborar sería ayudando en la transcripción de las entrevistas. Si tenéis experiencia en ello, serías de gran ayuda. En cuanto una colaboración para ampliar el corpus a estudiantes de otras lenguas maternas -todos nuestros informantes son serbios- no sé cómo podría hacerse. Lo que os sugiero es que hagáis vuestros propio corpus siguiendo nuestro ejemplo. Podéis contar conmigo para cualquier tipo de consulta sobre cómo hacerlo. La fase de planificación del corpus es muy importante. También debéis tener en cuenta que es algo muy laborioso, especialmente en lo que se refiere a la transcripción de los textos, y que necesitáis contar con tiempo, ganas y un equipo de trabajo implicado. No olvidéis que el IC y la Universidad de Santiago van a empezar a elaborar un corpus de interlengua escrito y oral (CAES: Corpus de aprendices de español) con estudiantes de cuatro lenguas maternas: inglés, árabe, portugués y francés. A principios de año se empezará con la recogida de muestras escritas y cuando se termine con el corpus escrito se dará inicio a la recogida de muestras orales, que serán transcritas no sé aún con qué convenciones. Si tenéis más preguntas o queréis una respuesta individualizada, podéis escribirme un mensaje personal o un correo electrónico a joraguco@hotmail.com. ¡Disfrutad de lo que resta de Comprofes! Y perdonad la parrafada. No puedo separar los párrafos en estos comentarios.

responder

Enviado por PatriciaIreneMa... el Mar, 22/11/2011 - 09:24.

Me interesa contactar con ustedes

Muchas gracias, me parecen también interesantes los corpus de textos escritos, aunque, si es oral, también me gustaría saber cómo colaborar con ustedes y cómo poder acceder a su copus.

responder

Enviado por macarena_ortiz el Mar, 22/11/2011 - 01:19.

Muchas gracias por compartir

Muchas gracias por compartir vuestro trabajo con toda la comunidad. Espero que pronto podamos acceder a él. ¿Sería posible aportar alguna información sobre el programa utilizado para el corpus? Gracias.

responder

Enviado por masaonav el Mar, 22/11/2011 - 00:42.

Enhorabuena

Sería recomendable nos enviaseis información sobre el Corpus una vez que haya sido culminado y publicado a quienes manifestemos interés en él. Muchas gracias y... Por favor, ¡seguid investigando! ;)

responder

Enviado por roksanushka el Lun, 21/11/2011 - 22:20.

Gracias

Muchas gracias por la ponencia. Me gustaría ponerla en práctica en mi colegio. ¿Podría aconsejarme en qué punto es mejor empezar a hacerlo?

responder

Enviado por isabel el Lun, 21/11/2011 - 21:50.

Útil para investigar

Muchas gracias, Jorge, a ti y a todo el equipo. Gracias por la elaboración del corpus, tan útil para cualquier investigación, y por la descripción tan detallada. Nos va a servir a muchos para estudiar todos los niveles lingüísticos, estrategias, análisis de errores, etc. Un saludo especial a mi compañero de estudios Moisés Moreno.

responder

Enviado por myepezl el Lun, 21/11/2011 - 20:29.

¡Muchas gracias!

¡Muchas gracias por una ponencia tan interesante! Espero pronto poder leer las entrevistas. En mis clases para estudiantes de diversos orígenes (PUCE,Quito, Ecuador) voy creando un corpus de interlengua que sirva como base para nuevas actividades.

responder

Enviado por Abir Salaaoui el Lun, 21/11/2011 - 15:34.

Información sobre el corpus

Estimado colega: le agradezco su ponencia. ¿Nos podría mandar más informaciones sobre la evolución del proceso de recopilación de este corpus? ¿Nos podría aclarar más el propósito del uso de los archivos "punto-cla".? Reciba un cordial saludo, Abir

responder

Enviado por Luciana el Lun, 21/11/2011 - 15:32.

Gracias

Gracias por esta ponencia tan enriquecedora, también quiero tener en manos la publicación para poder enriquecerme con los detalles de la misma. Quiero dar las gracias también a los demás compañeros que están aportando más información a través de los comentarios.

responder

Enviado por jspuchades el Lun, 21/11/2011 - 15:18.

Muy interesante

Muy interesante, Jorge, un trabajo que seguro nos orienta hacia mejores metas.

responder

Enviado por mblancomartin el Lun, 21/11/2011 - 15:12.

Corpus oral

Me está pareciendo muy interesante el proyecto de Corpus Oral para poner en práctica en un centro educativo como proyecto entre los diferentes departamentos de lenguas: castellano, inglés y catalán (en el caso de mi CCAA, Baleares)

responder

Enviado por lilianazurita el Lun, 21/11/2011 - 15:04.

Un corpus es una recopilación

Un corpus es una recopilación extensa de textos (escritos, orales o de ambos tipos) recogidos con el fin de servir como muestra representativa de una lengua, como conjunto de datos lingüísticos reales que reflejen el uso de la lengua (o del tipo de lengua específico) del cual quieren ser representativos. Es a esta segunda acepción a la que se refiere el término lingüístico de corpus.

responder

Enviado por mgiraltl el Lun, 21/11/2011 - 14:56.

Muchas gracias

Muchas gracias por la ponencia, sin duda, una muestra de cómo se puede llevar a cabo la elaboración de un corpus de lengua oral. Estoy deseando poder ver la publicación en el CVC.

responder

Enviado por Carlota Nicolás... el Lun, 21/11/2011 - 13:43.

Más información

Estimado colega: Muchas gracias por tu ponencia, me interesa mucho pues podría utilizar vuestro trabajo para hacerlo en la interlengua de estudiantes italianos. No he entendido muy bien para que hacéis los archivos "punto cla" ni el uso de CLAN. Os agradezco que me mandéis más información de la situación actual del corpus. Yo he realizado un corpus oral para la enseñanza que quizás pueda interesaros, pues tiene muchos puntos en común como tipo de transcripción, si quieres tener información sobre él se llama C-Or-DiAL y puedes acceder y utilizarlo en su publicación completa, como base de datos. Esta es la dirección: http://lablita.dit.unifi.it/corpora/cordial/ Está en fase de última corrección editorial. Sé que sabréis perdonar los errores. Un saludo Carlota Nicolás

responder

Proyecto de creación de un corpus oral de interlengua

Comentarios

Los corpus

Un proyecto interesantísimo

Respuesta para todos

Me interesa contactar con ustedes

Muchas gracias por compartir

Enhorabuena

Gracias

Útil para investigar

¡Muchas gracias!

Información sobre el corpus

Gracias

Muy interesante

Corpus oral

Un corpus es una recopilación

Muchas gracias

Más información

Enviar comentarios

Facebook Comprofes

Patrocinadores