Proyecto de creación de un corpus oral de interlengua


Ponentes
  • Jorge
    Agulló Covés
    Instituto Cervantes de Brasilia
    BRASIL
Resumen

Para investigar los procesos de adquisición del español como lengua extranjera es necesario contar con datos que se puedan analizar de una forma fiable y significativa. De esta forma obtendremos información crítica para mejorar nuestras metodologías de enseñanza.

Con tal objetivo, un grupo de profesores del IC de Belgrado, nos hemos
propuesto elaborar un corpus oral de interlengua, entrevistando a aprendices de origen exclusivamente serbio, los cuales serán posteriormente clasificados en niveles de dominio de la lengua. Estas entrevistas serán transcritas y publicadas en la red para que estén a disposición de la comunidad ELE.

En la ponencia se explicarán los detalles de este corpus, cuya elaboración ya se ha puesto en marcha.

Ver vídeo-resumen

Comentarios

Los corpus

Gracias, compañero, por esta ponencia, ha sido de gran ayuda identificar y conocer los corpus.

Un proyecto interesantísimo

Solo proyectos así justifican a los equipos docentes en su vertiente institucional. Lo demás, ya lo sabemos.

Respuesta para todos

Estimados compañeros, ante todo muchas gracias por vuestros comentarios y preguntas, a los que me dispongo a responder ahora. Me gustaría explicaros que la videoconferencia fue grabada y enviada hace ya unos meses y que en este periodo han ocurrido varias cosas que han retrasado la elaboración y publicación del corpus. Les pido paciencia. Yo ya no estoy en Belgrado, de manera que ya no soy el responsable del mismo. Pueden ustedes ponerse en contacto con Guillermo Menéndez (prof2bel@cervantes.es) y con Sandra Rivas (acbel@cervantes.es) para más detalles sobre el punto en que se encuentra el proyecto. Es más que probable que el corpus no se publique finalmente en el CVC, pero la intención es publicarlo de todos modos en otro lugar. El corpus no está diseñado tanto para su uso en clase sino para la investigación de la interlengua, es decir, de los procesos de adquisición del español como una segunda lengua. Yo no sé muy bien qué utilidad podría tener en la clase este tipo de muestras. Pensad que los informantes son estudiantes serbios de español, con lo que su constructo no es precisamente un modelo de lengua... Los corpus con hablantes nativos, como el C-Or-DiAL del que nos habla Carlota, son mucho más adecuado para ello. De todas formas, agradecería que si alguno de vosotros tuviera alguna idea de cómo usar un corpus de interlengua como material didáctico, la compartiera con los demás. Paso ahora al tema de los .cha y el programa CLAN. ".cha" es la extensión de los documentos que crea y con los que trabaja el programa CLAN. Este es un programa de análisis lingüístico, que permite la localización y contabilización estadística de todo tipo de elementos y fenómenos lingüísticos que hayan sido debidamente marcados en el corpus. Por ejemplo, se puede con él muy fácilmente contabilizar el número de apariciones de una palabra, digamos por ejemplo la aparición de "abrir" en los informantes de nivel A2 y compararlo con su frecuencia en otro nivel. Se pueden, por ejemplo, hacer estadísticas por niveles de frecuencia de errores morfológicos o de uso con el pretérito imperfecto, siempre y cuando estos hayan sido marcados previamente. Pues bien, este programa precisa para hacer este tipo de análisis de una cuidadosa transcripción que sigue unas convenciones muy bien definidas por el proyecto CHILDES. Aquí tenéis un ejemplo del aspecto que tiene una transcripción: *JDC: vale, y hablas otros idiomas? *S07: sí, inglés. *JDC: sólo inglés. *S07: sólo@g inglés@g. *JDC: vale, perfecto. *JDC: y, dime, ¿tienes una familia grande o [>]? *S07: no [<]! *S07: pequeña. *S07: &eh mi familia está compuesta por tres miembros : mis padres y yo, única hija de mis padres (.) y +... Una vez realizada la transcripción, se puede volcar en el programa CLAN, que crea un archivo .cha (basta con copiar de Word, pegar en CLAN y guardar el documento como .cha). Este archivo vendría a ser un documento de texto con un formato especial con el que CLAN puede hacer los análisis estadísticos que le solicitemos. Si estáis interesados en saber más sobre el asunto, podéis investigar en estos vínculos: http://www.splloc.soton.ac.uk/ http://childes.psy.cmu.edu/manuals/CLAN.pdf http://childes.psy.cmu.edu/manuals/CHAT.pdf Escogimos seguir el ejemplo del corpus Splloc porque nos pareció el más completo y porque pone a disposición de todos un programa de análisis lingüístico (CLAN) y unas convenciones de transcripción claras y utilizables (CHILDES) con ese programa, que además parecen tener una amplia aceptación internacional. Por último, si alguno de vosotros quisiera colaborar con la elaboración del corpus, os sugiero que os pongáis en contacto contacto con los responsables del proyecto en Belgrado. Una forma de colaborar sería ayudando en la transcripción de las entrevistas. Si tenéis experiencia en ello, serías de gran ayuda. En cuanto una colaboración para ampliar el corpus a estudiantes de otras lenguas maternas -todos nuestros informantes son serbios- no sé cómo podría hacerse. Lo que os sugiero es que hagáis vuestros propio corpus siguiendo nuestro ejemplo. Podéis contar conmigo para cualquier tipo de consulta sobre cómo hacerlo. La fase de planificación del corpus es muy importante. También debéis tener en cuenta que es algo muy laborioso, especialmente en lo que se refiere a la transcripción de los textos, y que necesitáis contar con tiempo, ganas y un equipo de trabajo implicado. No olvidéis que el IC y la Universidad de Santiago van a empezar a elaborar un corpus de interlengua escrito y oral (CAES: Corpus de aprendices de español) con estudiantes de cuatro lenguas maternas: inglés, árabe, portugués y francés. A principios de año se empezará con la recogida de muestras escritas y cuando se termine con el corpus escrito se dará inicio a la recogida de muestras orales, que serán transcritas no sé aún con qué convenciones. Si tenéis más preguntas o queréis una respuesta individualizada, podéis escribirme un mensaje personal o un correo electrónico a joraguco@hotmail.com. ¡Disfrutad de lo que resta de Comprofes! Y perdonad la parrafada. No puedo separar los párrafos en estos comentarios.

Me interesa contactar con ustedes

Muchas gracias, me parecen también interesantes los corpus de textos escritos, aunque, si es oral, también me gustaría saber cómo colaborar con ustedes y cómo poder acceder a su copus.

Muchas gracias por compartir

Muchas gracias por compartir vuestro trabajo con toda la comunidad. Espero que pronto podamos acceder a él. ¿Sería posible aportar alguna información sobre el programa utilizado para el corpus? Gracias.

Enhorabuena

Sería recomendable nos enviaseis información sobre el Corpus una vez que haya sido culminado y publicado a quienes manifestemos interés en él. Muchas gracias y... Por favor, ¡seguid investigando! ;)

Gracias

Muchas gracias por la ponencia. Me gustaría ponerla en práctica en mi colegio. ¿Podría aconsejarme en qué punto es mejor empezar a hacerlo?

Útil para investigar

Muchas gracias, Jorge, a ti y a todo el equipo. Gracias por la elaboración del corpus, tan útil para cualquier investigación, y por la descripción tan detallada. Nos va a servir a muchos para estudiar todos los niveles lingüísticos, estrategias, análisis de errores, etc. Un saludo especial a mi compañero de estudios Moisés Moreno.

¡Muchas gracias!

¡Muchas gracias por una ponencia tan interesante! Espero pronto poder leer las entrevistas. En mis clases para estudiantes de diversos orígenes (PUCE,Quito, Ecuador) voy creando un corpus de interlengua que sirva como base para nuevas actividades.

Información sobre el corpus

Estimado colega: le agradezco su ponencia. ¿Nos podría mandar más informaciones sobre la evolución del proceso de recopilación de este corpus? ¿Nos podría aclarar más el propósito del uso de los archivos "punto-cla".? Reciba un cordial saludo, Abir

Gracias

Gracias por esta ponencia tan enriquecedora, también quiero tener en manos la publicación para poder enriquecerme con los detalles de la misma. Quiero dar las gracias también a los demás compañeros que están aportando más información a través de los comentarios.

Muy interesante

Muy interesante, Jorge, un trabajo que seguro nos orienta hacia mejores metas.

Corpus oral

Me está pareciendo muy interesante el proyecto de Corpus Oral para poner en práctica en un centro educativo como proyecto entre los diferentes departamentos de lenguas: castellano, inglés y catalán (en el caso de mi CCAA, Baleares)

Un corpus es una recopilación

Un corpus es una recopilación extensa de textos (escritos, orales o de ambos tipos) recogidos con el fin de servir como muestra representativa de una lengua, como conjunto de datos lingüísticos reales que reflejen el uso de la lengua (o del tipo de lengua específico) del cual quieren ser representativos. Es a esta segunda acepción a la que se refiere el término lingüístico de corpus.

Muchas gracias

Muchas gracias por la ponencia, sin duda, una muestra de cómo se puede llevar a cabo la elaboración de un corpus de lengua oral. Estoy deseando poder ver la publicación en el CVC.

Más información

Estimado colega: Muchas gracias por tu ponencia, me interesa mucho pues podría utilizar vuestro trabajo para hacerlo en la interlengua de estudiantes italianos. No he entendido muy bien para que hacéis los archivos "punto cla" ni el uso de CLAN. Os agradezco que me mandéis más información de la situación actual del corpus. Yo he realizado un corpus oral para la enseñanza que quizás pueda interesaros, pues tiene muchos puntos en común como tipo de transcripción, si quieres tener información sobre él se llama C-Or-DiAL y puedes acceder y utilizarlo en su publicación completa, como base de datos. Esta es la dirección: http://lablita.dit.unifi.it/corpora/cordial/ Está en fase de última corrección editorial. Sé que sabréis perdonar los errores. Un saludo Carlota Nicolás

Enviar comentarios

 
  • Las direcciones de las páginas web y las de correo se convierten en enlaces automáticamente.
  • Images can be added to this post.

Más información sobre opciones de formato