Estimados compañeros, ante todo muchas gracias por vuestros comentarios y preguntas, a los que me dispongo a responder ahora.
Me gustaría explicaros que la videoconferencia fue grabada y enviada hace ya unos meses y que en este periodo han ocurrido varias cosas que han retrasado la elaboración y publicación del corpus. Les pido paciencia. Yo ya no estoy en Belgrado, de manera que ya no soy el responsable del mismo. Pueden ustedes ponerse en contacto con Guillermo Menéndez (prof2bel@cervantes.es) y con Sandra Rivas (acbel@cervantes.es) para más detalles sobre el punto en que se encuentra el proyecto. Es más que probable que el corpus no se publique finalmente en el CVC, pero la intención es publicarlo de todos modos en otro lugar.
El corpus no está diseñado tanto para su uso en clase sino para la investigación de la interlengua, es decir, de los procesos de adquisición del español como una segunda lengua. Yo no sé muy bien qué utilidad podría tener en la clase este tipo de muestras. Pensad que los informantes son estudiantes serbios de español, con lo que su constructo no es precisamente un modelo de lengua... Los corpus con hablantes nativos, como el C-Or-DiAL del que nos habla Carlota, son mucho más adecuado para ello. De todas formas, agradecería que si alguno de vosotros tuviera alguna idea de cómo usar un corpus de interlengua como material didáctico, la compartiera con los demás.
Paso ahora al tema de los .cha y el programa CLAN. ".cha" es la extensión de los documentos que crea y con los que trabaja el programa CLAN. Este es un programa de análisis lingüístico, que permite la localización y contabilización estadística de todo tipo de elementos y fenómenos lingüísticos que hayan sido debidamente marcados en el corpus. Por ejemplo, se puede con él muy fácilmente contabilizar el número de apariciones de una palabra, digamos por ejemplo la aparición de "abrir" en los informantes de nivel A2 y compararlo con su frecuencia en otro nivel. Se pueden, por ejemplo, hacer estadísticas por niveles de frecuencia de errores morfológicos o de uso con el pretérito imperfecto, siempre y cuando estos hayan sido marcados previamente.
Pues bien, este programa precisa para hacer este tipo de análisis de una cuidadosa transcripción que sigue unas convenciones muy bien definidas por el proyecto CHILDES. Aquí tenéis un ejemplo del aspecto que tiene una transcripción:
*JDC: vale, y hablas otros idiomas?
*S07: sí, inglés.
*JDC: sólo inglés.
*S07: sólo@g inglés@g.
*JDC: vale, perfecto.
*JDC: y, dime, ¿tienes una familia grande o [>]?
*S07: no [<]!
*S07: pequeña.
*S07: &eh mi familia está compuesta por tres miembros : mis padres y yo, única hija de mis padres (.) y +...
Una vez realizada la transcripción, se puede volcar en el programa CLAN, que crea un archivo .cha (basta con copiar de Word, pegar en CLAN y guardar el documento como .cha). Este archivo vendría a ser un documento de texto con un formato especial con el que CLAN puede hacer los análisis estadísticos que le solicitemos. Si estáis interesados en saber más sobre el asunto, podéis investigar en estos vínculos:
http://www.splloc.soton.ac.uk/http://childes.psy.cmu.edu/manuals/CLAN.pdfhttp://childes.psy.cmu.edu/manuals/CHAT.pdf
Escogimos seguir el ejemplo del corpus Splloc porque nos pareció el más completo y porque pone a disposición de todos un programa de análisis lingüístico (CLAN) y unas convenciones de transcripción claras y utilizables (CHILDES) con ese programa, que además parecen tener una amplia aceptación internacional.
Por último, si alguno de vosotros quisiera colaborar con la elaboración del corpus, os sugiero que os pongáis en contacto contacto con los responsables del proyecto en Belgrado. Una forma de colaborar sería ayudando en la transcripción de las entrevistas. Si tenéis experiencia en ello, serías de gran ayuda.
En cuanto una colaboración para ampliar el corpus a estudiantes de otras lenguas maternas -todos nuestros informantes son serbios- no sé cómo podría hacerse. Lo que os sugiero es que hagáis vuestros propio corpus siguiendo nuestro ejemplo. Podéis contar conmigo para cualquier tipo de consulta sobre cómo hacerlo. La fase de planificación del corpus es muy importante. También debéis tener en cuenta que es algo muy laborioso, especialmente en lo que se refiere a la transcripción de los textos, y que necesitáis contar con tiempo, ganas y un equipo de trabajo implicado.
No olvidéis que el IC y la Universidad de Santiago van a empezar a elaborar un corpus de interlengua escrito y oral (CAES: Corpus de aprendices de español) con estudiantes de cuatro lenguas maternas: inglés, árabe, portugués y francés. A principios de año se empezará con la recogida de muestras escritas y cuando se termine con el corpus escrito se dará inicio a la recogida de muestras orales, que serán transcritas no sé aún con qué convenciones.
Si tenéis más preguntas o queréis una respuesta individualizada, podéis escribirme un mensaje personal o un correo electrónico a joraguco@hotmail.com.
¡Disfrutad de lo que resta de Comprofes! Y perdonad la parrafada. No puedo separar los párrafos en estos comentarios.
Muchas gracias, me parecen también interesantes los corpus de textos escritos, aunque, si es oral, también me gustaría saber cómo colaborar con ustedes y cómo poder acceder a su copus.
Muchas gracias por compartir vuestro trabajo con toda la comunidad. Espero que pronto podamos acceder a él. ¿Sería posible aportar alguna información sobre el programa utilizado para el corpus?
Gracias.
Sería recomendable nos enviaseis información sobre el Corpus una vez que haya sido culminado y publicado a quienes manifestemos interés en él.
Muchas gracias y... Por favor, ¡seguid investigando!
;)
Muchas gracias, Jorge, a ti y a todo el equipo. Gracias por la elaboración del corpus, tan útil para cualquier investigación, y por la descripción tan detallada. Nos va a servir a muchos para estudiar todos los niveles lingüísticos, estrategias, análisis de errores, etc. Un saludo especial a mi compañero de estudios Moisés Moreno.
¡Muchas gracias por una ponencia tan interesante! Espero pronto poder leer las entrevistas. En mis clases para estudiantes de diversos orígenes (PUCE,Quito, Ecuador) voy creando un corpus de interlengua que sirva como base para nuevas actividades.
Estimado colega:
le agradezco su ponencia. ¿Nos podría mandar más informaciones sobre la evolución del proceso de recopilación de este corpus? ¿Nos podría aclarar más el propósito del uso de los archivos "punto-cla".?
Reciba un cordial saludo, Abir
Gracias por esta ponencia tan enriquecedora, también quiero tener en manos la publicación para poder enriquecerme con los detalles de la misma.
Quiero dar las gracias también a los demás compañeros que están aportando más información a través de los comentarios.
Me está pareciendo muy interesante el proyecto de Corpus Oral para poner en práctica en un centro educativo como proyecto entre los diferentes departamentos de lenguas: castellano, inglés y catalán (en el caso de mi CCAA, Baleares)
Un corpus es una recopilación extensa de textos (escritos, orales o de ambos tipos) recogidos con el fin de servir como muestra representativa de una lengua, como conjunto de datos lingüísticos reales que reflejen el uso de la lengua (o del tipo de lengua específico) del cual quieren ser representativos. Es a esta segunda acepción a la que se refiere el término lingüístico de corpus.
Muchas gracias por la ponencia, sin duda, una muestra de cómo se puede llevar a cabo la elaboración de un corpus de lengua oral. Estoy deseando poder ver la publicación en el CVC.
Estimado colega: Muchas gracias por tu ponencia, me interesa mucho pues podría utilizar vuestro trabajo para hacerlo en la interlengua de estudiantes italianos.
No he entendido muy bien para que hacéis los archivos "punto cla" ni el uso de CLAN.
Os agradezco que me mandéis más información de la situación actual del corpus.
Yo he realizado un corpus oral para la enseñanza que quizás pueda interesaros, pues tiene muchos puntos en común como tipo de transcripción, si quieres tener información sobre él se llama C-Or-DiAL y puedes acceder y utilizarlo en su publicación completa, como base de datos. Esta es la dirección:
http://lablita.dit.unifi.it/corpora/cordial/
Está en fase de última corrección editorial. Sé que sabréis perdonar los errores.
Un saludo
Carlota Nicolás
Comentarios
Los corpus
Un proyecto interesantísimo
Respuesta para todos
Estimados compañeros, ante todo muchas gracias por vuestros comentarios y preguntas, a los que me dispongo a responder ahora. Me gustaría explicaros que la videoconferencia fue grabada y enviada hace ya unos meses y que en este periodo han ocurrido varias cosas que han retrasado la elaboración y publicación del corpus. Les pido paciencia. Yo ya no estoy en Belgrado, de manera que ya no soy el responsable del mismo. Pueden ustedes ponerse en contacto con Guillermo Menéndez (prof2bel@cervantes.es) y con Sandra Rivas (acbel@cervantes.es) para más detalles sobre el punto en que se encuentra el proyecto. Es más que probable que el corpus no se publique finalmente en el CVC, pero la intención es publicarlo de todos modos en otro lugar. El corpus no está diseñado tanto para su uso en clase sino para la investigación de la interlengua, es decir, de los procesos de adquisición del español como una segunda lengua. Yo no sé muy bien qué utilidad podría tener en la clase este tipo de muestras. Pensad que los informantes son estudiantes serbios de español, con lo que su constructo no es precisamente un modelo de lengua... Los corpus con hablantes nativos, como el C-Or-DiAL del que nos habla Carlota, son mucho más adecuado para ello. De todas formas, agradecería que si alguno de vosotros tuviera alguna idea de cómo usar un corpus de interlengua como material didáctico, la compartiera con los demás. Paso ahora al tema de los .cha y el programa CLAN. ".cha" es la extensión de los documentos que crea y con los que trabaja el programa CLAN. Este es un programa de análisis lingüístico, que permite la localización y contabilización estadística de todo tipo de elementos y fenómenos lingüísticos que hayan sido debidamente marcados en el corpus. Por ejemplo, se puede con él muy fácilmente contabilizar el número de apariciones de una palabra, digamos por ejemplo la aparición de "abrir" en los informantes de nivel A2 y compararlo con su frecuencia en otro nivel. Se pueden, por ejemplo, hacer estadísticas por niveles de frecuencia de errores morfológicos o de uso con el pretérito imperfecto, siempre y cuando estos hayan sido marcados previamente. Pues bien, este programa precisa para hacer este tipo de análisis de una cuidadosa transcripción que sigue unas convenciones muy bien definidas por el proyecto CHILDES. Aquí tenéis un ejemplo del aspecto que tiene una transcripción: *JDC: vale, y hablas otros idiomas? *S07: sí, inglés. *JDC: sólo inglés. *S07: sólo@g inglés@g. *JDC: vale, perfecto. *JDC: y, dime, ¿tienes una familia grande oMe interesa contactar con ustedes
Muchas gracias por compartir
Muchas gracias por compartir vuestro trabajo con toda la comunidad. Espero que pronto podamos acceder a él. ¿Sería posible aportar alguna información sobre el programa utilizado para el corpus? Gracias.Enhorabuena
Gracias
Muchas gracias por la ponencia. Me gustaría ponerla en práctica en mi colegio. ¿Podría aconsejarme en qué punto es mejor empezar a hacerlo?Útil para investigar
¡Muchas gracias!
¡Muchas gracias por una ponencia tan interesante! Espero pronto poder leer las entrevistas. En mis clases para estudiantes de diversos orígenes (PUCE,Quito, Ecuador) voy creando un corpus de interlengua que sirva como base para nuevas actividades.Información sobre el corpus
Gracias
Gracias por esta ponencia tan enriquecedora, también quiero tener en manos la publicación para poder enriquecerme con los detalles de la misma. Quiero dar las gracias también a los demás compañeros que están aportando más información a través de los comentarios.Muy interesante
Corpus oral
Me está pareciendo muy interesante el proyecto de Corpus Oral para poner en práctica en un centro educativo como proyecto entre los diferentes departamentos de lenguas: castellano, inglés y catalán (en el caso de mi CCAA, Baleares)Un corpus es una recopilación
Muchas gracias
Más información
Enviar comentarios