EL CORPUS CORALSE
El corpus CORALSE será un conjunto de datos lingüísticos reales almacenados en un medio electrónico y reunidos con el fin último de estudiar la lengua de signos española. Los datos son muestras de lengua visual en formato de vídeo transcritas y etiquetadas para facilitar búsquedas complejas dentro del corpus.
Este proyecto está financiado por el Ministerio de Economía, Industria y Competitividad y se enmarca en el Programa Estatal de Fomento de la Investigación Científica y Técnica de Excelencia.
FINALIDAD
El objetivo del corpus es recoger muestras de signantes hablantes de LSE con el objetivo de recoger su lengua sabiendo que una lengua es un instrumento cambiante y que este proyecto nos permitirá ofrecer un testimonio lingüístico, reflejar las variantes diatópicas y generacionales de la LSE y ofrecer un material de investigación y de aplicación a investigadores, intérpretes, profesores, etc.
Esperamos que este corpus sirva también para completar la necesaria descripción lingüística de la lengua de signos española, imprescindible para la educación de los niños sordos y para el trabajo de los intérpretes y los docentes de las lenguas signadas.
HISTORIA
El proyecto del corpus CORALSE comenzó en el año 2013.
En una primera fase determinamos el corpus que queremos hacer, establecimos los límites geográficos, los criterios de anotación, los criterios para la selección de informantes, elaboramos la ficha de informantes + protocolo ético (recogida, el procesamiento, el almacenamiento y la distribución de los datos registrados) , determinamos los materiales de elicitación necesarios, seleccionamos y formamos a los moderadores de las grabaciones entrevistadores, seleccionamos a los primeros informantes y comenzamos las grabaciones.
En esta segunda fase continuamos completando el mapa de grabaciones y comenzamos a anotar las muestras ya grabadas.
OBJETIVOS
1. Documentación
Documentar el estado actual de la LSE mediante una muestra amplia y representativa de diferentes tipos de discurso signado y de diferentes áreas. Este trabajo se apoyará en la labor ya hecha en estos años de edición en LS y subtitulación de textos científicos y textos relevantes para la comunidad sorda.
2. Facilitación
Hacer una anotación básica y descriptiva y poner en línea parte del corpus como material accesible que pueda ser utilizado con finalidades de investigación, educativas o de consulta por parte de los usuarios.
3. Investigación
Ofrecer una herramienta útil para la investigación sincrónica y diacrónica tanto teórica —que nos permita conocer mejor la gramática y el léxico de la LSE—, como aplicada
4. Normalización
Contribuir al proceso de normalización de la LSE, tanto desde el punto de vista lingüístico como de cara al establecimiento de unos criterios metodológicos compartidos, fijando unas convenciones de anotación y transcripción.
IMPACTO
Un corpus lingüístico es una herramienta fundamental para avanzar en el conocimiento lingüístico de cualquier lengua. En el caso de la lengua de signos española, lengua minoritaria, de una comunidad con un patrimonio lingüístico y cultural específico, la elaboración de un primer corpus de referencia y anotado de todo el estado español permitirá en primer lugar garantizar la descripción y el análisis de la lengua de manera exhaustiva, además de convertirse en una condición indispensable para afrontar acciones normalizadoras que sirvan para conformar una visión global de la lengua y de su comunidad de hablante.
La investigación de las lenguas de señas no solo es beneficiosa desde el punto de vista de la adquisición de conocimiento sobre el lenguaje y las lenguas (faceta que comparte con todas las investigaciones en el ámbito de la lingüística), sino que tiene también implicaciones en la mejora de la calidad de vida de las personas sordas, tanto en ámbitos como la educación o la mediación lingüística como en el terreno del conocimiento de lenguas y culturas diferentes en contextos multiculturales y plurilingües.