CLEC - Colombian Learner English Corpus: first learner corpus of written production in English online in Colombia: CLEC - Corpus Colombiano de Aprendices de Inglés: primer corpus de producción escrita de aprendices de inglés en Colombia disponible en línea

Authors

María Victoria Pardo Rodríguez
Universidad de Antioquia
Antonio Jesús Tamayo Herrera
Instituto Politécnico Nacional

Synopsis

Abstract: This article aims to introduce CLEC’s web application (Colombian Learner English Corpus) to the research community. This application was created to search for information within a learner corpus labeled with error tags to add, modify and eliminate data. After having the corpus collected and tagged, it was necessary to create a tool that systematically searches for information within the labeled data.
The compilation of the learner corpus followed the guidelines of the Computational Corpus Linguistics (McEnery & Hardie, 2011) and the parameters of learner corpus Granger (2002), Gilquin (2015). The result is a web app designed to seek error tags within a context that can be easily revised and expanded through the system administrator. This corpus is available online, and it is open to any researcher who wants to consult it or contribute with data to enhance the corpus.
Resumen: Este artículo tiene como objetivo presentar la aplicación web de CLEC (Colombian Learner English Corpus) a la comunidad investigadora. Esta aplicación fue creada para buscar información dentro de un corpus de aprendices etiquetado con etiquetas de error para agregar, modificar y eliminar datos. Luego de haber recolectado y etiquetado el corpus, fue necesario crear una herramienta que hiciera búsquedas sistemáticas de información dentro de los datos etiquetados. La compilación del corpus de aprendices siguió las pautas de la Lingüística de Corpus Computacional (McEnery & Hardie, 2011) y los parámetros de los corpus de los aprendices Granger (2002), Gilquin (2015). El resultado es una aplicación web diseñada para buscar etiquetas de error dentro de un contexto que se puede revisar y expandir fácilmente a través del administrador del sistema. Este corpus está disponible en línea y está abierto a cualquier investigador que quiera consultarlo o que quiera aportar nuevos datos para aumentar el corpus.

Downloads

Published

September 10, 2023

Categories