Corpus TecEM: o processo de construção de um corpus de produções textuais em Língua Portuguesa elaboradas por alunos de Ensino Médio Integrado a cursos técnicos

LínguaTec

Endereço:
Rua General Osório, 348 - Centro
Bento Gonçalves / RS
95700086
Site: https://periodicos.ifrs.edu.br/index.php/LinguaTec/index
Telefone: (54) 3449-3300
ISSN: 25253425
Editor Chefe: Dra. Maísa Helena Brum
Início Publicação: 20/06/2016
Periodicidade: Semestral
Área de Estudo: Educação, Área de Estudo: Linguística, Letras e Artes

Corpus TecEM: o processo de construção de um corpus de produções textuais em Língua Portuguesa elaboradas por alunos de Ensino Médio Integrado a cursos técnicos

Ano: 2019 | Volume: 4 | Número: 1
Autores: M. M. Gil, J. F. Pinto, V. Gouvêa, B. C. Almeida, P. A. Santos, A. Weiand
Autor Correspondente: M. M. Gil | [email protected]

Palavras-chave: corpus de língua portuguesa, ensino de língua portuguesa, formação tecnológica

Resumos Cadastrados

Resumo Português:

O presente artigo visa a apresentar o processo de construção do Corpus TecEM, uma ferramenta que disponibiliza textos escritos por alunos de cursos técnicos integrados ao Ensino Médio em suas aulas de Língua Portuguesa. Para a obtenção deste objetivo geral, teve-se como objetivos específicos: (i) estabelecer os critérios para a organização dos dados linguísticos; (ii) organizar e rotular os textos do corpus de acordo com os critérios estabelecidos; e (iii) disponibilizar o corpus elaborado. A construção de um corpus com essas características se apresenta fundamental devido às potencialidades acadêmicas e ao desenvolvimento de práticas docentes que sua exploração pode embasar. Como base teórica, parte-se da compreensão da Linguística de Corpus como uma abordagem baseada em corpus, uma perspectiva para o estudo da linguagem.  Para tanto, foi necessário: (a) levantamento bibliográfico; (b) contato com professores de Língua Portuguesa de Institutos Federais e convite aos interessados em contribuir na coleta de textos; (c) coleta de textos escritos por alunos de cursos técnicos integrados ao Ensino Médio durante suas aulas de Língua Portuguesa; (d) compilação dos textos a partir dos critérios estabelecidos; (e) armazenamento do corpus TecEM em um banco de dados online, definindo sua estrutura de maneira alinhada aos critérios de compilação; (f) desenvolvimento e disponibilização da ferramenta. Em março de 2019, o Corpus TecEM possuía 327 textos (118,009 palavras) escritos por alunos dos IFs localizados no RS e mais textos já foram coletados a partir de abril do mesmo ano. Com a construção deste corpus, entende-se que foi disponibilizada à comunidade acadêmica uma base de dados rica e criteriosa para futuras pesquisas, contribuindo tanto para o desenvolvimento teórico quanto para a proposição de novas práticas de ensino de Língua Portuguesa, de modo geral, e em contextos de formação tecnológica, em particular.