DOESTE: corpora para a investigação de escrita escolar
Corpora desenvolvimentais são coleções de textos, mono ou multimodais, produzidos por falantes/escritores em processo de desenvolvimento de sua primeira língua. Nessa definição, enquadra-se o DOESTE, um repositório de corpora de textos escritos por crianças e adolescentes em contexto regular de salas de aula do Brasil e de Portugal. Quanto ao português do Brasil, têm-se produções de 5° e 9° anos do Ensino Fundamental e 3° do Ensino Médio do sistema educacional, coletados em escolas públicas de cidades do Meio Oeste Potiguar. Quanto ao português europeu, há produções do 5° e 7° anos do Ensino Básico e 10° ano do Ensino Secundário do sistema educacional de Portugal, coletados em escolas públicas da cidade de Lisboa. Todos os textos foram produzidos pelos participantes sempre a partir das mesmas tarefas de escrita. Para a edição dos corpora e respectiva disponibilização online, utiliza-se a plataforma TEITOK, uma plataforma baseada na web que permite a aplicação de distintos níveis de marcação textual e anotação linguística. A partir de recursos da plataforma TEITOK, o DOESTE traz detalhado fornecimento de metadados, fundamentados no sistema de marcação TEI P5. Na sua fase atual, o DOESTE conta com aproximadamente 90k palavras, tokenizadas, lematizadas e anotadas com informação morfológica. A seção brasileira traz ainda o recurso de visualização dos manuscritos, com formas originais e normalizadas. O DOESTE pauta-se pelo robusto sistema de consulta CQP, que permite a visualização, individual ou combinada, de formas originais, de formas normalizadas, de classes de palavras e de lemas, o que se pode combinar ainda com a consulta por metadados. Para a coleta de textos que constituem o DOESTE, solicitou-se autorização, no Brasil, do Comitê de Ética em Pesquisa (parecer 2.716.871), e, em Portugal, à Direção-Geral de Inovação e de Desenvolvimento Curricular (inquérito 0260700001), tendo sido, em ambos os contextos, aprovada sem óbices éticos de qualquer natureza. A existência de corpora desenvolvimentais, como os que se apresentam no DOESTE, contribui para o fortalecimento da área de investigação do desenvolvimento linguístico em idade escolar, que tem implicações diretas no ensino de línguas, já que se considera que o desenvolvimento não é apenas uma trajetória de acúmulo de novas expressões linguísticas, mas sim um movimento de constante reorganização da língua, em que formas já conhecidas ganham novas funções de uso e, concomitantemente, funções já compreendidas passam a realizar-se com novas formas.