Projeto

Edições filológicas e processamento automático de textos na Brasiliana Digital

Maria Clara Paixão de Sousa (Coord.)
Márcia de Aparecida Santos Mendes
Leila Rosa de Oliveira
Lucas Lopes Giron

Universidade de São Paulo
Pró-Reitoria de Graduação
Programa Ensinar com Pesquisa


Resumo

Esta proposta de pesquisa insere-se no contexto maior dos projetos Brasiliana USP e Brasiliana Digital. Desde fins de 2008, o Grupo de Pesquisas Língua Brasiliana veio somar-se às iniciativas da Brasiliana USP, investigando caminhos para revelar e preparar o potencial dos textos do Acervo como fonte da língua e sobre a língua no Brasil – uma área para a qual este material naturalmente se vocaciona. O grupo inicial, coordenado pela proponente do presente projeto, foi formado por um pesquisador doutorando da área de lingüística computacional; uma pesquisadora mestranda da área de lingüística histórica; e uma pesquisadora graduanda em letras, bolsista de Iniciação Científica do CNPq . Temos colaborado com o grupo maior da Brasiliana USP em pesquisas experimentais iniciais junto ao Laboratório Brasiliana, inaugurado no início de 2009 junto ao canteiro de obras do edifício em construção.

Nosso objetivo de longo prazo é desenvolver instrumentos para pesquisas lingüísticas com base no acervo, por meio da prospecção de materiais de interesse e do desenvolvimento e aplicação de métodos de preparação editorial e de instrumentação computacional para extração automática de informação dos textos mais antigos. Esperamos com isso fundar os alicerces para a exploração do acervo Brasiliana USPpor estudiosos da história da língua, bem como formar as bases humanas, tecnológicas e materiais para o aproveitamento futuro do acervo pela comunidade de pesquisa. A presente proposta de pesquisa pretende reunir alunos da graduação em letras em torno do desafio inicial de preparar edições filológicas em meio digital que permitam o tratamento computacional dos textos mais antigos do acervo para essas futuras pesquisas.