Projeto

Screen Shot 2013-05-10 at 1.44.57 PMEdições Filológicas na Brasiliana Digital:
Construção de um corpus de informações ligadas

Maria Clara Paixão de Sousa (Coord.)
Lucas Lopes Giron
Renato da Silva Fonseca

Universidade de São Paulo
Pró-Reitoria de Graduação
Programa Ensinar com Pesquisa


Resumo

Esta proposta de pesquisa insere-se no contexto maior dos projetos Brasiliana USP e Brasiliana Digital. Desde fins de 2008, o Grupo de Pesquisas Língua Brasiliana veio somar-se às iniciativas da Brasiliana USP, investigando caminhos para revelar e preparar o potencial dos textos do Acervo como fonte da língua e sobre a língua no Brasil – uma área para a qual este material naturalmente se vocaciona. O grupo inicial, coordenado pela proponente do presente projeto, foi formado por um pesquisador doutorando da área de lingüística computacional; uma pesquisadora mestranda da área de lingüística histórica; e uma pesquisadora graduanda em letras, bolsista de Iniciação Científica do CNPq . Temos colaborado com o grupo maior da Brasiliana USP em pesquisas experimentais iniciais junto ao Laboratório Brasiliana, inaugurado no início de 2009 junto ao canteiro de obras do edifício em construção.

Nosso objetivo de longo prazo é desenvolver instrumentos para pesquisas lingüísticas com base no acervo, por meio da prospecção de materiais de interesse e do desenvolvimento e aplicação de métodos de preparação editorial e de instrumentação computacional para extração automática de informação dos textos mais antigos. Esperamos com isso fundar os alicerces para a exploração do acervo Brasiliana USPpor estudiosos da história da língua, bem como formar as bases humanas, tecnológicas e materiais para o aproveitamento futuro do acervo pela comunidade de pesquisa. A presente proposta de pesquisa pretende reunir alunos da graduação em letras em torno do desafio inicial de preparar edições filológicas em meio digital que permitam o tratamento computacional dos textos mais antigos do acervo para essas futuras pesquisas.  A pesquisa aproveitará e ampliará os resultados colhidos por projetos anteriores, realizados em 2010 e 2011