
O Grupo de Pesquisas Humanidades Digitais é formado por pesquisadores interessados em explorar e interrogar a produção, a organização e a difusão da informação no meio digital.
Estamos construindo nossas interrogações como ação crítica e criativa. Incluímos em nosso horizonte duas perspectivas integradas: a reflexão teórica sobre as questões colocadas pelos novos meios de difusão da informação para o problema histórico e epistemológico da construção do conhecimento, e a experimentação em torno de novas formas de acesso, organização e processamento da informação.
Caminhos dos nossos primeiros experimentos
O elo inicial entre os pesquisadores deste grupo foi o desafio do desenvolvimento de um repositório digital a partir de um acervo de obras raras, no contexto do projeto Brasiliana USP. Entre 2009 e 2011, conduzimos nesse âmbito experimentos-piloto voltados para a construção de metodologias de descrição de documentos e para o desenvolvimento de soluções computacionais para o processamento de textos. Esses primeiros experimentos privilegiaram as crônicas e relatos de viagens presentes no acervo, e seus rumos foram moldados em torno das especificidades deste núcleo documental – em especial, suas características linguísticas e sua riqueza iconográfica.

Nossos primeiros projetos foram realizados na área de Filologia e linguística computacional, com o objetivo de aperfeiçoar o reconhecimento automático de caracteres nas obras impressas nos séculos XV, XVII e XVIII. Conduzimos experimentos com programas de OCR, e elaboramos edições filológicas em formato eletrônico para esses documentos, incluindo, em textos selecionados, a anotação de entidades nomeadas – personagens históricos, localidades e nomenclatura científica. Esse trabalho permitiria a ampliação do acesso aos textos por parte de mecanismos de buscas simples e a construção de um sistema de buscas semânticas.

Em 2011, elegemos um eixo temático de grande relevância para o trabalho com este núcleo documental: a Iconografia. Dois projetos na área de Descrição de documentos passaram a se dedicar à uniformização do catálogo de iconografia do acervo Brasiliana USP, pesquisando as informações específicas relativas às imagens digitais de gravuras e pinturas mais antigas. Esse trabalho oferecerá aos usuários do acervo uma uma melhor contextualização do material iconográfico, e ampliará o acesso ao catálogo de imagens por parte de mecanismos de busca.

Demos início ainda a projetos na área de Tradução, inicialmente ligados também a esse tema geral da iconografia, focalizados na tradução das descrições das imagens correspondentes a documentos impressos em línguas estrangeiras (no momento, alemão, francês e latim) presentes no acervo. Esse trabalho permitirá aos usuários do acervo um melhor acesso aos documentos produzidos nessas línguas, evidenciando a riqueza iconográfica envolvida na descrição do Brasil feita por viajantes, naturalistas e pensadores estrangeiros.
Os nossos primeiros experimentos compartilharam, assim, o objetivo de ampliar o acesso às obras do acervo, tanto pelo aprofundamento das informações a serem catalogadas, como pelo aperfeiçoamento das ferramentas automáticas de acesso ao catálogo e aos textos.
Com a consolidação do grupo, pretendemos estender esses experimentos-piloto para outros núcleos documentais, além de unir os resultados do trabalho de catalogação aos resultados dos experimentos com processamento de textos. A ampliação dos nossos experimentos poderá resultar na produção de novas metodologias e produtos no campo das ciências da informação e da ciência da computação, e nos aproximará de um projeto que acalentamos para o futuro: o desenvolvimento de uma biblioteca digital com pleno funcionamento remissivo, incluindo metadados, imagens e texto num mesmo sistema de informações ligadas.
A natureza desses novos experimentos e a forma que daremos a esse sistema de informações ligadas dependerão, fundamentalmente, dos desafios colocados pelas especificidades dos núcleos documentais com que viermos a trabalhar. No caso do acervo Brasiliana USP, os documentos se caracterizam justamente por sua grande diversidade de formas, gêneros e períodos – incluindo, por exemplo, obras de referência (dicionários históricos, catálogos biográficos, etc.), periódicos científicos e obras literárias, em forma de documentos impressos, manuscritos e gravuras, produzidos originalmente entre os séculos XVI e XX.
Esta diversidade e a especificidade do trabalho tecnológico que ela demanda se revelam com muita clareza ao olhar do pesquisador preocupado com a reflexão aprofundada e crítica que é característica das humanidades, como tratamos a seguir.
Caminhos das nossas primeiras reflexões
O trabalho experimental que estamos realizando junto ao acervo pressupõe a integração de múltiplas perspectivas de pesquisa: fazem-se necessários, entre outros, os olhares do especialista em computação, biblioteconomia, história, linguística e tradução. Nosso grupo é composto por pesquisadores de todas essas áreas mencionadas, mas seu caráter fundante é o de um grupo ligado às humanidades – e esta contingência marca nossas motivações, nossos procedimentos de trabalho e nossas perspectivas de pesquisa.
Fundamentalmente, nosso interesse pelas tecnologias digitais é um interesse de humanistas.
Encontramos no campo das Humanidades Digitais o espaço que pode abrigar essa abordagem do mundo das tecnologias contemporâneas da informação – uma abordagem que envolve o olhar crítico, o impulso experimental, e o compromisso político.
Essa confluência de perspectivas, de fato, movimentou nosso interesse em discutir o problema mais geral da produção, organização e difusão e do conhecimento nas perspectivas histórica, epistemológica e filosófica. Assim, nestes primeiros anos, estivemos reunidos em sessões de leitura e debate em torno da História do conhecimento e da História da ciência, e realizamos sete seminários internos, nos quais as pesquisas dos participantes nas áreas de linguística, filologia, história da escrita, história da ciência – entre outras – foram apresentadas e discutidas. O principal resultado desse processo foi, justamente, a instauração deste grupo de pesquisas permanente.
O grupo, como fica evidenciado nesse breve histórico de sua formação, não parte de fundamentos teóricos definidos – ao contrário, tomamos esta definição como um dos nossos primeiros pontos importantes de discussão. O que temos como horizonte comum, de partida, é uma perspectiva unívoca no que toca à ética fundamental e aos impactos sociais das nossas atividades de pesquisa e de seus produtos mais palpáveis, tais sejam, aqueles ligados ao potencial de desenvolvimento tecnológico dos nossos experimentos.
Nesse campo, assumimos um compromisso inflexível com as tecnologias transferíveis e com o software livre.
Este compromisso se coaduna com a nossa dedicação à ampliação e democratização dos processos de difusão do conhecimento – um aspecto que se evidencia, de fato, nos nossos próprios experimentos tecnológicos, todos fortemente marcados pelo objetivo de ampliar as possibilidades de acesso à informação encerrada num acervo digital de obras raras de grande importância para a compreensão da história política, social, cultural e científica do Brasil. A dedicação do grupo ao tema da democratização do acesso à informação, a um tempo, é motivada e motiva o nosso objetivo mais amplo, que é formar um corpo consistente de reflexão crítica sobre a difusão do conhecimento no meio digital – sua produção, sua circulação, seus sentidos.