Digitalização como tradução material: A tipografia líquida de ‘The Art of Google Books’

Tabelas que se contorcem, linhas de texto que ondulam como um rio ao longo da página, tipos que crescem e diminuem num balé entontecedor: essa é a beleza das imagens destacadas em The Art of Google Books. Ali, a artista plástica Krissy Wilson extrai, das “falhas técnicas” da digitalização do gigante Google, uma poesia: a poesia da quebra da opacidade pretendida pela representação digital.

http://theartofgooglebooks.tumblr.com
Página de “A Prognostication of Right Good Effect, Fructfully Augmented Contayninge Playne, Briefe, Pleasant, Chosen Rules”, 1555. Em The Art of Google Books, http://theartofgooglebooks.tumblr.com/ – 30/09/2013

É como se, ao longo de uma leitura que já se fazia confortável, subitamente, pelo encontro de uma dessas “falhas”, fossemos acordados do nosso sonho de estar lendo um livro renascentista sobre a previsão do tempo, e percebessemos por um breve instante, meio chocados, que estávamos apenas diante de uma representação do livro. Esse atordoamento provocado pela falha faz um corte no fluxo estável programado para a nossa fruição do objeto representado, e nos faz ver, através do corte, as entranhas do processo que tentou trazer aquele livro para a sala da nossa casa, percorrendo quilômetros de terra (e mar) e cinco séculos de tempo.

http://books.google.com.br/books?id=PXAaAQAAMAAJ
Página de “A Prognostication of Right Good Effect, Fructfully Augmented Contayninge Playne, Briefe, Pleasant, Chosen Rules”, 1555. Screenshot de http://books.google.com.br/books?id=PXAaAQAAMAAJ

As imagens destacadas pela artista entre as muitas falhas que podemos observar em páginas de livros escaneados nos remetem à delicada relação entre os objetos “digitalizados” e seus originais, sucitando a pergunta: o que estamos fazendo, afinal, quando digitalizamos livros impressos? A digitalização, mais que uma simples cópia, é uma representação, um processo de reprodução que envolve uma profunda transformação no objeto representado.

http://theartofgooglebooks.tumblr.com/
Página de “A Prognostication of Right Good Effect, Fructfully Augmented Contayninge Playne, Briefe, Pleasant, Chosen Rules”, 1555. Em The Art of Google Books, http://theartofgooglebooks.tumblr.com/ – 30/09/2013

O meio digital tem propriedades fundamentalmente distintas do meio a que pertenciam os objetos que se pretende representar, e na ponte entre um e outro meio reside a arte da representação pela digitalização. No campo da crítica textual, ainda não se formou um vocabulário técnico respeitável para lidarmos com essa nova forma de “cópia”. Eu mesma já propus o termo “Tradução Material” [i], sugerindo que a relação entre o objeto digital e seu original é semelhante à relação entre um texto traduzido e seu original. São e não são “o mesmo texto”: e a ilusão da similitude, quando obtida, é simplesmente a manifestação mais clara do bom resultado da representação – assim como, em um texto bem traduzido de uma língua para outra, o efeito da língua original se oblitera, foge à nossa percepção, pela boa arte do tradutor. Assim, nesses dois processos de tradução está em jogo a arte de produzir a ilusão da não-representação. Nesse sentido, quanto mais um livro digitalizado apresentar-se “igual” ao objeto impresso, maior terá sido o esforço da representação – mais perto se terá chegado da opacidade pretendida pela técnica.

Nesse sentido é que o olhar de Wilson em The Art of Google Books é singular. A artista enxergou, nas páginas distorcidas dos livros digitalizados, a brecha da “tradução manca”: aquele ponto de “erro” que nos revela o processo que quer operar na opacidade da perfeição técnica – a fábrica de representações se revelando transparente, como se revelaria um feixe de luz que se quisesse cobrir com um tecido fino demais.

http://theartofgooglebooks.tumblr.com
Página de “A Prognostication of Right Good Effect, Fructfully Augmented Contayninge Playne, Briefe, Pleasant, Chosen Rules”, 1555. Em The Art of Google Books, http://theartofgooglebooks.tumblr.com/ – 30/09/2013

Podemos ainda, é claro, ver a coleção de imagens reunida pela artista como um alerta sobre a baixa qualidade dos procedimentos adotados pela gigante corporativa Google em seu projeto de digitalização massificada e global (a própria artista reconhece que sua iniciativa pode ser abordada neste viés, em recente entrevista à coluna Art Beat).

Outros observadores da “arte das falhas” também incluem esse viés crítico. Destacaríamos, aqui, o fantástico “Google Hands“, de Benjamin Shaykin – livro inteiramente dedicado às imagens surreais e perturbadoras de mãos sobre páginas de livros digitalizados coletadas pelo artista.

http://www.newyorker.com/online/blogs/books/2013/12/the-art-of-google-book-scan.html
“Special Collection”, 2009. Benjamin Shaykin. Photo by the Library of the Printed Web. Disponível em http://www.newyorker.com/online/blogs/books/2013/12/the-art-of-google-book-scan.html

As imagens do livro de Shaykin parecem levar a um corte ainda mais violento que o das tabelas dançantes – pois, aqui, já não se trata simplesmente de uma distorção revelando o efeito da tradução material, mas sim da interferência brutal de um objeto externo ao livro, mostrando-nos, muito cruamente, o caráter de “fábrica de imagens” por trás do Google Books.

Segundo  esta ótima matéria na revista The New Yorker, já se pode falar em uma subcultura de colecionadores de “Google Hands”, artistas e observadores obcecados, como Shaykin, na reunião dessas imagens. As “Google Hands“, entretanto,  são apenas o lado mais visível dos efeitos da digitalização em massa sobre a qualidade do material digitalizado hoje disponível na rede mundial de computadores.

Temos, hoje, um volume inacreditável de livros à disposição para leitura, transmutados de seus suportes originais para dentro das telas dos nossos computadores pessoais. Os lados positivos desse processo nem precisam ser mencionados; mas, como saldo negativo, temos os problemas de qualidade que surgiram com o aumento no ritmo das digitalizações. A qualidade das imagens é apenas um deles (nem começaremos, aqui, a mencionar o problema da qualidade da catalogação dos livros).

The Art of Google Books, entretanto, consegue olhar esse universo com arte e delicadeza – é um álbum que vale a visita.

………………………………………

[i] PAIXÃO DE SOUSA, M. C. Humanidades Digitais: O digital e as novas formas de construção do conhecimento. Comunicação ao Seminário Internacional Sistemas de Informação e Acervos Digitais de Cultura. São Paulo, 12 de março de 2013. Gravado em vídeo – Canal da Secretaria de Políticas Culturais do Ministério da Cultura, 
http://youtu.be/m0s-iAfZPDE

Análise e visualização de redes: o Gephi

Modelo de visualização por algoritmo  (mais modelos em https://gephi.org/features)
Modelo de visualização em Gelphi por algoritmos múltiplos (mais em https://gephi.org/features)

O desenvolvimento de novas formas de visualização de informações tem sido uma das áreas mais ativas nas humanidades digitais. Já comentamos, aqui no blog, as técnicas de representação textual em nuvens de palavras. Mas entre os projetos voltados para a manipulação de dados históricos, espaciais e textuais, destacam-se os que fazem uso de ferramentas baseadas em grafos para a visualização de redes.

A ferramenta para manipulação de grafos mais utilizada tem sido o Gephi, um software livre colaborativo mantido por um consórcio sediado na França, com  inúmeras aplicações em áreas como as ciências biológicas ou a economia – aqui, comentamos sua utilização em projetos ligados à história e à análise textual.

Um dos primeiros projetos a fazer uso do Gephi para dados históricos é o mapeamento da República das Letras – Maping the Republic of Letters, sediado na Universidade de Stanford.

Cartografia de “Mapping the Republic of Letters” (visualização de conexões)

O projeto, que se dedica ao estudo da formação da rede de correspondências entre letrados dos séculos XVII e XVIII, criou o banco de dados Electronic Enlightenment, composto por milhares de cartas (de fato, 55.000 cartas, envolvendo 6.400 correspondentes); em 2009, em colaboração com cientistas da computação, foi lançada uma plataforma para a visualização da rede formada pela troca dessa correspondência, usando Gephi. Como destacam D. Chang e colegas no artigo Visualizing the Republic of Letters, a manipulação dos dados para sua representação visual fundada em grafos envolve questões metodológicas e epistemológicas importantes – dentre as quais se destacaria a pergunta sobre seus impactos sobre a perspectiva interpretativa dos próprios cientistas humanos. De que modo esses acadêmicos treinados e experientes na leitura vertical e aprofundada de documentos isolados darão sentido aos padrões formados pela junção, em rede, de grandes conjuntos de dados? –  ou, nas palavras dos autores: “How can humanities scholars trained in close reading of individual documents make sense of patterns in large sets of data?”

Uma pergunta que pode ser tomada como o avesso dessa é a que guia algumas das pesquisas realizadas pelo Laboratório de Estudos sobre Imagem e Cibercultura (Labic) dedicadas a compreender os sentidos que se formam pela relação remissiva entre os pequenos textos que circulam hoje nas chamadas redes sociais.

TodaRede
Cartografia do Labic – “Dilma nas redes sociais: o fim da bipolaridade política e o desejo de radicalizar mudanças”

Também através da visualização em Gephi, algumas das “cartografias” de redes sociais realizadas no laboratório têm mostrado como as redes se formam em torno de alguns “nós” principais, que propõem, disseminam e moldam a circulação dos sentidos – em especial, no caso dos textos publicados no Twitter em torno de assuntos e figuras políticas (veja-se, por exemplo, Dilma nas redes sociais: o fim da bipolaridade política e o desejo de radicalizar mudanças). Os estudos sobre as redes sociais realizados neste laboratório, ativo desde 2008 na Universidade Federal do Espírito Santo, são exemplo de uma linha cada vez mais intensa de estudos ao redor do mundo sobre a circulação dos sentidos nas redes sociais (em especial, no campo da política), muitos deles lançando mão de ferramentas para visualização de dados em grafos (veja-se uma lista extensa na própria wiki do Gephi).

Na área dos estudos textuais de um modo mais geral, as técnicas de visualização em grafos têm sido aplicadas sobretudo em estudos voltados para grandes volumes de textos – para um exemplo muito interessante, veja-se o artigo Identifying the Pathways for Meaning Circulation using Text Network Analysis, de Dmitry Paranyushkin.

Grafo em "Identifying the Pathways for Meaning Circulation using Text Network Analysis", de Dmitry Paranyushkin
Grafo de uma rede de textos em “Identifying the Pathways for Meaning Circulation using Text Network Analysis”, de Dmitry Paranyushkin

Novamente, surge a questão da calibragem do olhar: o passo entre a perspectiva (digamos) mais fina pela qual filólogos, linguistas e críticos literários acostumaram-se a ler o texto, e a perspectiva (tentemos de novo) amplificada pela qual podemos, hoje, analisar grandes conjuntos de textos (de fato: pela qual podemos visualizar relações entre textos em grandes conjuntos) – é um passo que determinará uma nova leitura? Tratamos nisso outras vezes neste blog, neste post, e especialmente neste outro; há também uma discussão muito interessante sobre o assunto no blog The Dragonfly’s Gaze: Computational approaches to literary text analysis.

Para muitos, o uso de novas técnicas para manipular e apresentar grandes volumes de dados levam a novas possibilidades de análise – pois construir uma representação, naturalmente, é propor uma interpretação.  Assim, os projetos dessa área constituem um exemplo marcante da complexidade envolvida na relação entre as tecnologias digitais e as humanidades: as tecnologias computacionais são, ao mesmo tempo, “ferramentas úteis” na construção do conhecimento e determinantes da construção do conhecimento.

Links de interesse

Artigos

BASTIAN, M (2009), Gephi : An Open Source Software for Exploring and Manipulating NetworksAAAI Publications, Third International AAAI Conference on Weblogs and Social Media, retrieved 2011-11-22

CHANG, Daniel et al. (2009) Visualizing the Republic of Letters. http://www.stanford.edu/group/toolingup/rplviz/papers/Vis_RofL_2009

W. G. Thomas, III. Computing and the historical imagination. In Companion to Digital Humanities, eds. S. Schreibman, R. Siemens,
and J. Unsworth, Wiley-Blackwell, Malden, MA. 2008.

SINCLAIR, Stéfan (et al). Information Visualization for Humanities Scholars, In Literary Studies in the Digital Age, NY: Modern Language Association.

Páginas e tutoriais

Palavras, palavras, palavras…

Uma vez, uma criança muito curiosa que espiava por cima do meu ombro enquanto eu trabalhava na minha tese de doutorado me disse:

Mamãe, o seu trabalho é praticamente palavras! “.Cloud Palavras

Para todos nós que vivemos praticamente de palavras, o mundo digital abriu possibilidades imensas de investigação. As tecnologias de automatização da linguagem, surgidas no pós-guerra e fortemente centradas na pesquisa sobre tradução automática, deram saltos inimaginávies nos últimos anos. Uma das razões para isso, suspeito, é que o mundo se transformou num imenso corpus.

A interligação de computadores em rede – a internet, e mais fundamentalmente, a www – deu à luz a uma nova forma de textualidade, uma textualidade espalhada sobre o mundo, que recobre tudo com sua manta de palavras a serem apreciadas e investigadas.

Nuvem deste Blog, gerada no Tagul
Nuvem deste Blog, gerada no Tagul

Na última década, surge uma tecnologia especialmente interessante: as nuvens de palavras, ou tag clouds. As nuvens são uma forma de representação da importância de diferentes termos em um corpus – um texto específico, um conjunto de textos, ou mesmo um conjunto de conjuntos de texto (a internet, e sua manta de palavras espalhadas). A tecnologia por trás das nuvens é muito delicada, e envolve fórmulas matemáticas para calcular o peso relativo de cada termo com base em sua frequência e daí derivar sua importância na representação, por meio de tamanho de fonte, cor, etc.

Screen Shot 2013-05-10 at 9.13.59 AM
Nuvem deste blog, gerada no TagCrowd

As nuvens de palavras possibilitam inúmeras aplicações. A mais comum é a representação da importância de um conjunto de metadados em sites e blogs (como a que temos no nosso próprio blog). Entretanto, há também aplicações importantes em pesquisas nas áreas de linguística e ciência da informação.

Um exemplo fascinante é a pesquisa realizada por um grupo de físicos brasileiros, comentada no intrigante artigo “A vida das Palavras”, na Revista da Fapesp de junho de 2011. Esse trabalho, que pretende investigar como o uso das palavras numa comunidade evolui com o tempo, usa as nuvens para construir representações de seus resultados.

Nuvem de “A vida das palavras”, Revista Fapesp

Outro campo no qual a técnica das nuvens vem sendo utilizada é na educação, como sugerem por exemplo o blog 21st Century Educational Technology and Learning, e o blog da plataforma de aplicativos para a sala de aula Knewton, com exemplos muito interessantes.

Nuvem dos presidentes americanos - exemplo do Knewton.com
Nuvem dos presidentes americanos – exemplo do Knewton.com

O uso das nuvens na educação é facilitado pelo surgimento de inúmeros aplicativos gratuitos que oferecem a possibilidade de criação de nuvens de palavras a partir de qualquer texto, de modo fácil, intuitivo (e bastante divertido), como o Tagul, o TagCrowd, o Word it out, o Tag Cloud Generator, ou todos esses outros sugeridos no blog 21st Century Educational Technology and Learning.

Assim, as nuvens de palavras parecem encerrar possibilidades ainda não imaginadas, e talvez nem mesmo vislumbradas pelos criadores da técnica.

Quem sabe essas novas possibilidades podem surgir da imaginação das crianças de hoje –  que, talvez, passem a gostar de fazer trabalhos que são, praticamente, palavras.

Humanidades digitais e representação

Man Ray: Rayograph ii, 1925
Man Ray: Rayograph ii, 1925

“We’ve spent a generation furiously building digital libraries, and I’m sure that we’ll now be building tools to use in those libraries, equally furiously, for at least another generation, and I look forward to it. I’m sure that the text won’t go away while we do our tool-building—but I’m also certain that our tools will put us into new relationships with our texts. All we can really ask, in the end, is that those relationships be fruitful”.

John Unsworth,
Forms of Attention: Digital Humanities Beyond Representation Continue Lendo “Humanidades digitais e representação”