ReCaptcha

Flickr - Chritopher Thompson - 17 de agosto de 2011
Flickr – Christopher Thompson – 17 de agosto de 2011

Por mais difícil que seja concretizar tal projeto, digitalizar livros se transformou em uma verdadeira demanda nos dias de hoje, que precisa ser rapida e eficientemente atendida, pelos mais variados motivos e razões.

Como dar conta de um projeto de dimensões hercúleas como esse? Como digitalizar acervos inteiros de bibliotecas, universidades, institutos públicos e privados, coleções particulares e etc? Claro está que haverá poucos problemas em digitalizar livros novos, reeditados recentemente, que por questões de direitos autorais, não poderão ter seu conteúdo plenamente divulgado em sua totalidade. A questão recai, então, sobre livros e materiais antigos, muitas vezes raros, de difícil leitura, não contemplados pelas leis de direitos autorais. Esses, sim, irão compor a grande massa de conteúdo digitalizado disponível na internet.  Entretanto é preciso considerar que a legibilidade dos suportes muito antigos é perturbadoramente variável, o que por certo trará diversos problemas para a digitalização de seus conteúdos.

É, justamente nesse ponto que o ReCaptcha se mostra verdadeiramente necessário nesse processo da digitalização de conteúdos. Isso se deve pelo fato de que inúmeras instituições – públicas e privadas – se depararam com essa nova demanda e com todas as especificidades que estas em geral têm.

Por meio de um inteligente mecanismo, usuários são capazes de realizar com êxito uma determinada operação que os computadores sem ajuda humana, até o momento, não são capazes de realizar. Essa etapa é melhor explicada no vídeo que se pode ver na matéria cujo link consta ao final desta página.

Tão instigante quanto essa nova demanda pela digitalização é justamente a possibilidade de se desenvolverem programas  que agilizem cada vez mais tarefas desmesuradamente volumosas como essa. Além disso, ferramentas como o ReCaptcha evidenciam que a digitalização de livros e conteúdos se estabelece firmemente como uma nova necessidade que sempre existiu mas que apenas nos dias de hoje nos vislumbra uma real possibilidade de satisfazê-la.

Ver mais em:

http://br.noticias.yahoo.com/blogs/vi-na-internet/como-o-captcha-que-voc%C3%AA-digita-na-internet-010003611.html

Anúncios

Palavras, palavras, palavras…

Uma vez, uma criança muito curiosa que espiava por cima do meu ombro enquanto eu trabalhava na minha tese de doutorado me disse:

Mamãe, o seu trabalho é praticamente palavras! “.Cloud Palavras

Para todos nós que vivemos praticamente de palavras, o mundo digital abriu possibilidades imensas de investigação. As tecnologias de automatização da linguagem, surgidas no pós-guerra e fortemente centradas na pesquisa sobre tradução automática, deram saltos inimaginávies nos últimos anos. Uma das razões para isso, suspeito, é que o mundo se transformou num imenso corpus.

A interligação de computadores em rede – a internet, e mais fundamentalmente, a www – deu à luz a uma nova forma de textualidade, uma textualidade espalhada sobre o mundo, que recobre tudo com sua manta de palavras a serem apreciadas e investigadas.

Nuvem deste Blog, gerada no Tagul
Nuvem deste Blog, gerada no Tagul

Na última década, surge uma tecnologia especialmente interessante: as nuvens de palavras, ou tag clouds. As nuvens são uma forma de representação da importância de diferentes termos em um corpus – um texto específico, um conjunto de textos, ou mesmo um conjunto de conjuntos de texto (a internet, e sua manta de palavras espalhadas). A tecnologia por trás das nuvens é muito delicada, e envolve fórmulas matemáticas para calcular o peso relativo de cada termo com base em sua frequência e daí derivar sua importância na representação, por meio de tamanho de fonte, cor, etc.

Screen Shot 2013-05-10 at 9.13.59 AM
Nuvem deste blog, gerada no TagCrowd

As nuvens de palavras possibilitam inúmeras aplicações. A mais comum é a representação da importância de um conjunto de metadados em sites e blogs (como a que temos no nosso próprio blog). Entretanto, há também aplicações importantes em pesquisas nas áreas de linguística e ciência da informação.

Um exemplo fascinante é a pesquisa realizada por um grupo de físicos brasileiros, comentada no intrigante artigo “A vida das Palavras”, na Revista da Fapesp de junho de 2011. Esse trabalho, que pretende investigar como o uso das palavras numa comunidade evolui com o tempo, usa as nuvens para construir representações de seus resultados.

Nuvem de “A vida das palavras”, Revista Fapesp

Outro campo no qual a técnica das nuvens vem sendo utilizada é na educação, como sugerem por exemplo o blog 21st Century Educational Technology and Learning, e o blog da plataforma de aplicativos para a sala de aula Knewton, com exemplos muito interessantes.

Nuvem dos presidentes americanos - exemplo do Knewton.com
Nuvem dos presidentes americanos – exemplo do Knewton.com

O uso das nuvens na educação é facilitado pelo surgimento de inúmeros aplicativos gratuitos que oferecem a possibilidade de criação de nuvens de palavras a partir de qualquer texto, de modo fácil, intuitivo (e bastante divertido), como o Tagul, o TagCrowd, o Word it out, o Tag Cloud Generator, ou todos esses outros sugeridos no blog 21st Century Educational Technology and Learning.

Assim, as nuvens de palavras parecem encerrar possibilidades ainda não imaginadas, e talvez nem mesmo vislumbradas pelos criadores da técnica.

Quem sabe essas novas possibilidades podem surgir da imaginação das crianças de hoje –  que, talvez, passem a gostar de fazer trabalhos que são, praticamente, palavras.

“O Fim do Livro”

O fim do livro já foi anunciado há mais de 150 anos

João Marcos Cardoso
Especial para o blog
Machado de Assis em 1864. Fotografia de Joaquim José Insley Pacheco (1830-1912). Arquivo da Academia Brasileira de Letras, http://www.academia.org.br

Em 1859, um jovem de 19 anos, defensor um tanto ingênuo dos princípios liberais e da crença inabalável no progresso que a eles se associava, publicou no jornal carioca Correio Mercantil dois artigos anunciando o provável fim do livro, cuja proeminência seria suplantada pelo jornal. O falso prognóstico dos textos e a juventude de seu autor teriam selado seu esquecimento se a assinatura Machado de Assis não os acompanhasse. Nesses dois artigos intitulados O jornal e o livro, não há praticamente nada que faça supor o grande autor de Memórias póstumas de Brás Cubas; ainda assim, tanto por suas virtudes quanto por seus defeitos, esses textos escritos por um Machado ainda crente nas ideologias de seu tempo têm muito a dizer sobre as mudanças do nosso tempo, que em vários pontos repetem os prenúncios do passado, como por exemplo o de que o livro em papel perecerá em breve.

Essas profecias já seculares interessam, em primeiro lugar, porque lá como aqui um meio de comunicação relativamente novo e promissor – a imprensa periódica no Segundo Império, as novas tecnologias de informação no séc. XIX – se desenha como uma ameaça a um meio que parece já não adequar-se a um novo ritmo histórico. Assim, diz Machado, o livro teria “alguma coisa de limitado e de estreito se o colocarmos em face do jornal.”; é uma forma obsoleta que se depara com uma “locomotiva intelectual”. Contudo, olhando para trás, não há dúvidas de que apesar da “morosidade” do livro, ele não perdeu o passo da história diante da “presteza e reprodução diária desta locomoção intelectual” que era o jornal impresso no séc. XIX. O dinamismo infinitamente potencializado das novas tecnologias de informação estariam em melhores condições para decretar o fim do livro, ao menos em sua forma tradicional?

As profecias interessam, em segundo lugar, porque Machado parece muito convicto de que a forma material pela qual o conhecimento é transmitido tem efeitos diretos na construção de seu sentido, na sua inserção em um dado meio social e cultural. Essa convicção é um dos pilares desses dois textos, pois em contraste com o livro, as características formais do jornal – “a forma que convém mais que nenhuma outra ao espírito humano” – estaria na base de uma “revolução na ordem social”: “O jornal é a liberdade, é o povo, é a consciência, é a esperança, é o trabalho, é a civilização”. Aqui chega ao ápice a utopia liberal do jovem Machado de Assis, que via no jornal não só o arauto de um futuro democrático, mas sobretudo o agente que o realizaria. Não é preciso dizer que, olhando retrospectivamente, essa utopia se frustrou; nem o mais entusiasmado defensor do jornal impresso acredita ainda que ele possa realizar essa grandiosa missão.

Atualmente ninguém mais vê o livro e o jornal como rivais, mas ambos parecem ser ameaçados pelo espectro das novas tecnologias da informação, tidas e havidas por muitos como a melhor roupagem do espírito contemporâneo, e mais do que isso como a detentora de um novo projeto utópico. Esse novo formato do pensamento humano desbancará finalmente o livro (e o jornal) e realizará o projeto revolucionário em que o jornal fracassou um século e meio atrás? Algumas décadas depois da publicação desses dois textos, seu autor, já amadurecido e desencantado com as ideologias de seu tempo, talvez risse de seu otimismo juvenil e das predições que dele derivaram. O que diria o Machado maduro a respeito de predições contemporâneas que têm o livro como alvo e que são similares às da sua juventude por seu conteúdo e por seu otimismo?

“Falar”

Apresentamos aqui uma lista de gramáticas, dicionários e outras obras sobre língua e linguagem publicadas entre 1712 e 1822 em português, como complemento para a leitura do capítulo IV (“Falar“) de “As palavras e as coisas“, de M. Foucault.

(… ainda na esteira da nossa Roda de Leitura, como neste post de 10/04 sobre o capítulo II e neste post de 30/03 sobre o capítulo I). Continue Lendo ““Falar””

“O Todo e a Parte” | Roger Chartier, entrevista

O Todo e a Parte

Jornal Valor Econômico – Suplemento cultural
Entrevista de Roger Chartier a Amarilis Lage,
13/04/2012

O suplemento cultural do jornal Valor Econômico deste fim de semana traz uma entrevista com o historiador Roger Chartier, que discute como as diferentes formas de publicação podem conferir diferentes sentidos a uma obra –  em especial, Chartier fala sobre as novas formas de leitura no mundo digital.

Matéria completa: http://www.valor.com.br/cultura/2614020/o-todo-e-parte

Humanidades digitais e representação

Man Ray: Rayograph ii, 1925
Man Ray: Rayograph ii, 1925

“We’ve spent a generation furiously building digital libraries, and I’m sure that we’ll now be building tools to use in those libraries, equally furiously, for at least another generation, and I look forward to it. I’m sure that the text won’t go away while we do our tool-building—but I’m also certain that our tools will put us into new relationships with our texts. All we can really ask, in the end, is that those relationships be fruitful”.

John Unsworth,
Forms of Attention: Digital Humanities Beyond Representation Continue Lendo “Humanidades digitais e representação”