Caixa de ferramentas

Ou
O que você precisa saber para começar a trabalhar com filologia no meio digital


Fiz aqui um mini-guia para colegas que estejam pensando em começar a trabalhar com ferramentas computacionais para construir edições filológicas e publicá-las no meio digital. Estou imaginando como leitores pesquisadores que venham de uma formação sólida em filologia ou linguística, mas que não têm familiaridade com o processamento e a publicação digital. Tento responder a uma pergunta frequente:

Por onde eu começo?!

Então vamos lá, por partes! Essas são as minhas sugestões:


1. Tome o pé da situação

O primeiro passo para esta jornada é você saber o que pode ser feito no mundo das edições filológicas eletrônicas: o que já se experimentou – os formatos possíveis de edição e de corpora, e o que nunca se experimentou – as fronteiras que ainda precisam ser ultrapassadas. E, nesse contexto, tome consciência sobre o que você consegue entender como funciona, e sobre o que você não consegue entender.

Tudo o que você ver que está sendo feito e que você não sabe como funciona deverá fazer parte de um plano de letramento digital seu, cujos primeiros passos eu sugiro abaixo.

Este passo de ‘saber o que pode ser feito‘ você provavelmente já deu, ou não teria nem a ideia de fazer suas próprias edições filológicas eletrônicas. Mas não custa estudar um pouco mais; então sugiro que você re-visite os projetos que vimos no curso, mas com calma, com tempo, e inclusive leia aquelas partes dos sites dos projetos que nunca lemos – os manuais, a parte da documentação dos sistemas.

Dessa forma você terá uma ideia inicial do que cada projeto efetivamente fez para construir aquele corpus, para compor aquelas edições. Isso pode ficar como um horizonte de prospecção para seus próprios trabalhos. Mas é importante dedicar algum tempo a esse estudo inicial, pois há sistemas muito diversos em uso atualmente, e em algum momento você vai precisar decidir por algum deles.

Além disso, como eu disse, neste novo momento de estudo, procure pensar em tudo que você precisa, ainda, entender como funciona, num processo de letramento digital. Os passos de ‘letramento’ que eu sugiro a seguir são relativamente independentes de sistemas, plataformas ou ferramentas já estabelecidas. Dessa forma você já pode começar o ‘letramento e só mais tarde, estando mais seguro, planejar um sistema efetivo de edição e publicação.

Ainda: as sugestões abaixo vão no sentido de você construir um sistema com base em linguagens abertas, programas de código livre, e que contam com uma comunidade de apoio e suporte ampla. Então eu sugiro, também, que você estude um pouco a cultura do software livre, neste primeiro momento e ao longo dos passos a seguir (há leituras para isso na nossa bibliografia). 

2. Aposente os processadores comerciais

Eu diria que a coisa mais importante, para começar a colocar as mãos na massa, é que você pare de usar processadores de textos comerciais comuns e formatos comerciais de arquivos para produzir suas edições filológicas.

Em outros termos, que você abandone, a partir de hoje, aquele programa que todo mundo usa (aquele mesmo) – ou, ao menos, que você continue a usá-lo para escrever artigos e livros, mas não mais para compor suas edições filológicas. 

Mas por quê?! Se ele é tão bonito, se ele é meu amigo, se ele faz negrito, itálico, tudo tão fácil e intuitivo; se quando eu uso aquele programa, eu nem percebo que estou computando nada, não tenho que pensar em códigos, comandos, e outras coisas desagradáveis?!

Por uma razão simples: em um computador, tudo que é simples; tudo que é fácil; tudo que você faz ‘sem precisar pensar’, ‘sem precisar programar‘, está sendo pensado para você, está sendo programado para você, está sendo codificado para você.

E, para quem faz trabalho filológico, isso significa algo muito simples: todas as informações que você está anotando no texto ‘sem fazer esforço’ estão inteiramente fora de seu controle. Você está confiando em um software comercial para guardar e preservar todo o seu trabalho de filólogo: suas intervenções, suas conjecturas, sua edição.

Repetindo: você está confiando à Microsoft© o coração do seu trabalho.

A penetração daquele processador de textos comercial em nossas vidas e mentes é tão profunda, entretanto, que você pode pensar: mas eu não sei escrever fora daquele processador de textos! Eu não sei nem por onde começar! Comece, então, pelos processadores mais simples possíveis que costumam estar disponíveis em qualquer computador – por exemplo, o Notepad; algum processador que produza arquivos do tipo ‘texto simples‘ (.txt). Sem formatos, sem nada; apenas as sequências de caracteres (e quebras de linha reais). 

.doc, .docx… > .txt

Nesses processadores mais simples, você pode produzir muita coisa, se usar alguma criatividade. Por exemplo: troque toda a sua anotação fundada em formatação por anotação fundada em caracteres. Pois enquanto a formatação depende do ambiente de processamento, os caracteres digitados são relativamente independentes do ambiente -e, uma vez lá, não vão sumir.

Ninguém tira os caracteres de você (normalmente); já a formatação é uma ilusão (sempre). 

Conjectura > Conj[ectura]
Deterioração > Deteriora[*]
Qualquer coisa > Qualquer [coisa]

O importante, neste processo de ‘libertação’ em relação àquele processador de textos, é que você se dê conta, profundamente, da separação entre o texto e a formatação do texto. Os processadores mais simples (que só gravam .txt) só codificam texto, sem nenhuma formatação – e assim nos mostram, pedagogicamente, o que é uma coisa, o que é outra.

Tudo o que você conseguir fazer no Notepad é seguro. Tudo o que você não consegue fazer no Notepad mas conseguia fazer naquele processador de textos era ilusão. Tudo que era ilusão podia se desmanchar no ar a qualquer momento – por exemplo, quando você tiver que mudar de computador; quando a Microsoft© resolver mudar o código daquele processador de textos…

Em resumo, a não ser que você seja uma das cinco pessoas no mundo que conhecem o código daquele processador de textos, não confie anos do seu trabalho àquela codificação, pois por exemplo (só para começar) você não tem nenhuma garantia de que os arquivos que você está produzindo poderão ser sequer abertos (quanto mais visualizados em toda a riqueza da sua linda formatação) daqui a cinco, dez anos.

Repetindo mais uma vez, de novo, redundantemente:
você está confiando à Microsoft© o coração do seu trabalho.

3. Aprenda a usar linguagens de anotação e sistemas modulares

Se você tiver que escolher uma coisa só para aprender, em computação, recomendo que seja uma linguagem de anotação de textos da família W3html (HyperText Markup Language) ou xml (eXtended Markup Language). O html é um ótimo começo, pois é relativamente intuitivo, tem ampla aplicação em recursos web, conta com inúmeros e muito bons tutoriais, e pode ser aplicado em inúmeros aplicativos – ou mesmo no mais simples dos processadores de texto.

Se você está disposto a ir um passo além, aprenda LaTeX. O LaTeX (‘Lamport text’) é um sistema de preparação de textos que não só permite compor um texto com tudo que você teria naquele processador comercial, como permite ir muito, muito além  – mas o mais importante: com absoluto controle sobre tudo o que você anota no texto. Pois este sistema, fundamentalmente, não é um processador de textos. É um sistema de composição de textos no qual conteúdo e forma são claramente separados, e a forma é programada e controlada pelo editor; computacionalmente, no qual o compilador do texto é independente.

Tutoriais

html, xml, e outras linguagens de anotação web: https://www.w3schools.com

LaTeXhttps://www.latex-project.org

Seja em html, seja em LaTeX, a minha sugestão é que você comece a usar alguma linguagem de anotação para construir textos gerais, não ainda suas edições filológicas. Vamos deixar isso para mais tarde, no passo 7 mais abaixo. Neste ponto você pode produzir conteúdos gerais, e os que construir em html podem servir para o próximo passo que eu sugiro agora.

4. Aprenda a construir uma plataforma de difusão na web (site, blog…)

Estou supondo que você tem o objetivo de em algum momento publicar suas novas edições filológicas, algum dia, em formato digital, na ‘web’. Você precisa, então, saber o que é a internet e como ela funciona – e a melhor forma de fazer isso é com as mãos na massa, construindo um site ou blog.

Hoje – no mundo pós-web 2.0 – é fácil demais construir um site. Demais no sentido de que é demais; tão fácil, que a gente nem percebe que está construindo nada: as plataformas emulam um processador de textos comum, e ‘fazem tudo para nós’. Aí mora o perigo, como já vimos.

Entretanto, para começar, mesmo essas plataformas já ajudam muito a compreender os funcionamentos básicos. Você pode optar por qualquer plataforma comercial e gratuita, como esta mesma aqui, WordPress, ou outras que povoam a web.

Recomendo que faça um site sobre qualquer coisa – jardinagem, receitas de bolos, o movimento punk, alguma coisa de que você goste – e tente manter por algum tempo, para ir sentindo o funcionamento.

Depois disso, um passo mais avançado seria construir um site acadêmico, um site para o seu projeto ou grupo de pesquisas, ainda nessa mesma plataforma comercial com que já aprendeu a lidar – mas agora com um pouco mais de compromisso quanto à qualidade do conteúdo, a arquitetura de navegação, etc.

Com isso, você vai poder entender como podem funcionar os sistemas de inter-ligação textual, e lentamente vai adquirir um vocabulário básico, um letramento digital, que vai te ajudar na etapa a seguir.

5. Conheça o setor de informática da sua instituição

Se você está ligado a uma instituição de ensino superior, pública ou privada, agora é o momento de você fazer novos amigos: os responsáveis pelo setor de informática da sua faculdade. Peça para eles um espaço no servidor para colocar o seu blog ou site acadêmico. Você então vai poder avaliar o grau de abertura do setor para o uso do sistema da faculdade pelos docentes e pesquisadores.

Se eles disserem que ‘não dá, professora‘, pule para o próximo passo. Se eles disserem que ‘mas claro, professora‘, parabéns, você está numa instituição acolhedora; e agora, você pode transferir o seu site para o servidor da faculdade.

Como você fará isso dependerá do sistema que a sua faculdade usa, o que certamente será explicado pelo seu ótimo setor de informática. O importante, aqui, é que você vai perceber que o funcionamento é mais complexo que o das plataformas comerciais. E isso vai aprofundar o seu letramento digital.

6. Aprenda a administrar uma plataforma de difusão por ftp/sftp

O próximo passo é ir além da plataforma comercial de sites, e administrar uma plataforma pelo envio direto de arquivos. Isso vai dar muito mais trabalho do que você tinha na plataforma comercial; e vamos lembrar, mais trabalho significa mais controle.

Se o setor de informática da sua instituição permite que você administre seu próprio site, provavelmente você precisará enviar arquivos por ftp (File Transfer Protocol) ou sftp (Secure File Transfer Protocol). Se você está naquelas instituições que não permitem aos docentes e pesquisadores administrarem suas próprias áreas nos servidores (que, me parece, são a maioria), eu recomento fortemente que você alugue um servidor comercial. Há planos baratos, e isso já servirá para este aprofundamento do seu letramento digital.

7. Experimente transformar suas edições filológicas .txt em documentos mais sofisticados

Agora que você sabe html, sabe administrar um site simples, e já se libertou dos processadores de texto comerciais… você está digitalmente letrado.

Você pode agora seguir alimentando seu site de projeto … ou passar para este passo interessante.

Todo o trabalho de edição filológica que você fez em texto simples pode servir de base para a criação de documentos mais sofisticados, em html ou LaTeX. Pode, ainda, servir de base para você passar a usar um sistema de edições filológicas eletrônicas, como o e-Dictor, que é o que eu uso; ou algum outro que você ache mais apropriado para as suas finalidades.

O importante é você ter clareza que, começando em .txt, você abre todas as portas possíveis; começando em .docx. você as fecha todas as portas possíveis, e com muitos cadeados, imensos e invisíveis.

8. Faça um mini-corpus

Agora que você tem de um lado um site mais profissional, e de outro, suas edições anotadas em html, você pode construir seu próprio corpus eletrônico, em um sistema mais simples ou mais complexo, a depender do quão fundo você esteve disposto a ir no aprendizado da linguagem de anotação. 

Mas este guia tem finalidade pedagógica, mais que nada; portanto eu recomendaria que você faça um ‘mini-corpus’, por mais simples que seja, só para ver o que acontece. Lembre sempre que você não precisa deixar seu site público; ou pode deixá-lo público, avisando a todos que é um trabalho em andamento. Isso é comum! 

9. Agora sim!

Agora que você fez isso tudo, você está bem letrado, e pode planejar seu sistema definitivo de produção e publicação de edições eletrônicas.

Para isso você pode começar a buscar colegas e grupos de pesquisadores que têm já algum tempo de estrada, para trocar experiências; consultar na sua instituição se algum pesquisador da área de computação tem interesse numa colaboração… Os caminhos podem ser muitos. 

Mas o importante, a meu ver, é que você não comece este caminho sem ter experimentado os processos que eu sugeri acima. Sem este letramento fundamental, você poderá perceber que você não vai saber quais perguntas fazer, nem que caminhos buscar, porque você não vai conseguir vislumbrar o que pode e o que não pode ser feito. 

10. Último conselho

Depois que você conseguir se libertar daquele processador de textos, e mais tarde, depois que você tiver dominado minimamente o sistema de publicação na web, não caia novamente em tentação. É como um regime: você precisa permanecer alerta mesmo depois de ter perdido muitos quilos (parabéns).

Ou seja, o que eu estou tentando avisar aqui é: cuidado com novas ferramentas e novos sistemas que fazem tudo para você. Não confie nelas.

Procure ferramentas e sistemas que dêem trabalho. Toda vez que você tem trabalho – ou seja, que tem que configurar minimamente uma ferramenta que não vem já toda configurada e fechadinha igual uma caixa preta; que tem que trabalhar com um mínimo de codificação; que tem que fazer alguma coisa um pouco mais sofisticada do que clicar em uma tela… toda vez que você tem trabalho, você está no controle da situação.

Por oposição: sempre que você tiver à sua frente uma ferramenta ou um sistema ‘facílimo’, que faz tudo para você, que só te exige que mova o dedo até um pedacinho da tela ou que use o emulador de máquina de escrever (‘teclado’) como se estivéssemos em 1945 – toda vez que você está diante de um computador e não está fazendo nenhum esforço mínimo de codificação, alguém está fazendo isso por você, e você está fora da esfera de controle da produção do seu documento digital.

Era isso!