O texto descorporificado.
Implicações para as disciplinas do texto.
Neste tópico, iremos explorar conceitos materiais de texto digital que, como vou sugerir, nos permitirão entender com maior profundidade as consequências das tecnologias computacionais para o trabalho filológico (e, paralelamente, também para o trabalho com o texto em algumas linhas da linguística).
Essencialmente, examinaremos os conceitos do texto como algoritmo (Eggert, 2010), do texto descorporificado (Paixão de Sousa, 2013), da redocumentarização (Pédauque, 2004 e outros), e da anotação textual como representação do conhecimento (Unsworth, 2004 e outros), e exploraremos suas consequências para o trabalho filológico.
Nesse exame conceitual, partiremos de um fato central e inescapável: o ‘texto’, no meio digital, é materialmente, uma fórmula matemática que representa um texto.


Em seguida, irei sugerir que esta contingência material do texto digital, longe de limitar o trabalho filológico, liberta-o.
Nisso, seguiremos a seguinte observação de A. Emiliano:
As tecnologias da informação põem hoje à disposição dos filólogos variadíssimos recursos (aplicações, utilitários, redes, suportes para armazenamento de grandes quantidades de texto) para editar, processar e analisar textos medievais. A representação tipográfica de textos medievais é uma das áreas que sofreu grandes avanços nas últimas décadas, com o desenvolvimento da tecnologia tipográfica digital, com o estabelecimento de diversas normas internacionais para representação de caracteres de escrita, e com o surgimento e desenvolvimento de aplicações de linguagens de anotação (“markup languages”). Estes desenvolvimentos e avanços interpelam decisivamente os filólogos portugueses, que são obrigados a repensar os procedimentos e estratégias editoriais praticados até o advento e generalização do computador pessoal: não é possível continuar a pensar as edições como objectos fechados e fixados imutavelmente na página impressa em papel, ou como simples transposições dos textos medievais para o suporte impresso através da utilização do escasso número de caracteres contido na versão moderna do alfabeto romano.
António Emiliano, Tipo Medieval para Computador: uma ferramenta informática para linguistas, historiadores da língua e paleógrafos, 2005. Meus grifos.

Paleografia digital
Na investigação conceitual do texto sugerida aqui, examinaremos alguns projetos e trabalhos na área da paleografia que exploraram com profundidade as possibilidades abertas pelas características materiais do texto digital, quebrando alguns paradigmas ligados à escrita manual e mecânica.
Projetos interessantes
Começamos destacando projetos (e ferramentas) que abordam a análise e o tratamento da paleografia de documentos medievais e renascentistas.






Leitura automática de manuscritos
Por fim, como exemplo emblemático das fronteiras a serem exploradas na relação entre a computação e o trabalho filológico, elegemos o campo da leitura automática de manuscritos – ou HTR, na sigla em inglês (Handwritten Text Recognition). Para muitos pesquisadores na área das humanidades digitais, da filologia e da arquivística, o desenvolvimento das tecnologias de HTR nos últimos dez anos representará a próxima revolução nessas áreas:
The automatic generation of accurate, machine readable transcriptions of digital images of handwritten material has long been an ideal of both researchers and institutions, and it is understood that with successful Handwritten Text Recognition (HTR) the next generation of digitized manuscripts promises to yet again extend and revolutionize the study of historical handwritten documents.
Terras, Melissa. ‘Inviting AI into the Archives: The Reception of Handwritten Recognition Technology into Historical Manuscript Transcription’. In Lise Jaillant (ed.), Archives, Access and Artificial Intelligence: Working with Born-Digital and Digitized Archival Collections. Bielefeld: Bielefeld University Press, 2022.


Bibliografia específica
Chaudiron, 2008; Clement, 2011; Eggert, 2010; Emiliano, 2005; Gillam, 2003; Gradmann & Meister, 2008; Lavagnino, 2007; Paixão de Sousa, 2009, 2013, 2014b; Pédauque, 2004, 2006, Rambaram-Olm, 2015; Salaün, 2007; Unsworth, 2004; Zöllner-Weber, 2009.