HUMANIDADES DIGITAIS E A SIMBIOSE ENTRE HUMANO E
MÁQUINA: ALGUMAS REFLEXÕES COMPARATIVAS ENTRE A INTERPRETAÇÃO E A MINERAÇÃO DE
TEXTOS
José Claudio Matos
Universidade
Federal de Santa Catarina
Eliana Maria dos Santos Bahia Jacinto
Universidade
Federal de Santa Catarina
elianambahia@gmail.com
Edgar Bisset Alvarez
Universidade
Federal de Santa Catarina
______________________________
Resumo
Examina a
relação entre a leitura e os programas computacionais de mineração de textos,
no contexto das Humanidades Digitais (HD). Através da pesquisa bibliográfica e
da reunião de fontes textuais relevantes para o argumento, esta relação é
descrita sob a forma de uma simbiose entre o ser humano e o computador, nos
termos propostos inicialmente por Asimov (2005). Uma concepção da leitura como
operação da inteligência é posta em diálogo com o conceito e as aplicações da
mineração de textos. Da reflexão sobre a simbiose entre leitura e mineração de
textos é obtido, como resultado, um ponto de vista em relação às HD, entendida
como um conjunto de estratégias para o crescimento e a adaptação da cultura
humana no ambiente digital.
Palavras-chave: Humanidades Digitais. Leitura. Mineração de Textos.
Inteligência artificial.
DIGITAL HUMANITIES AND
THE HUMAN-MACHINE SYMBIOSIS:
SOME COMPARATIVE REFLECTIONS
BETWEEN INTERPRETATION AND TEXT MINING
Abstract
It examines
the relationship between reading and computational programs of text mining in
the context of Digital Humanities (HD). Through the bibliographic research and
the reunion of textual sources relevant to the argument, this relationship is
described in the form of a symbiosis between the human and the computer, in
terms initially proposed by Asimov (2005). A conception of reading as an
operation of intelligence is put into dialogue with the concept and
applications of text mining. From the reflection on the symbiosis between
reading and text mining is obtained, as a result, a point of view in respect to
the HD, understood as a set of strategies for the growth and adaptation of
human culture in the digital environment.
Keywords: Digital Humanities. Reading. Text
Mining. Artificial Inteligence.
1 PREÂMBULO: LITERATURA, HUMANIDADES E ANTECIPAÇÃO TECNOLÓGICA
O conhecido
ensaísta e escritor Isaac Asimov é autor do prefácio de uma antologia de contos
de ficção científica, publicada no Brasil com o título de Histórias de Robôs (WARRICK; GREENBERG, 2005). Na edição original,
de 1983, o título era mais sugestivo: Machines
that Think – Máquinas que Pensam. O texto de Asimov, ao invés de
simplesmente comentar algo das histórias ali reunidas, discute em forma de
ensaio o interessante problema que o autor define como “medo irracional que o
homem tem dos autômatos” (ASIMOV, 2005, p. 7). Trata, em especial, do medo da
crescente capacidade dos computadores para realizar funções complexas, de forma
extremamente rápida e inteligente.
Segundo Asimov:
“Temos que admitir que, pelo menos como concepção, o medo não deixa de ser justificado.
Não há nenhum limite teórico visível para a complexidade e ‘inteligência’ do
computador” (ASIMOV, 2005, p. 13). Ele dirige seu argumento a uma conclusão
conciliadora, em termos de que a inteligência humana e a inteligência
artificial evoluíram por processos diferentes, apresentam melhor desempenho em
funções bastante diferentes e podem coevoluir de forma interativa, conforme os
mais elevados objetivos e interesses humanos.
O que Asimov
supõe, considerando o estado de desenvolvimento tecnológico do final do século
XX, é que
[...] duas
inteligências diferentes, especializando-se em objetivos diversos, cada qual
com sua utilidade, podem, num relacionamento simbiótico, aprender a colaborar
com a lei natural do Universo de forma mais eficiente do que separadamente
(ASIMOV, 2005, p. 15).
Esta passagem
incorpora, em grande medida, o sentido do problema que o presente artigo espera
discutir. Trata-se da indagação sobre quais fundamentos permitem propor a ideia
de uma relação simbiótica entre a mente humana e a inteligência artificial,
cujo resultado seja benéfico para o desenvolvimento da inteligência e da
cultura em geral – admitindo a hipótese de que é isso que Asimov quis dizer com
“lei geral do Universo”.
Com sutileza e
habilidade, Asimov evita caracterizar qualquer conflito de interesses entre
seres humanos e computadores, assim como qualquer sobreposição de funções. Seu
discurso é veemente ao defender que estes estão a serviço da humanidade, como
instrumentos ou, no máximo, como ajudantes. Mesmo assim é preciso reconhecer os
computadores como artefatos complexos, capazes de operações inteligentes e -
especialmente - como os constituintes do novo e penetrante ambiente
informacional que hoje em dia chamamos de ‘ciberespaço’ ou ‘infosfera’.
O escritor
menciona a agenda de “questões que implicam em conceitos sobre o que está certo
ou errado” (ASIMOV, 2005, p. 17), e relaciona o futuro da tecnologia digital
com o conjunto de princípios, valores, conhecimentos e formas estéticas que
caracterizam a cultura humana de forma geral. Essa tonalidade humanística de
seu ensaio, a profundidade das questões suscitadas por sua leitura, se
incorporada criticamente pelo leitor, enriquecem a experiência provocada pelos
contos da antologia da qual seu ensaio é o prefácio.
Para os fins da
presente discussão, a ideia de simbiose
entre a mente humana e o computador será discutida, no contexto de uma
atividade extremamente familiar e de alta importância cognitiva e social, que é
a leitura ou interpretação de textos escritos. Além disso, o cultivo de valores
humanísticos como a liberdade de expressão e o acesso ao conhecimento constitui
o cenário deste movimento investigativo, na forma da tendência contemporânea de
pensamento e trabalho intelectual conhecida como Humanidades Digitais (HD) - Digital Humanities.
Em um artigo
intitulado “Humanidades digitales, dejalas ser”, Juan Manuel Cuartas-Restrepo aponta para uma mudança operada na própria
atividade de pesquisa e investigação pelo advento da cultura digital. Segundo
ele, a própria escrita no campo das HD, difere das formas tradicionais de
comunicação do conhecimento. Afirma ele que
[...] em
essência, o que mudou nas ‘humanidades digitais’ é a escritura, tão sujeita à
razão e à lógica das linguagens verbais, mas tão diametralmente diferente do
duplo movimento de abstração e descrição de outras formas de representação como
as gráficas e as imagens[1] (CUARTAS, 2017, p. 73, tradução nossa).
Com esta
passagem, Cuartas indica a necessidade e possibilidade da multiplicação de
formas de comunicação, a fim de que se promova o ideal humanístico do acesso à
cultura e ao conhecimento, no movimento evolutivo em que se inserem as HD. A
referência ao pensamento de Isaac Asimov, e especialmente ao seu conceito de
‘relacionamento simbiótico’ entre o humano e o computador é tomada, no presente
trabalho, como parte desta diversificação da escrita, e desse “deslocamento do
centro de operações da vida acadêmica[2]”
(CUARTAS, 2017, p. 73, tradução nossa), que segundo este estudioso é um traço
marcante das HD.
Estas
considerações iniciais tiveram o objetivo de situar o leitor no campo de
discussão em que este trabalho pretende se movimentar. Fizeram isso indicando
que a inspiração ou a origem da questão a ser tratada se encontra num texto de
caráter literário, embora motivado por temas científicos. Esta modalidade da
experiência, que combina uma cultura artística e literária com uma cultura
científica e tecnológica, parece ser um exemplo interessante da espécie de
mentalidade acolhedora, ampla e inclusiva encontrada nos projetos e estudos das
HD. Isaac Asimov, mesmo sendo escritor de ficção científica, antecipou no
mencionado ensaio - como também em suas histórias – o importante tema da
simbiose entre a mente e o computador, que aqui se espera explorar,
particularmente para o caso da interpretação e leitura de textos escritos.
Feitas estas
considerações, segue-se a contextualização e caracterização do estudo, o exame
das informações e fontes bibliográficas em vista dos objetivos, e a exposição e
análise dos resultados obtidos.
2 INTRODUÇÃO
As HD vêm se
constituindo como um campo de iniciativas e de discussões em torno da relação
entre a cultura humanística tradicional, de um lado, e a cultura marcada pelas
tecnologias digitais, de outro. Priani formula de maneira bastante adequada sua
descrição das HD como “espaço de aplicação e reflexão acadêmica sobre o uso de
métodos e sistemas computacionais nas humanidades[3]”
(PRIANI, 2015, p. 1218, tradução nossa). Mais do que um campo disciplinar
específico, é proveitoso procurar compreender as HD como um conjunto de valores
e de atitudes promovidos a partir das investigações e iniciativas práticas que
se baseiam nesta relação entre as humanidades e a tecnologia digital.
Em um artigo
intitulado “Beyond the tale of the ‘two cultures’: filling the gap between
algorithms and interpretation” (TĂUT, 2017), o estudioso Val Codrin Tăut
argumenta em favor de um significado compreensivo e includente das HD. Sua
proposta é de um “entendimento não-dogmático das Humanidades Digitais[4]” (TĂUT,
2017, p. 2, tradução nossa), a partir do qual se possa integrar a atividade de
interpretação e apreciação do legado cultural, com a computação e os processos
algorítmicos da tecnologia digital. Conforme será apresentado adiante, esta
integração entre a interpretação e a computação é um processo que não pode se
desenvolver sem a formulação de um aparato conceitual, e sem a proposição
experimental de variadas metodologias e formas de aprendizagem. Neste horizonte
conceitual, a relação entre a cultura humanística e a cultura digital se revela
bastante complexa e multifacetada. Um dos casos desta diversidade de aspectos é
o da relação sempre controversa entre o desempenho da inteligência humana e o
desempenho dos computadores digitais.
Desde sua
invenção, as máquinas que processam informação suscitaram questionamentos
acerca da sobreposição ou da concorrência com aquilo que a mente humana faz.
Parte desses questionamentos manifesta a ideia de que a chamada inteligência
artificial possa ser entendida como uma equivalente da inteligência humana que
a projetou. Outra parte chega a expressar certo temor de que a inteligência
artificial possa substituir de forma indesejável o desempenho da mente em
tarefas que exigem raciocínio e capacidade de processamento de informações.
Ora, as HD, pelo que se observa pelos inúmeros projetos desenvolvidos neste
campo, vêm concentrando sua atenção na possibilidade de aperfeiçoar o emprego
da inteligência artificial a fim de promover valores práticos e teóricos como a
diversidade da cultura humana e a importância da educação e do esclarecimento,
pela via do acesso autônomo e crítico às realizações desta cultura.
No trabalho
intitulado “La diversidad cultural em las HD” (SÁNCHEZ, 2018), a autora discute
a integração indissociável entre o emprego de procedimentos de pesquisa e
investigação com os princípios humanísticos. Exemplos desta integração envolvem
a valorização das diversas culturas e a garantia de amplo acesso e inclusão
digital das pessoas de todas as sociedades. Interessante em seu argumento é o destaque
para “a línguas e seus usos, o resgate do patrimônio tangível e intangível e os
sistemas educativos[5]” (SÁNCHEZ,
2018, p. 183, tradução nossa). Sánchez reforça a noção de que a linguagem e a
comunicação são os meios de expressão da cultura, e que qualquer iniciativa
para desenvolver uma cultura digital da diversidade precisa dar conta da
diversidade de línguas, do acesso ao legado da cultura escrita, e ao
aprendizado da escrita e da leitura. Tăut, acima citado, reforça este ponto de
vista em seu estudo, ao afirmar que “o primeiro passo no desenvolvimento das HD
foi largamente dominado pela análise linguística e literária[6]” (TĂUT,
2017, p. 2, tradução nossa).
O que o presente
trabalho pretende acrescentar a estas reflexões é a percepção de que, na atualidade,
um dos instrumentos de investigação e promoção das HD são as ferramentas
digitais conhecidas como “descoberta de conhecimento em textos”, ou “mineração
de textos”. O que se espera discutir são as questões que nascem da correlação
entre a leitura, como um processo humano de interpretação, e a mineração de
textos, como um processo algorítmico de computação. A hipótese que se espera
submeter ao exame é a de que a simbiose
entre a mente humana e o computador - ou especificamente entre a interpretação
e a mineração de textos - expressa a forma mais bem fundamentada e mais
promissora desta correlação, no horizonte das HD.
A seguir, o
estudo apresenta seus aspectos metodológicos, para em seguida passar a compor
uma concepção teórica da leitura ou interpretação, assim como da mineração de
textos, com base na discussão especializada, revelada pela pesquisa de fontes
bibliográficas.
3 PROCEDIMENTOS METODOLÓGICOS
Este artigo
resultou de um processo de reflexão que buscou formular sua questão principal a
partir de um histórico de leituras dispersas ao longo de anos de atividades de
pesquisa e ensino, nos campos da filosofia, educação, ciência da informação,
ciências cognitivas e literatura. Este percurso mais individual de estudos, nem
por isso se ressente diante da exigência de evidências e justificativas que
possam ser alvo de uma abordagem crítica e objetiva por parte do leitor.
Dando atenção a
certa diversificação metodológica, na esteira do que acima foi comentado,
quando feita menção ao trabalho de Cuartas (2017), o formato deste documento
expressa um percurso intelectual que incorpora elementos culturais e teóricos
advindos de uma vivência de profunda reflexão sobre os assuntos aqui
discutidos. Em geral tomados em separado, pela primeira vez se empreende neste
trabalho a tentativa de construir a ponte entre temas da cultura literária e
humanística, com temas científicos e tecnológicos inerentes às HD. O tema da
leitura foi o agente catalisador dos conhecimentos derivados dessas fontes, e
seu tratamento dentro do cenário inovador e flexível das HD exigiu,
naturalmente, o reforço de uma pesquisa bibliográfica mais rigorosa e objetiva.
Embora não se
trate exatamente do relatório de um projeto de pesquisa científica em sentido
estrito, este estudo segue o procedimento da pesquisa bibliográfica,
concentrada em artigos de periódicos científicos qualificados. As bases
consultadas foram o Portal de Periódicos CAPES e a Journal Storage (JSTOR). Os termos da busca foram “leitura”,
“humanidades digitais”, “mineração de textos” e algumas combinações destes
termos segundo os operadores booleanos para recuperação da informação. A
seleção das fontes foi operada pela leitura dos resumos dos artigos
recuperados, com a finalidade de identificar aqueles que poderiam contribuir
para a discussão do tema central do artigo.
Uma das vantagens
de se praticar a reflexão em HD, é a de absorver a acessibilidade informacional
do ciberespaço como um constante recurso do debate e da reflexão. Assim
considerada, a base bibliográfica do presente artigo é sempre uma sugestão à
participação do leitor como um interagente crítico e um interlocutor ativo na
discussão que se propõe. Isso não é uma justificativa para o desleixo, a
informalidade ou a ausência de critérios de qualidade da pesquisa, mas sim um
chamado a uma forma de ler e consumir informação científica, em que outros
hábitos da inteligência e outras formas de atestar a legitimidade dos
conhecimentos possam ser considerados.
Segue-se aqui uma
caracterização dos conceitos de leitura e de mineração de textos, fundamentada
nestas leituras dispersas, em combinação com as fontes resultantes da pesquisa
bibliográfica por artigos especializados, com o objetivo de explorar as
relações entre ambos os processos e defender a ideia de uma relação simbiótica
entre o humano e a máquina, no âmbito das HD.
4 SOBRE LEITURA E
INTERPRETAÇÃO
A leitura é uma
atividade tão familiar e habitual, que muitas vezes é necessário certo esforço
de abstração para que se possam considerar teoricamente as questões que a
envolvem. Até aqui se optou por fazer referência a ela combinando os termos
“leitura” e “interpretação”. Quando se diz “leitura”, o termo costuma
significar o processo de reconhecimento ou construção do significado de textos
escritos em linguagem natural – como o português ou o inglês. Mas, para
acentuar o aspecto ativo e a profundidade cognitiva desta operação, se
acrescenta à “leitura” o complemento “interpretação”. A partir daqui será
empregada somente a palavra “leitura”, para referir à atividade da mente humana
quando decifra, codifica ou estabelece o significado de um segmento de texto escrito.
Além disso, como
observa Elsa Ramírez Leyva, em seu artigo “¿Qué es leer? ¿Qué es la lectura?”
(LEVYA, 2009), desde a explosão informacional a
leitura se tornou uma questão de interesse nas ciências sociais. Conforme a
autora, os estudiosos da leitura “começaram a questionar seus paradigmas, assim
como um campo de interesse para o âmbito cultural, em um contexto donde se
vislumbravam mudanças do modelo cultural, do projeto social e da tecnologia[7]” (LEVYA,
2009, p. 163, tradução nossa). Todos os aspectos do
fenômeno da linguagem e da comunicação tiveram um aumento de relevância nos
estudos teóricos, a partir da constituição cada vez mais evidente de uma
cultura virtual, e de uma forma de vida social marcada pelo fluxo intenso de
mensagens. Assim, “a leitura e a formação de leitores[8]”
(LEVYA, 2009, p. 163, tradução nossa),
especialmente a chamada leitura crítica ou reflexiva, se evidencia como um
aspecto fundamental da vida social na cultura contemporânea.
Para fins da
presente discussão será dada ênfase ao aspecto cognitivo da leitura de textos
escritos: leitura como uma operação mental de dar significado a um texto
escrito. Acerca disso, segue-se a recomendação de José Morais, em seu livro A
arte de ler (2002). Em suas palavras:
Para compreender
o que é a leitura temos que evitar estender o campo de aplicação do nosso
objeto de estudo. Aumentando a extensão do conceito, alguns pensam certamente
em aumentar sua importância. Dessa maneira, na verdade, não se saberia mais o
que exatamente se estuda (MORAIS, 2002, p. 15).
Reconhecendo a
relevância social e cultural desta atividade se espera, ainda assim, destacar o
entendimento da leitura como uma operação ativa de construção de significado,
realizada por uma pessoa, no contato com uma estrutura simbólica que é o texto
escrito. Em outra ocasião, pesquisas relacionadas com este problema resultaram
na seguinte formulação:
O termo “leitura”
está sendo usado no sentido de um tipo bem específico de “interpretação”, ou
seja, esforço intelectual de atribuição de significado a objetos que atuam como
signos, ou símbolos, com o objetivo de compreender e, portanto, ser capaz de
fazer uso destes objetos. Quando se diz “leitura”, não se está utilizando o
termo em sentido amplo e genérico, mas no sentido da interpretação dos símbolos
linguísticos componentes de um texto, estruturados de forma a veicular um
significado compreensível pelo leitor (MATOS, 2013, p. 582).
Esta demarcação liberta o argumento da
exigência de dar conta de todas as muitas questões periféricas em torno da
leitura, a fim de enfatizar a operação pessoal da interpretação de textos.
Finalmente, a
leitura é considerada uma operação da mente, uma das marcas características da
inteligência e da comunicação humana. Reconstruir um pensamento através da
decifração e da manipulação de símbolos escritos é uma das operações mais
fundamentais para o tipo de mente que a espécie humana desenvolveu. A leitura
de textos escritos equipa a mente individual com os conhecimentos e hábitos de
inteligência necessários a uma vida plena e significativa, nos ambientes
sociais complexos. Nos primórdios da modernidade, o velho Descartes dizia que
[...] a leitura
de todos os bons livros é qual uma conversação
com as pessoas mais qualificadas dos séculos passados, que foram seus autores,
e até uma conversação premeditada, na qual eles nos revelam tão-somente os
melhores de seus pensamentos (DESCARTES, 1984, p. 17, grifo nosso).
Esta aproximação
da leitura com a conversa é bastante difundida. A leitura está tão
profundamente atrelada ao comportamento tipicamente humano, que autoriza que
seja identificada - metaforicamente - com a conversação.
Grande parte do
ideal humanístico de esclarecimento e emancipação, que se observa nas bases do
pensamento moderno, está apoiada na difusão da leitura e da escrita,
especialmente a partir da revolução causada pela tecnologia de impressão. Ler
indica um traço humano característico, na medida em que envolve a capacidade de
reconhecer o significado do texto, a ponto de tornar possível acreditar ou
duvidar, questionar e refletir e, em geral, gerar respostas comportamentais e
emocionais a partir do texto.
Recentemente
observam-se programas computacionais realizando a decodificação de textos,
geralmente operando com um volume de dados muito acima da capacidade de um
leitor humano. O desempenho de tais programas inevitavelmente desperta
interesse, em vista das inúmeras aplicações possíveis e da similaridade, ou
distinção, em relação à leitura realizada pelas pessoas.
5 SOBRE MINERAÇÃO
DE TEXTOS
A evolução da
computação digital permitiu o desenvolvimento de programas capazes de obter
informações relevantes, analisando volumes cada vez maiores de dados. Na
primeira década deste século, os processos de mineração de textos começaram a
se tornar conhecidos da comunidade científica. Em um relatório técnico de 2007,
dedicado a caracterizar os procedimentos de mineração de textos, Morais e
Ambrósio fornecem a seguinte definição:
Mineração de
textos (Text Mining) é um Processo de Descoberta de Conhecimento, que utiliza
técnicas de análise e extração de dados a partir de textos, frases ou apenas
palavras. Envolve a aplicação de algoritmos computacionais que processam textos
e identificam informações úteis e implícitas, que normalmente não poderiam ser
recuperadas utilizando métodos tradicionais de consulta, pois a informação
contida nestes textos não pode ser obtida de forma direta (MORAIS &
AMBRÓSIO, 2007, p.1).
Esta definição
evidencia que o processo de mineração de textos é realizado de forma automática
por programas computacionais, que detectam padrões e singularidades na
estrutura de textos escritos por pessoas. Aranha e Passos, em seu artigo,
reforçam esta forma de conceber, ao afirmarem que “Mineração de textos consiste
em extrair regularidades, padrões ou tendências de grandes volumes de textos em
linguagem natural” (ARANHA; PASSOS, 2006, p. 1). Faltaria talvez acrescentar
que alguns desses programas são capazes de estabelecer ordenações e identificar
relações entre conceitos nos textos e classificando-os conforme qualquer
critério desejado, segundo sua estrutura.
Perceba-se que a
mineração de textos é um ramo específico do campo mais amplo conhecido como “mineração
de dados”, que em geral significa “processo de extração ou mineração de
conhecimento a partir de grandes volumes de dados” (MORAIS; AMBRÓSIO, 2007, p.
4). Estes dados geralmente se encontram organizados e preparados para receberem
tratamento algorítmico, o que não acontece no caso da mineração de textos, cuja
estrutura segue a forma da linguagem natural, visando a comunicação humana.
Textos são em geral escritos por pessoas, a fim de serem lidos por outras
pessoas. Os algoritmos de mineração de textos, portanto, são especiais porque
computam informações em estruturas de dados que não foram construídas para se
oferecer a este propósito.
Além disso, os
autores do referido relatório relacionam a mineração de textos com a noção de
“processo de descoberta de conhecimento” (MORAIS; AMBRÓSIO, 2007). Seria preciso tomar cuidado com a forma dessa expressão, na
medida em que faz sentido questionar: quem
faz a descoberta, e este conhecimento é conhecimento para quem? O texto é algo feito para ser ‘descoberto’ pela interpretação
de um humano falante da língua. Quando se fala em “descoberta de conhecimento”,
o sentido literal da expressão seria algo como: estabelecimento de padrões não
triviais de ocorrência de termos e formas sintáticas estruturadas logicamente,
com propósitos de análise estatística de grande volume de textos, e por
técnicas sintáticas baseadas em procedimentos automáticos. Claro está que quem
faz a descoberta de conhecimento é o usuário, tendo o programa computacional
como seu instrumento.
As
aplicações da mineração de textos envolvem a reunião de informações de textos
escritos em redes sociais ou postagens na internet, para uso em decisões
organizacionais. No ambiente acadêmico, ela se aproxima da chamada analítica
cultural - cultural analytics, que é definida por Manovich como “a
análise de conjuntos massivos de dados e fluxos culturais usando técnicas de
computação e visualização[9]”
(MANOVICHI, 2016, p. 1). Já foi mencionado que o texto em linguagem natural
constitui um tipo especial de estrutura de dados, pois sua estrutura tem como
propósito a comunicação de significados entre pessoas.
Aplicações
especialmente interessantes da mineração de textos são aquelas que se
desenvolvem em apoio ao processo tipicamente humano de leitura. Diversas produções
apresentam resultados do emprego da mineração de textos na aprendizagem e na
sofisticação de processos de leitura e de escrita de textos. Macedo et al. (2011), descrevem estratégias
para a aplicação da mineração de textos a fim de “levar o estudante a refletir
tanto sobre os textos individualmente, quanto sobre seus relacionamentos com
outros” (p. 1019). Muciolo (2017) é ainda mais ousado ao se referir à relação
entre leitura e tecnologia digital. Cita o “Gutenberg Project” como um
antecedente das recentes aplicações testa tecnologia que, segundo o autor,
permite “proporcionar conhecimento do material textual que ultrapassa a
barreira do conhecimento adquirido pela leitura” (p. 6). Parece haver relativo
consenso acerca de que a mineração colabora com a leitura, permitindo um
acréscimo de significado aos textos.
Tanto no sentido
da aprendizagem de formas mais reflexivas e aprofundadas de leitura, quanto do
ponto de vista da facilidade em manejar montantes muito grandes de textos, com
vistas à organização e sistematização, a mineração de textos tem apresentado
resultados promissores, a julgar pelo que os estudos vêm apresentando. O
comportamento de computadores digitais que analisam textos e favorecem a
“descoberta de conhecimento” parece muito mais interessante quando é descrito
em termos mentais. A capacidade de um programa, de fornecer um gráfico com os
termos de maior ocorrência em um texto, e a estrutura das relações entre os
termos, por exemplo, tem toda a aparência de um comportamento organizado e inteligente.
Não é o caso aqui
de fazer a análise de cada um dos programas de mineração de texto disponíveis,
embora alguns dos mais conhecidos possam ser mencionados como exemplo. É o caso
do Sobek, um algoritmo de mineração de textos criado em 2007, que produz
gráficos com os termos mais relevantes e as relações entre os principais termos
de um texto em linguagem natural. Segundo o tutorial desenvolvido pelo Grupo de
Pesquisa Gtech.Edu, da UFRGS, o Sobek, por sua interface de fácil utilização,
geralmente é adotado como ferramenta em projetos de apoio à leitura crítica e
ao letramento, mesmo no caso de crianças em idade escolar (UFRGS, 2017).
A figura 1
apresenta o grafo produzido pelo programa Sobek, a partir do texto do romance O Presidente Negro, de Monteiro Lobato
(2009).
Figura 1 – Grafo de mineração do texto de O Presidente Negro
Fonte: Elaborado pelos autores utilizando
o programa Sobek (2019)
Pode-se perceber
que o grafo apresenta termos recorrentes no texto escrito por Monteiro Lobato,
dando destaque diferente conforme a frequência com que o termo ocorre. As
linhas representam relações textuais entre os termos. Tanto os balões
diferenciados que representam a frequência dos termos, como as linhas que
representam relações, são indicativos do reconhecimento de padrões no texto por
parte do programa. Por se tratar de uma narrativa, é de esperar que os nomes
dos personagens tivessem aparição relativamente destacada. A figura 2 apresenta
o grafo deste artigo, produzido através da mineração do texto executada pelo
programa Sobek. O prezado leitor pode comparar sua própria leitura com a
mineração feita algoritmicamente pelo programa, que resultou no destaque dos
termos e das setas indicando relação, conforme apresentado na figura 2.
Figura 2 – Grafo de mineração do texto do
artigo “Humanidades Digitais e a simbiose entre humano e máquina –
Algumas reflexões comparativas entre a interpretação e a mineração de textos”
Fonte: Elaborado pelos autores
utilizando o programa Sobek (2019)
Poder-se-ia fazer
a objeção de que a complexidade do Sobek é muito baixa, a ponto de permitir uma
discussão mais detalhada da relação simbiótica entre leitura e mineração de
textos. Mas as vantagens de apresentar o Sobek como exemplo são: Primeiro, que
este programa vem sendo empregado em diversas iniciativas de aprendizagem da
leitura e interpretação de textos, em processos educacionais que se
caracterizam pela relação com a tecnologia digital. Uma dessas iniciativas está
descrita no artigo “Estratégias
pedagógicas de apoio à leitura, à escrita e ao acompanhamento baseadas na
tecnologia de mineração de texto” de Macedo et al. (2011), citado acima. A segunda razão é que, para fins de
sua própria experiência, qualquer leitor pode manusear
o programa Sobek, e testar sua aplicação na mineração de textos, já que este
não requer conhecimento de linguagens artificiais de programação (vide http://sobek.ufrgs.br/).
Outros
programas de mineração de textos que se pode mencionar aqui são o Iramuteq (http://www.iramuteq.org/) e o NLTK - Natural
Language Tool Kit (https://www.nltk.org/). Ambos são usados
para fins de pesquisa científica, devido a seu alto desempenho. Contudo, exigem
conhecimentos mais avançados de computação para serem manuseados. Não importa
se a inteligência depositada nestes programas seja oriunda da inteligência de sucessivas
etapas de projeto, por parte dos engenheiros que os projetaram. Para os fins a
que se destinam, a saber, a análise e descoberta de informações não triviais em
textos escritos, os programas de mineração de textos são casos daquilo que se
chama ‘inteligência artificial’. Enquanto ferramenta de descoberta de ordem,
padrões e regularidades, a mineração de textos é um instrumento de análise que
melhora a interpretação, mesmo que jamais substitua
a interpretação.
6 CONSIDERANDO
LEITURA E MINERAÇÃO DE TEXTOS EM UM ‘RELACIONAMENTO SIMBIÓTICO’
O fenômeno da
existência e aplicabilidade de programas computacionais que revelam informações
significativas em textos provoca inevitavelmente uma comparação entre a
mineração de textos, feita por computadores, e a leitura, feita pela mente
humana. Além da possibilidade de empregar a mineração
de textos como ferramenta, substituindo o demorado
esforço de análise de grandes volumes de textos, é interessante comparar a mineração
de textos com a leitura, em termos de suas operações
sobre o objeto-texto.
Isso
é revelador do que a mente faz com o texto quando está lendo, e por uma teoria
da leitura baseada nesta comparação, é possível explicar este comportamento
complexo que se denomina interpretação. Este é o ponto crítico da presente
discussão, a interpretação direta pela leitura não necessita transformação ou
preparação prévia dos “dados”. Ela se baseia numa comunicação direta pela via
da língua escrita, que dispensa intermediários. AY Liu, em seu artigo “The Meaning of Digital Humanities” (2013), fala
de “linhas de interpretação geradas pela observação de máquinas[10]” (AY,
2013, p. 414, tradução nossa). O artigo, como o título revela, está interessado
em discutir a questão do significado no cenário das HD.
Na passagem, o
autor está se referindo a um desenvolvimento no desempenho da leitura, que é
obtido pelo emprego da mineração de textos. Diz ele que
[...] um
computador deve ser capaz de ler textos algoritmicamente e descobrir
agrupamentos e padrões de palavras sem agir sobre o conceito inicial de um
intérprete procurando confirmar um tema particular[11] (AY, 2013, p. 414, tradução nossa).
Seu ponto de
vista é ousado: para Ay Liu a tecnologia digital abre possibilidades de
construção do significado dos textos escritos, possibilitando desenvolvimentos
que não seriam possíveis sem a simbiose entre o leitor e a máquina. Note-se o
uso da expressão “ler algoritmicamente”, para se referir à descoberta que a
mineração de textos faz de padrões relevantes e informações na estrutura do
texto. Esta forma de se referir à mineração de textos parece ser compatível, em
grande medida, com a suposição de uma simbiose entre a mente e o computador
digital.
Aqui é o
momento de retomar esta noção de simbiose entre a mente humana e o computador,
apresentada no início da discussão, e aplicá-la adequadamente ao caso da
relação entre a leitura e a
mineração de textos. O Oxford English
Dictionary (OED) define o termo como: “Interação entre dois organismos
diferentes vivendo em associação física próxima, tipicamente para a vantagem de
ambos[12]”
(OED). Essa noção específica da biologia é estendida a um sentido mais amplo e
geral: “Um relacionamento mutuamente benéfico entre diferentes pessoas ou
grupos[13]”
(OED). Uma simbiose é uma relação entre dois
organismos de espécies diferentes que, no curso da evolução, encontraram mútuo
benefício em compartilhar os recursos do ambiente. Simbiontes são organismos
que empregam uma forma de vida relacional, compartilhada, como estratégia
adaptativa em longo prazo.
Não é sem razão
que as ciências cognitivas, esta área interdisciplinar de estudo que se volta à
compreensão da mente humana, conduzem suas pesquisas em proximidade com partes
importantes da ciência da computação e da inteligência artificial. Howard
Gardner, em sua obra A nova ciência da
mente (1996), um clássico deste campo, menciona como um dos pilares das
ciências cognitivas
[...] a crença de
que o computador eletrônico é essencial para qualquer compreensão da mente
humana. Os computadores não apenas são indispensáveis para a realização de
estudos de vários tipos, mas, de forma mais crucial, o computador também é útil
como o modelo mais viável de como a mente humana funciona (GARDNER, 1996, p.
20).
Esta característica
das ciências cognitivas tem a ver com a revolução na tecnologia digital. Esta
tecnologia é que permitiu o planejamento dos computadores e a possibilidade de
utilizá-los para analisar dados, como ocorre com os textos em linguagem
natural. Claro está que uma mente é algo radicalmente diferente de um
computador. Mas as operações de ambos têm uma enorme semelhança que é causal, e
não casual. Mas são as diferenças entre a mente e o computador, e o desempenho
excelente de cada uma destas entidades em seu domínio específico, que
justificam a alegação de uma relação simbiótica com propósitos coordenados.
Asimov
formula a sua ideia de relacionamento simbiótico a partir da constatação de que
[...] o cérebro
humano, composto de ácido nucléico e proteína em meio aquoso, resulta de três
bilhões e meio de anos de evolução biológica, baseada em efeitos fortuitos da
mutação, seleção natural e outras influências, e estimulada pela necessidade de
sobrevivência (ASIMOV, 2005, p. 14).
A par disso,
temos o computador digital que,
[...] composto
por interruptores eletrônicos e corrente elétrica em meio metálico, resulta de
quarenta anos de aperfeiçoamento da criação humana, baseada em meticulosa
previsão e na engenhosidade do próprio homem, e estimulada pela necessidade de servir
a seus usuários” (ASIMOV, 2005, p. 14).
A proposta que se
faz na presente reflexão é de que a mente humana e os computadores digitais
sejam vistos como entidades simbiônticas, considerando o vasto pano de fundo de
um processo de evolução.
Trata-se aqui da
evolução das próprias entidades, mas também do ambiente em que elas se
encontram e no qual a simbiose é uma estratégia adaptativa. Em um trabalho
intitulado “Fundamentos filosóficos para uma teoria evolutiva da informação e
da cultura” (MATOS, 2016), esta ideia evolutiva e ambiental da atual sociedade
da informação foi apresentada em maiores detalhes. No caso presente, este
ambiente é a cultura, constituída de narrativas, conhecimentos, valores e
mensagens. Mais especialmente, é a cultura considerada como o conjunto dos
artefatos de todos os tipos, e também como uma espécie de herança, ou legado,
cuja apropriação, transformação e transmissão constituem a vida cultural.
Norbert
Wiener (2016), discute esta relação entre humano e máquina, na aurora da era
digital, em sua obra Cibernética
(publicada inicialmente em 1947). Na época, a situação do computador em relação
à mente humana já dava margem a comparações, e o futuro da computação parecia
ao autor, estar ligado a uma concepção da mente e da inteligência. Dizia ele
que: “De há muito é claro para mim que o moderno computador ultrarrápido era em
princípio um sistema nervoso central ideal para um aparelho de controle
automático” (WIENER, 2016, p. 50). O computador digital logo se apresentou como
uma metáfora do cérebro humano, e sua distinção essencial é o alto desempenho
em operações rotineiras ou automáticas de processamento de informação.
Wiener
(2016), além disso, antecipou uma futura convivência do computador com o
humano, em que a divisão de tarefas implicasse no bem-estar das pessoas.
Segundo suas palavras: “Pode ser ótimo para a humanidade que a máquina
desobrigue do trabalho servil e desagradável, mas também pode não o ser”
(WIENER, 2016, p. 50). Este resultado “ótimo para a humanidade”, conforme o
autor exige o cultivo de princípios e valores humanísticos, a partir dos quais
as decisões e a conduta individual e social possam se estruturar na direção de
uma simbiose bem sucedida. “A resposta, sem dúvida, é ter uma sociedade baseada
em outros valores humanos que não os da compra ou da venda” (WIENER, 2016, p.
51). Aqui se inaugura a questão moral do emprego da tecnologia informacional,
pois a relação entre máquina e humano pode muito bem resultar em conflito, ou
negligência - no caso das possibilidades de evolução tanto da tecnologia quanto
da cultura humana não receberem a devida atenção nos estudos e iniciativas
relevantes.
Autores como
Dennett (1998), Floridi (2011) e Gleick (2013), apresentam em suas reflexões
uma caracterização da sociedade digital como um meio ambiente. Dennett afirma: “Somos a única espécie que tem um meio extra de
preservação e comunicação de projeto: a cultura” (DENNETT, 1998, p. 352). A
cultura humana - sobretudo com o desenvolvimento do ciberespaço - é
constitutiva de um tipo novo e desafiador de ambiente, em que a espécie humana
procura se adaptar. Esta cultura digital é um ambiente em que a busca da
adaptação pelos seus habitantes leva a relações interativas e a um processo
complexo de evolução, nos termos do que se pode chamar uma infosfera.
No livro A mente pós-evolutiva (2010), João de
Fernandes Teixeira considera que a evolução humana sofre os efeitos da
civilização – e recentemente da tecnologia digital. A computação é examinada
por ele à luz desta concepção num discurso que o autor denomina de “filosofia
da mente no universo de silício” (TEIXEIRA, 2010). Suas conclusões sobre o
futuro desenvolvimento da civilização apontam para o inevitável estreitamento
da relação dos humanos com os computadores, bem como os avanços da inteligência
artificial. Para Teixeira:
O mundo
pós-evolutivo não será nem melhor nem pior que o atual. O desenvolvimento da
tecnologia parece ser nossa única saída para sobreviver à involução. A
parabiose, ou seja, nossa mistura com as máquinas, não é um aperfeiçoamento
artificial da espécie humana, mas sim uma de suas últimas tentativas de
sobreviver (2010, p. 154).
Esta concepção do
efeito da relação com os computadores, sob um pano de fundo de desenvolvimento
e evolução – biológica e cultural – tem ares de família com a proposta de uma
integração simbiótica entre mente e máquina, na atividade tão fundamental e
necessária da leitura. Poderia ser dito aqui, ao fim do exame de todas essas
evidências e ideias, que as HD são muito mais do que um elenco de ferramentas e
procedimentos para recuperação, análise e disseminação da cultura humanística.
As HD são parte de uma estratégia mais ampla da própria sobrevivência e
perspectiva de crescimento dessa cultura, amparada pelos recursos da tecnologia
digital.
7 CONSIDERAÇÕES
FINAIS
A vida cultural
está migrando velozmente para uma sociedade da informação, ou infosfera, que se
caracteriza pelo fluxo intenso e constante de grandes volumes de dados,
especialmente pela via das redes digitais. Por sua vez, as HD podem ser
consideradas como o campo de estudos e iniciativas envolvendo a promoção dos
valores desta vida cultural na infosfera, ou seja, no ambiente digital. Admitindo a diferença essencial entre as funções
mentais e as funções das máquinas, a cooperação simbiótica entre mente e
máquina favorece o desempenho de ambas. A saída simbiôntica, considerando a
relação entre a leitura e a mineração de textos, e sua ampla difusão nas
práticas de pesquisa e projetos das HD, contribui para a adaptação dos seres humanos
ao ambiente mutável de sua própria cultura. Dada a vastidão insondável desta
cultura, a simbiose é um recurso adaptativo que, hoje em dia, parece cada vez
mais irreversível. O caminho evolutivo dos próprios computadores, e a modelagem
da inteligência artificial que estes incorporam, estão determinados por esta
relação.
Na
medida em que a discussão das questões aqui propostas desperte o interesse da
comunidade de estudiosos das HD, abre-se a possibilidade de que a relação entre
a leitura e a mineração de textos seja alvo de investigação científica mais
específica. O presente trabalho terá cumprido sua finalidade se puder incitar a
indagação dos pesquisadores na direção desta forma de conceber a situação da
leitura e da mineração de textos frente aos princípios e valores teóricos das
HD.
Para
além dos limites desta discussão, permeada de ligações com a literatura e a
filosofia, permanece aberta a possibilidade de pesquisas mais pontuais. Um
levantamento exaustivo de projetos de HD em que a mineração de textos é
empregada em correlação com os hábitos e procedimentos de leitura, com uma
análise crítica dos resultados obtidos em tais projetos, por exemplo, seria uma
contribuição relevante para esta discussão.
Por
último, deixa-se o prezado leitor com uma provocação, motivada por todo o
percurso teórico e argumentativo apresentado acima: A relação simbiôntica entre
a leitura e a mineração de textos é um caso específico da relação simbiôntica
mais geral entre a mente humana e o computador digital. Esta relação,
considerando todo o discurso desenvolvido até aqui, poderia ser considerada
como o método geral das HD. Em outras palavras, a prática das HD, a julgar
pelas afirmações de seus intérpretes, é o desenvolvimento de diversas
iniciativas particulares, cuja forma geral é a de uma simbiose entre o ser
humano e o computador digital. Uma simbiose cujos benefícios e os riscos sequer
começam a ser observados com nitidez, na rápida evolução cultural a que todos
estamos submetidos.
REFERENCIAS
ARANHA, Christian; PASSOS, Emmanuel. A tecnologia de
mineração de textos. RESI: Revista
eletrônica de sistemas de informação, Curitiba,
v. 5, n. 2. 2006. Disponível em:
http://www.periodicosibepes.org.br/index.php/reinfo/article/view/171.
Acesso em 25 de janeiro de 2019.
ASIMOV, Isaac. Os robôs, os
computadores e o medo. In: WARRICK,
Patricia S.; GREENBERG, Martin H. (orgs.). Histórias
de Robôs. Porto Alegre: L&PM, 2005. v. 2.
CUARTAS-RESTREPO, J. M. Humanidades digitales, dejarlas
ser. Revista Colombiana de Educación, Bogotá, n. 72, p. 65-78. 2017.
DENNETT, Daniel. A
Perigosa ideia de Darwin. São Paulo: Rocco, 1998.
DESCARTES, René. Discurso
do Método. São Paulo: Nova Cultural, 1984.
FLORIDI, Luciano. The Philosophy of Information. London:
Routledge, 2011.
GLEICK, James. A
informação: uma teoria, uma história, uma enxurrada. São Paulo: Cia das
Letras, 2013.
LEYVA, Elsa M. Ramírez. ¿Qué es leer? ¿Qué es La lectura? Investigación Bibliotecológica, México.
v. 23, n. 47, enero/abril. 2009.
LOBATO, Monteiro. O Presidente Negro. São Paulo:
Globo, 2009.
MACEDO,
Alexandra Lorandi et al. Estratégias
pedagógicas de apoio à leitura, à escrita e ao acompanhamento baseadas na
tecnologia de mineração de texto. In:
SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO – SBIE, 22., 2011, Aracaju,
Anais do XXII SBIE - XVII WIE, Aracaju: SBIE, 2011. p. 1017-1026.
MANOVICH, Lev. The Science of Culture? Social computing, Digital Humanities and
Cultural Analytics. Journal of
cultural Analytics, May 23. 2016.
MATOS, José Claudio. A interpretação de textos e a formação da pessoa reflexiva – sobre a
concepção deweyana da leitura. Educação
e Filosofia, Uberlândia, v. 27, n. 54, p. 579-596, jul./dez. 2013.
MATOS,
José Claudio. Fundamentos
filosóficos de uma teoria evolutiva para a informação e a cultura. In: ENCONTRO NACIONAL DE PESQUISA EM
CIÊNCIA DA INFORMAÇÃO, 17., 2016, Salvador. Anais [...]. v.
1. p. 1-20. João Pessoa: UFPB, 2016.
MORAIS, Edison Andrade Martins; AMBRÓSIO, Ana Paula L. Mineração de textos. Goiás: UFG, 2007.
(Relatório Técnico. Instituto de Informática). Disponível em:
http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_005-07.pdf.
Acesso em 25 de janeiro de 2019.
MORAIS, José. A Arte de ler. Lisboa: Edições 70. 2002.
PRIANI, E. El texto digital y ladisyuntiva de las
humanidades digitales. Palabra Clave,
Buenos Aires, v. 18, n. 4, p. 1215-1234. 2015.
SÁNCHEZ, Adriana Álvarez. La diversidad Cultural em las HD.
In: PRIANI SAISO, Ernesto et al. Humanidades Digitales: Lengua, texto, Patrimonio. Mexico:
Bonilla y Red de Humanidades Digitales, 2018. p. 183-208.
SYMBIOSIS. In:
OXFORD English Dictionary. Versão online. [S.
l.]: Disponível em: https://en.oxforddictionaries.com/definition/symbiosis. Acesso
em 30 de janeiro de 2019.
TĂUT, Val Codrin. Beyond the tale of the ‘two
cultures’: filling the gap between algorithms and interpretation. In: INTERNATIONAL SCIENTIFIC
CONFERENCE E LEARNING AND SOFTWARE FOR EDUCATION, 13., 2017, Bucharest, Proceedings [...]. [S.l.]; Bucharest, 2017.
TEIXEIRA, João de Fernandes. A mente pós-evolutiva: filosofia da mente em um universo de
silício. Petrópolis: Vozes, 2010.
UNIVERSIDADE
FEDERAL DO RIO GRANDE DO SUL. Sobek
quick reference guide. Grupo de Pesquisa Gtech.edu. UFRGS, 2017.
WIENER, Norbert. Cibernética:
o controle no animal e na máquina. São Paulo: Cia das Letras. 2016.
[1] “[...] en esencia lo que ha cambiado en las “humanidades digitales” es la escritura, tan sujeta a la razón y a la lógica de los lenguajes verbales, pero tan diametralmente diferente al doble movimiento de abstracción y descripción de otras formas de representación como las gráficas y las imágenes” (CUARTAS, 2017, p. 73).
[2] “[...] desplazamiento del centro de operaciones de la vida acadêmica” (CUARTAS, 2017, p. 73).
[3] “[...] espacio de aplicación y reflexión académica
sobre el uso de métodos y sistemas computacionales en las humanidades”
(PRIANI, 2015, p. 1218).
[4] “[...] non-dogmatic understanding of Digital Humanities” (TĂUT, 2017, p. 2).
[5] “[...] la lengua y sus usos, el rescate Del patrimonio tangible e intangible y los sistemas educativos” (SÁNCHEZ, 2018, p. 183).
[6] “[...] this first step in the development of Digital Humanities was largely dominated by linguistic and literary analysis” (TĂUT, 2017, p. 2).
[7] “[...] empezaron a cuestionar sus paradigmas,sino
también un campo de interés para el ámbito cultural, en un contexto donde se
vislumbraban cambios del modelo cultural, el proyecto social y la tecnologia”
(LEVYA, 2009, p. 163).
[8] “[...] la lectura y la formación de lectores” (LEVYA, 2009, p. 163).
[9] “[...] the analysis of massive cultural data sets and flows using computational and visualization techniques” (MANOVICHI, 2016, p. 1).
[10] “[...] lines of inter-pretation generated by machine observation” (AY, 2013, p. 414).
[11] “[...] a computer should be able to read texts algorithmically and discover word cohorts or clusters leading to themes without acting on an initial concept from an interpreter looking to confirm a particular theme” (AY, 2013, p. 414).
[12] “Interaction between two different organisms living in close physical association, typically to the advantage of both” (OED).
[13] “A mutually beneficial relationship between different people or groups” (OED).