O audiolivro e a inteligência artificial “leitora”: fronteiras intermidiais

Autores

  • Jaimeson Machado Garcia Programa de Pós-Graduação em Sistemas e Processos, Universidade de Santa Cruz do Sul, Santa Cruz do Sul, RS, Brasil https://orcid.org/0000-0002-3398-6828
  • Ana Cláudia Munari Domingos Programa de Pós-Graduação em Sistemas e Processos, Universidade de Santa Cruz do Sul, Santa Cruz do Sul, RS, Brasil https://orcid.org/0000-0002-6629-588X
  • Rejane Frozza Programa de Pós-Graduação em Sistemas e Processos, Universidade de Santa Cruz do Sul, Santa Cruz do Sul, RS, Brasil https://orcid.org/0000-0002-3415-0870

DOI:

https://doi.org/10.18617/liinc.v19i1.6295

Palavras-chave:

Audiolivro, E-book, Inteligência artificial, Intermidialidade, Re-midiação

Resumo

O audiolivro é um tipo de mídia que, historicamente, demanda da gravação da leitura de um texto em voz alta capaz de ser reproduzida para ser midiado. Quando essa “leitura”, no entanto, é feita por uma Inteligência Artificial, a exemplo da assistente virtual Alexa, ainda podemos compreender esse produto de mídia sonoro como um audiolivro? Entendendo essa pergunta como uma questão que emerge de novas relações entre as mídias digitais, o presente artigo tem por objetivo definir que tipo de fenômeno é esse. Para isso, buscamos nos Estudos de Intermidialidade, a partir dos modelos propostos por Lars Elleström (2021), junto, ainda, a outros autores que nos auxiliaram a preencher determinadas lacunas e aprofundar outras de sua teoria, os elementos necessários para essa análise. Para ser possível aprofundarmos tal discussão, tomamos de exemplo o e-book e o audiolivro de O Alquimista (COELHO, 2017 [1988]), de Paulo Coelho, para a comparação entre a leitura realizada por um humano e a “leitura” realizada por uma Inteligência Artificial. A partir da análise, concluímos que a “leitura” realizada pela Alexa é, na verdade, uma oralização (BAJARD, 2014), o que corresponde a um processo de decodificação sonoro das palavras. Assim, quando comparada a um audiolivro lido por um ser humano, resultado de uma transmidiação, a decodificação da Alexa se trata de uma “re-midiação”, isto é, uma re-exibição das modalidades material, espaçotemporal, sensorial e potencialmente semióticas de um e-book por meio de uma mídia técnica de exposição diferente

Biografia do autor

Ana Cláudia Munari Domingos , Programa de Pós-Graduação em Sistemas e Processos, Universidade de Santa Cruz do Sul, Santa Cruz do Sul, RS, Brasil

Professora do Programa de Pós-Graduação em Letras da Universidade de Santa Cruz do Sul. Subcoordenadora dos Cursos de Letras, Letras EaD e Secretariado Executivo da Universidade de Santa Cruz do Sul (2020-atual). Doutora em Letras pela Pontifícia Universidade Católica do Rio Grande do Sul (2011), na área de Teoria da Literatura. Pós-Doutorado em Comparative Studies - Intermediality, na Linnéuniversitetet, Suécia, Linhas de Pesquisa: Estudos literários e midiáticos e Estudos de Mediação em Leitura. Grupos de pesquisa: Genalim (CNPq); Intermídia (CNPq); Literatura, artes e mídias (Anpoll). Projetos de pesquisa: Linguagens e suas tecnologias: intermidialidade e leitura; Intermidialidade: objetos, teorias, metodologias e práticas (Bolsa de Produtividade em Pesquisa CNPq); Linguagens e suas tecnologias: leitura das mídias na Educação Básica. Coordenadora do GT Intermidialidade: Literaturas, Artes e Mídias (2018-atual). Membro do Conselho da Anpoll (2020-atual). Membro do corpo editorial da Revista Rizoma (2021-atual). Atua principalmente nos seguintes temas: Teoria da Literatura; Literatura Comparada; Intermidialidade; Linguagens e suas tecnologias na Educação Básica; Ficção contemporânea; Quadrinhos; Cinema; Leitura das mídias. Email: ana.c.munari@gmail.com.

Rejane Frozza, Programa de Pós-Graduação em Sistemas e Processos, Universidade de Santa Cruz do Sul, Santa Cruz do Sul, RS, Brasil

Possui graduação em Informática pela Pontifícia Universidade Católica do Rio Grande do Sul (1993), mestrado em Computação pela Universidade Federal do Rio Grande do Sul (1997) e doutorado em Computação pela Universidade Federal do Rio Grande do Sul (2004). Realização de estágio doutoral sanduíche na Université Joseph Fourier (Grenoble/France) de 2001 a 2002. Atualmente é professora adjunta da Universidade de Santa Cruz do Sul, Santa Cruz do Sul, RS, no Departamento de Computação e no Programa de Pós-Graduação em Sistemas e Processos Industriais - Mestrado. Tem experiência na área de Computação, com ênfase em Inteligência Artificial, atuando principalmente nos seguintes temas: Sistemas Tutores Inteligentes, Agentes Pedagógicos em Sistemas Virtuais de Aprendizagem, Gestão do Conhecimento, Sistemas Multiagentes, Redes Neurais Artificiais, Sistemas Difusos, Sistemas de Raciocínio Baseado em Casos. ORCID: https://orcid.org/0000-0002-3415-0870. Research ID: A-4548-2019.

Referências

ADAMOPOULOU, E.; MOUSSIADES, L. Chatbots: History, technology, and applications. Em: Machine Learning with Applications. Vol 2. 2020. DOI: https://doi.org/10.1016/j.mlwa.2020.100006

BAJARD, Élie. Ler e dizer: compreensão e comunicação do texto escrito. São Paulo, SP: Cortez, 2014.

BOLTER, Jay David. GRUSIN, Richard. Remediation: Understanding New Media. Cambridge (MA): MIT Press, 2000.

BROCH, José Carlos. O conceito de affordance como estratégia generativa no design de produtos orientado para a versatilidade. [Em linha] Dissertação (Mestrado em Design e Tecnologia). Porto Alegre, RS: Universidade Federal do Rio Grande do Sul. [Acesso em 22 janeiro 2022]. Disponível em: https://www.lume.ufrgs.br/bitstream/handle/10183/25510/000752864.pdf

BRUHN, Jørgen Bruhn; SCHIRRMACHER, Beate. Intermedial studies. Em: BRUHN, Jørgen Bruhn; SCHIRRMACHER, Beate. Intermedial studies: an introduction to meaning across media. Nova York, NY: Routledge, 2022. DOI: https://doi.org/10.4324/9781003174288

CHARMEUX, Eveline. Apprendre à lire: échecá l’échec. Paris: Milan, 1987.

CHION, Michel. The three listening modes. Em: STERNE, Jonathan. The Sound Studies Reader. Nova York, NY: Routledge, 2012.

COELHO, Paulo. O Alquimista. Ledor: Beth Goulart. São Paulo, SP: Paralela, 2021. Audiolivro.

COELHO, Paulo. O Alquimista. São Paulo, SP: Paralela, 2017. E-book.

ELLESTRÖM, Lars. As modalidades das mídias II: um modelo expandido para compreender as relações intermidiais. Tradução: Beatriz Alves Cerveira, Júlia de Oliveira Rodrigues e Juliana de Oliveira Schaidhauer. Porto Alegre: EDIPUCRS, 2021.

ELLESTRÖM, Lars. The Modalities of Media: A Model for Understanding Intermedial Relations. Em: ELLESTRÖM, Lars (ed.). Media Borders, Multimodality and Intermediality. Basingstoke, Inglaterra: Palgrave Macmillan, 2010. p. 11-48. DOI: https://doi.org/10.1057/9780230275201_2

GOLD, Ben. MORGAN, Nelson. ELLIS, Dan. Speech and audio signal processing: processing and perception of speech and music. Nova Jersey, NJ: Wiley, 2011. DOI: https://doi.org/10.1002/9781118142882

HUANG, Xuedong; ACERO, Alex; HON, Hsiao-Wuen. Spoken Language Processing: A Guide to Theory, Algorithm and System Development. Nova Jersey, NJ: Prentice Hall, 2001.

LECUN, Y., BENGIO, Y., HINTON, G. (2015). Deep learning. Em: Nature, 521(7553), p 436-444. DOI: https://doi.org/10.1038/nature14539

MITCHELL, T. M. (1997). Machine learning. Burr Ridge, IL: McGraw Hill, 45(37), p. 870-877.

MITCHELL, William John Thomas. Picture Theory: Essays on Verbal and Visual Representation. Chicago: University of Chicago Press, 1994.

RABINER, L. R.; SCHAFER, R. W. Introduction to digital speech processing. Nova Jersey, NJ: Prentice Hall, 2010.

REZENDE, Solange Oliveira. Sistemas Inteligentes – Fundamentos e Aplicações. São Paulo: Manole, 2003.

RUSSEL, Stuart J.; NORVIG, Peter. Inteligência Artificial. Rio de Janeiro: Elsevier, 2004.

JENSEN, Signe Kjær; SALMOSE, Niklas. Media and modalities – Film. In: BRUHN, Jørgen; SCHIRRMACHER, Beate. (Aut.). Intermidial studies: an introduction to meaning across media. 1 ed. Nova York: Routledge, 2022. p. 28-41 DOI: https://doi.org/10.4324/9781003174288-2

SANTAELLA, Lucia. Comunicação Ubíqua: repercussões na cultura e na educação. São Paulo: Paulos, 2013.

SANTAELLA, Lucia. Matrizes da linguagem do pensamento: sonora visual verbal: aplicações na hipermídia. 3ª Ed. São Paulo: Iluminuras, 2005.

SANTAELLA, Lucia. Neo-humano: a sétima revolução do Sapiens. São Paulo: Paulus, 2022. Edição do Kindle.

SONNENSCHEIN, David. Sound design: the expressive power of music, voice, and sound effects in cinema. Michigan: Michael Wiese Productions, 2001.

TAYLOR, Paul. Text-to-Speech Synthesis. Nova York, NY: Cambridge University Press, 2009. DOI: https://doi.org/10.1017/CBO9780511816338

ZUMTHOR, Paul. Perfomance, recepção, leitura. Tradução: Jerusa Pires Ferreira e Suely Fenerich. São Paulo, SP: Ubu Editora, 2018.

ZUMTHOR, Paul. “A poesia e a voz.” In: ZUMTHOR, Paul. Escritura e nomadismo: entrevistas e ensaios. Cotia, SP: Ateliê Editorial, 2005.

Downloads

Publicado

07/06/2023

Como citar

GARCIA, J. M.; DOMINGOS , A. C. M.; FROZZA, R. O audiolivro e a inteligência artificial “leitora”: fronteiras intermidiais. Liinc em Revista, [S. l.], v. 19, n. 1, p. e6295, 2023. DOI: 10.18617/liinc.v19i1.6295. Disponível em: https://revista.ibict.br/liinc/article/view/6295. Acesso em: 27 abr. 2024.

Edição

Seção

O digital, o tradicional, o novo normal? Espaços, políticas e agentes de Leitura