ARTIGO  
PROVENIÊNCIA DE DADOS E INTELIGÊNCIA ARTIFICIAL EM  
SAÚDE  
desafios e implicações éticas sob a ótica da ciência da informação  
Márcio José Sembay  
Universidade Federal de Santa Catarina/UFSC  
Douglas Dyllon Jeronimo de Macedo  
Universidade Federal de Santa Catarina/UFSC  
______________________________  
Resumo  
A proveniência de dados e a inteligência artificial são cruciais na saúde, garantindo a integridade e a  
transparência das informações. A proveniência possibilita a rastreabilidade dos dados em diagnósticos,  
promovendo confiança nas decisões clínicas, enquanto a inteligência artificial analisa grandes volumes de dados,  
facilitando a identificação de padrões e a personalização de tratamentos. É relevante abordar a proveniência de  
dados e a inteligência artificial no contexto da saúde, enfatizando seus desafios e implicações éticas, com o  
objetivo de fornecer orientações a pesquisadores e profissionais da área. Este estudo teve como objetivo  
apresentar os desafios e implicações éticas evidenciadas nas publicações científicas encontradas sobre a  
proveniência de dados e a inteligência artificial no contexto de saúde. Realizamos uma revisão integrativa  
utilizando como estratégia de busca os termos Data Provenance and Artificial Intelligence and Health. Após  
analisar os resultados obtidos e revisar os textos completos, identificamos e selecionamos 2 artigos  
internacionais relevantes para a temática em questão. Nossa pesquisa evidencia a escassez de estudos sobre a  
proveniência de dados e a inteligência artificial em saúde, especialmente no que tange aos desafios e implicações  
éticas relacionados a esses processos. Nesse contexto, este trabalho constitui uma contribuição relevante para o  
campo da Ciência da Informação. Para pesquisas futuras sobre a temática aqui em questão, é fundamental  
desenvolver frameworks e diretrizes que integrem considerações éticas e práticas de governança de dados,  
abordando a proteção da privacidade, a transparência dos algoritmos e a mitigação de viés, além de aprofundar a  
pesquisa em estudos interdisciplinares.  
Palavras-chave: Proveniência de dados. Inteligência Artificial. Informação em saúde.  
Esta obra está licenciada sob uma licença  
Creative CommonsAttribution 4.0 International (CC BY-NC-SA 4.0).  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
1 INTRODUÇÃO  
Segundo Strecker (2017), na obra de Habermas, o autor estabelece uma distinção entre  
dados, informações e conhecimento, enfatizando a importância da comunicação e do  
entendimento mútuo na formação da sociedade. Habermas argumenta que a informação deve  
ser contextualizada dentro de um espectro mais amplo de comunicação. Para ele, o mero  
acúmulo de dados é insuficiente; é a interpretação e o diálogo que conferem significado a  
esses dados, transformando-os em informações úteis. Sua teoria da ação comunicativa sugere  
que o entendimento e a racionalidade emergem por meio de processos de interação social.  
No contexto da saúde, a distinção proposta por Habermas é particularmente relevante,  
pois os dados clínicos e estatísticas de saúde devem ser interpretados e discutidos em um  
ambiente de diálogo aberto, onde todos os envolvidos possam expressar suas preocupações e  
necessidades. A informação em saúde, portanto, não deve ser apenas um acúmulo de dados  
estatísticos, mas deve ser compreendida como um conjunto de saberes construídos  
coletivamente. Além disso, a teoria da ação comunicativa de Habermas pode ser utilizada para  
fortalecer a esfera pública em torno de temas de saúde, promovendo debates e discussões que  
considerem diferentes perspectivas. Isso é fundamental para o desenvolvimento de políticas  
de saúde inclusivas e para a construção de um sistema de saúde que atenda verdadeiramente  
às necessidades da população. Assim, a teoria de Habermas compactua com a relação entre a  
Ciência da Informação (CI) e a saúde que transcende o simples manejo de acervos  
documentais e científicos, uma vez que envolve a produção de informações pelos  
profissionais da área da saúde. Para Neves e Braz (2018) o ciclo da informação,  
especialmente em relação ao seu uso, abre novas perspectivas para o estudo do  
comportamento informacional.  
2
Desta forma, a interação entre a CI e a saúde gera competências em informação em  
saúde, que, segundo Fong et al (2018), referem-se à capacidade de obter, processar e  
compreender informações essenciais sobre saúde e serviços, necessárias para a tomada de  
decisões adequadas nesse campo. Brito et al (2020) ressaltam que a Tecnologia da  
Informação (TI) frequentemente desempenha um papel crucial nessa inter-relação,  
contribuindo para o desenvolvimento da competência em informação esperada tanto da  
população atendida quanto das organizações de saúde que a assistem.  
Nesse contexto, duas abordagens são fundamentais nos processos de saúde, a  
Proveniência de Dados (PD) e a Inteligência Artificial (IA). Essas duas grandes áreas estão  
interconectadas na saúde de maneira a potencializar a eficácia dos Sistemas de Informação  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
(SI) e a qualidade do atendimento. Segundo Ahmed et al (2023) a PD é fundamental para a  
auditoria e a validação em ambientes de saúde, onde decisões críticas são tomadas com base  
nas informações disponíveis. A transparência na proveniência ajuda a mitigar erros e a  
aumentar a confiança dos profissionais de saúde nos SI.  
Já Obermeyer e Emanuel (2016), afirmam que a IA pode transformar a medicina, mas  
sua eficácia está intrinsecamente ligada à qualidade dos dados utilizados. Portanto, a PD se  
torna um pilar essencial para a implementação segura e eficaz da IA em ambientes de saúde.  
Assim, a proveniência garante que os dados sejam rastreáveis e auditáveis, permitindo  
a identificação de sua origem e das transformações que sofreram. Isso é fundamental em  
ambientes de saúde, onde decisões críticas são baseadas em informações sensíveis e  
complexas. A IA, por sua vez, utiliza esses dados para treinar modelos preditivos e  
diagnósticos, proporcionando insights valiosos e personalizados para o cuidado do paciente.  
Porém, no contexto da saúde, a PD e a IA levantam desafios éticos críticos. A PD  
exige atenção para garantir que todas as fontes sejam confiáveis e que os dados sejam obtidos  
com autorização, respeitando a privacidade dos pacientes. O uso de fontes não autorizadas ou  
incorretas pode resultar em tratamentos inadequados, comprometendo a segurança e a  
integridade dos cuidados médicos.  
3
Além disso, a IA sem regulamentação apropriada pode levar a decisões automatizadas  
sem supervisão humana, com potenciais vieses que afetam a equidade e justiça no  
atendimento. A falta de regulamentação adequada também expõe os dados de saúde a riscos  
de privacidade e segurança, considerando a alta sensibilidade dessas informações.  
Desta forma, investigar a PD e a IA em contextos de saúde sob a ótica da CI é  
essencial para garantir práticas éticas e seguras. Uma estrutura para rastrear e documentar a  
proveniência, a manipulação e o uso dos dados, assegurando sua confiabilidade e  
transparência é essencial.  
No contexto da saúde, onde os dados são altamente sensíveis e diretamente impactam  
o bem-estar dos pacientes, essa abordagem permite que as informações sejam gerenciadas  
com rigor, protegendo a privacidade dos indivíduos e promovendo uma tomada de decisão  
baseada em evidências robustas. Além disso, a aplicação ética de algoritmos de IA é  
fundamental para evitar vieses e desigualdades no atendimento, tornando o uso dessas  
tecnologias mais responsável e alinhado aos princípios de justiça e equidade na saúde.  
Nesse contexto, emergiu a seguinte questão norteadora: quais são os desafios e as  
implicações éticas abordados na literatura sobre a PD e a IA em um contexto geral de saúde?  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
Definiu-se como objetivo desta pesquisa apresentar os desafios e implicações éticas  
evidenciadas nas publicações científicas sobre a PD e a IA no contexto de saúde.  
2 PROVENIÊNCIA DE DADOS  
A PD refere-se à documentação que complementa um dado específico, oferecendo  
informações sobre “como”, “quando”, “onde” e “por que” ele foi obtido, além de indicar  
“quem” o obteve. Essa documentação é importante para assegurar a qualidade e a veracidade  
dos dados, além de ajudar a rastrear a derivação histórica do dado a partir de suas fontes  
originais. Assim, a proveniência é um componente fundamental para garantir a  
reprodutibilidade dos resultados, bem como para facilitar o compartilhamento e o  
reaproveitamento do conhecimento na comunidade científica (Buneman, Khanna; Chiew,  
2001; Freire et al., 2008).  
Ainda, destaca Freire et al (2008), que a PD refere-se à informação que permite  
rastrear a origem histórica de um dado, desde suas fontes iniciais. Essa documentação é  
fundamental para assegurar a reprodutibilidade dos resultados, além de facilitar o  
compartilhamento e o reaproveitamento do conhecimento na comunidade científica. Ademais,  
a proveniência pode incluir dados gerados tanto manualmente quanto automaticamente por SI.  
De acordo com o estudo de Freund, Sembay e Macedo (2019), a PD é um requisito  
fundamental para garantir a confiabilidade e a segurança em SI. Nesse contexto, a  
proveniência permite rastrear as transformações que os dados inseridos nos SI sofreram ao  
longo do tempo (Davidson; Freire, 2008; Sembay; Macedo; Dutra, 2020a).  
4
Portanto, a PD é essencial para garantir a qualidade e a transparência das informações  
em diversas áreas. Ela permite que os usuários rastreiem a origem dos dados, assegurando sua  
autenticidade e a precisão das análises, o que é fundamental para reproduzir resultados em  
pesquisas científicas. Além disso, ajuda a integrar informações de diferentes fontes,  
facilitando a compreensão e a análise. Isso se traduz em decisões mais informadas, sendo vital  
para atender a requisitos legais em áreas reguladas. Em suma, a PD é um pilar que sustenta a  
confiança nas informações que usamos no dia a dia.  
2.1 PROVENIÊNCIA DE DADOS EM SAÚDE  
A PD nos setores de saúde exerce um papel fundamental na garantia da qualidade e da  
confiabilidade das informações médicas. Ao rastrear a origem e a trajetória dos dados,  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
incluindo registros de pacientes, resultados de exames e históricos de tratamentos, a  
proveniência assegura a autenticidade e a precisão das informações. Essa função contribui  
para a reprodutibilidade de estudos clínicos e para a tomada de decisões informadas em  
relação a diagnósticos e terapias. Ademais, a proveniência facilita a integração de dados  
provenientes de diversas fontes, como hospitais, laboratórios e sistemas de saúde pública,  
promovendo uma visão mais abrangente do estado de saúde da população. Dessa forma, a PD  
contribui para a transparência, a segurança e a eficácia no atendimento ao paciente.  
Para Sembay, Macedo e Dutra (2020b) os autores destacam que as aplicações da PD  
em contextos de saúde estão inseridas em um ambiente de crescente pesquisa, abrangendo  
uma variedade de cenários e aplicações. Assim, em diversos contextos de saúde que utilizam  
métodos, técnicas, modelos, metodologias e tecnologias que tratam da PD em Sistemas de  
Informação em Saúde (SIS), esses aspectos tornam-se fundamentais para a melhoria da  
qualidade dos cuidados prestados (Sembay et al., 2023; Sembay, 2023).  
Desta forma, Ahmed et al (2023) discutem a importância da PD em saúde, enfatizando  
que os registros eletrônicos de saúde são essenciais para o tratamento eficaz dos pacientes.  
Eles destacam que a PD permite entender melhor o contexto em que as informações foram  
coletadas. Essa transparência é fundamental para garantir a segurança e a integridade dos  
dados, especialmente em um cenário onde o compartilhamento de informações sensíveis é  
uma prática comum. Além disso, os autores argumentam que a PD é vital para atender à  
crescente necessidade de acesso a informações de saúde, tanto para pesquisadores quanto para  
profissionais de saúde e pacientes, e contribui para a responsabilidade e a confiabilidade dos  
SIS.  
5
Por último, Sembay, Macedo e Marquez Filho (2022) afirmam que a PD pode  
aumentar tanto a segurança quanto a eficiência nos processos de gerenciamento e  
rastreamento de informações de saúde. Além disso, essa prática viabiliza auditorias em  
sistemas locais ou na nuvem, contribuindo para a responsabilização em casos de erros  
médicos ou violações de segurança, além de permitir um acompanhamento detalhado do  
histórico dos dados.  
3 INTELIGÊNCIA ARTIFICIAL  
A IA tem se destacado como uma das tecnologias mais transformadoras do século  
XXI, impactando diversas áreas, incluindo saúde, educação e indústria. Segundo Poole e  
Mackworth (2010), a IA é o campo da Ciência da Computação (CC) que busca criar sistemas  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
que realizem tarefas que, quando executadas por humanos, requerem inteligência. Russell e  
Norvig (2020), destacam que a IA é o estudo de agentes que percebem seu ambiente e tomam  
ações que maximizam suas chances de sucesso em algum objetivo. A definição dos autores  
abrange uma ampla gama de técnicas e aplicações, desde sistemas baseados em regras com  
aprendizado de máquina e redes neurais, permitindo que máquinas realizem tarefas  
tradicionalmente executadas por seres humanos.  
Entretanto, a adoção da IA também apresenta desafios significativos, incluindo  
questões éticas e preocupações com a privacidade dos dados. Como afirma Slussareff (2022),  
os algoritmos não são apenas ferramentas; eles são usados para tomar decisões que podem  
afetar vidas, e isso traz consigo uma responsabilidade considerável.  
Em suma, enquanto a IA promete revolucionar diferentes setores, é imperativo que sua  
implementação seja acompanhada de uma reflexão crítica sobre as consequências éticas e  
sociais, garantindo que o avanço tecnológico não comprometa valores fundamentais como a  
privacidade e a responsabilidade nas decisões tomadas por sistemas automatizados.  
3.1 INTELIGÊNCIA ARTIFICIAL EM SAÚDE  
6
A IA tem se consolidado como uma força transformadora em diversas disciplinas,  
principalmente na área da saúde. Desta forma, a IA na área da saúde está alterando a  
abordagem de diagnósticos e tratamentos.  
Como observado por Topol (2019), a IA pode superar a capacidade humana em várias  
tarefas diagnósticas, proporcionando uma nova era na medicina personalizada. A aplicação de  
algoritmos de aprendizado profundo na análise de imagens médicas tem demonstrado  
resultados significativos, aumentando a rapidez e a precisão dos diagnósticos, além de aliviar  
a carga de trabalho dos profissionais da saúde.  
A IA está transformando o setor de saúde de maneira impressionante, tornando os  
diagnósticos mais rápidos e precisos ao analisar diferentes tipos de exames, possibilitando  
identificar doenças de forma eficiente. Com a capacidade de oferecer tratamentos  
personalizados, a IA leva em conta a proveniência dos dados (dados genéticos e históricos dos  
pacientes), promovendo abordagens mais eficazes.  
Por fim, a IA está contribuindo para acelerar a pesquisa de novos medicamentos,  
analisando grandes volumes de dados para descobrir novas opções de tratamento, tornando a  
gestão de recursos nos setores de saúde mais capazes.  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
3.2 ÉTICA E DESAFIOS PARA A INTELIGÊNCIA ARTIFICIAL EM SAÚDE  
A ética e os desafios da IA em saúde são temas com preocupações crescentes e de alta  
relevância à medida que essas tecnologias se tornam mais integradas nos cuidados médicos.  
De acordo com Char, Shah e Magnus (2018), a IA tem o potencial de transformar a prática  
clínica, mas também levanta preocupações éticas significativas que devem ser abordadas.  
Entre essas preocupações, estão a privacidade dos dados dos pacientes, o consentimento  
informado e o potencial para viés nos algoritmos, que podem levar a desigualdades no  
tratamento e na prestação de cuidados de saúde.  
Outro aspecto importante é a responsabilidade em caso de erros ou falhas nos sistemas  
de IA. Como afirmam Morley et al (2020), a introdução de sistemas de IA na saúde exige  
uma reflexão cuidadosa sobre a atribuição de responsabilidade em situações de erro. Isso  
implica que, à medida que os médicos e profissionais de saúde utilizam essas ferramentas,  
devem entender não apenas suas capacidades, mas também suas limitações, para garantir que  
as decisões clínicas sejam baseadas em dados precisos e representativos.  
Além disso, a transparência é essencial para promover a confiança nas tecnologias de  
IA. A explicabilidade dos algoritmos é, portanto, essencial, especialmente em setores como a  
saúde, onde decisões automatizadas podem impactar diretamente a vida dos pacientes e a falta  
dela nos modelos de IA pode prejudicar a confiança dos usuários e a aceitação dessas  
tecnologias. Portanto, a implementação de diretrizes que garantam que os sistemas de IA  
sejam compreensíveis e transparentes é fundamental para mitigar riscos éticos e assegurar que  
os pacientes e profissionais de saúde possam confiar nas decisões tomadas por essas  
ferramentas (Binns, 2018; Paraman; Anamalah, 2023).  
7
No Brasil, Dourado e Aith (2022) destacam que a ética na IA aplicada à saúde é  
fundamentada pela Lei Geral de Proteção de Dados Pessoais (LGPD). Essa lei orienta a  
coleta, processamento e compartilhamento de dados sensíveis de saúde, com ênfase na  
transparência, segurança e consentimento do paciente. Ela estabelece diretrizes para o uso  
responsável da IA, visando proteger a privacidade e prevenir o uso indevido de dados,  
promovendo um ambiente ético e seguro para a inovação em saúde.  
Portanto, a ética da IA em saúde engloba as questões levantadas pelos autores  
mencionados, e é fundamental enfrentar esses desafios para assegurar uma regulamentação  
eficaz. Isso inclui não apenas os pontos já discutidos, mas também a preocupação em garantir  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
que as inovações tecnológicas beneficiem todos os grupos de maneira equitativa, contribuindo  
para um sistema de saúde mais justo e acessível a todos.  
4 ASPECTOS METODOLÓGICOS  
Este estudo trata de uma revisão integrativa da literatura que de acordo com Souza,  
Silva e Carvalho (2010), é um método de pesquisa que permite sintetizar e analisar evidências  
de diferentes estudos sobre um determinado tema, integrando conhecimentos de diversas  
fontes. Esse tipo de revisão é especialmente útil para abordar questões complexas, pois  
proporciona uma visão abrangente e crítica sobre o estado atual do conhecimento. Assim, esse  
tipo de revisão permite a coleta e análise sistemática de informações, com o objetivo de  
esclarecer questões de pesquisa e embasar a prática e a tomada de decisões. Assim, os passos  
adotados neste processo incluíram a formulação da pergunta orientadora, a identificação da  
amostra através da revisão da literatura, a categorização dos estudos, a avaliação e análise dos  
dados, e, finalmente, a síntese dos resultados (Whittemore; Knafl, 2005).  
O levantamento de dados foi realizado entre 2014 e 2024 (últimos dez anos) nas bases  
de dados eletrônicas MEDLINE/PubMed69 e LILACS70 pela sua reconhecida excelência e  
confiabilidade na disseminação de literatura científica na área da saúde e na Web of Science71  
por se tratar de uma plataforma abrangente que permite a citação cruzada, facilitando a  
identificação de pesquisas influentes e suas interconexões na área de saúde. Foram utilizados  
os seguintes termos para a estratégia de busca avançada adequados para cada base de dados:  
MEDLINE/PubMed: (("Data Provenance") AND ("Artificial Intelligence")) AND (Health);  
LILACS: ("Data Provenance") AND ("Artificial Intelligence") AND (Health); Web of  
Science: ALL= ("Data Provenance" AND "Artificial Intelligence" AND "Health").  
Estabelecemos os seguintes critérios de inclusão: artigos publicados que abordassem a  
temática proposta em seus títulos, resumos e/ou descritores, e que estivessem disponíveis na  
íntegra no idioma inglês. Em relação aos critérios de exclusão, embora a produção sobre o  
tema seja limitada, decidimos desconsiderar teses, dissertações, monografias e jornais.  
Após a leitura dos artigos, foi realizada a seleção da amostra final, e as informações  
foram organizadas em um quadro contendo os seguintes elementos resumidos: autor, ano,  
título, objetivo e conclusão. Esse processo permitiu consolidar os achados mais relevantes na  
análise da amostra, possibilitando a identificação e a discussão dos desafios e implicações  
éticas presentes nos estudos.  
8
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
           
ARTIGO  
5 ANÁLISES E DISCUSSÕES  
A coleta de dados foi realizada especificamente entre 01/10/2014 e 01/10/2024,  
resultando inicialmente na identificação de 23 artigos científicos, distribuídos da seguinte  
forma: 5 artigos na base MEDLINE/PubMed, 3 artigos na LILACS e 15 artigos na Web of  
Science. É importante destacar que a grande maioria dos artigos da MEDLINE/PubMed e  
LILACS estavam também presentes na base de dados Web of Science. Após a aplicação dos  
critérios de inclusão e exclusão, foram selecionados apenas 2 artigos que compactuavam com  
o objetivo e pergunta de pesquisa deste estudo. Portanto, os dois artigos selecionados são  
descritos no Quadro 1.  
Quadro 1 – Sintetização dos estudos selecionados  
Base de dados: MEDLINE/PubMed, LILACS e Web of Science  
Autor (es)/Ano: Miller, 2019. Título: The medical AI insurgency: what physicians must know  
about data to practice with intelligent machines. Objetivo: Informar médicos e profissionais de saúde sobre  
a importância dos dados e da IA na prática clínica moderna. Conclusão: A obra conclui que, para que os  
1 médicos possam utilizar efetivamente a IA em sua prática, é essencial que eles compreendam a PD que  
alimentam esses sistemas. A integração da IA na medicina não deve ser vista como uma ameaça, mas sim  
como uma oportunidade de aprimorar o atendimento e melhorar os resultados para os pacientes, desde que  
os profissionais estejam bem-informados e preparados para lidar com essas tecnologias.  
Autor (es)/Ano: Ong et al., 2024. Título: Ethical and regulatory challenges of large language  
models in medicine. Objetivo: Analisar as implicações éticas e regulatórias da implementação de grandes  
modelos de linguagem na prática médica. Conclusão: A obra conclui que, embora os grandes modelos de  
linguagem, por meio da IA, sejam treinados com dados de proveniência de diferentes fontes para melhorar  
9
o atendimento ao paciente e a eficiência dos serviços de saúde, existe o risco de que parte desse conteúdo  
seja utilizado sem a devida autorização, mesmo sendo protegido por leis de propriedade intelectual. É  
2
crucial estabelecer diretrizes éticas e regulatórias claras para garantir que o uso desses modelos seja seguro  
e responsável. Além disso, é fundamental encontrar um equilíbrio entre a inovação tecnológica e a proteção  
dos direitos dos pacientes. Isso ressalta a importância de uma abordagem multidisciplinar que envolva  
reguladores, profissionais de saúde e especialistas em ética.  
Fonte: Elaborado pelos autores (2024).  
Os dois artigos selecionados no Quadro 1 para este estudo abordam aspectos  
fundamentais da interação entre PD e a IA na área da saúde. Além disso, eles apresentam os  
desafios e implicações éticas relevantes para o objetivo deste estudo.  
O primeiro artigo selecionado, intitulado “The medical AI insurgency: what physicians  
must know about data to practice with intelligent machines” de autoria de Miller (2019),  
aborda a crescente integração da IA na prática médica e a importância de os médicos  
compreenderem a PD utilizados por essas tecnologias. O autor destaca que, embora a IA  
tenha o potencial de transformar a assistência à saúde, sua eficácia depende da qualidade e da  
integridade dos dados empregados, ou seja, da PD em fontes fidedignas.  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
O artigo enfatiza também a importância da formação contínua dos médicos em relação  
ao uso da IA, de modo a capacitá-los a fazer escolhas informadas e éticas na prática clínica. A  
conscientização sobre as limitações e os riscos associados ao uso da IA é crucial para garantir  
que essa tecnologia beneficie os pacientes de maneira segura e equitativa.  
Já o segundo artigo selecionado, intitulado “Ethical and regulatory challenges of  
large language models in medicine” de autoria de Ong et al (2024) examina as  
complexidades éticas e regulatórias associadas ao uso de modelos de linguagem em ambientes  
médicos. Os autores discutem como esses modelos, que têm demonstrado potencial para  
melhorar a comunicação e a eficiência na assistência à saúde, também levantam preocupações  
significativas que precisam ser abordadas. Além disso, o artigo aborda a necessidade de  
regulamentação que garanta a segurança e a eficácia dos modelos de linguagem na medicina.  
Os autores enfatizam que, enquanto a inovação é essencial, deve haver um equilíbrio com a  
proteção dos direitos dos pacientes e a manutenção da confiança no sistema de saúde. Isso  
inclui a necessidade de diretrizes claras sobre o uso ético e responsável desses modelos, bem  
como mecanismos de supervisão que assegurem a conformidade com normas éticas e  
regulatórias. Em suma, o artigo destaca que, embora os modelos de linguagem tenham um  
potencial significativo para transformar a medicina, é crucial enfrentar os desafios éticos e  
regulatórios relacionados à PD e à sua aplicação prática, de modo a garantir que seu uso  
beneficie a saúde pública de maneira segura e equitativa.  
10  
Portanto, ambos os estudos enfatizam que a eficácia das tecnologias de IA na saúde  
depende fundamentalmente da qualidade dos dados utilizados, ou seja, da PD. Em síntese,  
ambos os artigos convergem para a ideia de que, embora a IA e os modelos de linguagem  
ofereçam oportunidades promissoras para a melhoria da assistência médica, sua  
implementação deve ser acompanhada de uma consideração rigorosa das questões éticas, da  
PD e da necessidade de regulamentação.  
5.1 DESAFIOS E IMPLICAÇÕES ÉTICAS DA PROVENIÊNCIA DE DADOS E DA  
INTELIGÊNCIA ARTIFICIAL EM SAÚDE  
Em relação aos desafios na aplicação da IA em saúde humana destacada por Miller  
(2019) e Ong et al (2024), destaca-se primeiramente a importância da proveniência e da  
qualidade dos dados. Dados de entrada de baixa qualidade ou com origem incerta podem  
comprometer diagnósticos e tratamentos, exigindo o envolvimento mais precoce de  
especialistas do domínio médico para mitigar riscos. Profissionais de saúde e cientistas de  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
dados enfrentam o problema de grandes volumes de dados sem estrutura adequada, o que  
limita a capacidade das máquinas de interpretar corretamente as informações. Além disso,  
muitos dados requerem limpeza extensa, consumindo 70-80% do tempo dos cientistas de  
dados e exigindo técnicas robustas para corrigir problemas como redundância e dados  
ausentes. Apesar da alta qualidade de dados de imagens médicas, o pré-processamento  
cuidadoso é essencial, dado que a IA é treinada para ser generalizável, mas não infalível. No  
entanto, médicos que utilizam aplicações de IA sem conhecer os dados de treinamento não  
conseguem avaliar completamente sua precisão ou adequação. A PD, um aspecto crítico para  
a qualidade da inferência, muitas vezes não é do conhecimento dos médicos. A adoção  
indiscriminada de novas tecnologias sem garantias transparentes de qualidade de dados pode  
gerar riscos à prática clínica.  
Em relação às implicações éticas do uso de IA no contexto da saúde, Ong et al (2024)  
mencionam o “O U.S. Copyright Office Fair Use Index” que contribui para orientar práticas  
de uso justo em contextos médicos envolvendo IA nos Estados Unidos. A doutrina de uso  
justo permite a utilização não licenciada de obras protegidas sob certas condições,  
promovendo a liberdade de expressão, podendo ser adaptada para o contexto da IA em saúde.  
Conforme a Seção 107 da Lei de Direitos Autorais, o uso justo deve considerar quatro fatores:  
(1) propósito e natureza do uso, com ênfase em usos transformadores e educacionais; (2)  
natureza do trabalho original, com menor proteção para obras factuais; (3) quantidade e  
relevância da parte utilizada; e (4) impacto do uso no mercado potencial da obra. Cada caso é  
analisado individualmente, sem uma fórmula exata para determinar o uso justo. Desta forma,  
Miller (2019) e Ong et al (2024) não estabelecem diretrizes e ou regulamentos específicos,  
mas discutem a existência de obstáculos regulatórios significativos, como a privacidade dos  
dados e os direitos de uso, que restringem o treinamento de modelos com grandes conjuntos  
de dados, especialmente quando há informações confidenciais de pacientes envolvidas. Os  
autores ainda relatam sobre as questões de propriedade intelectual que também emergem  
quando dados protegidos são utilizados sem o devido licenciamento, evidenciando a  
necessidade de uma regulamentação rigorosa que garanta o desenvolvimento ético e seguro da  
IA na saúde. Os usuários e consumidores, especialmente os clínicos e seus pacientes, devem  
estar plenamente cientes de seus direitos em relação aos dados, incluindo o direito de acesso,  
retificação, apagamento, restrição de processamento, portabilidade, objeção e o direito de não  
estar sujeito a decisões baseadas unicamente em processamento automatizado. Além disso, é  
essencial que os pacientes forneçam consentimento informado para o compartilhamento de  
seus dados e sejam informados proativamente sobre seus direitos, como o direito de exclusão  
11  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
e de limitar o uso e processamento de informações, assegurando, assim, uma prática de IA  
transparente e responsável na área da saúde.  
Portanto, fazendo um contraponto entre as observações de Miller (2019) e Ong et al  
(2024) em seus artigos, Char, Shah e Magnus (2018), discutem que os desafios éticos  
complexos na incorporação de algoritmos de aprendizado de máquina na medicina, estão  
especialmente no contexto da relação médico-paciente e da imparcialidade no atendimento. A  
possibilidade de viés racial e discriminação nos algoritmos levanta preocupações sobre a  
perpetuação de desigualdades existentes. Além disso, há riscos de manipulação dos sistemas  
para fins lucrativos, desviando-se do princípio de beneficência. A dependência crescente de  
ferramentas de IA e a potencial perda de responsabilidade individual entre médicos e sistemas  
automatizados desafiam conceitos éticos tradicionais, como a confidencialidade e o pacto  
fiduciário. Esses fatores indicam a necessidade urgente de diretrizes éticas claras e de  
transparência nos sistemas de IA em saúde para proteger os direitos dos pacientes e garantir  
um atendimento ético e seguro.  
6 LIMITAÇÕES DO ESTUDO  
12  
A escolha limitada dos artigos nesta revisão integrativa, justifica-se pelo fato de que a  
maioria dos estudos inicialmente analisados abordava o uso de blockchain na saúde, com foco  
em contratos inteligentes. Embora os contratos inteligentes possam ser aplicados em conjunto  
com tecnologias de IA, eles não são considerados IA. Esses contratos consistem em códigos  
autoexecutáveis em uma rede blockchain que formalizam e executam acordos  
automaticamente conforme condições predefinidas, enquanto a IA envolve a capacidade de  
aprender, raciocinar e tomar decisões com base em dados.  
Outra limitação relevante em relação à seleção dos artigos é a escassez de publicações  
que abordem especificamente a PD nos processos de IA em saúde. A maioria dos estudos  
encontrados concentra-se na aplicação de tecnologias de blockchain para garantir a  
rastreabilidade e a integridade dos dados, sem esclarecer detalhadamente a importância da PD  
no desenvolvimento e na eficácia dos modelos de IA. Esse foco restrito dificulta uma  
compreensão mais ampla sobre como a PD pode impactar a qualidade dos dados utilizados  
em IA e, por consequência, a precisão e confiabilidade dos resultados gerados por esses  
sistemas.  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
Assim, é importante destacar que, os desafios e implicações éticas relacionados à PD e  
à IA na saúde encontram-se em um estágio inicial, caracterizado pela ausência de diretrizes e  
regulamentações consolidadas, o que limita a produção acadêmica e prática sobre o tema.  
Por fim, os termos de busca utilizados também podem representar uma limitação, uma  
vez que termos excessivamente específicos podem restringir o alcance dos resultados,  
potencialmente excluindo estudos relevantes que abordem a PD e a IA na saúde sob diferentes  
perspectivas.  
7 CONCLUSÃO  
A PD e a IA constituem áreas fundamentais na saúde contemporânea com  
significativos avanços. A gestão eficaz da PD é essencial para garantir a qualidade, a  
segurança e a transparência das informações utilizadas nos processos de tomada de decisão  
clínica. Além disso, a pesquisa neste campo desempenha um papel interdisciplinar na CI,  
oferecendo insights valiosos que podem aprimorar tanto a prática médica quanto a  
administração de sistemas de saúde.  
Esses avanços contribuem para a otimização de diagnósticos, no desenvolvimento de  
tratamentos personalizados e na melhoria na eficiência operacional das instituições de saúde.  
A integração dessas áreas promove um entendimento mais profundo sobre os fluxos de  
informação, possibilitando um uso mais consciente e responsável dos dados, o que, por sua  
vez, fortalece a confiança entre profissionais de saúde e pacientes.  
13  
Portanto, esta pesquisa cumpre seu objetivo ao apresentar os desafios e implicações  
éticas da PD e da IA no contexto de saúde, conforme discutido nos artigos selecionados. Em  
resumo, os desafios da aplicação da IA em saúde incluem a necessidade de dados de alta  
qualidade e com proveniência confiável para diagnósticos precisos, o que demanda um  
extenso processo de limpeza e pré-processamento.  
A falta de transparência sobre a PD e o uso indiscriminado de novas tecnologias sem  
garantias podem gerar riscos clínicos. Em termos éticos, aspectos como privacidade, direitos  
autorais e consentimento informado dos pacientes são essenciais, exigindo regulamentações  
que assegurem o uso responsável da IA e informem os pacientes sobre seus direitos de acesso  
e proteção de dados.  
Por fim, como trabalho futuro a temática aqui abordada, é fundamental desenvolver  
frameworks e diretrizes que integrem considerações éticas e práticas de governança de dados  
buscando abordar a proteção da privacidade dos pacientes, a transparência nos algoritmos  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
utilizados e a mitigação de viés, garantindo que as tecnologias sejam implementadas de forma  
responsável e eficaz. Além disso, aprofundar a pesquisa em estudos interdisciplinares que  
reúnam especialistas em CI, CC, Ciências da Saúde e ética, visando construir uma  
compreensão holística dos desafios e oportunidades que essas inovações apresentam, assim  
como seu impacto na prática clínica e na pesquisa em saúde.  
14  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
REFERÊNCIAS  
AHMED, M.; DAR, A. R.; HELFERT, M.; KHAN, A.; KIM, J. Data provenance in  
healthcare: approaches, challenges, and future directions. Sensors (Basel), Basel, v. 23, n. 14,  
BINNS, R. Fairness in machine learning: Lessons from political philosophy. In: Conference  
on fairness, accountability and transparency. PMLR, 2018. p. 149-159.Disponível em:  
BRITO, J. F., SILVA, R. C. D., SANTOS, B. R. P., MELLO, M. R. G. D., & MARTÍNEZ-  
ÁVILA, D. Arquitetura da informação no contexto da informação em saúde: um olhar para o  
website da Covid-19 no Brasil. AtoZ: Novas Práticas em Informação e Conhecimento, v. 9, n.  
em: 20 set. 2024.  
BUNEMAN, P.; KHANNA, S. E.; CHIEW, W. Why and where: a characterization of data  
provenance. In:VAN DEN BUSSCHE, J., VIANU, V. (ed.). Database theory: ICDT 2001.  
Lecture Notes in Computer Science, v. 1973. Berlin, Heidelberg: Springer, 2001. Disponível  
Acesso em: 02 out. 2024.  
CHAR, D, S.; SHAH, N, H.; MAGNUS, D. Implementing machine learning in health care—  
addressing ethical challenges. New England Journal of Medicine, v. 378, n. 11, p. 981-983,  
ago.2024.  
15  
DAVIDSON, S. B.; FREIRE, J. Provenance and scientific workflows: challenges and  
opportunities. In: ACM SIGMOD INTERNATIONAL CONFERENCE ON  
MANAGEMENT OF DATA, p. 1345–1350, 2008. Proceedings [...]. Disponível em:  
DOURADO, D. A; AITH, F. M. A. A regulação da inteligência artificial na saúde no Brasil  
começa com a Lei Geral de Proteção de Dados Pessoais. Revista de Saúde Pública, v. 56, p.  
2024.  
ESTEVA, A., KUPREL, B., NOVOA, R. A., KO, J., SWETTER, S. M., BLAU, H. M., &  
THRUN, S. Dermatologist-level classification of skin cancer with deep neural networks.  
0368&sid=googleScholar&v=2.1&it=r&linkaccess=fulltext&issn=00280836&p=AONE&sw  
=w. Acesso em: 22 out. 2024  
FONG, H. F., ROTHMAN, E. F., GARNER, A., GHAZARIAN, S. R., MORLEY, D. S.,  
SINGERMAN, A., & BAIR-MERRITT, M. H. Association between health literacy and  
parental self-efficacy among parents of newborn children. Journal of Pediatrics, v. 202, p.  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
2024.  
FREIRE, J., KOOP, D., SANTOS, E., & SILVA, C. T. Provenance for computational tasks: a  
survey. Journal Computing in Science and Engineering, v. 10, n. 3, p. 11–21, 2008. ISSN  
doi=10.1.1.147.3801&rep=rep1&type=pdf. Acesso em: 24 out. 2024.  
FREUND, G. P.; SEMBAY, M. J.; MACEDO, D. D. J. de. Proveniência de dados e  
segurança da informação: relações interdisciplinares no domínio da ciência da informação.  
Revista Ibero-Americana de Ciência da Informação, Brasília, v. 12, n. 3, p. 807–825, 14  
article/view/21203/23548. Acesso em: 20 out. 2024.  
MILLER, D. D. The medical AI insurgency: what physicians must know about data to  
practice with intelligent machines. NPJ digital medicine, v. 2, n. 1, p. 62, 2019. Disponível  
MORLEY, J; COWLS, J; TADDEO, M; FLORIDI, L. Ethical guidelines for COVID-19  
d41586-020-01578-0. Disponível em: https://go.gale.com/ps/i.do?id=GALE%7CA  
625089945&sid=googleScholar&v=2.1&it=r&linkaccess=fulltext&issn=00280836&p=AON  
E&sw=w. Acesso em: 22 out. 2024  
NEVES, B. C.; BRAZ, M. I. Interlocução entre saúde e Ciência da Informação: proposta para  
o diagrama multidisciplinar da CI. Informação & Informação, v. 23, n. 3, p. 100-121, 2018.  
16  
OBERMEYER, Z; EMANUEL, E, J. Predicting the future—big data, machine learning, and  
clinical medicine. New England Journal of Medicine, v. 375, n. 13, p. 1216-1219, 2016.  
org/doi/full/10.1056/NEJMp1606181. Acesso em: 24 out. 2024.  
ONG, J. C. L., CHANG, S. Y. H., WILLIAM, W., BUTTE, A. J., SHAH, N. H., CHEW, L.  
S. T., ... & TING, D. S. W. Ethical and regulatory challenges of large language models in  
medicine. The Lancet Digital Health, v. 6, n. 6, p. e428-e432, 2024.DOI:  
thelancet.com/journals/landig/article/PIIS2589-7500(24)00061-X/fulltext. Acesso em: 02 out.  
2024.  
PARAMAN, P; ANAMALAH, S. Ethical artificial intelligence framework for a good AI  
society: principles, opportunities and perils. AI & SOCIETY, v. 38, n. 2, p. 595-611, 2023.  
springer.com/article/10.1007/s00146-022-01458-3. Acesso em: 27 out. 2024.  
POOLE, D, L.; MACKWORTH, A, K. Artificial Intelligence: foundations of  
computational agents. Cambridge University Press, 2010.  
RUSSELL, S. J.; NORVIG, P. Artificial intelligence: a modern approach. Pearson, 2016.  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.  
ARTIGO  
SEMBAY, M. J.; MACEDO, D. D. J. de; DUTRA, M. L. A Method for collecting  
provenance data: a case study in a Brazilian hemotherapy center. In: Lecture Notes of the  
Institute for Computer Sciences, Social InformaTIC and Telecommunications  
Engineering. 1. ed. Springer International Publishing, 2020a. v. 1. p. 89-102. DOI  
10.1007/978-3-030-50072-6_8.  
SEMBAY, M. J; MACEDO, D. D. J. de; DUTRA, M. L. A proposed approach for  
provenance data gathering. Mobile Networks & Applications, p. 1–13, 2020b. DOI  
10.1007/s11036-020-01648-7. Acesso em: 10 out. 2024.  
SEMBAY, M. J.; MACEDO, D. D. J. de; MARQUEZ FILHO, A. A. G. Proveniência de  
dados em Sistemas de Informação em Saúde. In: ENCONTRO NACIONAL DE PESQUISA  
E PÓS GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO, 22., Porto Alegre. Anais [...].  
handle.net/20.500.11959/brapci/200577. Acesso em: 20 out. 2024.  
SEMBAY, M. J et al. Provenance data management in health information systems: a  
systematic literature review. Journal Personalized Medicine, Basel, v. 13, n. 6, p. 991, jun.  
SEMBAY, M. J. PROV-Health: método para gerenciamento de dados de proveniência em  
sistemas de informação em saúde. 2023. 311p. Tese (Doutorado em Ciência da Informação) –  
Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-  
Graduação em Ciência daInformação, Florianópolis, 2023. Disponível em:  
17  
SLUSSAREFF, M, os algoritmos não são apenas ferramentas; eles são usados para tomar  
decisões que podem afetar vidas, e isso traz consigo uma responsabilidade considerável. M.  
O’Neil, Cathy. 2016. Weapons of math destruction: how big data increases inequality and  
threatens democracy. Crown. CyberOrient 16(1):72–75, 2022. DOI:  
SOUZA, M. T; SILVA, M, D; CARVALHO, R. Revisão integrativa: o que é e como fazer.  
45082010RW1134. Disponível em: https://www.scielo.br/j/eins/a/ZQT  
BkVJZqcWrTT34cXLjtBx/?lang=pt&%3A~%3Atext=A. Acesso em: 20 out. 2024.  
STRECKER, D. The theory of society: the theory of communicative action (1981): a classic  
of social theory. In: The Habermas Handbook. Columbia University Press, 2017. p. 360-  
TOPOL, E. Deep medicine: how artificial intelligence can make healthcare human again.  
Hachette UK, 2019.  
WHITTEMORE, R.; KNAFL, K. The integrative review: updated methodology. Journal of  
Advanced Nursing, Portland, v. 52, n. 5, p. 546-553, 2005.  
Disponível em:  
LOGEION: Filosofia da informação, Rio de Janeiro, v. 11, ed. especial, p. 1-17, e-7388, nov. 2024.