Na última década, a altmetria contribuiu para abrir espaço para indicadores de atenção e impacto social da ciência, e a repaginar a cienciometria, embora ainda persista a centralidade das métricas de performance na produção científica. Nesse sentido, há uma demanda por outras fontes de dados que contribuam para conferir contexto e também fornecer substrato para a construção de outros indicadores, capazes de atuar na interface ciência-sociedade de forma mais qualificada. Este trabalho demonstrará o potencial de que um banco de dados estruturado de press releases (comunicados de imprensa) seja um dos caminhos pelos quais indicadores de atenção social da ciência podem ser melhor contextualizados e compreendidos. Para isso, foi realizada a coleta de comunicados de imprensa de três agências de notícias de ciência: Eurekalert! (EUA), AlphaGalileo (Reino Unido) e Agência BORI (Brasil). Essas agências disponibilizam nos seus sites os press releases sobre artigos científicos; no entanto, informações importantes como título do artigo, conteúdo, data da publicação, URL, DOI, não estão disponíveis de forma estruturada. Foram utilizadas técnicas de web scraping na coleta, organização e análise dessas informações. A utilização de web scraping com o armazenamento em banco de dados MySQL mostrou-se eficaz para coletar e gerenciar informações de páginas web dessas agências, possibilitando com que análises abrangentes e contextualizadas sejam realizadas. Enquanto o comunicado de imprensa não é a única forma de qualificar e entender a atenção social da ciência, a construção do banco de dados e testes realizados demonstram que se trata de um material relevante nessa compreensão.
Agência de Notícias de Ciências, Press Releases, Acesso Aberto, Indicador Social da Ciência, Processamento de Linguagem Natural
Platform and workflow by OJS/PKP
Desenvolvido por Commscientia