Skip navigation
Veuillez utiliser cette adresse pour citer ce document : http://repositorio.unb.br/handle/10482/53779
Fichier(s) constituant ce document :
Fichier TailleFormat 
DaniellePompeuNoronhaPontes_TESE.pdf4 MBAdobe PDFVoir/Ouvrir
Titre: Classificação de contas entre bots e humanas que divulgam artigos científicos no X : contribuições para aprimoramento dos indicadores altmétricos
Auteur(s): Pontes, Danielle Pompeu Noronha
Orientador(es):: Maricato, João de Melo
Assunto:: Altmetria
Divulgação científica
Redes sociais
Inteligência artificial
Detecção de bots
X (Rede social on-line)
Date de publication: 28-jan-2026
Référence bibliographique: PONTES, Danielle Pompeu Noronha. Classificação de contas entre bots e humanas que divulgam artigos científicos no X: contribuições para aprimoramento dos indicadores altmétricos. 2025. 206 f. Tese (Doutorado em Ciência da Informação) — Universidade de Brasília, Brasília, 2025.
Résumé: A disseminação automatizada de publicações científicas por meio de contas robotizadas em redes sociais representa um desafio à validade dos indicadores altmétricos. Esta pesquisa teve como objetivo desenvolver e validar métodos computacionais para a detecção de bots e a classificação automatizada de contas da plataforma X (antigo Twitter) com foco na divulgação científica. De natureza aplicada e abordagem qualiquantitativa, a pesquisa utilizou metodologia baseada no modelo CRoss-Industry Standard Process for Data Mining (CRISP-DM), combinando técnicas de aprendizado de máquina, curadoria de dados e análise estatística. Como principais resultados, foram desenvolvidos: (i) uma metodologia de inteligência artificial para classificação de contas, testando os algoritmos k-nearest neighbors (KNN), Árvore de decisão, Random Forest e Extreme Gradient Boosting (XGBoost), sendo este último o que apresentou melhor desempenho (acurácia de 94,29% e AUC de 0,9392); (ii) um dataset rotulado inédito, composto por 13.767 contas da rede X identificadas como humanas ou bots, construído por meio da integração de fontes reconhecidas da literatura e da validação manual rigorosa; e (iii) o protótipo SciBotScan, uma aplicação interativa desenvolvida em Python e hospedada em ambiente web (Streamlit), capaz de estimar a probabilidade de uma conta ser automatizada com base em 46 variáveis preditivas. Os resultados revelam que, embora os bots representem apenas 4% das contas analisadas, eles são responsáveis por 22% das postagens, com atividade média por conta significativamente superior à das contas humanas. Observou-se ainda que a presença e o impacto de bots variam entre áreas do conhecimento, com destaque para as divisões de Ciências Matemáticas, Computação e Ciências Físicas. A pesquisa conclui que a adoção de modelos especializados e bases de dados representativas é fundamental para aprimorar a confiabilidade dos indicadores altmétricos e mitigar distorções provocadas por automação, contribuindo para uma avaliação mais justa e transparente da produção científica em redes sociais.
Abstract: The automated dissemination of scientific publications by fake accounts on social media poses a growing threat to the reliability of altmetric indicators. This research aimed to develop and validate computational methods for bot detection and automated classification of accounts on the X platform (formerly twitter) focused on scholarly communication. Characterized as applied research with a qualitative-quantitative approach, the study followed the CRoss-Industry Standard Process for Data Mining (CRISP-DM) methodological model, combining machine learning techniques, data curation, and statistical analysis. The main contributions of this thesis include: (i) an artificial intelligence methodology for account classification, evaluating the performance of k-nearest neighbors (KNN), Random Forest, and Extreme Gradient Boosting (XGBoost) algorithms the latter achieving the best results, with 94.29% accuracy and an AUC of 0.9392; (ii) a novel labeled dataset comprising 13,767 X accounts categorized as human or bot, built through the integration of recognized academic sources and rigorous manual verification; and (iii) the SciBotScan prototype, an interactive application developed in Python and deployed on a web platform (Streamlit), capable of estimating the likelihood that an account is automated based on 46 predictive features. The findings show that although bots represent only 4% of the analyzed accounts, they are responsible for 22% of the scientific posts, exhibiting a significantly higher posting frequency than human accounts. Additionally, the presence and influence of bots vary across fields of knowledge, with greater concentration in Mathematical Sciences, Computing, and Physical Sciences. The study concludes that the adoption of specialized models and representative datasets is essential to enhance the reliability of altmetric indicators and mitigate distortions caused by automation, thereby promoting more transparent and equitable evaluations of scientific impact on social media.
metadata.dc.description.unidade: Faculdade de Ciência da Informação (FCI)
Description: Tese (doutorado) — Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2025.
metadata.dc.description.ppg: Programa de Pós-Graduação em Ciência da Informação
Licença:: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Collection(s) :Teses, dissertações e produtos pós-doutorado

Affichage détaillé " class="statisticsLink btn btn-primary" href="/handle/10482/53779/statistics">



Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.