Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.unb.br/handle/10482/53779
Ficheros en este ítem:
Fichero Tamaño Formato  
DaniellePompeuNoronhaPontes_TESE.pdf4 MBAdobe PDFVisualizar/Abrir
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorMaricato, João de Melopt_BR
dc.contributor.authorPontes, Danielle Pompeu Noronhapt_BR
dc.date.accessioned2026-01-28T16:47:50Z-
dc.date.available2026-01-28T16:47:50Z-
dc.date.issued2026-01-28-
dc.date.submitted2025-10-13-
dc.identifier.citationPONTES, Danielle Pompeu Noronha. Classificação de contas entre bots e humanas que divulgam artigos científicos no X: contribuições para aprimoramento dos indicadores altmétricos. 2025. 206 f. Tese (Doutorado em Ciência da Informação) — Universidade de Brasília, Brasília, 2025.pt_BR
dc.identifier.urihttp://repositorio.unb.br/handle/10482/53779-
dc.descriptionTese (doutorado) — Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2025.pt_BR
dc.description.abstractA disseminação automatizada de publicações científicas por meio de contas robotizadas em redes sociais representa um desafio à validade dos indicadores altmétricos. Esta pesquisa teve como objetivo desenvolver e validar métodos computacionais para a detecção de bots e a classificação automatizada de contas da plataforma X (antigo Twitter) com foco na divulgação científica. De natureza aplicada e abordagem qualiquantitativa, a pesquisa utilizou metodologia baseada no modelo CRoss-Industry Standard Process for Data Mining (CRISP-DM), combinando técnicas de aprendizado de máquina, curadoria de dados e análise estatística. Como principais resultados, foram desenvolvidos: (i) uma metodologia de inteligência artificial para classificação de contas, testando os algoritmos k-nearest neighbors (KNN), Árvore de decisão, Random Forest e Extreme Gradient Boosting (XGBoost), sendo este último o que apresentou melhor desempenho (acurácia de 94,29% e AUC de 0,9392); (ii) um dataset rotulado inédito, composto por 13.767 contas da rede X identificadas como humanas ou bots, construído por meio da integração de fontes reconhecidas da literatura e da validação manual rigorosa; e (iii) o protótipo SciBotScan, uma aplicação interativa desenvolvida em Python e hospedada em ambiente web (Streamlit), capaz de estimar a probabilidade de uma conta ser automatizada com base em 46 variáveis preditivas. Os resultados revelam que, embora os bots representem apenas 4% das contas analisadas, eles são responsáveis por 22% das postagens, com atividade média por conta significativamente superior à das contas humanas. Observou-se ainda que a presença e o impacto de bots variam entre áreas do conhecimento, com destaque para as divisões de Ciências Matemáticas, Computação e Ciências Físicas. A pesquisa conclui que a adoção de modelos especializados e bases de dados representativas é fundamental para aprimorar a confiabilidade dos indicadores altmétricos e mitigar distorções provocadas por automação, contribuindo para uma avaliação mais justa e transparente da produção científica em redes sociais.pt_BR
dc.language.isoporpt_BR
dc.rightsAcesso Abertopt_BR
dc.titleClassificação de contas entre bots e humanas que divulgam artigos científicos no X : contribuições para aprimoramento dos indicadores altmétricospt_BR
dc.typeTesept_BR
dc.subject.keywordAltmetriapt_BR
dc.subject.keywordDivulgação científicapt_BR
dc.subject.keywordRedes sociaispt_BR
dc.subject.keywordInteligência artificialpt_BR
dc.subject.keywordDetecção de botspt_BR
dc.subject.keywordX (Rede social on-line)pt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.pt_BR
dc.description.abstract1The automated dissemination of scientific publications by fake accounts on social media poses a growing threat to the reliability of altmetric indicators. This research aimed to develop and validate computational methods for bot detection and automated classification of accounts on the X platform (formerly twitter) focused on scholarly communication. Characterized as applied research with a qualitative-quantitative approach, the study followed the CRoss-Industry Standard Process for Data Mining (CRISP-DM) methodological model, combining machine learning techniques, data curation, and statistical analysis. The main contributions of this thesis include: (i) an artificial intelligence methodology for account classification, evaluating the performance of k-nearest neighbors (KNN), Random Forest, and Extreme Gradient Boosting (XGBoost) algorithms the latter achieving the best results, with 94.29% accuracy and an AUC of 0.9392; (ii) a novel labeled dataset comprising 13,767 X accounts categorized as human or bot, built through the integration of recognized academic sources and rigorous manual verification; and (iii) the SciBotScan prototype, an interactive application developed in Python and deployed on a web platform (Streamlit), capable of estimating the likelihood that an account is automated based on 46 predictive features. The findings show that although bots represent only 4% of the analyzed accounts, they are responsible for 22% of the scientific posts, exhibiting a significantly higher posting frequency than human accounts. Additionally, the presence and influence of bots vary across fields of knowledge, with greater concentration in Mathematical Sciences, Computing, and Physical Sciences. The study concludes that the adoption of specialized models and representative datasets is essential to enhance the reliability of altmetric indicators and mitigate distortions caused by automation, thereby promoting more transparent and equitable evaluations of scientific impact on social media.pt_BR
dc.description.unidadeFaculdade de Ciência da Informação (FCI)pt_BR
dc.description.ppgPrograma de Pós-Graduação em Ciência da Informaçãopt_BR
Aparece en las colecciones: Teses, dissertações e produtos pós-doutorado

Mostrar el registro sencillo del ítem " class="statisticsLink btn btn-primary" href="/handle/10482/53779/statistics">



Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.