| Campo DC | Valor | Lengua/Idioma |
| dc.contributor.advisor | Maricato, João de Melo | pt_BR |
| dc.contributor.author | Pontes, Danielle Pompeu Noronha | pt_BR |
| dc.date.accessioned | 2026-01-28T16:47:50Z | - |
| dc.date.available | 2026-01-28T16:47:50Z | - |
| dc.date.issued | 2026-01-28 | - |
| dc.date.submitted | 2025-10-13 | - |
| dc.identifier.citation | PONTES, Danielle Pompeu Noronha. Classificação de contas entre bots e humanas que divulgam artigos científicos no X: contribuições para aprimoramento dos indicadores altmétricos. 2025. 206 f. Tese (Doutorado em Ciência da Informação) — Universidade de Brasília, Brasília, 2025. | pt_BR |
| dc.identifier.uri | http://repositorio.unb.br/handle/10482/53779 | - |
| dc.description | Tese (doutorado) — Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2025. | pt_BR |
| dc.description.abstract | A disseminação automatizada de publicações científicas por meio de contas
robotizadas em redes sociais representa um desafio à validade dos indicadores
altmétricos. Esta pesquisa teve como objetivo desenvolver e validar métodos
computacionais para a detecção de bots e a classificação automatizada de contas da
plataforma X (antigo Twitter) com foco na divulgação científica. De natureza aplicada
e abordagem qualiquantitativa, a pesquisa utilizou metodologia baseada no modelo
CRoss-Industry Standard Process for Data Mining (CRISP-DM), combinando técnicas
de aprendizado de máquina, curadoria de dados e análise estatística. Como principais
resultados, foram desenvolvidos: (i) uma metodologia de inteligência artificial para
classificação de contas, testando os algoritmos k-nearest neighbors (KNN), Árvore de
decisão, Random Forest e Extreme Gradient Boosting (XGBoost), sendo este último
o que apresentou melhor desempenho (acurácia de 94,29% e AUC de 0,9392); (ii) um
dataset rotulado inédito, composto por 13.767 contas da rede X identificadas como
humanas ou bots, construído por meio da integração de fontes reconhecidas da
literatura e da validação manual rigorosa; e (iii) o protótipo SciBotScan, uma aplicação
interativa desenvolvida em Python e hospedada em ambiente web (Streamlit), capaz
de estimar a probabilidade de uma conta ser automatizada com base em 46 variáveis
preditivas. Os resultados revelam que, embora os bots representem apenas 4% das
contas analisadas, eles são responsáveis por 22% das postagens, com atividade
média por conta significativamente superior à das contas humanas. Observou-se
ainda que a presença e o impacto de bots variam entre áreas do conhecimento, com
destaque para as divisões de Ciências Matemáticas, Computação e Ciências Físicas.
A pesquisa conclui que a adoção de modelos especializados e bases de dados
representativas é fundamental para aprimorar a confiabilidade dos indicadores
altmétricos e mitigar distorções provocadas por automação, contribuindo para uma
avaliação mais justa e transparente da produção científica em redes sociais. | pt_BR |
| dc.language.iso | por | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.title | Classificação de contas entre bots e humanas que divulgam artigos científicos no X : contribuições para aprimoramento dos indicadores altmétricos | pt_BR |
| dc.type | Tese | pt_BR |
| dc.subject.keyword | Altmetria | pt_BR |
| dc.subject.keyword | Divulgação científica | pt_BR |
| dc.subject.keyword | Redes sociais | pt_BR |
| dc.subject.keyword | Inteligência artificial | pt_BR |
| dc.subject.keyword | Detecção de bots | pt_BR |
| dc.subject.keyword | X (Rede social on-line) | pt_BR |
| dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
| dc.description.abstract1 | The automated dissemination of scientific publications by fake accounts on social
media poses a growing threat to the reliability of altmetric indicators. This research
aimed to develop and validate computational methods for bot detection and automated
classification of accounts on the X platform (formerly twitter) focused on scholarly
communication. Characterized as applied research with a qualitative-quantitative
approach, the study followed the CRoss-Industry Standard Process for Data Mining
(CRISP-DM) methodological model, combining machine learning techniques, data
curation, and statistical analysis. The main contributions of this thesis include: (i) an
artificial intelligence methodology for account classification, evaluating the
performance of k-nearest neighbors (KNN), Random Forest, and Extreme Gradient
Boosting (XGBoost) algorithms the latter achieving the best results, with 94.29%
accuracy and an AUC of 0.9392; (ii) a novel labeled dataset comprising 13,767 X
accounts categorized as human or bot, built through the integration of recognized
academic sources and rigorous manual verification; and (iii) the SciBotScan prototype,
an interactive application developed in Python and deployed on a web platform
(Streamlit), capable of estimating the likelihood that an account is automated based on
46 predictive features. The findings show that although bots represent only 4% of the
analyzed accounts, they are responsible for 22% of the scientific posts, exhibiting a
significantly higher posting frequency than human accounts. Additionally, the presence
and influence of bots vary across fields of knowledge, with greater concentration in
Mathematical Sciences, Computing, and Physical Sciences. The study concludes that
the adoption of specialized models and representative datasets is essential to enhance
the reliability of altmetric indicators and mitigate distortions caused by automation,
thereby promoting more transparent and equitable evaluations of scientific impact on
social media. | pt_BR |
| dc.description.unidade | Faculdade de Ciência da Informação (FCI) | pt_BR |
| dc.description.ppg | Programa de Pós-Graduação em Ciência da Informação | pt_BR |
| Aparece en las colecciones: | Teses, dissertações e produtos pós-doutorado
|