http://repositorio.unb.br/handle/10482/52672| Arquivo | Tamanho | Formato | |
|---|---|---|---|
| IcaroMarcelinoMiranda_DISSERT.pdf | 22,46 MB | Adobe PDF | Visualizar/Abrir |
| Título: | Programação genética para Classificação Interpretável e de Alto Desempenho de Sinais EEG |
| Autor(es): | Miranda, Ícaro Marcelino |
| Orientador(es): | Garcia, Luís Paulo Faina |
| Assunto: | Aprendizado de máquina Classificação Eletroencefalografia Programação genética (Computação) Séries temporais |
| Data de publicação: | 13-Out-2025 |
| Data de defesa: | 27-Mar-2025 |
| Referência: | MIRANDA, Ícaro Marcelino. Programação Genética para Classificação Interpretável e de Alto Desempenho de Sinais EEG. 2025. 93 f., il. Dissertação (Mestrado profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2025. |
| Resumo: | Sinais de Eletroencefalograma (EEG) são essenciais para diagnosticar condições neurológicas, como epilepsia e distúrbios do sono, pois representam graficamente a atividade cerebral de um indivíduo em tempo real. Contudo, a complexidade desses sinais, caracterizada pela alta variabilidade inter e intra-sujeitos, covariância espacial e temporal, além de sua natureza não estacionária, dificulta a extração de atributos discriminativos e compromete a generalização dos modelos de Aprendizado de Máquina (AM). Neste estudo, propomos o Genetic Programming-Based Feature Selection and Construction (GP-FeSCo), um framework baseado em Programação Genética (PG) para a engenharia automatizada de atributos em sinais de EEG. O GP-FeSCo permite a construção e seleção evolutiva de atributos, adaptando representações complexas ao contexto específico de cada tarefa, melhorando o desempenho e a interpretabilidade dos modelos de classificação tradicionais. Para garantir avaliações robustas e alinhadas com cenários do mundo real, adotamos a validação cruzada Leave-One-Subject-Out (LOSO), que simula a aplicação prática ao testar os modelos exclusivamente em sujeitos não vistos anteriormente, reduzindo vieses associados à segmentação tradicional dos dados. Realizamos experimentos em três problemas de classificação de sinais de EEG: Identificação de Fusos do Sono, Detecção de Alcoolismo e Classificação de Imagética Motora, utilizando cinco conjuntos de atributos amplamente citados na literatura. O desempenho dos atributos gerados pela PG foi avaliado, assim como a convergência da função fitnees das populações e a complexidade dos modelos gerados. Os resultados mostram que os atributos construídos pelo GP-FeSCo não apenas melhoraram o desempenho dos classificadores em F1-score, mas também possibilitaram a redução no número de atributos necessários para a classificação, sem aumento de overfitting. Além disso, a análise da frequência de seleção de atributos evidenciou os canais de EEG mais relevantes para cada tarefa, contribuindo para otimizar futuras aquisições de sinais, tornando-as mais eficientes e acessíveis. |
| Abstract: | Electroencephalography (EEG) signals are essential for diagnosing neurological conditions such as epilepsy and sleep disorders, as they graphically represent an individual’s brain activity in real-time. However, the complexity of these signals, characterized by high inter- and intra-subject variability, spatial and temporal covariance, and their nonstationary nature, makes it challenging to extract discriminative features and compromises the generalization of Machine Learning (ML) models. In this study, we propose Genetic Programming-Based Feature Selection and Construction (GP-FeSCo), a framework based on Genetic Programming (GP) for the automated engineering of EEG features. GP-FeSCo enables the evolutionary construction and selection of features, adapting complex representations to the specific context of each task and enhancing both the performance and interpretability of traditional classification models. To ensure robust evaluations aligned with real-world scenarios, we adopt Leave-One-Subject-Out (LOSO) cross-validation, which simulates practical applications by testing models exclusively on previously unseen subjects, mitigating biases associated with conventional data segmentation methods. We conducted experiments on three EEG classification problems: Sleep Spindle Identification, Alcoholism Detection, and Motor Imagery Classification, using five widely referenced feature sets. The performance of the GP-generated features was assessed in addition to analyzing the convergence of the population’s fitness function and the complexity of the evolved models. Results show that the features constructed by GPFeSCo not only improved classifier performance in terms of F1-score but also enabled a reduction in the number of features required for classification without increasing overfitting. Furthermore, the analysis of feature selection frequency revealed the most relevant EEG channels for each task, contributing to optimizing future signal acquisitions, making them more efficient and accessible. |
| Unidade Acadêmica: | Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC) |
| Informações adicionais: | Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Computação Aplicada, 2025. |
| Programa de pós-graduação: | Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional |
| Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
| Agência financiadora: | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES). |
| Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.