Skip navigation
Please use this identifier to cite or link to this item: http://repositorio.unb.br/handle/10482/53205
Files in This Item:
File SizeFormat 
JoaoPedroFelixDeAlmeida_DISSERT.pdf3,02 MBAdobe PDFView/Open
Title: Holistic and local representation learning for online signature verification
Authors: Almeida, João Pedro Felix de
Orientador(es):: Freitas, Pedro Garcia
Coorientador(es):: Espinoza, Bruno Luiggi Macchiavello
Assunto:: Verificação de assinaturas online
Aprendizado de representações
Aprendizado de métricas
Discrepância média máxima
Issue Date: 24-Nov-2025
Citation: ALMEIDA, João Pedro Felix de. Holistic and Local Representation Learning for Online Signature Verification. 2025. 86 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2025.
Abstract: Neste trabalho, abordamos o problema de minimizar a taxa de Equal Error Rate (EER) global em um sistema de verificação de assinaturas online independente de escritor, decompondo-a em duas componentes: a taxa de erro de separação e a taxa de erro de alinhamento. A taxa de separação surge da falta de uma separação correta entre assina- turas genuínas e falsificadas, enquanto a de alinhamento resulta da incapacidade de um único limiar global capturar de forma eficaz as separações específicas de cada escritor. Enquanto as abordagens tradicionais da literatura focam exclusivamente em aumentar a separação entre assinaturas genuínas e falsificadas, essa decomposição nos permite endereçar o problema também do ponto de vista da falta de alinhamento entre os limiares específicos de cada usuário. Para isso, propomos HoLoSig, um novo arcabouço que integra duas populares rep- resentações profundas de assinaturas através de uma arquitetura convolucional 1D compartilhada que se bifurca em dois ramos especializados. Em um dos ramos, utilizamos a Triplet Loss com Soft-DTW para aprender representações locais de comprimento var- iável, cujas pontuações de dissimilaridade são deslocadas para uma região comum com a ajuda da Discrepância Média Máxima, a fim de melhorar o desempenho do sistema ao usar um limiar global. No outro ramo, empregamos como função de perda a expansão polinomial da entropia cruzada com correção no primeiro polinômio para aprender rep- resentações holísticas de comprimento fixo, que são usadas para reforçar ainda mais a separação criada pelo ramo de representações locais. Para avaliar o método proposto nós conduzimos diversos experimentos de ablação que confirmam a redução tanto no erro de separação quanto de alinhamento e concluímos que a Triplet-MMD desempenha papel fundamental na redução do último. Em seguida, estendemos a análise ao substituir a MMD por outras medidas de divergência estatística e comprovamos que elas alcançam resultados comparáveis—demonstrando que o erro de alinhamento pode ser reduzido ao garantir que as pontuações de dissimilaridade do sistema sigam uma distribuição consistente. Como um arcabouço independente de escritor, HoLoSig não possui dependência de usuários e é portanto capaz de verificar assinaturas de escritores não vistos durante o treinamento sem a necessidade de qualquer adaptação ou ajuste-fino. No entanto, HoLoSig não está livre de vieses relacionados aos dispositivos de captura e protocolo de aquisição de assinaturas. Portanto, para avaliar a robustez do modelo a essas particularidades nós realizamos diversos experimentos onde o treinamento é realizado com dados oriundos de protocolos de aquisição e dispositivos de captura diferentes dos utilizados para medir o erro do sistema. Nossos resultados são promissores, pois eles não apenas mostram forte capacidade de generalização mas também que HoLoSig consegue superar métodos que figuram no estado da arte mesmo se treinada com apenas metade dos dados utilizados por eles. HoLoSig foi idealizada para verificação de assinaturas online realizadas com canetas (stylus). No entanto, nós estendemos sua arquitetura para endereçar o problema de verifi- cação de assinaturas online realizadas com dedo. Um dos maiores desafios na verificação de assinaturas feitas com dedo é o tamanho limitado dos conjuntos de dados disponíveis para pesquisa comparado com aqueles onde as assinaturas foram feitas com caneta, o que fre- quentemente inviabiliza o treinamento do zero. Para endereçar isso, nós adicionamos um ramo classificador de domínio na arquitetura de HoLoSig, transformando-a efetivamente em uma Rede Neural de Adaptação de Domínio. A arquitetura HoLoDANN resultante nos permite tirar proveito tanto das assinaturas feitas com caneta quanto das assinaturas feitas com dedo para melhor abordar o problema de assinaturas feitas com dedo. HoLoSig e HoLoDANN alcançam resultados de ponta no DeepSignDB, o maior con- junto de verificação de assinaturas online atualmente. Os resultados (EER) de HoLoSig no cenário de assinaturas feitas com caneta contra falsificações habilidosas e aleatórias são: 1,73% (4vs1 habilidosas), 3,29% (1vs1 habilidosas), 0,43% (4vs1 aleatórias) e 0,89% (1vs1 aleatórias). Os resultados (EER) de HoLoDANN no cenário de assinaturas feitas com dedo contra falsificações habilidosas e aleatórias são: 5,65% (4vs1 habilidosas), 9.99% (1vs1 habilidosas), 0,55% (4vs1 aleatórias) e 1,78% (1vs1 aleatórias).
Abstract: In this work, we address the problem of minimizing the Equal Error Rate (EER) in a Writer-Independent (WI) Online Signature Verification (OSV) system by decomposing it into two components: the separation error and the alignment error. The separation error arises from the lack of proper distinction between genuine and forged signatures, while the alignment error arises from the inability of a single global threshold to effectively capture the writer-specific separations. While traditional approaches in the literature focus solely on increasing the separation between genuine and forged signatures, this decomposition also enables us to tackle the problem from the perspective of writer-specific threshold misalignment. To this end, we propose HoLoSig, a novel framework that integrates two popular deep signature representations via a shared 1D convolutional backbone, which bifurcates into two specialized branches. On one branch, we employ Triplet Loss with Soft-DTW to learn variable-length local representations, whose dissimilarity scores are shifted to a common region with the help of Maximum Mean Discrepancy (MMD), improving the system’s performance when using a global threshold. On the other branch, we use Poly-1 Cross Entropy Loss to learn fixed-length holistic representations, which further enhance the separation achieved by the local representation branch. To evaluate the proposed method, we conduct several ablation experiments that confirm the reduction of both separation and alignment errors, and show that Triplet-MMD plays a significant role in reducing the latter. We further extend Triplet-MMD by replacing MMD with other divergence metrics, and find that they achieve comparable results—demonstrating that alignment error can be reduced by ensuring the dissimilarity scores of the OSV system follow a consistent distribution. As a WI framework, HoLoSig has no dependency on writers and is therefore capable of verifying signatures from unseen writers without the need for any adaptation or finetuning. However, HoLoSig is not free from biases related to acquisition devices and protocols. To assess the model’s robustness to these particularities, we conduct several experiments in which training is performed using data acquired with different devices and protocols from those used to evaluate the system’s EER. Our results are promising, as they show not only strong generalization capability but also that HoLoSig can outperform state-of-the-art methods while using as little as half the training data they use. HoLoSig is designed for stylus-written OSV. However, we extend its architecture to address the problem of finger-written OSV. One of the major challenges in finger-written OSV is the limited size of available datasets compared to those for stylus-written signatures, which often makes training from scratch difficult. To address this, we add a domain classifier branch to HoLoSig, effectively transforming it into a Domain Adaptation Neural Network (DANN). The resulting HoLoDANN architecture allows us to leverage knowledge from both stylus- and finger-written signatures to better tackle the finger-written OSV problem. HoLoSig and HoLoDANN achieve state-of-the-art results on DeepSignDB, the largest OSV dataset to date. HoLoSig’s EER results in the stylus scenario against skilled and random forgeries are: 1.73% (4vs1 skilled), 3.29% (1vs1 skilled), 0.43% (4vs1 random), and 0.89% (1vs1 random). HoLoDANN’s EER results in the finger scenario against skilled and random forgeries are: 5.65% (4vs1 skilled), 9.99% (1vs1 skilled), 0.55% (4vs1 random), and 1.78% (1vs1 random).
metadata.dc.description.unidade: Instituto de Ciências Exatas (IE)
Departamento de Ciência da Computação (IE CIC)
Description: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Informática, 2025.
metadata.dc.description.ppg: Programa de Pós-Graduação em Informática
Licença:: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Agência financiadora: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).
Appears in Collections:Teses, dissertações e produtos pós-doutorado

Show full item record " class="statisticsLink btn btn-primary" href="/handle/10482/53205/statistics">



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.