面向银行业务的小样本学习方法研究

项目周期:

  2022.7-2023.7(在研)

项目来源:

  中国科大-招商银行联合实验室

合作单位

  中国招商银行

项目简介:

在银行日常业务中常常会面临着需要人工审核,但意外情况却甚少发生的情况,例如伪证件、伪印章的识别等业务。这样的情况不仅耗费大量的人力财力,同时由于伪造样本相对真实样本比例极小,业务员在审核时也极易出现疲劳而导致漏查、误查的状况。因此发展一套面向小样本伪证件检测的智能审核系统是当下亟需的。

本项目旨在深入分析实际银行业务场景,从以下三个问题出发提出解决方案:(1)真伪证件鉴别;(2)印章比对和伪印章鉴别;(3)手写签名生成。以上三个问题均呈现小样本的特性,本项目从内容和形式两个角度出发实现鉴伪。针对前两个任务,本项目利用高精度字符识别模型(OCR)来完成证件和印章内容的识别和校对。同时通过缓解类别不平衡后的深度分类模型实现证件伪造的各种类型(例如复印件、屏幕翻拍和PS篡改等)识别。特别地,由于伪印章易于通过人工生成,本项目也通过数据增广的方式进一步缓解伪印章小样本问题。另一方面,银行也广泛涉及对各类手写签名的识别任务,但是由于不同人和场景其签名风格均有一定的变化使得该任务变得困难。针对该问题,本项目提出风格迁移模型对手写签名生成各种场景和风格下的新样本,利用这些新样本进一步辅助识别手写签名。

项目目标:

  发展一套面向小样本伪证件(印章)检测的智能审核系统

研究方法:

  本项目的研究架构如下:


  基于prototype network的搭建小样本证件鉴别网络,并且撰写相关方法生成数目及其稀缺的伪样本作为训练集的补充。

  基于triplet loss的搭建印章鉴别网络,利用正负类别之间的距离实现基于印模匹配印章的功能。此外,使用一定的数据增强方法来增强印章样本。

  利用GAN网络完成手写字体风格的提取和生成,实现手写字体生成目标。


项目成果:

  本项目以交付两版测试代码。