博客
关于我
增强半监督人脸识别噪声
阅读量:743 次
发布时间:2019-03-21

本文共 1214 字,大约阅读时间需要 4 分钟。

半监督人脸识别减少标注瓶颈

摘要

本文提出一种基于多代理的半监督人脸识别方法,通过结合噪声标签学习和鲁棒训练,有效解决了深度人脸识别中的标注成本问题。我们提出的GroupNet(GN)方法在有噪声的标注数据中展现出优异的效果,并基于此开发了半监督学习解决方案NRoLL。该方法不仅能够在极小标注数据下实现稳健训练,还能准确进行大规模无标记数据的标注。实验结果表明,我们的解决方案在多个基准测试中均超越了现有方法,具备良好的实际应用潜力。

关键词

半监督学习, 人脸识别, 噪声标签, 多代理方法, 稊式归属承认


1. 背景与问题

深度人脸识别技术的快速发展离不开大规模标注数据集的支撑。然而,随着数据规模的扩大,标注成本显著增加,错误标注(噪声标签)问题日益严重。例如,在MSSeleb数据集中,噪声标签部分超过50%,这严重影响模型的性能。现有的半监督学习方法虽然能利用少量标注数据和大量无标注数据,但在噪声标签的问题上仍存在挑战。

2. 提出方法

我们提出了一种基于多代理的半监督人脸识别方法,主要包括以下两部分:

(1)GroupNet(GN)鲁棒训练

GN通过多代理协同学习,有效解决噪声标注数据的鲁棒性问题。具体而言,GN采用分层策略,将样本按损失值划分为高置信样本(HC)、中等置信样本(MC)和低置信样本(LC)。高置信样本用于训练,其损失值很小且预测一致;中等置信样本则用于代理间交换和相互学习;低置信样本则直接丢弃。通过动态调整代理间的信息交换策略,GN能够有效减少噪声标签对模型的干扰,显著提升模型的鲁棒性。

(2)NRoLL 噪声鲁棒学习标签

基于GN的鲁棒能力,我们开发了半监督学习方法NRoLL。NRoLL首先在小量标注数据上进行预训练,利用GN的优势即使标注数据中存在50%以上的噪声也能稳健训练模型。随着模型不断接触更多无标注数据,NRoLL通过动态标注策略,选择具有高置信度的样本进行标注,并持续优化标注模型。这种标注过程与模型训练相辅相成,实现了标注成本的显著降低和识别精度的持续提升。

3. 实验结果

实验结果表明,GN在传统监督人脸识别任务中展现出优异性能,即使噪声标签占比超过50%也能保持领先水平。NRoLL在多个基准测试中均高于现有半监督方法的性能,并且能够在动态扩展数据集的过程中逐步提升标注精度和识别精度。具体来看:

  • 鲁棒性测试:GN在有噪声标注数据的训练中表现出色,识别精度始终保持在97%以上。
  • 半监督学习性能:NRoLL在无标注数据扩展过程中,标注精度逐步提升至92%,识别精度优于传统方法。

4. 总结

本文提出了一种新型多代理半监督人脸识别方法,有效解决了噪声标签和标注成本问题。GroupNet(GN)和NRoLL的组合不仅大幅降低了标注成本,还显著提升了深度人脸识别的性能。未来的研究将进一步优化代理间的信息交换策略,探索更多适用于大规模人脸识别场景的鲁棒学习方案。

转载地址:http://rpagz.baihongyu.com/

你可能感兴趣的文章
mysql中datetime与timestamp类型有什么区别
查看>>
MySQL中DQL语言的执行顺序
查看>>
mysql中floor函数的作用是什么?
查看>>
MySQL中group by 与 order by 一起使用排序问题
查看>>
mysql中having的用法
查看>>
MySQL中interactive_timeout和wait_timeout的区别
查看>>
mysql中int、bigint、smallint 和 tinyint的区别、char和varchar的区别详细介绍
查看>>
mysql中json_extract的使用方法
查看>>
mysql中json_extract的使用方法
查看>>
mysql中kill掉所有锁表的进程
查看>>
mysql中like % %模糊查询
查看>>
MySql中mvcc学习记录
查看>>
mysql中null和空字符串的区别与问题!
查看>>