纽约大学坦登工程学院的研究人员开发了一种新的人工智能技术,可以改变图像中人的表观年龄,同时保持其独特的识别特征,这是标准人工智能模型的重大进步,标准人工智能模型可以使人们看起来更年轻或更老,但无法保留他们的个人生物特征身份标识。
在预印本服务器arXiv上发表的一篇论文中,该论文将在IEEE国际生物识别联合会议(IJCB)会议记录上发表,该论文的第一作者、计算机科学与工程(CSE)的研究助理教授SudiptaBanerjee)部门和同事训练了一种生成式人工智能模型(潜在扩散模型),以“知道”如何执行保留身份的年龄转换。
为此,Banerjee与CSE博士合作。候选人戈文德·米塔尔(GovindMittal)和博士。研究生AmeyaJoshi在CSE副教授ChinmayHegde和CSE教授NasirMemon的指导下克服了此类工作中的一个典型挑战,即组装大量由显示个人多年的图像组成的训练数据。
相反,该团队使用一小组个人图像以及一组单独的图像来训练模型,这些图像的标题表明所代表的人的年龄类别:儿童、青少年、青年、中年、老年人或老年人。这组照片包括名人一生的照片。
该模型学习了识别第一组个体的生物特征。带年龄标题的图像让模型了解图像和年龄之间的关系。然后,经过训练的模型可以通过使用文本提示指定目标年龄来模拟老化或去老化。
研究人员采用了一种名为“DreamBooth”的方法,通过使用神经网络组件的组合逐步修改人脸图像来编辑人脸图像。该方法涉及向图像添加和去除噪声(随机变化或干扰),同时考虑底层数据分布。
该方法利用文本提示和类标签来指导图像生成过程,重点是维护特定于身份的细节和整体图像质量。采用各种损失函数来微调神经网络模型,并通过生成具有年龄相关变化和上下文变化的人脸图像的实验证明了该方法的有效性。
研究人员通过让26名志愿者将生成的图像与该人的实际图像进行匹配,并使用面部识别算法ArcFace来测试他们的方法与其他现有的年龄修改方法。他们发现他们的方法优于其他方法,错误拒绝率降低了44%。