AI是怎样从你的声音听出你的长相的
扫描二维码
随时随地手机看文章
随着人工智能技术的不断发展,AI似乎变得越来越“无所不能”,只需要一滴唾液或者汗液,就能诊断你的压力有多大;甚至还能够能够通过你的声音,推测出你长啥样!?
最近,麻省理工学院人工智能实验室(MIT CSAIL)发布了一项令人惊讶的研究——只需要听6秒的声音片段,AI就能推断出说话者的容貌。
其实,从声音推断一个人的长相并不是玄学,平时我们在打电话时会根据对方的声音脑补出相貌特征,这是因为年龄、性别、嘴巴形状、面部骨骼结构等,都会影响人发出的声音。此外,语言、口音、速度通常会体现出一个的民族、地域、文化特征。
AI 正是根据语音和相貌的关联性做出推测。为此,研究人员提取了几百万个 YouTube 视频,通过训练,让深度神经网络学习声音和面部的相关性,找到说话的人一些基本特征,并还原出相貌。在这个过程中,不需要人类标记视频,由模型自我监督学习。
当然,该研究也有翻车的时候。例如让一个亚洲人分别说英语和中文,结果分别得到了一张西方人面孔和一张中国人面孔。还例如变声期之前的儿童,也会导致模型误判性别发生错误。