EN
EN

2018世界智能制造大会 2018 World Intelligent Manufacturing Summit 新闻中心

智能制造前沿技术专题论坛|声音转化成文字不是梦

发布时间:2018-10-26 07:28:51

打开 GPS,你可以选择明星“周星驰”或者“林志玲”为你导航。你是不是以为是导航公司请了这两个明星专程录制的声音呢?如果你以为那真的是周星驰和林志玲的声音,那就错了。那是合成的!12月8日,在世界智能制造大会智能制造前沿技术专题论坛上,科大讯飞产业投资有限公司总裁起东风做了《认知智能最新进展》的报告,他说,现在合成的声音想模仿谁就模仿谁,真假难辨。目前,他还在研发一款机器人,将来可以走进考场,去考大学。

“声纹”未来将代替指纹

“人工智能现在可火了,和基因技术、火箭一样热门。”一开口,祁东风就讲起了人工智能的火爆。他说,未来又两大产业发展机遇,分别是:以语言为主,键盘为辅的人机交互时代即将到来,另一个则是人工智能像水和电一样进入每一个行业,深刻改变世界。

说到声音,它有些什么奥秘呢?祁东风说,每个人说话都有自己的特点,不论说话声音的大小、口音、口语,给人的感觉等等,这些都各不相同。不同人的声音采集、合成后,可以灵活运用,甚至你都辨别不出来。“人工智能合成声音经历了三个阶段,第一阶段是运算智能,这时候的合成声音,一听就知道是机器人的;第二阶段是感知智能,这个阶段人工智能合成声音像小演员,甚至比人讲的好,第三阶段是认识智能,人工智能合成声音也会理解和思考。”

祁东风说,每个人的说话声音都像指纹一样,这被称为声纹。声纹某种程度上可以代替指纹,将来在识别和间谍上是一场战争。

把声音变成文字,记者更轻松

祁东风说,他的团队里,一共有 1000 多名研发人员。这么多研发人员都是研究声纹的,通过研究,他们还可以把声音变成文字,而且准确率达到 90% 以上。

“现在有很多文字工作者,尤其是记者,他们都很希望能够把采访对象的话,一下就能变成文字,这样就会轻松很多。而我们就做了这么一件很牛的事情,我们研发的软件,就可以把语音转化成文字,很多人测试使用了以后发现准确率非常高,90% 以上。我们还和最高法院合作。在法院庭审中,每个法庭都有速记员,他们的打字速度都非常快速精确,我们把语音转化成文字的系统,在庭审中试验,发现比速记员还快,准确度也非常高。”祁东风说。

不过,祁东风认为,人工智能和人类的关系,始终是 1:0。比如:人工声音识别系统目前还无法识别干笑、冷笑等,尤其是在情感方面,机器人始终无法超越的。(记者 胡玉梅 金凤 赵杰 / 摄)

World
Intelligent
Manufacturing
Summit
2018

2018世界智能制造大会
赋能升级 智造未来

Nanjing · China

October 11-13
您可能还对以下内容感兴趣

主办单位 江苏省人民政府 工业和信息化部 中国工程院 中国科学技术协会

承办单位 江苏省经济和信息化委员会 江苏省人民政府外事办公室 中国科协智能制造学会联合体 南京市人民政府

联系我们 江苏经信智能制造研究院 江苏省南京市江宁区苏源大道19号
九龙湖国际企业总部园C1-5
service@wimsite.org

关注我们 关注世界智能制造大会
官方微信随时了解大会
最新动态