【中国经济新闻联播 深圳讯 记者易全报道】聚焦AI技术、应用和产业,剖析AI技术在酒店、车载、教育等领域的应用与落地。继北京站之后,云知声开放日(Open Day)第2场4月18日来到深圳。云知声董事长/CTO梁家恩博士联手多位云知声技术专家,与腾讯杰出科学家、腾讯AI Lab副主任俞栋,携住科技联合创始人叶明,同行者科技联合创始人叶维,金鹰卡通卫视产品总监戴文博,三诺声智联副总经理乔峤等多位嘉宾一起,向深圳的合作伙伴和行业人士,全面展示了全栈AI硬核技术。
全栈:技术能力全栈,产业服务全栈
梁家恩作为人工智能行业的资深从业者,在现场复盘了发展历程。他表示在 AI大潮退去之后,技术的产业化能力成为决胜关键。“技术如果不能解决产业问题,那么技术将化为企业‘炫技’的产物”。基于此,梁家恩将云知声的AI哲学概括为“全栈”和“硬核”两个部分。

(云知声董事长CTO 梁家恩博士)
“全栈”包含了全栈AI技术能力和全栈AI落地能力两个维度。经过多年的发展,云知声目前的AI能力已超越单一的语音技术,覆盖了Atlas机器学习超算平台,信号、语音、图像、文本的感知和表达能力,知识、理解、分析、决策等认知技术,并朝着多模态人工智能系统方向发展。与此同时,云知声通过将能力封装在自研AI芯片上,打磨出“云端芯”一体化产品体系,从而推动了AI技术在家居、车载、儿童、教育、医疗、金融、零售等多个领域的落地,实现了从AI技术到产业应用的生态闭环。
硬核:确实、有效地解决产业规模化的痛点
“硬核”,是指技术方案能够确实有效地解决产业规模化痛点,以为终端用户提供相对成熟的用户体验。以当时最热门的智能语音为例,经历了两年的市场教育,语音交互技术在今天已被广泛应用到各大场景中,成为了AI技术落地的最典型应用案例。然而在实际使用中,AI需要面对的情况比实验室中要复杂得多,一旦产品软硬件的某一环节处理不好,便容易出现“听不到、听不懂、答非所问”等问题。针对这类行业痛点,本次云知声开放日深圳站现场,云知声的技术团队从语音交互技术的拾音、识别和交互等维度,深度剖析了技术难点和解决方案。
在 AIoT 场景下,设备首先要解决的便是远场拾音问题。云知声 AI Labs 技术专家关海欣表示,解决远程语音识别的关键在前端信号处理阶段,需要解决回声、混响和噪音3大核心问题,以确保设备可以准确识别到用户指令。目前,云知声在回声消除、混响抑制、噪声处理等方向均已有成熟的技术方案,相关技术指标也达到了行业一流水准。另外,未来远程语音识别还将呈现DSP+DL结合、分布式拾音两大趋势,对此,云知声也已经展开了相应的技术部署。

(云知声AI Labs技术专家关海欣)
在语音识别阶段,需要在声学和语言层面赋予机器感知和语音指令的能力。云知声AI Labs技术专家李轶杰表示,在声学方面,云知声基于大数据、前沿声学建模、自适应学习搭建了声学模型;在语言层面,云知声创建了一个数据规模大、融合能力强、灵活且个性化的语言模型,以上模型还将基于超算平台不断优化迭代。此外,云知声还将其语音识别能力延展到语音评测、声纹识别、情绪识别等多个方向。

(云知声AI Labs技术专家李轶杰)
在对话阶段,围绕更加自然的人机交互,云知声打造了流式交互、语用计算与知性会话3大硬核能力。云知声AI Labs技术专家单波介绍到,流式交互最大的特点是多轮对话免唤醒,大大提升了人机对话过程中的流畅程度;语用计算则是将人机对话内容放置到对应的语境中,以让设备准确地理解人的意图;最后,知性会话则是通过将知识图谱应用到人机对话过程中,以让设备准确响应用户的问题。

(云知声AI Labs技术专家单波)
基于上述技术,云知声2013年面向合作伙伴开放了对话技能开放平台(语义云),以帮助合作伙伴打造更加自然的人机交互体验,同时在实践中不断提升语义解析能力。目前这一平台已经支持200多个对话内容,覆盖了通讯、休闲娱乐、医疗健康、交通出行、设备控制等多个场景,语义解析准确率高达93%。
值得一提的是,语音感知与表达、语言与知识计算,只是云知声硬核 AI 技术的冰山一角,目前,云知声硬核技术还包含了AIoT芯片、超算平台与图像、翻译拓展等。
落地:覆盖酒店、汽车、儿童、音箱等场景
在大数据、深度学习、超算平台的加持下,人工智能底层技术将冲破阈值,带来成熟的体验;在技术和需求的双重推动下,人工智能将迈入发展的黄金阶段并掀起新一轮AIoT产业变革。在下午举行的“智能+”分论坛中,云知声副总裁康恒、云知声AIOS架构师郭洪光,连同携住科技、同行者科技、金鹰卡通、三诺声智联等多位合作伙伴,结合实际案例深入探讨了AI技术在酒店、汽车、儿童和音箱等场景中的应用。
云知声副总裁康恒表示,在整个产业链中,AI技术是个“基础设施”,且这一基础设置不可能在不加以定制的情况下适用全部场景。AI在落地过程中需要充分考虑使用场景和落地行业。基于对场景和产业的深度思考,云知声2014年便开始结合产业链,将云知声的AI技术赋能到整个行业中去。

(云知声副总裁康恒)
面向行业,云知声推出了一站式人工智能平台UniOS。云知声AIOS架构师郭洪光表示,与同类产品相比,UniOS具备开放、垂直两大特性,其中开放指的是云知声面向行业和合作伙伴开放技能平台与设备平台,并在此基础上兼容第三方AIOS;垂直则代表 UniOS会针对特定的行业需求输出解决方案,以此来帮助产业转型。

(云知声AIOS架构师郭洪光)
携住科技联合创始人叶明介绍了AI技术在酒店场景中的应用案例。叶明表示,针对酒店场景,携住科技基于AIoT技术,通过多种设备联动和场景定制,为酒店客户带来全新的智能互联场景体验;另一方面,通过信息整合和大数据分析,AI还将提高酒店管理效率。

(携住科技联合创始人叶明)
同行者科技联合创始人叶维分享了AI语音技术如何助力汽车产业升级。叶维表示,在车载场景下语音即服务。语音是用户与设备、互联网连接的主要手段,承载了车联网资源整合与用户触达的功能。因此,车载场景下的AI必须聚合丰富的内容和服务,并根据场景进行智能匹配,以打造千人千面的智能化体验。

(同行者科技联合创始人叶维)
金鹰卡通卫视产品总监戴文博分享了金鹰卡通对儿童产品智能化的思考。戴文博指出,儿童和家长对智能产品的需求与普通场景十分不同,基于此,金鹰卡通围绕儿童场景的特征,将 AI技术与“麦咭”的形象做了深度整合,以打造麦咭智能亲子产品生态。

(金鹰卡通卫视产品总监戴文博)
三诺声智联副总经理乔峤从产品角度出发分享了人工智能产品设计思考。乔峤指出,人工智能时代的设计方向是感知设计,产品只有将形状、外观、听觉、触感等诸多因素综合成一个完整的信息,才有可能充分调动人类的本能,设计出更普遍、更通用的产品。

(三诺声智联副总经理乔峤)
以带屏音箱为例,屏幕为人机交互补充重要的视觉信息,更加接近用户本能,“未来5年,单带屏的智能音箱就会达到3亿多台,超过PC的规模。”
链接:关于云知声和Open Day
成立于2012年的云知声是一家专注于物联网人工智能,拥有自主知识产权的智能语音人工智能企业。是中国人工智能行业成长最快、商业化落地最好的人工智能企业之一。其业务主要覆盖智慧生活和智慧服务两大场景,在包括家居、车载、医疗、教育、政府、机器人等领域拥有广泛布局。客户涵盖了格力、美的、长虹、海尔、华帝、北京协和医院、吉利、平安集团、京东、360等。
2018 年 5 月份,云知声正式推出第一代UniOne物联网AI芯片及其解决方案——雨燕(Swift)。该芯片由云知声自主设计研发,采用云知声自主AI指令集,性能较通用方案提升超50倍。基于该芯片的标准化解决方案,可帮助传统硬件产品在更短的时间周期内,以更少的成本快速实现AI化,实现人机交互智能。
Open Day是云知声一年一度的对外技术分享与交流活动,是云知声面向人工智能硬核科技,与合作伙伴、相关学术和产业研究机构等共话人工智能前沿技术与产业应用,并借此探讨合作的平台。2019首届云知声Open Day设北京、深圳、上海、厦门四站。据了解,继北京、深圳站之后,上海站活动将于5月上旬正式开启。













