爱奇艺技术沙龙——语音和语言技术在自然交互中的实践

时间: 2019-12-21 - 17:30
地点: 北京 - 北一街2号爱奇艺创新大厦

活动内容 [活动纠错]

语音交互正在渗透进家居生活、车载、金融服务等日常生活场景

成为连接人与信息/服务的新入口

如何能够提供便捷、高效、高可用的语音技术?在不同场景和终端的应用上踩过哪些坑?

本期【爱奇艺技术沙龙】以 “语音和语音技术在自然交互中的实践 为主题,

邀请来自 爱奇艺、百度、小米 的技术专家,

分享他们语音技术实践经验

出品人

| 朱俊敏  爱奇艺技术总监 |

上海交通大学硕士,拥有 3 篇美国专利, 5 篇中国专利, 以及 21 篇在审专利。

曾任事于英特尔开源软件中心, 2015 年加入爱奇艺,目前负责 AI 算法的产品落地和创新应用开发。

演讲嘉宾和内容

王视鎏 爱奇艺  研究员   |

个人介绍 :2011年毕业于复旦大学计算机系硕士研究生。在web引擎和移动开发等领域有丰富的开发和项目经验。目前就职于爱奇艺,负责HomeAI项目,聚焦智能语音交互,持续优化产品体验,探索人工智能在视频点播场景的创新应用, 推动新技术落地。

演讲主题: 爱奇艺HomeAI智能语音交互系统

内容简介:

爱奇艺HomeAI提供完整的智能语音交互解决方案,服务于爱奇艺移动端、TV端、奇巴布和VR设备等多个重要产品。

在影视剧点播领域,语音交互存在诸多困难:

1. 新片片名字错高,片名成句难理解

2. 视频标签表达多,没有提示难对应

3. 视频长尾内容多,结果合理难判断

在本次分享中,我们会介绍HomeAI在语言、语义、召回等多个环节针对影视点播做的一系列优化工作。

同时HomeAI在语音交互过程通过获取当前状态,结合对视频内容的理解,推出只看他、这是谁、智能跳转等多项创新,使用户在观影过程中能够基于视频内容有更多的交互方式。

| 孙珂 百度  自然语言处理部主任研发架构师、百度UNIT负责人 |

个人介绍 :百度自然语言 处理部主任研发架构师、百度UNIT负责人

演讲主题:

可定制对话系统关键技术

内容简介:

近几年来智能对话已经逐步融入各行各业,通过车载、音箱、客服、机器人等场景,给用户带来了更加便捷与高效的交互体验。本次报告将结合百度的实践,介绍可定制对话系统研发中的挑战与实践。

演讲主题: 面向家居场景的远场语音探索与实践

李晓明   小米  科技AI实验室声学阵列算法团队负责人   |

个人介绍: 李晓明博士,小米科技AI实验室声学阵列算法团队负责人,现负责小米IOT语音交互设备远场拾音算法研发与落地。加入小米前,曾任职于三星北京研究院、陌陌科技,长期从事语音频编解码、手机通话增强、音效处理和阵列增强算法等相关研究工作。

常洋  小米  小米电视语音业务负责人   |

个人介绍 :常洋博士多年来一直负责小米电视语音业务。从合作到自研,从近场到远场,全程参与了小米电视语音业务诞生至今的全过程。 其团队主要负责小米电视上语音相关功能的产品定义与研发,新技术探索与落地。加入小米前,曾任职于英国约克大学、播思科技、Intel中国,长期从事垃圾收集、实时系统的研究工作

演讲主题: 面向家居场景的远场语音探索与实践

内容简介:

随着远场语音技术在近年来的不断成熟,智能音箱和远场电视得到了普及,并在与IOT设备结合之后深刻地改变着人们的居家生活方式。这其中语音前端处理技术对于提高语音唤醒、语音识别的鲁棒性起到了非常重要的作用。本次分享第一部分主要介绍远场增强算法的基本概念和方法,以及在真实用户场景下,小米自研前端增强算法在小米AI音箱中的应用。其次我们还将给大家分享一下小米电视在进入远场语音时代之后的一些变化以及我们在声纹等新技术落地探索过程中的一些心得。

陈海涛    爱奇艺 资深研发工程师    |

个人介绍 :2015年毕业于电子科技大学。目前就职于爱奇艺,主要负责语音合成等相关算法开发。对语音合成,语音识别,自然语言处理等方向有浓厚的兴趣,聚焦智能语音交互,推动语音相关新技术的落地。

演讲主题: Voice Conversion探索与实践

内容简介:

Voice Conversion(VC)是将一个人的声音转换为另一个音色,而声音内容没有改变。能够应用到爱奇艺的多个业务场景中,给用户带来更有乐趣的体验。 Voice Conversion主要分为基于parallel语料和non-parallel语料等两类。早期的VC方法多为基于parallel语料找出Source和Target的一些映射关系,但是parallel语料难以获取限制了这类方法的使用。现有的基于ASR的VC方法,多基于PPG或者Bottleneck特征,该类方法多适用于将语音转换为特定音色,无法满足到任意音色的转换。近年来,出现了一些基于GAN网络的VC方法,试图解决Many-to-Many的问题。在本次分享中,主要介绍VC的发展历史,常见方法,并结合我们的实际业务需求,介绍爱奇艺在Voice Conversion方向的一些探索与实践。

交通信息

时间: 2019年12月21日(周六)

地点: 北京市海淀区中关村大街爱奇艺创新大厦5层

礼品福利   

礼品福利

合作伙伴

爱奇艺技术沙龙

由爱奇艺技术产品团队出品,秉承高效、开放、创新的理念,

联合业界知名公司、合作伙伴、相关学术和产业研究机构,

通过交流,分享爱奇艺生态理念与技术进展,引领视频体验革命。