DataFun AI Talk——NLP技术沙龙·上海站

时间: 11-17 09:00 - 12:30
地点: 上海 - 田林路200号C座一楼COCOSPACE

活动内容 [活动纠错]

DataFun AI Talk

NLP技术沙龙·上海站

关于NLP的话题持续升温,DataFun本次活动将继续为大家带来关于NLP细分领域的一些最新技术与实践。

11月17日 ,DataFun社区将来到上海,并有幸邀请到乐言科技、复旦大学、阅文信息的三位嘉宾,分别为大家分享NLP的一些最新技术和实践情况。

主办方: DataFun社区

联合主办方: COCOSPACE

时间: 2018年 11 17 日, 09:00~12:30

地点: 上海市徐汇区田林路 200号C座一楼COCOSPACE

议程安排:

时间

议程安排

09:00-09:30

签到

09:30-09:35

主持人开场

09:35-10:20

认知智能在企业计算中的机遇和挑战

王昊奋 上海乐言信息科技有限公司CTO

10:30-11:20

自然语言处理中的多任务学习

邱锡鹏 复旦大学计算机科学技术学院 副教授,博士生导师

11:30-12:20

网络文学领域的NLP技术落地实践

马宇峰 阅文信息 内容挖掘平台技术负责人

12:20-12:30 自由交流时间

详细介绍:

 

王昊奋 上海乐言信息科技有限公司CTO

嘉宾介绍: 王昊奋 ,上海乐言信息科技有限公司CTO,中文知识图谱zhishi.me创始人、OpenKG发起人之一、CCF理事、CCF术语审定工委主任、CCF TF执委、中文信息学会语言与知识计算委员会副秘书长,共发表80余篇高水平论文,在知识图谱、问答系统和聊天机器人等诸多领域有丰富的研发经验。其带队构建的语义搜索系统在Billion Triple Challenge中荣获全球第2名;在著名的本体匹配竞赛OAEI的实体匹配任务中斩获得全球第1名。曾主持并参与多项国家自然科学基金、863重大专项和国家科技支撑项目,以学术负责人身份参与Paypal、Google、Intel、IBM、百度等企业的合作项目。

分享主题:认知智能在企业计算中的机遇和挑战

内容概要: 在中国企业计算(Enterprise Computing)由于种种原因一直是一个被低估的市场。最近,Saas的推广和AI计算的成熟极大地改善了企业计算的现状。尤其值得一提的是:通过使用认知技术(如自然语言处理和知识图谱等)能为这些企业用户在成本节约和收入增长等两个方面带来显而易见的好处。在本次演讲中,我将向大家介绍各种在不同企业场景中成功使用认知技术的典型方法。在此基础上,我将根据乐言公司在商业落地过程中的第一线经验分享其中的关键技术和注意事项等。

邱锡鹏 复旦大学计算机科学技术学院 副教授,博士生导师

嘉宾介绍: 邱锡鹏 ,复旦大学计算机科学技术学院 副教授,博士生导师,于复旦大学获得理学学士和博士学位。中国中文信息学会青年工作委员会执委、计算语言学专委会委员、中国人工智能学会青年工作委员会常务委员、自然语言理解专委会委员。主要研究领域包括人工智能、机器学习、深度学习、自然语言处理等,并且在上述领域的顶级期刊、会议(ACL/EMNLP/IJCAI/AAAI等)上发表过50余篇论文。自然语言处理开源工具FudanNLP作者,2015年入选首届中国科协青年人才托举工程,2017年ACL杰出论文奖。

分享主题: 自然语言处理中的多任务学习

内容概要: 过去几年,深度学习在自然语言处理中取得了很大的进展,但进展并不像其在计算机视觉中那么显著。其中一个重要的原因是数据规模问题。因为自然语言处理任务的标注成本一般都比较高,所以语料规模一般都不是很大,这就限制了一些深度模型在自然语言处理中的应用。然而,自然语言处理的一个特点是不同任务之间都有一定的相关性,比如词性分析和句法分析两个任务可以促进。这样在自然语言处理中,一种可以有效解决数据稀缺问题的方法是多任务学习。多任务学习是将多个任务一起学习,充分挖掘多个任务之间的相关性,来提高每个任务的模型准确率,从而可以减少每个任务对训练数据量的需求。目前,多任务学习已经在大部分自然语言处理任务上取得了非常好的效果。本报告主要讲述在自然语言处理中的多任务学习方法,主要包括不同的共享模式(硬共享、软共享和并行共享)和具体的多任务学习模型,以及如何从多领域、多层次、多语言、多模态等角度来设计多任务的学习方式。

马宇峰 阅文信息 内容挖掘平台技术负责人

嘉宾介绍: 马宇峰 ,阅文信息 资深研发工程师 内容挖掘平台技术负责人。前百度高级研发工程师,研究方向主要包括知识图谱、用户理解、推荐系统。曾获 2014百度知识图谱竞赛第1名。  

分享主题: 网络文学领域的 NLP技术落地实践

内容概要: 内容是互联网下半场的争夺焦点,谁能建设好内容生态并有效挖掘其价值,谁就能作为平台掌握创作者的话语权。在其中网络文学是内容的重要组成部分,也是 IP战略支撑的漫画、影视、游戏的起始点。这里我们将着重讨论NLP相关技术是如何在网文领域建设并实际落地的。

主办方介绍:

DataFun 定位于最 “实用”的数据科学社区,主要形式为线下的深度沙龙、线上的内容整理。希望将工业界专家在各自场景下的实践经验,通过DataFun的平台传播和扩散,对即将或已经开始相关尝试的同学有启发和借鉴。DataFun的愿景是:为大数据、人工智能从业者和爱好者打造一个分享、交流、学习、成长的平台,让数据科学领域的知识和经验更好的传播和落地产生价值。

DataFun社区成立至今,已经成功在全国范围内举办数十场线下技术沙龙,有 超过一 百位 业内专家参与分享,聚集了万余大数据、算法相关领域从业者。

联合主办方: