基于京东快递文本识别的自然语言处理优化之路演讲简介:让用户的操作更加简单高效,是每一款产品设计的原则。作为一家以“客户为先”为首要价值观的公司,京东更是将这种理念渗透到物流的每一个环节。传统的寄递业务,做了怎样的技术演进,怎样充分挖掘京东的海量数据来渗透到用户体验的方方面面。本次分享将涉及快递场景下NLP的深度挖掘详解,另外,还会结合位置服务及地址文本的语义解析,详细讲述用户体验和高效运营背后的技术架构升级历程。
分享提纲:
1、对海量地址做结构化分析价值在哪儿;
2、介绍NLP在语义分析以及处理各种场景的解决思路;
3、地址分词、Word2Vec的改进、各种置信度以及预测值的平衡等。
分享要点:
首先,对于无统一标准的地址文本,如何做便于快递场景下易于用户理解的结构化分析。在一堆杂乱的OCR识别出的文本中挑出有用的信息。并且把核心的兴趣点做层级化的用户展示。
其次,在这些业务点的背后,如何利用组合以及优化NLP中各种算法已达到佳效果。前处理、后处理以及埋点数据的技巧。
后,结合位置服务,扩展轨迹的拓扑挖掘、配运协同的数据挖掘,反补兴趣点有价值的信息,以及佳工程化高并发低延迟的设计结合。
王梓晨 京东物流 技术总监嘉宾介绍:2012年1月加入京东,曾任职京东物流多个条线的架构师以及技术负责人,技术扎实,组织保障多年大促备战。在负责智图平台组期间,从0到1打造精益团队,落地了物流地图的系列产品,建立了统一地址标准的联盟生态,实现大幅降本增效。多次被评为Qcon/ArchSummit/MPD技术峰会明星讲师;并担任中国精准定位联盟理事、中国卫星导航定位协会委员。
AI导购机器人助力58商家提升效益演讲简介:58同城是国内大的综合性分类信息平台,业务覆盖房产、招聘、生活黄页、二手车等多个细分领域。平台连接着数千万C端用户和数百万B端商家,IM微聊是两端用户的重要沟通渠道之一,在微聊场景中AI对话机器人可以代替58商家与C端用户进行沟通,帮助商家高效获取商机,以提升商家在平台上的收益。本次分享将详细介绍AI导购机器人的应用场景、多轮对话算法、工程系统实践以及落地效果。
韩伟 58同城 AI Lab算法架构师嘉宾介绍:58同城AI Lab算法架构师,现任58同城AI Lab智能问答部负责人。先后就职于三星、阿里、猎户星空,主要从事机器学习、自然语言处理和人机交互等相关工作。2019年加入58同城AI Lab,负责AI技术在智能客服、商机导购等方面的研发工作,对人工智能,自然语言处理,人机交互等方面有一定的研究和实际研发经验。
基于视觉AI的内容创作理解演讲简介:对于内容行业中的剧集、综艺等制作投入巨大,然而播前内容质量判断是整个业内的痛点。随着AI技术在各个行业的崛起,我们在内容评估侧,利用视觉AI技术,对内容视频进行全方位结构,数据化内容视频,并辅助内容早期剪辑、中后期的宣发。区别于传统的视频解构与打标,影视剧等视频特别重视内容情感传达、内容节奏表现、拍摄手法变化等。针对这些特点,我们深入打磨了用户观影曲线、剧集人物重识别等基础模型,并完成了面向网大电影、剧集等制作平台放的智能分析能力输出。
分享提纲:
1、内容创作理解背景与意义
2、内容体检体系与技术框架—内容认知框架与内容创作解构
3、影视剧分析中的视觉技术特点
4、内容情感线--视频情感计算模型介绍
5、内容故事线—人物场景与推理模型介绍
6、未来方向
赵寅 阿里巴巴大文娱优酷 内容智能算法专家嘉宾介绍:博士,毕业于清华大学,曾就职于硅谷独角兽公司,后加入阿里巴巴,有多年数据建模与优化、计算机视觉、机器学习经验。现在负责优酷内容智能团队计算机视觉方向,搭建了业内内容创作理解框架与现场解决方案。
SuperSQL:数据湖时代的高性能SQL引擎演讲简介:漂移计算SuperSQL是腾讯大数据自研的跨数据中心、跨集群、跨数据源的高性能大数据SQL引擎,满足对位于不同数据中心/集群的不同类型数据源的数据联邦分析/即时查询的需求,解决大数据中数据孤岛难题,降低数据使用壁垒,提升数据使用效率,大化数据价值。
在这个演讲中,我们会介绍漂移计算SuperSQL项目的细节,包括:
1、漂移计算的背景和定位;
2、漂移计算的整体架构;
3、漂移计算的技术细节;
4、漂移计算的性能表现;
5、未来规划。
张韶全 腾讯 SuperSQL项目研发负责人嘉宾介绍:香港中文大学博士,毕业后一直从事大数据相关工作。现任腾讯大数据工程师,SuperSQL项目研发负责人。《SparkSQL内核剖析》作者之一。