2020DTCC大会 专场16 AI与大数据应用(下) PPT
基于京东快递文本识别的自然语言处理优化之路
让用户的操作更加简单高效,是每一款产品设计的原则。作为一家以“客户为先”为首要价值观的公司,京东更是将这种理念渗透到物流的每一个环节。传统的寄递业务,做了怎样的技术演进,怎样充分挖掘京东的海量数据来渗透到用户体验的方方面面。本次分享将涉及快递场景下NLP的深度挖掘详解,另外,还会结合位置服务及地址文本的语义解析,详细讲述用户体验和高效运营背后的技术架构升级历程。分享提纲:1、对海量地址做结构化分析价值在哪儿;2、介绍NLP在语义分析以及处理各种场景的解决思路;3、地址分词、Word2Vec的改进、各种置信度以及预测值的平衡等。分享要点:首先,对于无统一标准的地址文本,如何做便于快递场景下易于用户理解的结构化分析。在一堆杂乱的OCR识别出的文本中挑出有用的信息。并且把核心的兴趣点做层级化的用户展示。其次,在这些业务点的背后,如何利用组合以及优化NLP中各种算法已达到佳效果。前处理、后处理以及埋点数据的技巧。后,结合位置服务,扩展轨迹的拓扑挖掘、配运协同的数据挖掘,反补兴趣点有价值的信息,以及佳工程化高并发低延迟的设计结合。
2012年1月加入京东,曾任职京东物流多个条线的架构师以及技术负责人,技术扎实,组织保障多年大促备战。在负责智图平台组期间,从0到1打造精益团队,落地了物流地图的系列产品,建立了统一地址标准的联盟生态,实现大幅降本增效。多次被评为Qcon/ArchSummit/MPD技术峰会明星讲师;并担任中国精准定位联盟理事、中国卫星导航定位协会委员。
AI导购机器人助力58商家提升效益
58同城是国内大的综合性分类信息平台,业务覆盖房产、招聘、生活黄页、二手车等多个细分领域。平台连接着数千万C端用户和数百万B端商家,IM微聊是两端用户的重要沟通渠道之一,在微聊场景中AI对话机器人可以代替58商家与C端用户进行沟通,帮助商家高效获取商机,以提升商家在平台上的收益。本次分享将详细介绍AI导购机器人的应用场景、多轮对话算法、工程系统实践以及落地效果。
58同城AI Lab算法架构师,现任58同城AI Lab智能问答部负责人。先后就职于三星、阿里、猎户星空,主要从事机器学习、自然语言处理和人机交互等相关工作。2019年加入58同城AI Lab,负责AI技术在智能客服、商机导购等方面的研发工作,对人工智能,自然语言处理,人机交互等方面有一定的研究和实际研发经验。
SuperSQL:数据湖时代的高性能SQL引擎
漂移计算SuperSQL是腾讯大数据自研的跨数据中心、跨集群、跨数据源的高性能大数据SQL引擎,满足对位于不同数据中心/集群的不同类型数据源的数据联邦分析/即时查询的需求,解决大数据中数据孤岛难题,降低数据使用壁垒,提升数据使用效率,大化数据价值。在这个演讲中,我们会介绍漂移计算SuperSQL项目的细节,包括:1、漂移计算的背景和定位;2、漂移计算的整体架构;3、漂移计算的技术细节;4、漂移计算的性能表现;5、未来规划。
香港中文大学博士,毕业后一直从事大数据相关工作。现任腾讯大数据工程师,SuperSQL项目研发负责人。《SparkSQL内核剖析》作者之一。
相关文章