2020SACC专场十三: 人工智能算法与应用实践(上)(PPT下载)
在 RTB 广告中,在预算限制下确定优出价是广告主面临的一大挑战,目前已有一些智能营销优化工具支持对单个投放计划的优化。然而面对庞杂的线上广告业务线,从全局视角出发在各个业务线间做整体优化,仍极大程度上依赖于人工经验。在京东营销组合优化工具 TMM(Touchpoint Mix Modeling)中,广告主可以将不同产品线中的投放计划整合为一个优化组,在总预算约束下,大化整体营销目标。TMM 算法基于京东多触点归因模型(MTA)结果,对优化组内的所有出价维度进行科学准确效果评估,建立出价调整对广告消耗的影响分析模型,分解 KKT 条件将问题简化为迭代求解子问题,并基于此构建全局优化器。算法经历多轮 AB 实验,diff in diff 的客观评估结果显示,数十个广告商平均提升整体转化25%,目前产品已经在京准通上线,助力品牌在技术驱动力下完成智慧决策,实现稳健而又高效的增长。
分享提纲:
a. 介绍京东营销组合优化工具 TMM 和京东多触点归因模型(MTA)背景;
b. 介绍利用归因数据预测产品线基础出价粒度 CVR;预测出价变动下的花销,推导二价条件下出价-花销的数学关系;基于 KKT 条件的优化器;
c. diff in diff的AB实验设计及结论。
分享要点:
首先,介绍背景:广告主很难从全局视角出发整体优化各业务线内的推广计划,TMM 是互联网广告业内基于多触点归因和组合优化,可对多推广计划进行整体智能优化的营销工具;
其次,介绍技术细节:利用归因数据预测投放粒度 CVR 中的挑战;通过还原竞价队列,模拟出价调整带来的花销变动,在二价条件下推到竞价-消耗关系,得到显式数学表达;全局优化器的算法和设计;
后,介绍 diff in diff 的 AB 实验设计方法:通过对比 TMM 算法策略和广告主投放策略在数据累积期和实验期的效果,得出科学的算法效果评估结论。
本科毕业于南京大学数学系,硕士毕业于哈尔滨工业大学,在校研究方向为生物信息学,相关研究论文在 IEEE Access 等期刊发表。目前在京东广告数据部担任算法架构师,负责广告效果评估和智能营销优化开发工作。
短视频和直播为代表的复杂流媒体在当下成为用户消费的主流内容消费形态,在电商领域,也不例外。相对于传统的电商基于货物理解的电商推荐系统,或者基于标签,BGM理解的内容推荐系统来说,内容电商的推荐系统要求将货物的理解与内容本身的理解进行深度的结合,从而满足消费者对于内容+货物的双重满意度。本次分享将主要详细分析在复杂流媒体环境下电商推荐系统遇到的困难,并介绍在这个问题上目前的进展和未来展望。
分享提纲:
a.介绍内容电商的背景,短视频和直播与电商的结合情况;
b.介绍多模态理解的工作和推荐系统近些年的进展;
c.针对二者的结合提供在阿里场景下的优化思路和技术演进方向。
分享要点:
首先,提出复杂流媒体的理解与推荐系统的结合范式,归纳现有方法;
其次,介绍过去一段时间业界的工作,以及在该范式下的进展;
后,介绍在一个业务场景下,如何深度融合多模态技术与推荐系统技术。
阿里巴巴内容&互动算法短视频算法负责人,7年推荐系统算法工作经验,曾参与电商搜索算法和推荐系统算法的建设,现负责淘宝短视频算法,专注于内容理解技术在推荐场景下的创新和应用。
从业务角度看,对于以视频平台为代表的内容平台,对于内容收益的预判是内容采购投资必备环节,是降本增效的核心能力;从技术角度看,预测是一个复杂问题,现实世界大部分问题都是小样本问题,即FSL或者ZSL,而这个过程中伴随着用户的行为和认知过程,而简单的显式行为偏好建模会造成因果偏差,有效认知过程建模变得重要。本内容主要总结在阿里文娱内容预测里的一些系统化的工作,尝试对以上两个问题做粗浅初探。
曾在 IBM 等多家知名企业工作,主导研发了开源深度学习平台 DeepDriver 并在图像,NLP,以及对话,预测等领域都有深入的应用。主导研发了行业领先的大数据内容生命周期三维立体分析平台,是国内外领先的视频行业的智能大数据驱动运营分析应用,并由此受邀在中国计算机学会大数据论坛等学术交流会进行了成果分享,受到广泛好评和反响;对大数据和人工智能技术有着信仰般的热情,欢迎多多沟通,交流。
陌陌数据驱动团队承担陌陌社交、直播、增长等核心场景的分发匹配工作,重点使用推荐技术给用户提供个性化、精准的结果展示。在机器学习工程化方面经历了模型从浅层模型到深度模型,在线服务经历了从低吞吐到高吞吐的演进。推荐系统涉及到数据生产、模型训练、在线推理等环节,如何解决多个业务场景下,机器学习工程化的快速落地;如何解决线上线下特征数据的一致性;在模型复杂度增长,预估规模增大的同时,如何保持在线推理服务的高可用、高性能;如何解决多业务场景下,AB实验的迭代效率问题。
分享大纲及要点:
1. 介绍陌陌数据驱动团队在机器学习工程化的工作;
2. 介绍大规模稀疏模型在线推理架构的演进过程;
3. 介绍机器学习平台后续的技术展望。
本科毕业于中山大学,2019年加入陌陌数据驱动团队,负责高性能计算相关工作,从无到有建设了大规模预估平台,ANN平台,机器学习平台;曾在腾讯和滴滴就职,先后负责过中间件、推荐架构和推送系统的开发。
为了提升各类数据库的性能,尤其面对复杂查询场景时,当传统的方法例如索引和增加硬件等方式仍存在很大瓶颈,自然需要革新的方法。数据嵌入加速器革新了数据库查询算法和所需硬件,通过将数据库计算逻辑翻译至GPU或FPGA上进行计算,实现至少数万倍的计算效率提升,可解决大部分的系统性能瓶颈问题。数据嵌入加速器同时可实现国产化替代,符合国家信息技术大方向。
广州皓岚数据科学家,负责各类AI产品落地全流程,曾任某政府大数据部门算法负责人,现同时负责国内大型人工智能社区炼数成金。
相关文章