当前位置:首页 > 科技  > 资讯

广告出价进入“自动驾驶”时代,快手提出生成式强化学习出价技术

来源: 责编: 时间:2025-09-30 10:16:23 59观看
导读近日,快手首次提出生成式强化学习出价技术,并将其应用于大规模广告系统中。该项技术显著提升了广告竞价的智能化水平,实现了出价策略从传统“依赖单步状态决策”到新一代“序列决策”的关键跨越,在为

近日,快手首次提出生成式强化学习出价技术,并将其应用于大规模广告系统中。该项技术显著提升了广告竞价的智能化水平,实现了出价策略从传统“依赖单步状态决策”到新一代“序列决策”的关键跨越,在为广告主带来更高投放回报的同时,也提升了平台整体收益,真正实现了双赢。2025年至今,该技术已成功推动快手广告收入提升3%,成效显著。rQq28资讯网——每日最新资讯28at.com

广告出价:实时竞价中的“智能大脑”rQq28资讯网——每日最新资讯28at.com

在实时竞价(RTB)广告系统中,出价模块作为连接广告主与流量的核心枢纽,需要在多重约束条件下实现广告投放效果的最优化。rQq28资讯网——每日最新资讯28at.com

这一过程面临三大挑战。首先是既要控制支出,又要追求效益。广告主不仅需要将单日花费严格控制在预算范围内,还应力求降低每次转化的成本,实现成本效益的双重优化。rQq28资讯网——每日最新资讯28at.com

其次是,未来环境的不确定性。系统难以预知即将到来的流量状况与竞争对手行为,因此必须依赖实时花费与成本等数据,动态调整出价策略以应对波动市场。rQq28资讯网——每日最新资讯28at.com

最后是决策之间的连锁影响。每一次出价不仅直接影响广告的展示与消耗,还会改变账户状态(如剩余预算),进而干扰后续出价决策,形成一个连续且复杂的序列决策问题。rQq28资讯网——每日最新资讯28at.com

三代技术革新,快手提出新一代生成式强化学习出价技术rQq28资讯网——每日最新资讯28at.com

快手出价技术已历经三代演进:从PID控制——基于当前状态与目标的偏差进行调节,响应直接但适应性有限,难以应对复杂多变的竞价环境;到第二代MPC预测模型——能够预测短期未来并优化动作,但预测范围有限,易陷局部最优;再到第三代强化学习——通过历史数据学习不同状态下的最优出价策略,最大化长期收益,兼顾效果与安全性。rQq28资讯网——每日最新资讯28at.com

近年来,尽管强化学习在自动出价中表现优异,但其决策仍依赖单步状态信息,对序列历史利用不足。而生成式模型擅长对序列数据进行建模和生成,却不擅长直接优化目标收益。rQq28资讯网——每日最新资讯28at.com

面对这一挑战,快手创新融合两类技术,提出生成式强化学习出价技术——在继承生成模型序列建模能力的基础上,引入强化学习的目标导向优化机制,实现出价策略在长序列决策中的新突破。rQq28资讯网——每日最新资讯28at.com

两大核心算法实现广告出价“多维思考”,助推智能决策升级rQq28资讯网——每日最新资讯28at.com

在将生成模型应用于强化出价策略的过程中,主要面临两大挑战:一是对高质量数据集的依赖较强,限制了泛化能力;二是生成模型难以直接优化序列整体收益,导致出价策略与广告主全局目标存在偏差。rQq28资讯网——每日最新资讯28at.com

rQq28资讯网——每日最新资讯28at.com

针对这些挑战,快手提出了GAVE和CBD两大创新算法。GAVE算法融合了Score-based RTG机制与价值函数引导的动作探索策略,显著提升了离线训练中的探索能力,该成果助力团队荣获NeurIPS 2024自动出价竞赛双赛道冠军。rQq28资讯网——每日最新资讯28at.com

rQq28资讯网——每日最新资讯28at.com

CBD算法则聚焦于生成模型与优化目标的对齐问题,引入“Completer(扩散补全)”和“Aligner(偏好对齐)”双模块,通过补全未来状态轨迹并进行校准,使出价策略更贴合广告主真实需求,提升了系统长程规划与决策可解释性。rQq28资讯网——每日最新资讯28at.com

2025年至今,生成式强化学习出价技术已在快手广告系统中全面部署,并推动平台广告收入提升3%。在多项关键客户指标上实现突破——如在成本控制场景中,消耗提升2.0%,CPA达标率提升1.9%。rQq28资讯网——每日最新资讯28at.com

展望未来,快手将围绕两大方向持续演进。一是构建出价基座大模型,整合多场景数据训练通用模型,发挥规模效应;二是发展出价推理大模型,引入大语言模型增强推理能力,提升可解释性与复杂决策水平。rQq28资讯网——每日最新资讯28at.com

快手将继续推动自动出价技术向更高层次的智能化迈进,为数字营销行业注入创新动力。rQq28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-189089-0.html广告出价进入“自动驾驶”时代,快手提出生成式强化学习出价技术

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 岚图泰山开启预订 旗舰实力定义新时代中式豪华

下一篇: 快手“AI创想剧场”成果丰硕,AIGC影像创作营在中国传媒大学圆满举办

标签:
  • 热门焦点
  • 中兴AX5400Pro+上手体验:再升级 双2.5G网口+USB 3.0这次全都有

    2021年11月的时候,中兴先后发布了两款路由器产品,中兴AX5400和中兴AX5400 Pro,从产品命名上就不难看出这是隶属于同一系列的,但在外观设计上这两款产品可以说是完全没一点关系
  • 石头自清洁扫拖机器人G10S评测:多年黑科技集大成之作 懒人终极福音

    科技圈经常能看到一个词叫“缝合怪”,用来形容那些把好多功能或者外观结合在一起的产品,通常这样的词是贬义词,但如果真的是产品缝合的好、缝合的实用的话,那它就成了中性词,今
  • 三言两语说透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术,可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
  • 虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • 2023年,我眼中的字节跳动

    此时此刻(2023年7月),字节跳动从未上市,也从未公布过任何官方的上市计划;但是这并不妨碍它成为中国最受关注的互联网公司之一。从2016-17年的抖音强势崛起,到2018年的“头腾
  • 联想YOGA 16s 2022笔记本将要推出,屏幕支持触控功能

    联想此前宣布,将于11月2日19:30召开联想秋季轻薄新品发布会,推出联想 YOGA 16s 2022 笔记本等新品。官方称,YOGA 16s 2022 笔记本将搭载 16 英寸屏幕,并且是一
  • 由于成本持续增加,笔记本产品价格预计将明显上涨

    根据知情人士透露,由于材料、物流等成本持续增加,笔记本产品价格预计将在2021年下半年有明显上涨。进入6月下旬以来,全球半导体芯片缺货情况加剧,显卡、处理器
  • 外交部:美方应停止在网络安全问题上不负责任地指责他国

      中国外交部今天(16日)举行例行记者会。会上,有记者问,美国情报官员称,他们正在阻拦来自中国以及其他国家的黑客获取相关科研成果。 中方对此有何评论?对此
  • 北京:科技教育体验基地开始登记

      北京“科技馆之城”科技教育体验基地登记和认证工作日前启动。首批北京科技教育体验基地拟于2023年全国科普日期间挂牌,后续还将开展常态化登记。  北京科技教育体验基
Top