当前位置:首页 > 科技  > 资讯

广告出价进入“自动驾驶”时代,快手提出生成式强化学习出价技术

来源: 责编: 时间:2025-09-30 10:16:23 35观看
导读近日,快手首次提出生成式强化学习出价技术,并将其应用于大规模广告系统中。该项技术显著提升了广告竞价的智能化水平,实现了出价策略从传统“依赖单步状态决策”到新一代“序列决策”的关键跨越,在为

近日,快手首次提出生成式强化学习出价技术,并将其应用于大规模广告系统中。该项技术显著提升了广告竞价的智能化水平,实现了出价策略从传统“依赖单步状态决策”到新一代“序列决策”的关键跨越,在为广告主带来更高投放回报的同时,也提升了平台整体收益,真正实现了双赢。2025年至今,该技术已成功推动快手广告收入提升3%,成效显著。bc628资讯网——每日最新资讯28at.com

广告出价:实时竞价中的“智能大脑”bc628资讯网——每日最新资讯28at.com

在实时竞价(RTB)广告系统中,出价模块作为连接广告主与流量的核心枢纽,需要在多重约束条件下实现广告投放效果的最优化。bc628资讯网——每日最新资讯28at.com

这一过程面临三大挑战。首先是既要控制支出,又要追求效益。广告主不仅需要将单日花费严格控制在预算范围内,还应力求降低每次转化的成本,实现成本效益的双重优化。bc628资讯网——每日最新资讯28at.com

其次是,未来环境的不确定性。系统难以预知即将到来的流量状况与竞争对手行为,因此必须依赖实时花费与成本等数据,动态调整出价策略以应对波动市场。bc628资讯网——每日最新资讯28at.com

最后是决策之间的连锁影响。每一次出价不仅直接影响广告的展示与消耗,还会改变账户状态(如剩余预算),进而干扰后续出价决策,形成一个连续且复杂的序列决策问题。bc628资讯网——每日最新资讯28at.com

三代技术革新,快手提出新一代生成式强化学习出价技术bc628资讯网——每日最新资讯28at.com

快手出价技术已历经三代演进:从PID控制——基于当前状态与目标的偏差进行调节,响应直接但适应性有限,难以应对复杂多变的竞价环境;到第二代MPC预测模型——能够预测短期未来并优化动作,但预测范围有限,易陷局部最优;再到第三代强化学习——通过历史数据学习不同状态下的最优出价策略,最大化长期收益,兼顾效果与安全性。bc628资讯网——每日最新资讯28at.com

近年来,尽管强化学习在自动出价中表现优异,但其决策仍依赖单步状态信息,对序列历史利用不足。而生成式模型擅长对序列数据进行建模和生成,却不擅长直接优化目标收益。bc628资讯网——每日最新资讯28at.com

面对这一挑战,快手创新融合两类技术,提出生成式强化学习出价技术——在继承生成模型序列建模能力的基础上,引入强化学习的目标导向优化机制,实现出价策略在长序列决策中的新突破。bc628资讯网——每日最新资讯28at.com

两大核心算法实现广告出价“多维思考”,助推智能决策升级bc628资讯网——每日最新资讯28at.com

在将生成模型应用于强化出价策略的过程中,主要面临两大挑战:一是对高质量数据集的依赖较强,限制了泛化能力;二是生成模型难以直接优化序列整体收益,导致出价策略与广告主全局目标存在偏差。bc628资讯网——每日最新资讯28at.com

bc628资讯网——每日最新资讯28at.com

针对这些挑战,快手提出了GAVE和CBD两大创新算法。GAVE算法融合了Score-based RTG机制与价值函数引导的动作探索策略,显著提升了离线训练中的探索能力,该成果助力团队荣获NeurIPS 2024自动出价竞赛双赛道冠军。bc628资讯网——每日最新资讯28at.com

bc628资讯网——每日最新资讯28at.com

CBD算法则聚焦于生成模型与优化目标的对齐问题,引入“Completer(扩散补全)”和“Aligner(偏好对齐)”双模块,通过补全未来状态轨迹并进行校准,使出价策略更贴合广告主真实需求,提升了系统长程规划与决策可解释性。bc628资讯网——每日最新资讯28at.com

2025年至今,生成式强化学习出价技术已在快手广告系统中全面部署,并推动平台广告收入提升3%。在多项关键客户指标上实现突破——如在成本控制场景中,消耗提升2.0%,CPA达标率提升1.9%。bc628资讯网——每日最新资讯28at.com

展望未来,快手将围绕两大方向持续演进。一是构建出价基座大模型,整合多场景数据训练通用模型,发挥规模效应;二是发展出价推理大模型,引入大语言模型增强推理能力,提升可解释性与复杂决策水平。bc628资讯网——每日最新资讯28at.com

快手将继续推动自动出价技术向更高层次的智能化迈进,为数字营销行业注入创新动力。bc628资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-186590-0.html广告出价进入“自动驾驶”时代,快手提出生成式强化学习出价技术

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 茅台“双节”市场调查:动销稳中有进,真实消费夯实市场根基

下一篇: 快手“AI创想剧场”成果丰硕,AIGC影像创作营在中国传媒大学圆满举办

标签:
  • 热门焦点
  • 一加Ace2 Pro官宣:普及16G内存 引领24G

    一加官方今天继续为本月发布的新机一加Ace2 Pro带来预热,公布了内存方面的信息。“淘汰 8GB ,12GB 起步,16GB 普及,24GB 引领,还有呢?#一加Ace2Pro#,2023 年 8 月,敬请期待。”同时
  • Mate60手机壳曝光 致敬自己的经典设计

    8月3日消息,今天下午博主数码闲聊站带来了华为Mate60的第三方手机壳图,可以让我们在真机发布之前看看这款华为全新旗舰的大致轮廓。从曝光的图片看,Mate 60背后摄像头面积依然
  • CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 10天营收超1亿美元,《星铁》比《原神》差在哪?

    来源:伯虎财经作者:陈平安即便你没玩过《原神》,你一定听说过的它的大名。恨它的人把《原神》开服那天称作是中国游戏史上最黑暗的一天,有粉丝因为索尼在PS平台上线《原神》,怒而
  • 当家的盒马,加速谋生

    来源 | 价值星球Planet作者 | 归去来自己“当家”的盒马,开始加速谋生了。据盒马官微消息,盒马计划今年开放生鲜供应链,将其生鲜商品送往食堂。目前,盒马在上海已经与
  • 华为Mate 60系列用上可变灵动岛:正式版体验将会更出色

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
  • 三翼鸟智能家居亮相电博会,让用户体验更真实

    2021电博会在青岛国际会展中心开幕中,三翼鸟直接把“家”搬到了现场,成为了展会的一大看点。这也是三翼鸟继9月9日发布了行业首个一站式定制智慧家平台后的
  • “买真退假” 这种“羊毛”不能薅

    □ 法治日报 记者 王春   □ 本报通讯员 胡佳丽  2020年初,还在上大学的小东加入了一个大学生兼职QQ群。群主“七王”在群里介绍一些刷单赚
Top