当前位置：首页 > 元宇宙 > AI

谷歌 AI 推出 CardBench 评估框架：含 20 个真实数据库，更全面评估基数估计模型

来源：责编：时间：2024-09-05 16:20:27 231观看

导读 9 月 3 日消息，谷歌 AI 研究人员最新推出了 CardBench 基准，主要为学习型基数估计（cardinality estimation）满足系统评估框架需求。CardBench 基准是个综合评估框架，包含 20 个不同真实数据库中的数千次查询，大大超

9 月 3 日消息，谷歌 AI 研究人员最新推出了 CardBench 基准，主要为学习型基数估计（cardinality estimation）满足系统评估框架需求。

CardBench 基准是个综合评估框架，包含 20 个不同真实数据库中的数千次查询，大大超过了以往的任何基准。

项目背景

基数估计（cardinality estimation，简称 CE）是优化关系数据库查询性能的关键，涉及预测数据库查询将返回的中间结果数量，直接影响查询优化器对执行计划的选择。

对于选择高效的连接顺序、决定是否使用索引以及选择最佳连接方法来说，准确的卡入度估计至关重要。

这些决策会对查询执行时间和数据库整体性能产生重大影响。不准确的估计会导致糟糕的执行计划，从而大大降低性能，有时甚至会降低几个数量级。

现代数据库系统中广泛使用的基数估计技术，依赖于启发式（Heuristic）方法和简化模型，例如假设数据统一和列独立。

这些方法虽然计算效率高，但往往需要准确预测基数，在涉及多个表和过滤器的复杂查询中表现尤为明显。

最新的数据驱动方法试图在不执行查询的情况下，对表内和表间的数据分布进行建模，从而减少了一些开销，但在数据发生变化时仍需要重新训练。

尽管取得了这些进步，但由于缺乏全面的基准，因此很难对不同的模型进行比较，也很难评估它们在不同数据集上的通用性。

CardBench

CardBench 能在各种条件下对学习到的基数模型进行更全面的评估。该基准支持三种关键设置：

基于实例的模型，即在单个数据集上进行训练；

零点模型，即在多个数据集上进行预训练，然后在一个未见数据集上进行测试；

微调模型，即进行预训练，然后使用目标数据集的少量数据进行微调。

该基准测试提供两组训练数据：一组用于具有多个筛选条件谓词的单个表查询，另一组用于涉及两个表的二进制联接查询。

该基准测试包括 9125 个单表查询和 8454 个二进制连接查询，适用于其中一个较小的数据集，从而确保为模型评估提供强大且具有挑战性的环境。

例如，微调图神经网络（GNN）模型在二进制连接查询中的 q-error 中位数为 1.32，第 95 百分位数为 120，明显优于零点模型。结果表明，即使是 500 次查询，对预训练模型进行微调也能大幅提高其性能。这使它们在训练数据有限的实际应用中变得可行。

总之，CardBench 代表了在学习的基数估计方面的重大进步。研究人员可以通过提供全面、多样的基准，系统地评估和比较不同的 CE 模型，从而促进这一关键领域的进一步创新。该基准能够支持需要较少数据和训练时间的微调模型，为训练新模型成本过高的实际应用提供了切实可行的解决方案。

附上参考地址

CardBench: A Benchmark for Learned Cardinality Estimation in Relational Databases

Google AI Introduces CardBench: A Comprehensive Benchmark Featuring Over 20 Real-World Databases and Thousands of Queries to Revolutionize Learned Cardinality Estimation

本文链接：http://www.28at.com/showinfo-45-6704-0.html谷歌 AI 推出 CardBench 评估框架：含 20 个真实数据库，更全面评估基数估计模型

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

下一篇： Meta 公布 Llama AI 模型家族下载量数据：全球超 3.5 亿、3.1-405B 模型最受欢迎

标签：

热门焦点

元宇宙的文旅赛道，还能如何发力？

来源：X增强现实苹果推出Vision Pro，为XR行业注入一剂强心针。而在苹果开发者大会上迪士尼CEO鲍勃·艾格在宣布迪士尼与苹果达成合作，其Disney+流媒体服务将于Vision Pro
上、中、下游加深融合，搭建元宇宙产业全景

元宇宙产业链涉及多种技术和多个领域。在上游，聚集着大量的技术厂商，提供元宇宙相关的硬件和软件支持；在中游，内容运营与分发领域也吸引着越来越多的企业以VR内容
如何对一款 NFT 项目进行价值评估？

原文作者 | Othmane Senhaji Rhazi，Web 3 企业家.编译整理 | 黑米@白泽研究院我之所以成为一位大力倡导 Web3 和 NFT 领域的企业家，因为我相信我们正在见证社会
元宇宙社交啫喱、希壤爆款迭出，腾讯慌了吗？

文 | 陈桥辉没想到腾讯超级QQ秀的20周年归来首秀，被一款名不见经传的产品抢了风头。1月15日，一款名为“啫喱”的社交App迅速在各个互联网的社交圈内火爆起来，引起
2022年中国元宇宙产业系列研究报告-基础设施篇（5）

传感器是由敏感元件和转换元件构成，能够感受规定的检测量(物理量、化学量、生物量等)，并按照一定规律将检测量转化成可用的输出信号的器件和装置，进而满足信息的
又一家数字营销公司入局元宇宙，国内首个艺术元宇宙社区“Meta彼岸”上线

作者：董宇佳2月28日，智度股份在北京举办产品发布会，宣布其与国光电器联手打造的国内首个艺术元宇宙社区——“Meta彼岸”在VR端和移动端正式公测。从科技巨头布局
音乐家如何利用NFTs来提高歌迷参与度

"音乐是一种语言，不以特定的文字说话。它用情感说话，如果它在骨子里，它就在骨子里。" - Keith Richards音乐激励着我们，使我们流泪，使我们充满狂喜，并抚慰我们的灵魂
NFT高玩必备：NFT分析工具大盘点

NFT市场的火热让越来越多的投资者投身其中，但当前的 NFT 生态系统存在几个问题却困扰了大多数人，如难以准确评估 NFT 项目的资产价格、缺乏 NFT 市场动态信息、

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

谷歌 AI 推出 CardBench 评估框架：含 20 个真实数据库，更全面评估基数估计模型

元宇宙的文旅赛道，还能如何发力？

10亿基金，李彦宏呼唤下一个AI独角兽

上、中、下游加深融合，搭建元宇宙产业全景

如何对一款 NFT 项目进行价值评估？

元宇宙社交啫喱、希壤爆款迭出，腾讯慌了吗？

2022年中国元宇宙产业系列研究报告-基础设施篇（5）

又一家数字营销公司入局元宇宙，国内首个艺术元宇宙社区“Meta彼岸”上线

音乐家如何利用NFTs来提高歌迷参与度

NFT高玩必备：NFT分析工具大盘点

最新推荐

汽车元宇宙，是概念还是未来？

“元宇宙”里过大年，《迷你世界》在做一场怎样的实验？

米哈游推出元宇宙品牌；VR/AR老牌企业当红齐天完成B轮+融资

城市数字孪生标准化白皮书（2022版）

从NFT顶级公链到Web3.0基础设施：带你了解不一样的Flow

在互联网考古后，我被豆瓣上这座元宇宙古城征服了

猜你喜欢

热门推荐

相关资讯