当前位置:首页 > 科技  > 软件

查电影评分上互联网?别逗了!

来源: 责编: 时间:2024-01-23 08:43:52 378观看
导读作者 | 汪昊审校 | 重楼自互联网诞生以来,互联网上的评分网站层出不穷。美国的 IMDB 和烂番茄等网站都有大量的电影评分和影评。许多人在观影之前都要上类似的网站搜索电影评分以决定自己是否要看某一部电影。可以说,在

作者 | 汪昊O2D28资讯网——每日最新资讯28at.com

审校 | 重楼O2D28资讯网——每日最新资讯28at.com

自互联网诞生以来,互联网上的评分网站层出不穷。美国的 IMDB 和烂番茄等网站都有大量的电影评分和影评。许多人在观影之前都要上类似的网站搜索电影评分以决定自己是否要看某一部电影。可以说,在过去 10 年的人类文明发展过程中,无数的人已经养成了这一习惯。今天,我们要给大家泼一盆冷水:以后还是别上电影评分网站搜电影了。电影评分网站的评分根本就不可靠。O2D28资讯网——每日最新资讯28at.com

O2D28资讯网——每日最新资讯28at.com

在说服大家之前,我们先来介绍一下什么是博尔达计数法。博尔达计数法是1770 年法国科学家提出的评选法国科学院院士的投票方法。虽然博尔达计数法的发明时间可能远远早于 1770 年,但是该方法还是以博尔达的名字命名了。博尔达计数法的投票方式如下:假设现在有 N 个候选人竞选某个职位,观众给他们投票,每个人给心中的第一名打 N 分,给第二名 N-1 分…… 最后统计所有分数的总和,得分最高的候选人获选。博尔达计数法被用在金球奖评分等活动中,时至今日仍然影响着我们。O2D28资讯网——每日最新资讯28at.com

或许我们对博尔达计数法没有那么熟悉,但我们一定见过博尔达计数法的变种——区间评分法。所谓区间评分法,举个例子,在 IMDB 上,我们看一部电影,最高分给 5 分,差一些的给 4 分,…… 这就是所谓的区间评分法。因为我们给的分数是一个区间内的整数,所以叫区间评分法。下面,我们将要告诉读者,所有基于区间评分法的评分系统都是无效评分系统。O2D28资讯网——每日最新资讯28at.com

在国际学术会议 ICHESS 2023 上,研究者发表了一篇题为 The Fallacy of Borda Count Method -- Why it is Useless with Group Intelligence and Shouldn't be Used with Big Data including Banking Customer Services 的论文,否定了大数据场景下区间评分法的合理性。因为区间评分法广泛应用于文化评分网站、电商商品和客服评价系统、银行柜员评价系统、移动通讯客服评价系统等,因此这篇论文意义深远,值得每一个人认真阅读。O2D28资讯网——每日最新资讯28at.com

这篇论文首先回顾了作者在过去 3 年发表的若干篇论文。这些论文介绍了若干零样本学习算法:ZeroMat、DotMat、RankMat、PoissonMat、PowerMat、LogitMat 等。这些论文有一个共同特点:在不借助迁移学习/元学习和预训练模型的前提下,可以不利用任何用户评分数据,极为准确的预测用户物品评分值,是人工智能历史上第一批真正意义的零样本学习算法。这些算法,可以在推荐系统领域完美的解决冷启动问题,并且效果丝毫不逊于有完整数据的非零样本学习算法。这些颠覆性的成果迫使我们重新思考整个推荐系统领域和在线评分网站评分体系的有效性。这些算法都有一个共同特点,就是充分利用了推荐系统输入数据的幂律特性,使用评分本身近似评分分布,来替代最大似然函数中的相关公式,从而达到不需要任何实际数据就能完成推荐的目的。O2D28资讯网——每日最新资讯28at.com

要想理解这些算法,就必须先理解矩阵分解算法。所谓矩阵分解算法,就是利用用户特征向量和物品特征向量的点乘来最大程度的近似用户物品评分。矩阵分解的损失函数如下:O2D28资讯网——每日最新资讯28at.com

O2D28资讯网——每日最新资讯28at.com

损失函数 L 可以通过随机梯度下降法进行求解。关于矩阵分解的最精确的数学解释是 2007 年的推荐系统里程碑论文 Probabilistic Matrix Factorization。这篇论文将矩阵分解重构成了最大似然函数求解问题。ZeroMat 将评分的高斯分布假设改成了真实的幂律分布,得到了如下的最大似然函数求解公式:O2D28资讯网——每日最新资讯28at.com

O2D28资讯网——每日最新资讯28at.com

这个公式可以利用随机梯度下降进行求解。求解过程如下(标准差设定为 1):O2D28资讯网——每日最新资讯28at.com

O2D28资讯网——每日最新资讯28at.com

这个算法在 MovieLens 和 LDOS-CoMoDa 数据集合上进行测试,都取得了和利用全部用户评分数据进行运算的矩阵分解算法比肩的效果。O2D28资讯网——每日最新资讯28at.com

DotMat 算法的损失函数公式如下:O2D28资讯网——每日最新资讯28at.com

O2D28资讯网——每日最新资讯28at.com

利用随机梯度下降公式对该损失函数进行求解,得到如下公式:O2D28资讯网——每日最新资讯28at.com

O2D28资讯网——每日最新资讯28at.com

为了省略文章篇幅,下面我们只讨论 PoissonMat 和 LogitMat 这两个算法。PoissonMat 算法的最大似然函数公式如下:O2D28资讯网——每日最新资讯28at.com

O2D28资讯网——每日最新资讯28at.com

利用随机梯度下降对最大似然函数进行求解,得到如下公式:O2D28资讯网——每日最新资讯28at.com

O2D28资讯网——每日最新资讯28at.com

O2D28资讯网——每日最新资讯28at.com

下面我们看一下 LogitMat 算法。这个算法的损失函数结合了逻辑回归和矩阵分解:O2D28资讯网——每日最新资讯28at.com

O2D28资讯网——每日最新资讯28at.com

利用随机梯度下降对损失函数进行求解,得到了如下公式:O2D28资讯网——每日最新资讯28at.com

O2D28资讯网——每日最新资讯28at.com

通过观察这些函数的求解公式,我们发现这些算法无一例外的都不需要任何用户评分数据。我们可以在不借助任何数据的情况下完成推荐算法的设计。下面我们从这些算法的原始论文中找出一些原始图片来分析一下算法的结果:O2D28资讯网——每日最新资讯28at.com

O2D28资讯网——每日最新资讯28at.com

图 1 和图 2 展示的是 ZeroMat、DotMat、PoissonMat 和 LogitMat 与经典的矩阵分解模型的对比结果。可以看到,许多不需要任何数据的算法在准确性和公平性指标上都击败了经典的矩阵分解模型,而该模型利用了所有的用户评分矩阵数据。O2D28资讯网——每日最新资讯28at.com

这一系列的结果让我们有了充足的理由推翻区间评分法:因为幂律效应的原因,我们可以使用评分本身代替评分的概率分布对最大似然函数进行建模,这样可以得到零样本学习算法,并且零样本学习算法可以精确预测用户评分喜好,在 [1, 5] 评分区间上评分误差可以不超过 0.8 。这一发现在很大程度上冲击了我们对于推荐系统领域的认知。因为用户评分数据,特别是电影评分数据中的幂律效应不可避免,所以零样本算法永远成立。既然一个人给电影打多少分可以不用任何数据进行预测,这样的评分系统还有何用?因此电影评分网站的评分系统都是无效的评分系统。而这一结论可以轻易的扩展到其他区间评分的系统中去:只要该系统的输入存在幂律效应,区间评分法就是无效的。O2D28资讯网——每日最新资讯28at.com

查电影评分上互联网?别逗了!你给电影打多少分,不用查你的历史数据就能猜的很准。而这仅仅是因为电影评分的幂律效应。这样的影评评分系统,你敢用吗?O2D28资讯网——每日最新资讯28at.com

作者简介

汪昊,前 Funplus 人工智能实验室负责人。曾在 ThoughtWorks、豆瓣、百度、新浪等公司担任技术和技术高管职务。在互联网公司和金融科技、游戏等公司任职 12 年,对于人工智能、计算机图形学和区块链等领域有着深刻的见解和丰富的经验。在国际学术会议和期刊发表论文 42 篇,获得IEEE SMI 2008 最佳论文奖、ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 最佳论文报告奖。O2D28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-66351-0.html查电影评分上互联网?别逗了!

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: JDK19推出新特性虚拟线程是什么?

下一篇: VS Code 内置神器,五个必备功能助你高效编程!

标签:
  • 热门焦点
  • MIX Fold3包装盒泄露 新机本月登场

    小米的全新折叠屏旗舰MIX Fold3将于本月发布,近日该机的真机包装盒在网上泄露。从图上来看,新的MIX Fold3包装盒在外观设计方面延续了之前的方案,变化不大,这也是目前小米旗舰
  • Golang 中的 io 包详解:组合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是对Reader和Writer接口的组合,
  • Flowable工作流引擎的科普与实践

    一.引言当我们在日常工作和业务中需要进行各种审批流程时,可能会面临一系列技术和业务上的挑战。手动处理这些审批流程可能会导致开发成本的增加以及业务复杂度的上升。在这
  • 之家push系统迭代之路

    前言在这个信息爆炸的互联网时代,能够及时准确获取信息是当今社会要解决的关键问题之一。随着之家用户体量和内容规模的不断增大,传统的靠"主动拉"获取信息的方式已不能满足用
  • 雅柏威士忌多款单品价格大跌,泥煤顶流也不香了?

    来源 | 烈酒商业观察编 | 肖海林今年以来,威士忌市场开始出现了降温迹象,越来越多不断暴涨的网红威士忌也开始悄然回归市场理性。近日,LVMH集团旗下苏格兰威士忌品牌雅柏(Ardbeg
  • 梁柱接棒两年,腾讯音乐闯出新路子

    文丨田静 出品丨牛刀财经(niudaocaijing)7月5日,企鹅FM发布官方公告称由于业务调整,将于9月6日正式停止运营,这意味着腾讯音乐长音频业务走向消亡。腾讯在长音频领域还在摸索。为
  • 小米MIX Fold 3下月亮相:今年唯一无短板的全能折叠屏

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都有新的进展,其中荣耀、三星都已陆续发布了最新的折叠屏旗舰,尤其号荣耀Magi
  • onebot M24巧系列一体机采用轻薄机身设计,现已在各平台开售

    onebot M24 巧系列一体机目前已在线上线下各平台同步开售。onebot M24 巧系列采用一体化轻薄机身设计,最薄处为 10.15mm,拥有宝石红、午夜蓝、石墨绿、雅致
  • 微软发布Windows 11新版 引入全新任务栏状态

    近日,微软发布了Windows 11新版,而Build 22563更新主要引入了几周前曝光的平板模式任务栏等,系统更流畅了。更新中,Windows 11加入了专门针对平板优化的任务栏
Top