当前位置:首页 > 科技  > 网络

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

来源: 责编: 时间:2025-06-17 19:13:35 172观看
导读 编程王者Claude地位不稳了??大模型竞技场新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4。要知道Claude Opus 4可是公认的“全球强编码模型”。so,能在编程上战胜Claude Opus 4,DeepSee

编程王者Claude地位不稳了??nq028资讯网——每日最新资讯28at.com

大模型竞技场新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4。nq028资讯网——每日最新资讯28at.com

要知道Claude Opus 4可是公认的“全球强编码模型”。nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

so,能在编程上战胜Claude Opus 4,DeepSeek-R1-0528到底啥来头?nq028资讯网——每日最新资讯28at.com

看名字你可能以为是个小版本更新,但实际上——nq028资讯网——每日最新资讯28at.com

它在LiveCodeBench上几乎与OpenAI o3-high相当,乃至一众网友猜测其为传说中的R2。nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

这样一看,在编程这一项上,双方貌似都不太好惹~nq028资讯网——每日最新资讯28at.com

所以话不多说,咱们还是一手实测DeepSeek-R1-0528,康康究竟有多强。nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

实测一下nq028资讯网——每日最新资讯28at.com

目前DeepSeek-R1-0528已上线DeepSeek官方网站、App和小程序(打开深度思考)。nq028资讯网——每日最新资讯28at.com

这里咱们直接进入官网体验。nq028资讯网——每日最新资讯28at.com

测试1:制作一个太阳系的动画应用程序nq028资讯网——每日最新资讯28at.com

提示词如下:nq028资讯网——每日最新资讯28at.com

制作一个太阳系的动画应用程序,使用网络搜索。nq028资讯网——每日最新资讯28at.com

仅思考49秒后,DeepSeek-R1-0528就给出了一段python代码。nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

用VS Code运行后,结果如下:nq028资讯网——每日最新资讯28at.com

出现了能自主运行的动画,不过页面相对粗糙。nq028资讯网——每日最新资讯28at.com

不过呢,如果换成其他提示词,效果则明显不一样了。nq028资讯网——每日最新资讯28at.com

用Three.js模拟太阳系,鼠标悬停在星球上时显示星球名称。nq028资讯网——每日最新资讯28at.com

仅用时34秒,DeepSeek-R1-0528就理清楚了设计思路:nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

关键是这一次能直接一键运行了,无需再单独打开自己的编辑器。(运行功能感觉像开盲盒,不一定都会出现)nq028资讯网——每日最新资讯28at.com

而且同样有动画、能交互,效果直接进入Next Nevel~nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

测试2:前端网页制作nq028资讯网——每日最新资讯28at.com

接下来我们要求DeepSeek生成一个主题为AGI的网站,提示词如下:nq028资讯网——每日最新资讯28at.com

请设计一个以通用人工智能(AGI)为主题的网页,包含“知识共享”、“社区”和“未来创造”三个概念部分。每个部分应配有相应的图标和简洁描述,整体风格现代且科技感十足,突出AGI的创新和协作精神。使用HTML、CSS和JavaScript实现交互和视觉特效。nq028资讯网——每日最新资讯28at.com

思考23秒后,DeepSeek-R1-0528后续给出了一段HTML代码,依旧能一键运行。nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

测试3:创建一个俄罗斯方块小游戏nq028资讯网——每日最新资讯28at.com

后我们试试英文提示词:nq028资讯网——每日最新资讯28at.com

Create a full featured version of tetris with beautiful graphics and controls.nq028资讯网——每日最新资讯28at.com

创建一个具有精美图形和控制功能的完整版俄罗斯方块。nq028资讯网——每日最新资讯28at.com

可以看到,DeepSeek-R1-0528思考12秒后就给出了一段python代码。nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

运行结果be like:nq028资讯网——每日最新资讯28at.com

虽然确实是俄罗斯方块小游戏,但基本演示存在明显bug,而且缺少交互按钮。nq028资讯网——每日最新资讯28at.com

不死心的我们尝试让DeepSeek继续改进,结果第二次还是翻车了。nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

改进后的游戏依旧无法正常运行(总是穿墙而过),且未实现我们明确要求的交互功能。nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

小结一下,从以上简单实测来看,DeepSeek新版R1作为一款开源模型,在编程能力上确实大有进步,但仍有一定提升空间。nq028资讯网——每日最新资讯28at.com

不过有一说一,它对咱们国内普通用户明显更友好(相对Claude模型来说免费又易于获取)。nq028资讯网——每日最新资讯28at.com

One More Thingnq028资讯网——每日最新资讯28at.com

除了编程能力榜单更新,DeepSeek新版R1还当选了当前好的开源文本模型。nq028资讯网——每日最新资讯28at.com

MIT许可证下,总榜第六,开源当中第一。nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

而在细分领域,它在困难提示方面排名第4,在数学方面排名第5,属于开源模型中相当能打的玩家。nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

不过值得一提的是,Kimi新模型刚刚拿下代码开源SOTA——nq028资讯网——每日最新资讯28at.com

参数量仅72B的开源代码模型Kimi-Dev,在SWE-bench Verified上以60.4%的成绩取得开源SOTA。nq028资讯网——每日最新资讯28at.com

不仅编程水平比新的DeepSeek-R1还强,和闭源模型比较也表现优异。nq028资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一nq028资讯网——每日最新资讯28at.com

不知道其真实能力又如何呢(doge)~nq028资讯网——每日最新资讯28at.com

 nq028资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-160494-0.html网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 股民或可考虑!美的集团“不差钱”拟大手笔回购股票

下一篇: 吉卜力风手游爆火 可灵+Midjourney生成的!教程已出 支持复刻

标签:
  • 热门焦点
  • 5月安卓手机好评榜:魅族20 Pro夺冠

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年5月1日至5月31日,仅限国内市场。第一名:魅族20 Pro好评率:97.50%不得不感慨魅族老品牌还
  • iPhone卖不动了!苹果股价创年内最大日跌幅:市值一夜蒸发万亿元

    8月5日消息,今天凌晨美股三大指数高开低走集体收跌,道指跌0.41%;纳指跌0.36%;标普500指数跌0.52%。热门科技股也都变化极大,其中苹果报181.99美元,跌4.8%,创
  • 印度登月最关键一步!月船三号今晚进入环月轨道

    8月5日消息,据印度官方消息,月船三号将于北京时间今晚21时30分左右开始近月制动进入环月轨道。这是该探测器能够成功的最关键步骤之一,如果成功将开始围
  • 一文看懂为苹果Vision Pro开发应用程序

    译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实(MR)头戴设备。Vision Pro结合了虚拟现实(VR)和增强现实(AR)的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
  • 一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • 如何使用JavaScript创建一只图像放大镜?

    译者 | 布加迪审校 | 重楼如果您曾经浏览过购物网站,可能遇到过图像放大功能。它可以让您放大图像的特定区域,以便浏览。结合这个小小的重要功能可以大大改善您网站的用户体验
  • 梁柱接棒两年,腾讯音乐闯出新路子

    文丨田静 出品丨牛刀财经(niudaocaijing)7月5日,企鹅FM发布官方公告称由于业务调整,将于9月6日正式停止运营,这意味着腾讯音乐长音频业务走向消亡。腾讯在长音频领域还在摸索。为
  • 三星折叠屏手机去年销售近1000万台 今年目标定为1500万

    7月29日消息,三星率先发力可折叠手机市场,在全球市场已经取得了非常亮眼的成绩,接下来会进一步巩固和扩大这一优势。三星在推出Galaxy Z Flip5和Galax
  • Android 14发布:首批适配机型公布

    5月11日消息,谷歌在今天凌晨举行了I/O大会,本次发布会谷歌带来了自家的AI语言模型PaLM 2、谷歌Pixel Fold折叠屏、谷歌Pixel 7a手机,同时发布了Androi
Top