当前位置：首页 > 科技 > 通信

禁令解除72小时：141GB H20 跑满血实测，DeepSeek 性能超预期

来源：责编：时间：2025-07-20 18:20:34 265观看

导读　阿里云优惠券先领券再下单2025 年 7 月 15 日，英伟达 CEO 黄仁勋宣布了一个震动 AI 圈的消息：美国政府即日起解除 H20 芯片对华销售禁令，而就在禁令解除后，云工场科技发布详细测试数据--- 8 卡 141GB 显存的 H20 服务

　阿里云优惠券先领券再下单

2025 年 7 月 15 日，英伟达 CEO 黄仁勋宣布了一个震动 AI 圈的消息：美国政府即日起解除 H20 芯片对华销售禁令，而就在禁令解除后，云工场科技发布详细测试数据--- 8 卡 141GB 显存的 H20 服务器，能流畅运行 671B 参数的满血版非量化 DeepSeek-R1 模型，推理吞吐量突破预期。

硬核实测：141GB H20 跑满血版非量化 DeepSeek 性能全面解析

测试环境配置

一. 测试数据

二. 关键性能测试结果

测试显示：

1.首 token 响应快：在测试的多个并发量下，首个 Token 的响应时间 (TTFT) 都保持在3秒以内（实测 0.1s - 2.8s），用户体验非常流畅，感觉不到任何延迟。

2.高并发吞吐大： H20 显卡展现出优秀的并发处理能力。在模拟 100 个用户同时提问（并发请求=100）的中高负载场景下：

·处理短问题（输入/输出各 256 tokens），系统总吞吐量高达约 1124 tokens/s。

·处理典型问题（输入/输出各 1K tokens），总吞吐量稳定在约 1100 tokens/s。

·处理复杂问题/长对话（输入/输出各 2K tokens），总吞吐量仍能保持约 1020 tokens/s。

分场景性能趋势：

1.低并发场景 (<10 用户)：

·响应极快： TTFT 始终低于 0.9 秒，用户几乎感觉不到等待。

·吞吐未饱和：系统能力远未被充分利用，吞吐量相对较低（32-208 tokens/s），性能表现轻松自如。

2.中高并发场景 (50-100用户)：

·响应依然迅速： TTFT 保持在 1.9 秒 (1K上下文) 到 2.8 秒 (2K上下文)，交互体验依然流畅。

·吞吐大幅跃升：系统资源得到高效利用，总吞吐量急剧上升至 634 - 1124 tokens/s。

·长上下文优势显现：在相同并发下，处理更长（1K/2K）的上下文通常能获得比短上下文（256）更高的吞吐量（尤其在并发50时最明显），充分体现了 vLLM 对长文本的优化效果。

3.极限场景 (100用户 + 长上下文 2K)：

·响应可控： TTFT 为 2.8 秒，交互体验依然流畅。

·吞吐维持高位：即使在此压力下，系统总吞吐量仍达 1020 tokens/s。

三.测试总结

云工场科技构建了全面的异构计算资源池，涵盖 NVIDIA 全系高性能 GPU（包括 141GB 显存 H20、L20、RTX 4090 等最新型号）、AMD w7900 以及国产算力三巨头（华为昇腾 910B 系列、百度昆仑芯 P800、燧原 S60）等等，可本地部署到就近机房，提供 DeepSeek、文心一言、华为盘古、LLaMA 等开源大模型本地部署。

通过严格的横向性能基准测试，云工场科技验证了不同架构 GPU 在 LLM 推理、计算机视觉等场景的能效比差异，并为客户提供"算力租赁 + 算力智能调度 + 平台化交付"的完整 AI 服务体系，目前已在教育/工业/通信/交通等多领域成功落地，支撑其大模型部署、推理及场景化落地的全流程需求。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

本文链接：http://www.28at.com/showinfo-20-171179-0.html禁令解除72小时：141GB H20 跑满血实测，DeepSeek 性能超预期

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：为眼健康加分的好灯：主流护眼灯十大品牌推荐

下一篇：淘宝返利平台哪个佣金比较高？京东抖音返利软件哪个最好用？

标签：

热门焦点

6月iOS设备性能榜：M2稳居榜首 A系列只能等一手3nm来救

没有新品发布，自然iOS设备性能榜的上榜设备就没有什么更替，仅仅只有跑分变化而产生的排名变动，毕竟苹果新品的发布节奏就是这样的，一年下来也就几个移动端新品，不会像安卓厂商，一
六大权益！华为8月服务日开启：手机免费贴膜、维修免人工费

8月5日消息，一年一度的华为开发者大会2023（Together）日前在松山湖拉开帷幕，与此同时，华为8月服务日也式开启，到店可享六大专属权益。华为用户可在华为商城Ap
一文掌握 Golang 模糊测试（Fuzz Testing）

模糊测试（Fuzz Testing）模糊测试（Fuzz Testing）是通过向目标系统提供非预期的输入并监视异常结果来发现软件漏洞的方法。可以用来发现应用程序、操作系统和网络协议等中的漏洞或
一文搞定Java NIO，以及各种奇葩流

大家好，我是哪吒。很多朋友问我，如何才能学好IO流，对各种流的概念，云里雾里的，不求甚解。用到的时候，现百度，功能虽然实现了，但是为什么用这个？不知道。更别说效率问题了~下次再遇到，
使用AIGC工具提升安全工作效率

在日常工作中，安全人员可能会涉及各种各样的安全任务，包括但不限于：开发某些安全工具的插件，满足自己特定的安全需求；自定义github搜索工具，快速查找所需的安全资料、漏洞poc、exp
8月见！小米MIX Fold 3获得3C认证：支持67W快充

这段时间以来，包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都得到了不少爆料，而小米新一代折叠屏旗舰——小米MIX Fold 3此前也屡屡被传
2299元起！iQOO Pad开启预售：性能最强天玑平板

5月23日，iQOO如期举行了新品发布会，除了首发安卓最强旗舰处理器的iQOO Neo8系列新机外，还在发布会上推出了旗下首款平板电脑——iQOO Pad，其搭载了天玑
首发天玑9200+ iQOO Neo8系列发布首销售价2299元起

2023年5月23日晚，iQOO Neo8系列正式发布。其中，Neo系列首款Pro之作——iQOO Neo8 Pro强悍登场，限时售价3099元起；价位段最强性能手机iQOO Neo8同期上市
引领旗舰级影像能力向中端机普及 OPPO K11 系列发布 1799 元起

7月25日，OPPO正式发布K系列新品—— OPPO K11 。此次 K11 在中端手机市场长期被忽视的影像板块发力，突破性地搭载索尼 IMX890 旗舰大底主摄，支持 OIS

禁令解除72小时：141GB H20 跑满血实测，DeepSeek 性能超预期

6月iOS设备性能榜：M2稳居榜首 A系列只能等一手3nm来救

六大权益！华为8月服务日开启：手机免费贴膜、维修免人工费

一文掌握 Golang 模糊测试（Fuzz Testing）

一文搞定Java NIO，以及各种奇葩流

使用AIGC工具提升安全工作效率

8月见！小米MIX Fold 3获得3C认证：支持67W快充

2299元起！iQOO Pad开启预售：性能最强天玑平板

首发天玑9200+ iQOO Neo8系列发布首销售价2299元起

引领旗舰级影像能力向中端机普及 OPPO K11 系列发布 1799 元起

最新推荐

猜你喜欢

热门推荐

相关资讯