当前位置:首页 > 科技  > 数码

AMD显卡可以本地玩DeepSeek了!附简单部署教程

来源: 责编: 时间:2025-02-10 08:20:15 182观看
导读 快科技2月9日消息,DeepSeek火得一塌糊涂,国内外的相关企业都在积极适配支持,而对于AI大模型来说,使用GPU运行无疑是高效的,比如AMD,无论是Instinct加速卡还是Radeon游戏卡,都已经适配到位。你只需要任意一块AMD RX

快科技2月9日消息,DeepSeek火得一塌糊涂,国内外的相关企业都在积极适配支持,而对于AI大模型来说,使用GPU运行无疑是高效的,比如AMD,无论是Instinct加速卡还是Radeon游戏卡,都已经适配到位。vCJ28资讯网——每日最新资讯28at.com

你只需要任意一块AMD RX 7000系列显卡,就可以在本地体验DeepSeek。vCJ28资讯网——每日最新资讯28at.com

AMD显卡可以本地玩DeepSeek了!附简单部署教程vCJ28资讯网——每日最新资讯28at.com

AMD Radeon游戏卡本地部署DeepSeek非常简单,只需打开AMD官网(中英文均可),搜索“15.1.1”,进入第一个结果,下载AMD Adrenalin 25.1.1测试版驱动,安装并重启。vCJ28资讯网——每日最新资讯28at.com

直接下载地址:vCJ28资讯网——每日最新资讯28at.com

https://www.amd.com/zh-cn/resources/support-articles/release-notes/RN-RAD-WIN-25-1-1.htmlvCJ28资讯网——每日最新资讯28at.com

AMD显卡可以本地玩DeepSeek了!附简单部署教程vCJ28资讯网——每日最新资讯28at.com

然后打开LM Studio官网网站的锐龙专栏(https://lmstudio.ai/ryzenai),并下载LM Studio for Ryzen AI安装包,安装并运行。vCJ28资讯网——每日最新资讯28at.com

AMD显卡可以本地玩DeepSeek了!附简单部署教程vCJ28资讯网——每日最新资讯28at.com

启动之后,点击右下角设置(可选中文语言),找到并开启“Use LM Studio's Hugging Face”这个选项。vCJ28资讯网——每日最新资讯28at.com

AMD显卡可以本地玩DeepSeek了!附简单部署教程vCJ28资讯网——每日最新资讯28at.com

回到主界面,在左侧菜单栏点击搜索图标,输入“DeepSeek R1”,就可以看到已经训练好的各种DeepSeek模型。vCJ28资讯网——每日最新资讯28at.com

AMD显卡可以本地玩DeepSeek了!附简单部署教程vCJ28资讯网——每日最新资讯28at.com

至于如何选择,可以参考如下的AMD官方推荐列表,比如旗舰级的RX 7900 XTX可以支持到32B参数,主流的RX 7600则仅支持8B模型。vCJ28资讯网——每日最新资讯28at.com

顺带一提,新的中国特供版显卡RX 7650 GRE也同样支持本地部署DeepSeek,只待正式发布。vCJ28资讯网——每日最新资讯28at.com

AMD显卡可以本地玩DeepSeek了!附简单部署教程vCJ28资讯网——每日最新资讯28at.com

然后下载合适的模型,在主界面上方选择已下载的模型,然后调高“GPU Offload”的数值,不同选项的具体含义可自行搜索或者直接询问DeepSeek。vCJ28资讯网——每日最新资讯28at.com

AMD显卡可以本地玩DeepSeek了!附简单部署教程vCJ28资讯网——每日最新资讯28at.com

AMD显卡可以本地玩DeepSeek了!附简单部署教程vCJ28资讯网——每日最新资讯28at.com

模型加载完毕后,就可以尽情地在本地体验DeepSeek了。vCJ28资讯网——每日最新资讯28at.com

AMD显卡可以本地玩DeepSeek了!附简单部署教程vCJ28资讯网——每日最新资讯28at.com

与此同时,AMD Instinct GPU加速卡也已经部署集成DeepSeek V3模型,并优化了SGLang性能,支持完整的671B参数,开发者可以借助AMD ROCm平台快速、高效地开发AI应用。vCJ28资讯网——每日最新资讯28at.com

1、启动Docker容器vCJ28资讯网——每日最新资讯28at.com

docker run -it --ipc=host --cap-add=SYS_PTRACE --network=host /vCJ28资讯网——每日最新资讯28at.com

 --device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined /vCJ28资讯网——每日最新资讯28at.com

 --group-add video --privileged -w /workspace lmsysorg/sglang:v0.4.2.post3-rocm630vCJ28资讯网——每日最新资讯28at.com

2、开始使用vCJ28资讯网——每日最新资讯28at.com

(1)、使用CLI登陆进入Hugging Face。vCJ28资讯网——每日最新资讯28at.com

huggingface-cli login vCJ28资讯网——每日最新资讯28at.com

(2)、启动SGLang Server,在本地部署DeepSeekV3 FP8模型。vCJ28资讯网——每日最新资讯28at.com

python3 -m sglang.launch_server --model-path deepseek-ai/DeepSeek-V3 --port 30000 --tp 8 --trust-remote-codevCJ28资讯网——每日最新资讯28at.com

(3)、服务器启动后,打开新的终端,发送请求。vCJ28资讯网——每日最新资讯28at.com

curl http://localhost:30000/generate /vCJ28资讯网——每日最新资讯28at.com

 -H "Content-Type: application/json" /vCJ28资讯网——每日最新资讯28at.com

 -d '{vCJ28资讯网——每日最新资讯28at.com

  "text": "Once upon a time,",vCJ28资讯网——每日最新资讯28at.com

  "sampling_params": {vCJ28资讯网——每日最新资讯28at.com

  "max_new_tokens": 16,vCJ28资讯网——每日最新资讯28at.com

  "temperature": 0vCJ28资讯网——每日最新资讯28at.com

 }vCJ28资讯网——每日最新资讯28at.com

}'vCJ28资讯网——每日最新资讯28at.com

3、基准测试vCJ28资讯网——每日最新资讯28at.com

export HSA_NO_SCRATCH_RECLAIM=1vCJ28资讯网——每日最新资讯28at.com

python3 -m sglang.bench_one_batch --batch-size 32 --input 128 --output 32 --model deepseek-ai/DeepSeek-V3 --tp 8 --trust-remote-codevCJ28资讯网——每日最新资讯28at.com

python3 -m sglang.launch_server --model deepseek-ai/DeepSeek-V3 --tp 8 --trust-remote-codevCJ28资讯网——每日最新资讯28at.com

python3 benchmark/gsm8k/bench_sglang.py --num-questions 2000 --parallel 2000 --num-shots 8vCJ28资讯网——每日最新资讯28at.com

Accuracy: 0.952vCJ28资讯网——每日最新资讯28at.com

Invalid: 0.000vCJ28资讯网——每日最新资讯28at.com

另外,如果需要BF16精度,可以自行转换:vCJ28资讯网——每日最新资讯28at.com

cd inferencevCJ28资讯网——每日最新资讯28at.com

python fp8_cast_bf16.py --input-fp8-hf-path /path/to/fp8_weights --output-bf16-hf-path /path/to/bf16_weightsvCJ28资讯网——每日最新资讯28at.com

AMD显卡可以本地玩DeepSeek了!附简单部署教程vCJ28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-129339-0.htmlAMD显卡可以本地玩DeepSeek了!附简单部署教程

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: RTX 5090/5080黑屏变砖!NVIDIA终于启动调查

下一篇: GPU竞争失衡 AMD股价重挫 分析师:市场只认NVIDIA!

标签:
  • 热门焦点
  • 鸿蒙OS 4.0公测机型公布:甚至连nova6都支持

    华为全新的HarmonyOS 4.0操作系统将于今天下午正式登场,官方在发布会之前也已经正式给出了可升级的机型产品,这意味着这些机型会率先支持升级享用。这次的HarmonyOS 4.0支持
  • 帅气纯真少年!日本最帅初中生选美冠军出炉

    日本第一帅哥初一生选美大赛冠军现已正式出炉,冠军是来自千叶县的宗田悠良。日本一直热衷于各种选美大赛,从“最美JK”起到“最美女星&r
  • 三言两语说透设计模式的艺术-简单工厂模式

    一、写在前面工厂模式是最常见的一种创建型设计模式,通常说的工厂模式指的是工厂方法模式,是使用频率最高的工厂模式。简单工厂模式又称为静态工厂方法模式,不属于GoF 23种设计
  • 如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • 只需五步,使用start.spring.io快速入门Spring编程

    步骤1打开https://start.spring.io/,按照屏幕截图中的内容创建项目,添加 Spring Web 依赖项,并单击“生成”按钮下载 .zip 文件,为下一步做准备。请在进入步骤2之前进行解压。图
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 猿辅导与新东方的两种“归途”

    作者|卓心月 出品|零态LT(ID:LingTai_LT)如何成为一家伟大企业?答案一定是对“势”的把握,这其中最关键的当属对企业战略的制定,且能够站在未来看现在,即使这其中的
  • 首发天玑9200+ iQOO Neo8系列发布首销售价2299元起

    2023年5月23日晚,iQOO Neo8系列正式发布。其中,Neo系列首款Pro之作——iQOO Neo8 Pro强悍登场,限时售价3099元起;价位段最强性能手机iQOO Neo8同期上市
  • “买真退假” 这种“羊毛”不能薅

    □ 法治日报 记者 王春   □ 本报通讯员 胡佳丽  2020年初,还在上大学的小东加入了一个大学生兼职QQ群。群主“七王”在群里介绍一些刷单赚
Top