Windows DeepSeek本地部署

DeepSeek R1 Distill 本地部署相关资料

资料来源 https://henjihenji.feishu.cn/wiki/MN3Vwl2STigk2qk1r6lcGoY5nYg

注意事项

建议使用 NVIDIA 卡,体验会好不少,AMD 显卡未做测试,但应该也是能跑的

欢迎各位在本文档评论区反馈各自运行情况,这样可以帮到更多人

LM Studio

官网下载:https://lmstudio.ai/

夸克网盘:https://pan.quark.cn/s/f7f610d2ac7a

模型列表

请选择文件体积小于自己显存大小的模型,略大一些的虽然也能跑,但是速度会慢很多。因个人能力有限,以下模型推荐不一定是最好的

更多模型下载

链接1:https://www.modelscope.cn/organization/lmstudio-community

记得用搜索功能搜索 DeepSeek 相关模型

链接2:https://www.modelscope.cn/collections/DeepSeek-R1-Distill-GGUF-eec5fee2f2ee42

相比链接1会多一点不同量化精度的模型

点击模型名称可以直接下载

显存大小 推荐模型 备注
32GB DeepSeek-R1-Distill-Qwen-32B-Q6_K.gguf
24GB DeepSeek-R1-Distill-Qwen-32B-Q4_K_M.gguf
DeepSeek-R1-Distill-Qwen-32B-Q5_K_M.gguf
二选一即可,比较推荐第一个
Q5 质量上可能会好一点,但是因为太接近 24G 显存,所以上下文多了之后,速度可能会慢。
上面的 Q6 勉强也能跑,但速度会比较慢。
16GB DeepSeek-R1-Distill-Qwen-14B-Q6_K.gguf
12GB DeepSeek-R1-Distill-Qwen-14B-Q4_K_M.gguf
11GB DeepSeek-R1-Distill-Qwen-14B-Q4_K_M.gguf
8GB DeepSeek-R1-Distill-Qwen-7B-Q6_K.gguf
DeepSeek-R1-Distill-Llama-8B-Q6_K.gguf
二选一即可
6GB DeepSeek-R1-Distill-Qwen-7B-Q4_K_M.gguf
DeepSeek-R1-Distill-Llama-8B-Q4_K_M.gguf
二选一即可
4GB DeepSeek-R1-Distill-Qwen-7B-Q3_K_L.gguf
DeepSeek-R1-Distill-Qwen-1.5B-Q8_0.gguf
二选一即可,比较推荐第一个
第二个 4G 显存能跑,但可能会比较慢
3GB、2GB DeepSeek-R1-Distill-Qwen-1.5B-Q8_0.gguf

如何查看自己的显存

image

显存大小 对应N卡型号
2GB GTX 1050、GT 1030
3GB GTX 1060 3GB
4GB GTX 1050 Ti
6GB GTX 1060 6GB、RTX 2060 6GB、RTX 3050 (6GB)
8GB GTX 1080、GTX 1070 Ti、GTX 1070、RTX 2080 SUPER、RTX 2080、RTX 2070 SUPER、RTX 2070、RTX 2060 SUPER、RTX 3070 Ti、RTX 3070、RTX 3060 Ti、RTX 3060 (8GB)、RTX 3050 (8GB)、RTX 4080、RTX 4060 Ti 8GB、RTX 4060、RTX 5070
11GB GTX 1080 Ti、RTX 2080 Ti
12GB RTX 2060 12GB、RTX 3060 (12GB)、RTX 4070 Ti SUPER、RTX 4070、RTX 5070 Ti
16GB RTX 4060 Ti 16GB、RTX 5080
24GB RTX 3090 Ti、RTX 3090、RTX 4090
32GB RTX 5090

本地部署测试

GPU:AMD Radeon RX580 8G

CPU:AMD Ryzen 5600X

内存:16G

运行LM Studio

image

加载本地模型

注意模型这里直接选根目录,LM Studio会自动搜索

image

点击顶部加载模型,开始新的对话

image

0%