DeepSeek本地部署,可视化、无延迟、畅快使用
你的DeepSeek又提示服务器繁忙了吗?
很多朋友已经发现DeepSeek的API服务能力远远没有跟上它的爆火程度,回答问题的响应速度明显比豆包、Kimi、智谱等国产大模型慢,时不时还会崩掉~~
无论是个人体验还是企业业务,都需要一个低延迟响应大模型服务。此外,如果有数据隐私、定制化(微调、RAG、多模态)等需求时,本地部署就更加必要了。
第一步,选择模型
以下是DeepSeek-R1不同版本蒸馏模型本地部署所需的硬件资源,我们稍后将根据自己的硬件资源下载对应的模型:
第二步,下载并运行模型
2.1 下载Ollama(网址:https://ollama.com/download)
Ollama用于本地运行AI模型,使用方式十分简单。
以Windows系统为例,安装OllamaSetup.exe后,双击软件图标即可运行Ollama服务。
2.2 使用Ollama下载运行模型,这里选用最小的1.5b模型(15亿参数)
ollama run deepseek-r1:1.5b
这是运行模型的命令,因为本地还没有模型,所以Ollama会先从仓库中下载模型再运行,相当于:
ollama pull deepseek-r1:1.5b
ollama run deepseek-r1:1.5b
此时模型服务已经起来了,默认的本地服务地址是http://localhost:11434,有了这个本地的API服务地址,我们可以将其配置到其它软件中,打造本地DeepSeek智能助手,比如代码助手,参阅DeepSeek代码助手。
也可以直接在命令行使用:
第三步,配置对话界面
如果要像市面上常见的大模型那样有一个聊天界面,可以使用Chatbox
3.1 安装Chatbox(网址:https://chatboxai.app/zh)
安装运行后你将看到如下界面:
此时还没有配置模型服务,点击红框提示中的“点击这里打开设置”,然后配置我们的Ollama服务:
接下来就可以愉快使用本地模型了:
转自:观智能公众号
DeepSeek本地部署,可视化、无延迟、畅快使用 https://www.gzza.com/25745.html
本网站资源来自互联网收集,仅供用于学习和交流,请勿用于商业用途。原创内容除特殊说明外,转载本站文章请注明出处。
如有侵权、不妥之处,联系删除。 Email:master@gzza.com
本网站资源来自互联网收集,仅供用于学习和交流,请勿用于商业用途。原创内容除特殊说明外,转载本站文章请注明出处。
如有侵权、不妥之处,联系删除。 Email:master@gzza.com
THE END