Ollama内网离线部署大模型

我在北国不背锅

19834人浏览 · 2024-03-06 11:45:33

我在北国不背锅 · 2024-03-06 11:45:33 发布

在这里插入图片描述

为了演示方便，我这里选用参数较小的Qwen1.5-0.5B-Chat模型。

下载GGUF模型

访问huggingface下载qwen1_5-0_5b-chat-q5_k_m.gguf模型。

https://huggingface.co/Qwen/Qwen1.5-0.5B-Chat-GGUF/tree/main

在这里插入图片描述
注意：

huggingface访问不到，可以选择国内的modelscope
选择q5_k_m模型，参考https://blog.csdn.net/weixin_44455388/article/details/136500170?spm=1001.2014.3001.5501

创建Ollama Modelfile

1、创建一个名为 Modelfile 的文件，并使用 FROM 指令，填写的模型的本地文件路径。

FROM ./qwen1_5-0_5b-chat-q5_k_m.gguf

Modelfile文件中还可以添加系统提示词以及各项参数：

FROM ./qwen1_5-0_5b-chat-q5_k_m.gguf

# set the temperature to 1 [higher is more creative, lower is more coherent]
PARAMETER temperature 1

# set the system message
SYSTEM """
你是AI助手小智，请根据用户的提问做出合适的回答。
"""

2、在Ollama中创建模型

ollama create qwen:0.5b -f Modelfile

在这里插入图片描述

3、运行模型

ollama run qwen:0.5b

在这里插入图片描述

经过测试，大模型回答总是答非所问，或者是没有任何回复，换了Qwen1.5-4B-Chat-GGUF同样是这样。

解决方法：

Modelfile中要按照一定的模板，参考下载的官方提供的14B模型的Modelfile：
在这里插入图片描述
设置自定义的0.5B的Modelfile：

FROM ./qwen1_5-0_5b-chat-q5_k_m.gguf

TEMPLATE """{{ if .System }}<|im_start|>system
{{ .System }}<|im_end|>{{ end }}<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"""

PARAMETER stop "<|im_start|>"
PARAMETER stop "<|im_end|>"

优化之后的效果：

(base) [root@localhost my_model]# ollama run qwen:0.5b
>>> 你好
你好！有什么问题我可以帮助你解答吗？

>>> 你是谁
我是来自阿里云的大规模语言模型，我叫通义千问。

>>> Send a message (/? for help)

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模