目录

Mac-部署Ollama-OpenWebUI完全指南

Mac 部署Ollama + OpenWebUI完全指南

文章目录

      • [1. 安装 ](#1_Ollamahttpsgithubcomollamaollama_21)
      • [2. 部署 (可视化大模型对话界面)](#2_OpenWebUIhttpswwwopenwebuicom_146)

想拥有一个完全属于自己的AI助手,还不依赖互联网?本教程带你从零开始搭建本地AI环境!(Apple Silicon架构)

💻 环境说明

配置项MacWindows
操作系统macOS SonomaWindows 10/11
CPUM412核或以上
内存16GB32GB或以上
硬盘空间20GB20GB或以上

🛠️ Ollama安装配置

官网https://ollama.com/
模型https://ollama.com/library
Githubhttps://github.com/ollama/ollama
Dockerhttps://hub.docker.com/r/ollama/ollama/tags

1. 安装

# 使用Homebrew安装
brew install ollama

# 或直接下载安装包
curl https://ollama.ai/download/Ollama-darwin.zip -o Ollama.zip
unzip Ollama.zip

# 输入`ollama`或 `ollama -v`验证安装
ollama

https://i-blog.csdnimg.cn/direct/f619dbb9fe3f402b8c4b995b0fbd629a.png

2. 启动 Ollama

# 启动 Ollama 服务
ollama serve

https://i-blog.csdnimg.cn/direct/15a1652352224034a6935907dbef0f1d.png

# 或点击浏览器访问:http://localhost:11434

https://i-blog.csdnimg.cn/direct/bd79f95cd7ad4d2d9900a7fa85c29487.png

显示 Ollama is running 代表已经运行起来了!

 # 下载 Llama3 8B 模型
ollama run llama3:8b # 建议先尝试小模型

https://i-blog.csdnimg.cn/direct/8eb258a56179470881bb40867d387d52.png

💡 小贴士:你应该至少有 8 GB 的 RAM 来运行 7B 模型,16 GB 的 RAM 来运行 13B 模型,以及 32 GB 的 RAM 来运行 33B 模型。

3. 模型存储位置

Mac 下,Ollama 的默认存储位置:

  • 模型文件: ~/.ollama/models
  • 配置文件: ~/Library/Application Support/Ollama

Windows 下,Ollama 的默认存储位置:

  • 程序目录: C:\Users\<用户名>\AppData\Local\Programs\Ollama
  • 模型目录: C:\Users\<用户名>ollamamodels
  • 配置文件: C:\Users\<用户名>\AppData\Local\Ollama

💡 小贴士:建议通过环境变量 OLLAMA_MODELS 自定义模型存储路径,避免占用系统盘空间。

4. 配置 Ollama 环境变量

Ollama 提供了多种环境变量以供配置:

  • OLLAMA_DEBUG:是否开启调试模式,默认为 false。
  • OLLAMA_FLASH_ATTENTION:是否闪烁注意力,默认为 true。
  • OLLAMA_HOST:Ollama 服务器的主机地址,默认为空。
  • OLLAMA_KEEP_ALIVE:保持连接的时间,默认为 5m。
  • OLLAMA_LLM_LIBRARY:LLM 库,默认为空。
  • OLLAMA_MAX_LOADED_MODELS:最大加载模型数,默认为 1。
  • OLLAMA_MAX_QUEUE:最大队列数,默认为空。
  • OLLAMA_MAX_VRAM:最大虚拟内存,默认为空。
  • OLLAMA_MODELS:模型目录,默认为空。
  • OLLAMA_NOHISTORY:是否保存历史记录,默认为 false。
  • OLLAMA_NOPRUNE:是否启用剪枝,默认为 false。
  • OLLAMA_NUM_PARALLEL:并行数,默认为 1。
  • OLLAMA_ORIGINS:允许的来源,默认为空。
  • OLLAMA_RUNNERS_DIR:运行器目录,默认为空。
  • OLLAMA_SCHED_SPREAD:调度分布,默认为空。
  • OLLAMA_TMPDIR:临时文件目录,默认为空。
  • OLLAMA_DEBUG:是否开启调试模式,默认为 false。
  • OLLAMA_FLASH_ATTENTION:是否闪烁注意力,默认为 true。
  • OLLAMA_HOST:Ollama 服务器的主机地址,默认为空。
  • OLLAMA_KEEP_ALIVE:保持连接的时间,默认为 5m。
  • OLLAMA_LLM_LIBRARY:LLM 库,默认为空。
  • OLLAMA_MAX_LOADED_MODELS:最大加载模型数,默认为 1。
  • OLLAMA_MAX_QUEUE:最大队列数,默认为空。
  • OLLAMA_MAX_VRAM:最大虚拟内存,默认为空。
  • OLLAMA_MODELS:模型目录,默认为空。
  • OLLAMA_NOHISTORY:是否保存历史记录,默认为 false。
  • OLLAMA_NOPRUNE:是否启用剪枝,默认为 false。
  • OLLAMA_NUM_PARALLEL:并行数,默认为 1。
  • OLLAMA_ORIGINS:允许的来源,默认为空。
  • OLLAMA_RUNNERS_DIR:运行器目录,默认为空。
  • OLLAMA_SCHED_SPREAD:调度分布,默认为空。
  • OLLAMA_TMPDIR:临时文件目录,默认为空。

5. Ollama 常用命令

  1. 启动 Ollama 服务: ollama serve
  2. 从模型文件创建模型: ollama create
  3. 显示模型信息: ollama show
  4. 运行模型: ollama run 模型名称
  5. 从注册表中拉去模型: ollama pull 模型名称
  6. 将模型推送到注册表: ollama push
  7. 列出模型: ollama list
  8. 复制模型: ollama cp
  9. 删除模型: ollama rm 模型名称
  10. 获取有关 Ollama 任何命令的帮助信息: ollama help

6. Ollama 终端指令

  1. 查看支持的指令:使用命令 /?
  2. 退出对话模型:使用命令 /bye
  3. 显示模型信息:使用命令 /show
  4. 设置对话参数:使用命令 /set 参数名 参数值,例如设置温度(temperature)或 top_k 值
  5. 清理上下文:使用命令 /clear
  6. 动态切换模型:使用命令 /load 模型名称
  7. 存储模型:使用命令 /save 模型名称
  8. 查看快捷键:使用命令 /?shortcuts

🌐 OpenWebUI 部署

Githubhttps://github.com/open-webui/open-webui
文档https://docs.openwebui.com/

1. 安装 Docker

  1. 访问 下载 Mac 版本(Apple Silicon)

  2. 安装并启动 Docker Desktop

  3. 配置国内镜像源加速下载(我这里 科学上网 不需要)

    https://i-blog.csdnimg.cn/direct/46b5f0a06cdc42d68e021ba16f7b4f36.png

💡 小贴士:Windows 安装 Docker 需要开启 Hyper-V(Windows 专业版必需)

2. 部署 (可视化大模型对话界面)

# 拉取镜像 (直接 run 默认会拉取 latest 标签的镜像)
docker pull ghcr.io/open-webui/open-webui:main

#(官方文档)以上是从 GitHub Container Registry (GHCR) 上拉取镜像,而不是从 Docker Hub。
# 也可以 docker hub 拉取 open-webui 镜像
docker pull dyrnq/open-webui:main

https://i-blog.csdnimg.cn/direct/361e58474834446cb840fdd80b23d184.png

# 启动容器
docker run -d -p 3000:8080 \
--add-host=host.docker.internal:host-gateway \
-v open-webui:/app/backend/data \
--name open-webui \
--restart always \
ghcr.io/open-webui/open-webui:main

访问 http://localhost:3000 即可使用 Web 界面。

https://i-blog.csdnimg.cn/direct/c0c9cf51ff6f4c3eb67d85f730ebaea0.png 创建账号,这个是本地账号,随便添加账号信息即可

https://i-blog.csdnimg.cn/direct/9c2e50d44be84a0ba1c6dbe3a77dc5ac.png

  • 注册时邮箱可以随便填写,设置密码后注意保存!
  • ollama 后台一定要运行着模型,如:ollama run phi-4

🔒 离线部署方案

1. 准备工作

下载必要的 Docker 镜像

在有网络的环境中,需要下载以下镜像:

# 下载 Ollama 镜像
docker pull ollama/ollama:latest

# 下载 OpenWebUI 镜像
docker pull ghcr.io/open-webui/open-webui:main

# 保存镜像到文件
docker save ollama/ollama:latest -o ollama.tar
docker save ghcr.io/open-webui/open-webui:main -o openwebui.tar
下载所需的模型文件

在有网络的环境中下载模型文件:

# 使用 Ollama 下载模型
ollama pull llama3
# 模型文件位于 ~/.ollama/models 目录

2. 离线环境部署

加载 Docker 镜像
# 加载保存的镜像文件
docker load -i ollama.tar
docker load -i openwebui.tar
创建 Docker 网络
docker network create ollama-network
启动 Ollama 容器
docker run -d \
--name ollama \
--network ollama-network \
-v ~/.ollama:/root/.ollama \
-p 11434:11434 \
ollama/ollama
启动 OpenWebUI 容器
docker run -d \
--name open-webui \
--network ollama-network \
-p 3000:8080 \
-e OLLAMA_API_BASE_URL=http://ollama:11434/api \
ghcr.io/open-webui/open-webui:main

3. 验证部署

检查容器状态
docker ps
docker logs ollama
docker logs open-webui
访问 WebUI

在浏览器中访问 http://localhost:3000

4. 故障排除

  1. 如果容器无法启动,检查日志:
docker logs ollama
docker logs open-webui
  1. 检查网络连接:
# 确保容器间可以通信
docker network inspect ollama-network
  1. 检查模型文件:
# 进入 Ollama 容器检查模型文件
docker exec -it ollama ls /root/.ollama/models

5. 注意事项

  1. 确保模型文件已正确复制到 Ollama 容器的对应目录

  2. 检查磁盘空间是否充足,容器间的网络通信是关键,需要确保正确配置

  3. 确保端口 3000 和 11434 未被占用

  4. 容器的启动顺序很重要,必须先启动 Ollama 再启动 OpenWebUI

  5. 目前也有捆绑安装的方式,将 Open WebUI 和 Ollama 打包在一个 Docker 容器中,通过一条命令就能同时安装和启动两者。

    docker run -d -p 3000:8080 --gpus=all -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama

⚡ 性能优化建议

  1. 内存管理

    • 关闭不必要的后台应用
    • 使用 Activity Monitor 监控内存使用
  2. 模型选择

    • 建议从小模型开始测试
    • 推荐模型大小顺序:
      • qwen2:0.5b (最轻量)
      • llama2:7b (平衡型)
      • codellama:7b (代码专用)
  3. 温度控制

    • 保持 Mac Mini 通风良好
    • 可使用监控工具观察 CPU 温度

❓ 常见问题

  1. Q: M4 芯片能跑多大的模型?

    A: 16GB 内存的 M4 可以流畅运行 8B 参数的模型,更大的模型可能会影响性能。

  2. Q: Llama 中文支持不好怎么办?

    A: 可以使用 等经过中文优化的模型。

  3. Q: OpenWebUI 打不开怎么办?

    A: 检查 Docker 状态:

    docker ps # 查看容器状态
    docker logs open-webui # 查看日志

🎉 结语

通过本教程的配置,你已经拥有了一个完全本地化的 AI 助手!有任何问题欢迎在评论区讨论,让我们一起探索 AI 的无限可能!


如果觉得这篇文章对你有帮助,别忘了点赞转发哦~ 👍

你用 Mac Mini 跑过哪些 AI 模型?欢迎分享你的使用体验!💭