ollama 0.11.9 引入了出色的 CPU/GPU 性能优化

追风者 • 2025年9月3日上午11:37 • 行业资讯

ollama 开源软件能够轻松跨不同操作系统、硬件和模型运行 AI 大语言模型 (LLM)，即将迎来显著的速度提升。

ollama 0.11.9-rc0 测试版不久前发布，性能显著提升。ollama 的下一个版本将通过重叠 GPU 和 CPU 计算来提升性能。

ollama 0.11.9 引入了出色的 CPU/GPU 性能优化

这项 ollama 优化来自 VMware 工程师 Daniel Hiltgen，旨在异步构建下一批次的计算图，以保持 GPU 的繁忙。Hiltgen 在上个月的拉取请求中解释道：

“这重构了 ollama 运行器的主运行循环，使其能够在 Go 例程中执行主要的 GPU 密集型任务（计算 + 浮点运算），以便我们能够并行准备下一批任务，从而减少 GPU 等待下一批任务的停滞时间。

在 Metal 上，我看到令牌速率提高了 2-3%。在单块 RTX 4090 上，我看到了约 7% 的加速。”

NVIDIA GeForce RTX 4090 的性能提升了约 7%，这是一个显著的变化，其他高端 GPU 型号也应该会从这一改进中获得不错的收益，有助于保持 GPU 持续工作。

ollama 0.11.9-rc0 版本还修复了无法识别的 AMD GPU 导致 ollama 出错的问题。此外，还修复了部分 Mac 和 Linux 系统 ollama 安装中未处理的错误导致的崩溃问题。

你可以通过 GitHub 下载并了解更多有关此 ollama 测试版本的详情。

版权声明：本文内容转自互联网，本文观点仅代表作者本人。本站仅提供信息存储空间服务，所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至1393616908@qq.com 举报，一经查实，本站将立刻删除。

赞 (0)

追风者认证作者

0

行业资讯

ollama v0.3 发布，支持 Llama 3.1 和 Mistral Large 2

ollama 是在系统上轻松运行大型语言模型 (LLM) 的开源工具，对于 ollama 的爱好者来说，olama v0.3 已经发布，并支持最新的激动人心的模型。连夜发布的 o…

AIGC
2024年7月26日
行业资讯

ollama 0.14 发布，可利用 Bash 使 AI/LLM 在您的系统上运行命令

ollama 0.14-rc2 版本今日发布，它引入了一项新功能：使用 ollama run –experimental 命令，即可在实验模式下运行代理循环，从而使 LLM 能够…

追风者
2026年1月12日
行业资讯

ollama 0.17 版本发布，改进了 OpenClaw 入门流程

开源项目 ollama 发布了新版本，该项目旨在帮助用户在 Windows、macOS 和 Linux 系统下轻松部署各种 LLM（生命周期管理）系统。此次 ollama v0.1…

追风者
2026年2月24日
行业资讯

ollama 0.6.2 发布，支持 AMD Strix Halo

2025年3月18日，ollama 开源软件的最新版本发布，它可以轻松运行 Llama 3、DeepSeek-R1、Gemma 3 和其他大型语言模型。ollama 软件可以轻松利…

AIGC
2025年3月19日
行业资讯

ollama 0.12.11 带来 Vulkan 加速功能

ollama 0.12.11 版本于上周五发布，作为部署 OpenAI GPT-OSS、DeepSeek-R1、Gemma 3 等大型语言模型的便捷方案，本次更新带来了全新功能。最…

AIGC
2025年11月17日
行业资讯

ollama 0.12.6-rc0 发布，推出实验性 Vulkan 支持及扩展 AMD 和 Intel GPU 覆盖范围

ollama 0.12.6-rc0 软件发布，带来了实验性的 Vulkan API 支持。 ollama 软件因能轻松运行大语言模型（如GPT-OSS、DeepSeek-R1、Ge…

追风者
2025年10月16日