Ollama

Ollama 是一个轻量级可扩展框架，专为简化本地机器上大型语言模型（LLM）的部署与管理而设计。它提供简洁的 API 用于创建、运行和管理模型，并内置预训练模型库，可轻松集成到各类应用中。通过 Ollama，用户无需复杂配置或依赖云端服务，就能快速使用 Llama 3.2、Gemma 3 等众多模型。

Ollama 的核心特性包括：

简易安装：单行命令即可安装，立即运行模型
Docker 支持：通过官方 Ollama Docker 镜像实现容器化部署
模型定制：通过提示词和参数调整，定制符合特定需求的响应
多模态支持：部分模型（如 Llama 3.2 Vision）支持基于图像的交互
REST API：提供程序化访问接口，便于与其他工具服务集成
本地化运行：完全在本地设备运行模型，兼顾隐私保护与低延迟

Ollama 支持的模型涵盖从 Gemma 3（10亿参数）等轻量款到 DeepSeek-R1（6710亿参数）等大型版本，还能通过 Modelfile 导入 GGUF 格式模型，具有高度灵活性。无论您是希望探索 LLM 的开发者，还是需要本地化 AI 能力的企业，Ollama 都能提供稳定易用的解决方案。

Ollama

在本地轻松上手大型语言模型（large language models）

Screenshot-to-Code

facefusion