Ollama：取代 OpenAI 和 Claude API 的自托管大型語言模型培訓

Ollama 是一款開源工具，可在消費級和企業級硬體上本地運行大型語言模型。它將模型量化、GPU 分配和 API 服務抽象化為單一命令列介面，使組織能夠自托管 Llama、Mistral 和 Qwen 等 LLM，而無需將提示或數據發送給 OpenAI、Anthropic 或 Google。

這項由導師主導的現場培訓（線上或線下）面向希望使用 Ollama 用自托管的主權語言模型推理取代雲端 LLM API 的中級 AI 工程師和平台運營人員。

完成此培訓後，學員將能夠：

在支援 GPU 的 Linux、macOS 和 Windows 上安裝 Ollama。
從 Ollama 註冊表和 HuggingFace 拉取、量化並服務模型。
構建包含系統提示和參數調優的自定義 Modelfile。
通過與 OpenAI 兼容的 API 將本地 LLM 集成到應用程序中。
優化僅 CPU 和多 GPU 設置的推理性能。

課程形式

互動式講座和討論。
大量的練習和實踐。
在實時實驗室環境中進行動手實施。

課程定制選項

如需為本課程申請定制化培訓，請聯繫我們以安排。

感謝您提交詢問！我們的一位團隊成員將在短時間內與您聯繫。

感謝您提交預訂！我們的一位團隊成員將在短時間內與您聯繫。

課程簡介

AI 主權與 LLM 本地部署

雲端 LLM 的風險：數據保留、基於輸入訓練、外國管轄權。
Ollama 架構：模型服務器、註冊表及與 OpenAI 兼容的 API。
與 vLLM、llama.cpp 和 Text Generation Inference 的比較。
模型許可證：Llama、Mistral、Qwen 和 Gemma 的條款。

安裝與硬體設置

在支援 CUDA 和 ROCm 的 Linux 上安裝 Ollama。
僅 CPU 的回退方案及 AVX/AVX2 優化。
Docker 部署與持久化卷映射。
多 GPU 設置與 VRAM 分配策略。

模型管理

從 Ollama 註冊表拉取模型：ollama pull llama3。
從 HuggingFace 和 TheBloke 導入 GGUF 模型。
量化級別：Q4_K_M、Q5_K_M、Q8_0 的權衡。
模型切換與並發加載模型的限制。

自定義 Modelfile

編寫 Modelfile 語法：FROM、PARAMETER、SYSTEM、TEMPLATE。
溫度、top_p 和 repeat_penalty 調優。
針對角色特定行為的系統提示工程。
創建並發布自定義模型至本地註冊表。

API 集成

與 OpenAI 兼容的 /v1/chat/completions 端點。
流式響應和 JSON 模式。
與 LangChain、LlamaIndex 及自定義應用程序集成。
通過反向代理進行身份驗證和速率限制。

性能優化

上下文窗口大小調整與 KV 緩存管理。
批量推理與並行請求處理。
CPU 線程分配與 NUMA 感知。
監控 GPU 利用率與內存壓力。

安全與合規

模型服務端點的網絡隔離。
輸入過濾與輸出審核管道。
提示和完成的審計日誌記錄。
模型溯源與哈希驗證。

最低要求

中間級 Linux 和容器管理知識。
高級層面對機器學習和變換器模型的理解。
熟悉 REST API 和 JSON。

受眾

替換雲端 LLM API 的 AI 工程師和開發人員。
因數據敏感性而無法使用雲端模型的組織。
需要物理隔離語言模型的情報和國防團隊。

14 小時

需要幫助選擇合適的課程嗎？
macao@nobleprog.com 或 +852 81990613

Ollama：取代 OpenAI 和 Claude API 的自托管大型語言模型培訓

課程簡介

最低要求

課程分類

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Ollama：取代 OpenAI 和 Claude API 的自托管大型語言模型培訓

課程簡介

最低要求

相關課程

進階 Ollama 模型除錯與評估

使用 Ollama 構建私有 AI 工作流程

使用Ollama部署及最佳化大型語言模型

EXO：端到端本地 AI 集群部署

EXO for DevOps：建構私有 AI 基礎設施

EXO 安全性與治理：離線模型管理

在Ollama上微調和自訂AI模型

安全的本地協作式AI：受監管產業的私有Ollama開發

使用 Ollama 打造多模態應用程式

入門 Ollama：運行本地 AI 模型

Ollama 與數據隱私：安全部署模式

Ollama 在金融領域的應用

Ollama 在醫療保健領域的應用

Ollama用於負責任的AI與治理

監管機構組織的主權AI：控制數據、模型與推理環境

課程分類

Ollama

AI Sovereignty

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites