課程簡介

LLM架構與攻擊面概述

  • LLM如何構建、部署並通過API訪問
  • LLM應用堆棧中的關鍵組件(如提示、代理、內存、API)
  • 實際使用中安全問題的產生位置和方式

提示注入與越獄攻擊

  • 什麼是提示注入及其危險性
  • 直接和間接提示注入場景
  • 繞過安全過濾器的越獄技術
  • 檢測與緩解策略

數據泄漏與隱私風險

  • 通過響應意外暴露數據
  • PII泄漏與模型內存濫用
  • 設計注重隱私的提示與檢索增強生成(RAG)

LLM輸出過濾與防護

  • 使用Guardrails AI進行內容過濾與驗證
  • 定義輸出模式與約束
  • 監控與記錄不安全輸出

人機協作與工作流方法

  • 何時何地引入人工監督
  • 審批隊列、評分閾值、後備處理
  • 信任校準與可解釋性的作用

安全LLM應用設計模式

  • API調用與代理的最小權限與沙箱化
  • 速率限制、節流與濫用檢測
  • 使用LangChain進行穩健的鏈式操作與提示隔離

合規性、日誌記錄與治理

  • 確保LLM輸出的可審計性
  • 保持可追溯性與提示/版本控制
  • 與內部安全政策及監管需求保持一致

總結與下一步

最低要求

  • 瞭解大語言模型和基於提示的界面
  • 使用Python構建LLM應用的經驗
  • 熟悉API集成和基於雲的部署

受衆

  • AI開發者
  • 應用和解決方案架構師
  • 使用LLM工具的技術產品經理
 14 時間:

課程分類