Large Language Models (LLMs) and Reinforcement Learning (RL)培訓
Large Language Models (LLMs) 是高級類型的神經網路,旨在根據接收到的輸入來理解和生成類似人類的文本。Reinforcement Learning (RL) 是一種機器學習,其中代理通過在環境中執行操作來學習做出決策,以最大化累積獎勵。
這種以講師為主導的現場培訓(在線或遠端)面向希望全面瞭解 Large Language Models (LLMs) 和 Reinforcement Learning (RL) 的中級數據科學家。
在培訓結束時,參與者將能夠:
- 瞭解變壓器模型的元件和功能。
- 針對特定任務和應用程式優化和微調 LLM。
- 瞭解強化學習的核心原則和方法。
- 瞭解強化學習技術如何提高 LLM 的性能。
課程形式
- 互動講座和討論。
- 大量的練習和練習。
- 在現場實驗室環境中動手實施。
課程自定義選項
- 如需申請本課程的定製培訓,請聯繫我們進行安排。
課程簡介
Large Language Models (LLMs) 簡介
- LLM概述
- 定義和意義
- 當今人工智慧中的應用
變壓器架構
- 什麼是變壓器,它是如何工作的?
- 主要元件和特點
- 嵌入和位置編碼
- 多頭注意力
- 前饋神經網路
- 歸一化和殘差連接
變壓器型號
- 自注意力機制
- 編碼器-解碼器架構
- 位置嵌入
- BERT(來自 Transformer 的雙向編碼器表示)
- GPT(產生式預訓練轉換器)
性能優化和陷阱
- 上下文長度
- 曼巴和狀態空間模型
- 閃光注意力
- 稀疏變壓器
- 視覺變壓器
- 量化的重要性
改進變壓器
- 檢索增強文本生成
- 模型混合
- 思想之樹
微調
- 低秩適應理論
- 使用 QLora 進行微調
LLM 中的縮放定律和優化
- LLM擴展法的重要性
- 數據和模型大小縮放
- 計算擴展
- 參數效率縮放
優化
- 模型大小、數據大小、計算預算和推理需求之間的關係
- 優化 LLM 的性能和效率
- 用於訓練和微調 LLM 的最佳實踐和工具
訓練和微調 LLM
- 從頭開始培訓 LLM 的步驟和挑戰
- 數據採集與維護
- 大規模數據、CPU 和記憶體要求
- 優化挑戰
- 開源 LLM 的前景
Reinforcement Learning (RL) 的基礎知識
- Reinforcement Learning 簡介
- 通過積極強化學習
- 定義和核心概念
- 瑪律可夫決策過程 (MDP)
- 動態規劃
- 蒙特卡羅方法
- 時差學習
深 Reinforcement Learning
- 深度 Q 網路 (DQN)
- 近端策略優化 (PPO)
- Element秒,共 Reinforcement Learning
LLM 和 Reinforcement Learning 的集成
- 將 LLM 與 Reinforcement Learning 相結合
- RL在LLM中的使用方式
- Reinforcement Learning 人工反饋 (RLHF)
- RLHF的替代品
案例研究和應用
- 實際應用
- 成功案例和挑戰
高級主題
- 先進技術
- 高級優化方法
- 尖端研發
摘要和後續步驟
最低要求
- 基本瞭解 Machine Learning
觀眾
- 數據科學家
- 軟體工程師
需要幫助選擇合適的課程嗎?
Large Language Models (LLMs) and Reinforcement Learning (RL)培訓 - Enquiry
Large Language Models (LLMs) and Reinforcement Learning (RL) - 咨詢詢問
咨詢詢問
相關課程
Building Private AI Workflows with Ollama
14 時間:這是由講師指導的現場培訓課程,適合在澳門(線上或現場)參加的高階專業人士,旨在使用Ollama實現安全且高效的人工智慧驅動工作流程。
在培訓結束時,參與者將能夠:
- 部署並配置Ollama以進行私有AI處理。
- 將AI模型整合到安全的企業工作流程中。
- 在保持數據隱私的同時優化AI性能。
- 利用本地AI功能自動化業務流程。
- 確保符合企業安全與治理政策。
Claude AI for Content Creation
14 時間:這門由教師主導的現場培訓課程面向初學者到中級內容創作者、編輯和營銷人員,旨在教他們利用 Claude AI 進行內容生成、編輯和總結,以增強博客、報告和營銷材料。
培訓結束時,參與者將能夠:
- 使用 Claude AI 進行內容頭腦風暴和想法擴展。
- 通過 AI 助理編輯和校對來增強寫作。
- 為長格式內容和報告生成總結。
- 為不同平台自動化營銷副本創建。
Claude AI for Developers: Building AI-Powered Applications
14 時間:這個面向希望將Claude AI集成到他們的應用程序中、構建AI驅動的聊天機器人以及通過AI驅動的自動化來增強軟件功能的中級軟件開發人員和AI工程師的澳門(在線或現場) Instructor-led, live training (online or onsite)。
在這次培訓結束時,參與者將能夠:
- 使用Claude AI API將AI集成到應用程序中。
- 開發AI驅動的聊天機器人和虛擬助手。
- 利用AI驅動的自動化和NLP增強應用程序。
- 對不同的用例優化和微調Claude AI模型。
Claude AI for Research and Knowledge Management
14 時間:這項在澳門(線上或現場)進行的由講師主導的現場培訓,旨在幫助中級研究人員、分析師和知識工作者利用Claude AI處理大量數據、綜合信息和自動化研究任務。
培訓結束時,參與者將能夠:
- 利用Claude AI進行文獻回顧和研究綜合。
- 總結報告、研究論文和長格式文檔。
- 從結構化和非結構化數據中提取關鍵洞察和趨勢。
- 將Claude AI集成到研究和知識管理工作流程中。
Claude AI for Workflow Automation and Productivity
14 時間:這門由講師主導的現場培訓在澳門(在線或現場)旨在幫助有志於將Claude AI整合到日常工作流程中以提高效率和自動化的初級專業人員。
培訓結束時,參加者將能夠:
- 利用Claude AI來自動化重複性任務和精簡工作流程。
- 利用人工智慧驅動的自動化技術提高個人和團隊的生產力。
- 將Claude AI與現有的商業工具和平台整合。
- 優化AI驅動的決策制定和任務管理。
Deploying and Optimizing LLMs with Ollama
14 時間:這是一場由講師指導的現場培訓,地點在澳門(線上或現場),適合希望使用Ollama部署、優化和整合LLM的中級專業人士。
在培訓結束時,參與者將能夠:
- 使用Ollama設置和部署LLM。
- 優化AI模型以提升性能和效率。
- 利用GPU加速提升推理速度。
- 將Ollama整合到工作流程和應用程式中。
- 監控和維護AI模型的長期性能。
Fine-Tuning and Customizing AI Models on Ollama
14 時間:這是一個由講師指導的現場培訓課程,可在澳門(線上或現場)進行,旨在為高級專業人士提供微調和自訂Ollama上的AI模型的能力,以提升性能和針對特定領域的應用。
在培訓結束時,參與者將能夠:
- 在Ollama上設置高效的AI模型微調環境。
- 為監督式微調和強化學習準備數據集。
- 優化AI模型以提升性能、準確性和效率。
- 在生產環境中部署自訂模型。
- 評估模型改進並確保其穩健性。
Introduction to Google Gemini AI
14 時間:這種以講師為主導的澳門(在線或現場)實時培訓面向希望使用 Google Gemini AI 將 AI 功能整合到其應用程式中的初級到中級開發人員。
在培訓結束時,參與者將能夠:
- 瞭解大型語言模型的基礎知識。
- 設置和使用 Google Gemini AI 執行各種 AI 任務。
- 實現文字到文字和圖像到文字的轉換。
- 構建基本的 AI 驅動型應用程式。
- 探索 Google Gemini AI 中的高級功能和自定義選項。
Google Gemini AI for Content Creation
14 時間:這種以講師為主導的澳門(在線或現場)現場培訓面向希望利用 Google Gemini AI 來提高其內容品質和效率的中級內容創作者。
在培訓結束時,參與者將能夠:
- 瞭解 AI 在內容創作中的作用。
- 設置和使用 Google Gemini AI 來生成和優化內容。
- 應用文字到文本的轉換來生成創意和原創內容。
- 使用 AI 驅動的見解實施 SEO 策略。
- 使用 Gemini AI 分析內容性能並調整策略。
Google Gemini AI for Transformative Customer Service
14 時間:這種以講師為主導的澳門(在線或現場)現場培訓面向希望在客戶服務運營中實施 Go ogle Gemini AI 的中級客戶服務專業人員。
在培訓結束時,參與者將能夠:
- 瞭解 AI 對客戶服務的影響。
- 設置 Google Gemini AI 以自動化和個人化客戶交互。
- 利用文字到文本和圖像到文本的轉換來提高服務效率。
- 制定 AI 驅動的策略,用於即時客戶反饋分析。
- 探索高級功能,打造無縫的客戶服務體驗。
Google Gemini AI for Data Analysis
21 時間:這種以講師為主導的澳門(在線或現場)現場培訓面向希望使用 Google Gemini AI 在各個行業更直觀地執行複雜數據分析任務的初級到中級數據分析師和業務專業人員。
在培訓結束時,參與者將能夠:
- 瞭解 Google Gemini AI 的基礎知識。
- 將各種數據源連接到 Gemini AI。
- 使用自然語言查詢瀏覽數據。
- 分析數據模式並得出見解。
- 創建引人入勝的數據可視化。
- 有效地傳達數據驅動的見解。
Intermediate Gemini AI for Public Sector Professionals
16 時間:這是由講師指導的澳門(線上或線下)培訓,針對中級水平的公共部門專業人士,旨在通過更先進的AI互動,使用Gemini生成高質量內容、協助研究並提高生產力。
在培訓結束時,參與者將能夠:
- 為特定用例製作更有效和量身定制的提示。
- 使用Gemini生成原創和創意的內容。
- 精確地總結和比較複雜的信息。
- 使用Gemini進行頭腦風暴、計劃和高效組織想法。
Introduction to Claude AI: Conversational AI and Business Applications
14 時間:這項由講師主持的現場培訓(在線或現場)旨在幫助希望了解Claude AI的基本原理並利用它進行商業應用的初級商業專業人士、客戶支持團隊和技術愛好者。
培訓結束時,參與者將能夠:
- 了解Claude AI的能力和用例。
- 有效地設置和與Claude AI互動。
- 利用對話式AI自動化業務工作流程。
- 利用AI驅動的解決方案提升客戶互動和支持。
LangChain: Building AI-Powered Applications
14 時間:這種由講師指導的澳門(在線或現場)現場培訓面向希望使用LangChain框架構建AI驅動的應用程式的中級開發人員和軟體工程師。
在培訓結束時,參與者將能夠:
- 瞭解LangChain及其元件的基礎知識。
- 將 LangChain 與 GPT-4 等大型語言模型 (LLM) 集成。
- 使用 LangChain 構建模組化 AI 應用程式。
- 排查LangChain應用程式中的常見問題。
Getting Started with Ollama: Running Local AI Models
7 時間:這是一個由講師指導的現場培訓課程,可在澳門(線上或現場)進行,適合初級專業人士學習如何在本地機器上安裝、配置和使用 Ollama 來運行 AI 模型。
在本課程結束時,學員將能夠:
- 了解 Ollama 的基本概念及其功能。
- 設置 Ollama 以運行本地 AI 模型。
- 使用 Ollama 部署並與 LLM 進行互動。
- 優化 AI 工作負載的性能和資源使用。
- 探索本地 AI 部署在各行業中的應用案例。