使用Python進行網頁抓取培訓
網頁抓取是一種從網站提取數據並保存到本地文件或數據庫的技術。
本課程爲講師指導的培訓(線上或線下),面向希望使用Python自動化抓取多個網站以提取數據進行處理和分析的開發人員。
培訓結束後,參與者將能夠:
- 安裝並配置Python及所有相關包。
- 檢索並解析存儲在不同網站上的數據。
- 瞭解網站的工作原理及其HTML結構。
- 構建爬蟲以大規模抓取網頁。
- 使用Selenium抓取AJAX驅動的網頁。
課程形式
- 互動講座與討論。
- 大量練習與實踐。
- 在實驗環境中進行實際操作。
課程定製選項
- 本課程假定學員具備編程知識。
- 如需爲本課程定製培訓,請聯繫我們安排。
課程簡介
簡介
設置開發環境
Python入門:數據結構、條件語句、文件處理等
用於網頁抓取的Python包:Scrapy和BeautifulSoup
網站的工作原理
HTML的結構
發起網頁請求
抓取HTML頁面
使用XPath和CSS
使用正則表達式過濾數據
創建網頁爬蟲
使用Selenium抓取AJAX和JavaScript頁面
網頁抓取最佳實踐
故障排除
總結與結論
最低要求
- 編程經驗,最好有Python經驗。如果參與者有其他編程語言的經驗,培訓可延長以包含更多Python入門練習。
受衆
- 開發人員
需要幫助選擇合適的課程嗎?
使用Python進行網頁抓取培訓 - 詢問
使用Python進行網頁抓取 - 咨詢詢問
客戶評論 (1)
涵蓋了許多不同的示例和主題,從基礎調查到登錄管理,再到動態頁面管理。
Daniele Tagliaferro - Creditsafe Italia Srl
課程 - Web Scraping with Python
機器翻譯
相關課程
進階 Python:最佳實踐與設計模式
28 小時這門深入的實踐課程涵蓋了高級Python技術、工程最佳實踐以及常用的設計模式,以構建可維護、可測試和高性能的Python應用程序。課程重點介紹了現代工具、類型系統、併發模型、架構模式以及部署就緒的工作流程。
這門由講師指導的線下或線上培訓面向中級到高級Python開發者,旨在幫助他們採用專業的實踐和模式,以構建生產級的Python系統。
在培訓結束時,學員將能夠:
- 應用Python類型系統、數據類和類型檢查,以提高代碼的可靠性。
- 使用設計模式和架構原則來構建健壯的應用程序。
- 正確使用asyncio和多進程實現併發和並行。
- 使用pytest、基於屬性的測試和CI管道構建經過良好測試的代碼。
- 對Python應用程序進行性能分析、優化並使其適用於生產環境。
- 使用現代工具和容器打包、分發和部署Python項目。
課程形式
- 互動講座和簡短演示。
- 每天的實踐實驗和編碼練習。
- 集成了模式、測試和部署的頂點小項目。
課程定製選項
- 如需定製培訓或聚焦特定領域(數據、Web或基礎設施),請聯繫我們安排。
Agentic AI 工程與 Python — 構建自主代理
21 小時本課程教授使用 Python 設計、構建、測試和部署代理(自主)系統的實用工程技術。內容涵蓋代理循環、工具集成、內存和狀態管理、編排模式、安全控制以及生產考慮。
本課程爲講師指導的培訓(線上或線下),面向中級到高級的機器學習工程師、AI 開發者和軟件工程師,幫助他們使用 Python 構建健壯、可用於生產的自主代理。
培訓結束後,參與者將能夠:
- 設計和實現代理循環及決策工作流。
- 集成外部工具和 API 以擴展代理功能。
- 實現代理的短期和長期內存架構。
- 協調多步驟編排和代理可組合性。
- 爲部署的代理應用安全、訪問控制和可觀測性最佳實踐。
課程形式
- 互動講座與討論。
- 使用 Python 和流行 SDK 構建代理的動手實驗。
- 基於項目的練習,生成可部署的原型。
課程定製選項
- 如需定製本課程,請聯繫我們安排。
人工智能與Python(中級水平)
35 小時使用Python的人工智能是通過Python豐富的AI和機器學習庫生態系統來開發智能系統。
本課程爲講師指導的培訓(線上或線下),面向希望使用Python設計、實施和部署AI解決方案的中級Python程序員。
通過本培訓,參與者將能夠:
- 使用Python的核心AI庫實現AI算法。
- 處理監督學習、無監督學習和強化學習模型。
- 將AI解決方案集成到現有應用程序和工作流程中。
- 評估模型性能,並優化準確性和效率。
課程形式
- 互動講座和討論。
- 大量練習和實踐。
- 在即時實驗室環境中進行動手操作。
課程定製選項
- 如需爲本課程定製培訓,請聯繫我們安排。
使用Python和R進行算法交易
14 小時本課程爲講師指導的線下或線上培訓,旨在幫助希望使用算法交易、Python和R實現交易自動化的業務分析師。
在本培訓結束時,參與者將能夠:
- 使用算法快速以特定增量買賣證券。
- 通過算法交易減少與交易相關的成本。
- 自動監控股價並進行交易。
從零開始應用AI Python
28 小時這是一個為期 4 天的課程,介紹了 AI 及其使用 Python 程式設計語言的應用程式。完成本課程后,可以選擇額外有一天的時間來開展 AI 專案。
AWS Cloud9 和 Python:實用指南
14 小時這種講師指導的現場培訓在 澳門(在線或現場)進行,面向希望使用 AWS Cloud9 增強其 Python 開發體驗的中級 Python 開發人員。
在本次培訓結束時,參與者將能夠:
- 設置和配置 AWS Cloud9 以進行 Python 開發。
- 瞭解 AWS Cloud9 IDE 介面和功能。
- 在 AWS Cloud9 中編寫、調試和部署 Python 個應用程式。
- 使用 AWS Cloud9 平臺與其他開發人員協作。
- 將 AWS Cloud9 與其他 AWS 服務整合以進行高級部署。
使用Python構建聊天機器人
21 小時聊天機器人是能夠通過聊天界面自動模擬人類響應的計算機程序。聊天機器人通過提供更簡單、更快捷的用戶交互選項,幫助組織最大化其運營效率。
在這次由講師指導的線下培訓中,參與者將學習如何使用Python構建聊天機器人。
培訓結束後,參與者將能夠:
- 理解構建聊天機器人的基礎知識
- 使用Python構建、測試、部署和調試各種聊天機器人
受衆
- 開發者
課程形式
- 部分講座,部分討論,練習和大量動手實踐
注意
- 如需爲本課程定製培訓,請聯繫我們安排。
使用CUDA和Python進行GPU編程
14 小時本次由講師指導的培訓在澳門(線上或線下)面向希望使用CUDA構建在NVIDIA GPU上並行運行的Python應用程序的中級開發者。
培訓結束後,參與者將能夠:
- 使用Numba編譯器加速在NVIDIA GPU上運行的Python應用程序。
- 創建、編譯和啓動自定義CUDA內核。
- 管理GPU內存。
- 將基於CPU的應用程序轉換爲GPU加速的應用程序。
使用Python和Dask進行數據擴展分析
14 小時本課程爲講師指導的培訓(線上或線下),面向希望使用Dask與Python生態系統構建、擴展和分析大型數據集的數據科學家和軟件工程師。
在培訓結束時,參與者將能夠:
- 設置環境,開始使用Dask和Python進行大數據處理。
- 探索Dask中可用的功能、庫、工具和API。
- 瞭解Dask如何加速Python中的並行計算。
- 學習如何使用Dask擴展Python生態系統(Numpy、SciPy和Pandas)。
- 優化Dask環境,以保持處理大型數據集時的高性能。
Data Analysis in Python using Pandas and Numpy
14 小時本課程爲講師指導的培訓,在澳門(線上或線下)進行,面向希望提升使用Pandas和NumPy進行數據分析和操作技能的中級Python開發者和數據分析師。
通過本培訓,參與者將能夠:
- 設置包含Python、Pandas和NumPy的開發環境。
- 使用Pandas和NumPy創建數據分析應用。
- 執行高級數據整理、排序和過濾操作。
- 進行聚合操作並分析時間序列數據。
- 使用Matplotlib和其他可視化庫進行數據可視化。
- 調試和優化數據分析代碼。
FARM (FastAPI, React, 和 MongoDB) 全棧開發
14 小時本課程由講師主導,提供線下或線上培訓,旨在幫助開發者使用 FARM (FastAPI, React, 和 MongoDB) 技術棧構建動態、高性能且可擴展的 Web 應用。
通過本課程,學員將能夠:
- 搭建集成了 FastAPI、React 和 MongoDB 的開發環境。
- 理解 FARM 技術棧的關鍵概念、特點和優勢。
- 學習如何使用 FastAPI 構建 REST API。
- 學習如何使用 React 設計交互式應用。
- 使用 FARM 技術棧開發、測試和部署應用(前端和後端)。
使用Python和FastAPI開發API
14 小時本課程爲講師指導的培訓,在澳門(線上或線下)進行,面向希望使用FastAPI與Python更快速、更輕鬆地構建、測試和部署RESTful API的開發者。
通過本課程,學員將能夠:
- 設置必要的開發環境,以使用Python和FastAPI開發API。
- 使用FastAPI庫更快速、更輕鬆地創建API。
- 學習如何基於Pydantic和OpenAPI創建數據模型和模式。
- 使用SQLAlchemy將API連接到數據庫。
- 使用FastAPI工具在API中實現安全和身份驗證。
- 構建容器鏡像並將Web API部署到雲服務器。
使用Python和TensorFlow進行欺詐檢測
14 小時這種以講師為主導的澳門現場現場培訓針對的是希望使用TensorFlow分析潛在欺詐數據的數據科學家。
在培訓結束時,參與者將能夠:
- 在Python和TensorFlow中創建欺詐檢測模型。
- 建立線性回歸和線性回歸模型來預測欺詐。
- 開發一個端到端的人工智慧應用程序來分析欺詐數據。
使用Modin加速Python Pandas工作流
14 小時這種由 講師指導的 澳門 現場現場培訓(在線或現場)面向希望使用 Modin 構建和實施並行計算的數據科學家和開發人員 Pandas 以加快數據分析速度。
在本次培訓結束時,參與者將能夠:
- 設置必要的環境,開始使用 Modin 大規模開發 Pandas 工作流。
- 瞭解 Modin 的功能、架構和優勢。
- 瞭解 Modin、Dask 和 Ray 之間的區別。
- 使用 Modin 更快地執行 Pandas 操作。
- 實現整個 Pandas API 和函數。