SMACK Stack 數據科學培訓
SMACK 是一組數據平臺軟件,包括 Apache Spark、Apache Mesos、Apache Akka、Apache Cassandra 和 Apache Kafka。使用 SMACK 技術棧,用戶可以創建和擴展數據處理平臺。
本次講師指導的培訓(線上或線下)面向希望使用 SMACK 技術棧構建大數據解決方案的數據科學家。
培訓結束後,參與者將能夠:
- 實現用於處理大數據的數據管道架構。
- 使用 Apache Mesos 和 Docker 開發集羣基礎設施。
- 使用 Spark 和 Scala 分析數據。
- 使用 Apache Cassandra 管理非結構化數據。
課程形式
- 互動講座和討論。
- 大量練習和實踐。
- 在即時實驗室環境中動手操作。
課程定製選項
- 如需定製本課程,請聯繫我們安排。
課程簡介
介紹
SMACK 技術棧概述
- 什麼是 Apache Spark?Apache Spark 的特性。
- 什麼是 Apache Mesos?Apache Mesos 的特性。
- 什麼是 Apache Akka?Apache Akka 的特性。
- 什麼是 Apache Cassandra?Apache Cassandra 的特性。
- 什麼是 Apache Kafka?Apache Kafka 的特性。
Scala 語言
- Scala 語法和結構。
- Scala 控制流。
準備開發環境
- 安裝和配置 SMACK 技術棧。
- 安裝和配置 Docker。
Apache Akka
- 使用 actors。
Apache Cassandra
- 創建用於讀取操作的數據庫。
- 處理備份和恢復。
連接器
- 創建流。
- 構建 Akka 應用。
- 使用 Cassandra 存儲數據。
- 回顧連接器。
Apache Kafka
- 處理集羣。
- 創建、發佈和消費消息。
Apache Mesos
- 分配資源。
- 運行集羣。
- 使用 Apache Aurora 和 Docker。
- 運行服務和作業。
- 在 Mesos 上部署 Spark、Cassandra 和 Kafka。
Apache Spark
- 管理數據流。
- 處理 RDD 和數據幀。
- 執行數據分析。
故障排除
- 處理服務故障和錯誤。
總結與結論
最低要求
- 對數據處理系統的理解。
受衆
- 數據科學家。
需要幫助選擇合適的課程嗎?
SMACK Stack 數據科學培訓 - 詢問
SMACK Stack 數據科學 - 咨詢詢問
咨詢詢問
客戶評論 (1)
非常互動...
Richard Langford
課程 - SMACK Stack for Data Science
機器翻譯
相關課程
Anaconda 數據科學家生態系統
14 時間:這種由 講師指導的 澳門 現場培訓(在線或現場)面向希望使用 Anaconda 生態系統在單一平臺中捕獲、管理和部署軟體包和數據分析工作流 的數據科學家。
在本次培訓結束時,參與者將能夠:
- 安裝和配置 Anaconda 個元件和庫。
- 瞭解 Anaconda 的核心概念、功能和優勢。
- 使用 Anaconda Navigator 管理包、環境和頻道。
- 將 Conda、R 和 Python 包用於數據科學和機器學習。
- 瞭解管理多個數據環境的一些實際使用案例和技術。
A Practical Introduction to Data Science
35 時間:完成本培訓的學員將獲得對數據科學及其相關技術、方法和工具的實踐性、現實世界的理解。
學員將有機會通過動手練習將所學知識付諸實踐。小組互動和講師反饋是課程的重要組成部分。
課程從數據科學的基本概念介紹開始,然後逐步深入數據科學中使用的工具和方法。
受衆
- 開發者
- 技術分析師
- IT顧問
課程形式
- 部分講座,部分討論,練習和大量動手實踐
注意
- 如需爲此課程定製培訓,請聯繫我們安排。
Data Science Programme
245 時間:当今世界信息和数据的爆炸式增长是无与伦比的,我们创新和突破可能性的能力比以往任何时候都快。数据科学家的角色是当今整个行业最需要的技能之一。
我们提供的不仅仅是通过理论学习;我们提供实用的、适销对路的技能,弥合学术界与工业界需求之间的差距。
这个为期 7 周的课程 可以根据您的特定行业要求进行定制,请联系我们了解更多信息或访问 Nobleprog Institute 网站
观众:
该课程面向研究生以及任何具有所需必备技能的人 ,这些技能将通过评估和面试确定。
交货:
该课程的交付将采用讲师指导的课堂和讲师 指导的在线课程;通常,第 1 周是“课堂主导”,第 2 周 - 第 6 周是“虚拟课堂”,第 7 周是“课堂主导”。
Data Science for Big Data Analytics
35 時間:大數據是如此龐大和復雜的數據集,傳統的數據處理應用軟件不足以處理它們。大數據挑戰包括捕獲數據,數據存儲,數據分析,搜索,共享,傳輸,可視化,查詢,更新和信息隱私。
Data Science essential for Marketing/Sales professionals
21 時間:本課程面向市場營銷和銷售專業人士,旨在深入探討數據科學在市場營銷和銷售中的應用。課程詳細介紹了用於“向上銷售”、“交叉銷售”、市場細分、品牌建設和客戶終身價值(CLV)的各種數據科學技術。
市場營銷與銷售的區別 - 銷售和市場營銷有何不同?
簡單來說,銷售可以被視爲一個專注於個人或小羣體的過程。而市場營銷則針對更大的羣體或公衆。市場營銷包括研究(識別客戶需求)、產品開發(生產創新產品)和產品推廣(通過廣告)以及在消費者中建立產品意識。因此,市場營銷意味着生成潛在客戶或線索。一旦產品進入市場,銷售人員的工作就是說服客戶購買產品。銷售意味着將潛在客戶或線索轉化爲購買和訂單,而市場營銷則着眼於長期目標,銷售則與短期目標相關。
Jupyter for Data Science Teams
7 時間:本課程爲講師引導的培訓(線上或線下),介紹了數據科學中的協作開發理念,並演示瞭如何使用 Jupyter 跟蹤並作爲團隊參與“計算想法的生命週期”。課程將帶領學員基於 Jupyter 生態系統創建一個示例數據科學項目。
在本課程結束時,學員將能夠:
- 安裝和配置 Jupyter,包括在 Git 上創建和集成團隊倉庫。
- 使用 Jupyter 的擴展、交互式小部件、多用戶模式等功能,實現項目協作。
- 與團隊成員創建、共享和組織 Jupyter Notebook。
- 通過 Jupyter 界面選擇 Scala、Python、R 等語言,編寫並執行鍼對 Apache Spark 等大數據系統的代碼。
Kaggle
14 時間:這個由 講師指導的 澳門 現場培訓(在線或現場)面向希望在 Data Science 中使用 Kaggle 學習和建立職業生涯的數據科學家和開發人員。
在本次培訓結束時,參與者將能夠:
- 了解數據科學和機器學習。
- 探索數據分析。
- 瞭解 Kaggle 及其工作原理。
MATLAB基礎、數據科學與報告生成
35 時間:在本培訓的第一部分,我們將介紹 MATLAB 的基礎知識及其作為語言和平臺的功能。 本次討論包括對 MATLAB 語法、陣列和矩陣、數據可視化、腳本開發和面向對象原則的介紹。
在第二部分中,我們將演示如何使用 MATLAB 進行數據挖掘、機器學習和預測分析。為了向參與者提供一個清晰而實用的視角來瞭解 MATLAB 的方法和能力,我們將使用 MATLAB 與使用其他工具(如電子表格、C、C++ 和 Visual Basic)進行比較。
在培訓的第三部分,參與者學習如何通過自動化數據處理和報告生成來簡化他們的工作。
在整個課程中,參與者將通過實驗室環境中的實踐練習將學到的想法付諸實踐。在培訓結束時,參與者將全面掌握 MATLAB 的能力,並能夠利用它來解決現實世界的數據科學問題,以及通過自動化來簡化他們的工作。
將在整個課程中進行評估,以衡量進展情況。
課程形式
- 課程包括理論和實踐練習,包括案例討論、示例代碼檢查和動手實施。
注意
- 實踐課程將基於預先安排的樣本數據報告範本。如果您有具體要求,請聯繫我們安排。
Machine Learning – Data science
21 時間:這項由講師指導的澳門(線上或線下)培訓,針對中級數據分析師、開發人員或有志成為數據科學家的人士,旨在應用機器學習技術於Python中,以提取洞察、進行預測並自動化數據驅動的決策。
在本課程結束時,參與者將能夠:
- 理解並區分關鍵的機器學習範式。
- 探索數據預處理技術和模型評估指標。
- 應用機器學習算法解決實際數據問題。
- 使用Python庫和Jupyter筆記本進行實作開發。
- 構建用於預測、分類、推薦和聚類的模型。
使用Modin加速Python Pandas工作流
14 時間:這種由 講師指導的 澳門 現場現場培訓(在線或現場)面向希望使用 Modin 構建和實施並行計算的數據科學家和開發人員 Pandas 以加快數據分析速度。
在本次培訓結束時,參與者將能夠:
- 設置必要的環境,開始使用 Modin 大規模開發 Pandas 工作流。
- 瞭解 Modin 的功能、架構和優勢。
- 瞭解 Modin、Dask 和 Ray 之間的區別。
- 使用 Modin 更快地執行 Pandas 操作。
- 實現整個 Pandas API 和函數。
Python金融編程
35 時間:Python 是一種在金融行業中廣受歡迎的程式語言。它被大型投資銀行和對沖基金採用,用於構建各種金融應用程式,從核心交易程式到風險管理系統。
在這場由講師指導的現場培訓中,學員將學習如何使用 Python 開發實際應用程式,以解決一系列特定的金融相關問題。
培訓結束時,學員將能夠:
- 理解 Python 程式語言的基本原理
- 下載、安裝並維護用於在 Python 中創建金融應用程式的最佳開發工具
- 選擇並利用最合適的 Python 套件和程式技術來組織、可視化和分析來自各種來源(CSV、Excel、數據庫、網絡等)的金融數據
- 構建解決資產配置、風險分析、投資績效等問題的應用程式
- 對 Python 應用程式進行故障排除、集成、部署和優化
目標受眾
- 開發人員
- 分析師
- 量化分析師
課程形式
- 部分講授、部分討論、練習和大量實踐操作
注意事項
- 本培訓旨在為金融專業人員面臨的一些主要問題提供解決方案。如果您有特定的主題、工具或技術希望補充或進一步詳細說明,請聯繫我們進行安排。
GPU數據科學之NVIDIA RAPIDS
14 時間:本次由講師指導的線下或線上培訓,面向希望使用RAPIDS構建GPU加速的數據管道、工作流和可視化的數據科學家和開發者,應用如XGBoost、cuML等機器學習算法。
培訓結束後,參與者將能夠:
- 設置必要的開發環境,使用NVIDIA RAPIDS構建數據模型。
- 瞭解RAPIDS的特性、組件和優勢。
- 利用GPU加速端到端的數據和分析管道。
- 使用cuDF和Apache Arrow實現GPU加速的數據準備和ETL。
- 學習如何使用XGBoost和cuML算法執行機器學習任務。
- 使用cuXfilter和cuGraph構建數據可視化並執行圖分析。
Python與Spark大數據分析(PySpark)
21 時間:在這個由講師指導的 澳門 現場培訓中,參與者將學習如何在動手練習中同時使用 Python 和 Spark 來分析大數據。
在培訓結束時,參與者將能夠:
- 瞭解如何將Spark與 Python 結合使用來分析 Big Data。
- 進行模仿真實世界案例的練習。
- 使用 PySpark 使用不同的工具和技術進行大數據分析。
Stratio: 使用PySpark的Rocket與Intelligence模塊
14 時間:Stratio是一個以數據爲中心的平臺,集成了大數據、人工智能和治理功能,提供一體化解決方案。其Rocket和Intelligence模塊支持在企業環境中快速進行數據探索、轉換和高級分析。
本次由講師指導的培訓(線上或線下)面向中級數據專業人員,旨在幫助他們有效使用Stratio中的Rocket和Intelligence模塊與PySpark,重點涵蓋循環結構、用戶自定義函數和高級數據邏輯。
培訓結束後,參與者將能夠:
- 在Stratio平臺中導航並使用Rocket和Intelligence模塊。
- 在數據攝取、轉換和分析中應用PySpark。
- 使用循環和條件邏輯控制數據工作流和特徵工程任務。
- 創建並管理用戶自定義函數(UDFs),以在PySpark中實現可重用的數據操作。
課程形式
- 互動式講座與討論。
- 大量練習與實踐。
- 在即時實驗室環境中進行動手操作。
課程定製選項
- 如需爲本課程定製培訓,請聯繫我們安排。