Data Mining & Machine Learning with R培訓
R 是一種用於統計計算、數據分析和圖形的開源免費程式設計語言。R 被越來越多的公司和學術界的經理和數據分析師使用。R 具有多種用於數據挖掘的包。
課程簡介
資料挖掘簡介和 Machine Learning
- 統計學習與機器學習
- 反覆運算和評估
- 偏差-方差權衡
回歸
- 線性回歸
- 泛化和非線性
- 習題
分類
- 貝葉斯複習
- 樸素貝葉斯
- 二元分析
- 邏輯回歸
- K-最近鄰
- 支援向量機
- 神經網路
- 決策樹
- 習題
交叉驗證和重採樣
- 交叉驗證方法
- Bootstrap
- 習題
無監督學習
- K 均值聚類
- 例子
- 無監督學習和超越 K 均值的挑戰
高級主題
- 集成模型
- 混合模型
- 提高
- 例子
多維還原
- 影響因數
- 主成分分析
- 例子
最低要求
本課程是數據科學家技能集(領域: 分析技術和方法)的一部分
需要幫助選擇合適的課程嗎?
Data Mining & Machine Learning with R培訓 - Enquiry
Data Mining & Machine Learning with R - 咨詢詢問
咨詢詢問
客戶評論 (1)
The trainer was so knowledgeable and included areas I was interested in.
Mohamed Salama
Course - Data Mining & Machine Learning with R
相關課程
From Data to Decision with Big Data and Predictive Analytics
21 時間:聽眾
如果您試圖理解您可以訪問或想要分析網絡上可用的非結構化數據(如Twitter,鏈接等等),那麼本課程適合您。
它主要針對決策者和需要選擇哪些數據值得收集以及值得分析的人。
它不是針對人們配置解決方案,但這些人將從大局中受益。
交貨方式
在課程期間,代表們將獲得大多數開源技術的工作示例。
講座後將進行簡短的講座,參加者將進行簡單的練習
使用的內容和軟件
每次運行課程時都會更新所有使用的軟件,因此我們會檢查最新版本。
它涵蓋了從獲取,格式化,處理和分析數據的過程,以解釋如何使用機器學習自動化決策制定過程。
Data Mining with Python
14 時間:這是一個由講師指導的培訓(線上或線下),旨在幫助數據分析師和數據科學家使用Python實現更高級的數據分析技術,以進行數據挖掘。
在培訓結束時,學員將能夠:
- 理解數據挖掘的重要領域,包括關聯規則挖掘、文本情感分析、自動文本摘要和數據異常檢測。
- 比較並實施各種策略,以解決現實世界中的數據挖掘問題。
- 理解並解釋結果。
課程形式
- 互動式講座和討論。
- 大量的練習和實踐。
- 在實時實驗室環境中進行動手實踐。
課程定制選項
- 如需為本課程定制培訓,請聯繫我們進行安排。
Data Mining with R
14 時間:R是一種用於統計計算,數據分析和圖形的開源免費編程語言。 R被企業和學術界內越來越多的經理和數據分析師使用。 R有各種各樣的數據挖掘包。
Data Vault: Building a Scalable Data Warehouse
28 時間:在這個由 澳門 講師指導的現場培訓中,參與者將學習如何構建 Data Vault。
在本次培訓結束時,參與者將能夠:
- 瞭解 Data Vault 2.0 背後的架構和設計概念,以及它與 Big Data、NoSQL 和 AI 的交互。
- 使用數據保險庫技術對數據倉庫中的歷史數據進行審計、跟蹤和檢查。
- 開發一致且可重複的 ETL(提取、轉換、載入)流程。
- 構建和部署高度可擴展且可重複的倉庫。
Data Visualization
28 時間:本課程面向從事數據挖掘和知識發現工作的工程師和決策者。
您將學習如何創建有效的圖表以及以一種吸引決策者並幫助他們理解隱藏信息的方式呈現和表示您的數據的方法。
Data Science for Big Data Analytics
35 時間:大數據是如此龐大和復雜的數據集,傳統的數據處理應用軟件不足以處理它們。大數據挑戰包括捕獲數據,數據存儲,數據分析,搜索,共享,傳輸,可視化,查詢,更新和信息隱私。
Foundation R
7 時間:這是一個由講師指導的澳門(線上或線下)培訓課程,旨在幫助初學者掌握R語言的基礎知識以及如何處理數據。
在本培訓結束時,學員將能夠:
- 了解R編程環境和RStudio界面。
- 使用R命令和套件導入、處理和探索數據集。
- 執行基本的統計分析和數據摘要。
- 使用base R和ggplot2生成可視化圖表。
- 有效管理工作區、腳本和套件。
KNIME Analytics Platform for BI
21 時間:KNIME Analytics Platform是數據驅動創新的領先開源選項,可幫助您發現隱藏在數據中的潛力,挖掘新的見解或預測新的未來。 KNIME Analytics Platform擁有1000多個模塊,數百個可立即運行的示例,全面的集成工具以及最廣泛的高級算法選擇,是任何數據科學家和業務分析師的理想工具箱。
KNIME分析平台的這門課程是向KNIME介紹初學者,高級用戶和KNIME專家的理想機會,學習如何更有效地使用它,以及如何基於KNIME工作流程創建清晰,全面的報告
Process Mining
21 時間:流程挖掘或 Automated Business Process Discovery (ABPD) 是一種將演算法應用於事件日誌以分析業務流程的技術。流程挖掘超越了數據存儲和數據分析;它將數據與流程聯繫起來,並提供對影響流程效率的趨勢和模式的洞察。
課程形式
- 本課程首先概述了最常用的流程挖掘技術。我們將討論用於根據原始事件數據發現和建模流程的各種流程發現演算法和工具。使用 ProM 開源框架檢查真實的案例研究並分析數據集。
Introductory R for Biologists
28 時間:R是一種用於統計計算,數據分析和圖形的開源免費編程語言。 R被企業和學術界內越來越多的經理和數據分析師使用。 R還發現沒有計算機編程技能的統計學家,工程師和科學家的追隨者都很容易使用。它的受歡迎程度是由於越來越多地使用數據挖掘來實現各種目標,例如設定廣告價格,更快地找到新藥或微調財務模型。 R有各種各樣的數據挖掘包。
Statistics with SPSS Predictive Analytics Software
14 時間:Goal:
學習在獨立性級別使用SPSS
收件者:
分析師、研究人員、科學家、學生以及所有希望獲得使用SPSS軟體包的能力並學習流行的數據挖掘技術的人。
Introduction to Data Visualization with Tidyverse and R
7 時間:受众
课程形式
通过本次培训,参与者将能够:
在这次由讲师主导的线下培训中,参与者将学习如何使用Tidyverse中包含的工具来操作和可视化数据。
Tidyverse是一组多功能R包,用于数据清理、处理、建模和可视化。包含的一些包有:ggplot2、dplyr、tidyr、readr、purrr和tibble。
- R语言初学者
- 数据分析和数据可视化初学者
- 部分讲座、部分讨论、练习和大量动手实践
- 进行数据分析并创建吸引人的可视化效果
- 从各种样本数据集中得出有用的结论
- 过滤、排序和汇总数据以回答探索性问题
- 将处理后的数据转换为信息丰富的线图、条形图、直方图
- 从不同的数据源(包括Excel、CSV和SPSS文件)导入和过滤数据