Lịch học dự kiến diễn ra
Lớp: | SQ05B9L1 LEVEL 1 |
---|---|
Địa điểm: | Tầng 5, Tòa nhà Star City, 23 Lê Văn Lương, HN |
Thời gian học: | Thứ 2 - 19H00 - 21H30 & Thứ 6 - 19H00 - 21H30 |
Lịch khai giảng: | Sept. 23, 2024 |
Thời gian kết thúc: | Oct. 21, 2024 |
Giảng viên dự kiến: | None |
Lớp: | PB99SB9L1 Level 1 |
---|---|
Địa điểm: | 13 Cao Thắng, Quận 3, HCM |
Thời gian học: | Thứ 4 - 19H00 - 21H30 & Chủ nhật - 19H00 - 21H30 |
Lịch khai giảng: | Sept. 25, 2024 |
Thời gian kết thúc: | Oct. 20, 2024 |
Giảng viên dự kiến: | chuyennt_vba |
Lớp: | SQ09SB9L1 LEVEL 1 |
---|---|
Địa điểm: | 13 Cao Thắng, Quận 3, HCM |
Thời gian học: | Thứ 2 - 19H00 - 21H30 & Thứ 5 - 19H00 - 21H30 |
Lịch khai giảng: | Sept. 23, 2024 |
Thời gian kết thúc: | Oct. 21, 2024 |
Giảng viên dự kiến: | Tiendlt_SQL |
Lớp: | PY03B9L1 LEVEL 1 |
---|---|
Địa điểm: | Tầng 5, Tòa nhà Star City, 23 Lê Văn Lương, HN |
Thời gian học: | Thứ 5 - 19H00 - 21H30 & Chủ nhật - 19H00 - 21H30 |
Lịch khai giảng: | Sept. 29, 2024 |
Thời gian kết thúc: | Oct. 31, 2024 |
Giảng viên dự kiến: | Datnh.Py |
Lớp: | PB01SA10L1 LEVEL 1 |
---|---|
Địa điểm: | 13 Cao Thắng, Quận 3, HCM |
Thời gian học: | Thứ 2 - 19H00 - 21H30 & Thứ 6 - 19H00 - 21H30 |
Lịch khai giảng: | Oct. 7, 2024 |
Thời gian kết thúc: | Nov. 1, 2024 |
Giảng viên dự kiến: | None |
Lớp: | SQ09SA10L1 LEVEL 1 |
---|---|
Địa điểm: | 13 Cao Thắng, Quận 3, HCM |
Thời gian học: | Thứ 2 - 19H00 - 21H30 & Thứ 6 - 19H00 - 21H30 |
Lịch khai giảng: | Oct. 14, 2024 |
Thời gian kết thúc: | Nov. 11, 2024 |
Giảng viên dự kiến: | None |
Lớp: | PY07SA10L1 LEVEL 1 |
---|---|
Địa điểm: | 13 Cao Thắng, Quận 3, HCM |
Thời gian học: | Thứ 3 - 19H00 - 21H30 & Thứ 7 - 19H00 - 21H30 |
Lịch khai giảng: | Oct. 8, 2024 |
Thời gian kết thúc: | Nov. 9, 2024 |
Giảng viên dự kiến: | None |
Data Analyst Professional (Data Analyst with Python Track)
Đây là chương trình đào tạo full skill về Data Analyst gồm 05 khóa học. Hình thức đào tạo online và offline trong thời lượng 42 buổi học, mỗi buổi học từ 2.5 - 3 tiếng.
Tên 05 khóa học nhỏ trong chương trình Data Analyst Professional (Data Analyst with Python Track):
1. SQL for Newbies: Data Analysis for Beginners (SQL Level 1) với 09 buổi học
2. Analyzing and visualizing data on Power BI (Power BI Level 1) với 08 buổi học
3. Python Foundation in Data Analytics (Python Level 1) với 10 buổi học
4. Math & Statistics for Data Science với 05 buổi học
5. Python for Machine Learning (Python Level 2) với 10 buổi học
Cơ hội nghề nghiệp nổi bật sau khi tốt nghiệp chương trình đào tạo này là các vị trí hot sau:
• Data Analyst
• Business Intelligence Analyst
• Data Scientist
• Machine Learning Engineer
• Big Data Analyst
Đối tượng
• Sinh viên khối kinh tế, kĩ thuật có định hướng tham gia ngành Data Science, Data Analytics đang cần học thêm kiến thức liên quan Python, SQL và Power BI để ứng dụng vào phân tích Big Data, Machine Learning, Deep Learning, trí tuệ nhân tạo và ứng dụng trong các dự án thực tế.• Người đã đi làm mong muốn cải thiện kỹ năng làm việc và ra quyết định với dữ liệu, kỹ năng ứng dụng các công nghệ mới trong lĩnh vực khoa học dữ liệu và trí thông minh nhân tạo vào công việc thực tế để có nhiều bước đột phá hơn trong sự nghiệp.
• Các bạn có mong muốn chuyển ngang sang ngành Data Science, Data Analyst, Data Engineer… để có mức thu nhập cao hơn lên tới 1000$/tháng và mô trường làm việc năng động & sáng tạo hơn.
Yêu cầu đầu vào
Không yêu cầu đầu vàoBạn sẽ học những gì
• Làm quen và thành thạo SQL, tối ưu hóa xử lý dữ liệu và quản trị cơ sở dữ liệu.• Sử dụng Power BI để phân tích và trực quan hóa dữ liệu theo thời gian thực, hỗ trợ ra quyết định kinh doanh thông minh.
• Hiểu các khái niệm toán học, thống kê cơ bản và áp dụng Python, scikit-learn để triển khai thuật toán.
• Ứng dụng Python trong phân tích dữ liệu lớn (Big Data Analyst) và quản trị rủi ro kinh doanh, ứng dụng nâng cao trong lĩnh vực Học máy (Machine Learning), Học sâu (Deep Learning) và AI (trí tuệ nhân tạo)
Nội dung khóa học
- Buổi 1: Tổng quan về SQL
- Buổi 2: Các lệnh tương tác và truy vấn dữ liệu
- Buổi 3: Ghép nối bảng
- Buổi 4: Các hàm xử lý dữ liệu
- Buổi 5: Phương pháp truy vấn dữ liệu trên các bảng phụ
- Buổi 6: Thống kê bảng dữ liệu và chủ đề về ranking
- Buổi 7: Các lệnh thêm, sửa, xóa dữ liệu trong bảng
- Buổi 8: Tối ưu CSDL và kết nối đến các phần mềm trực quan hóa và trình bày báo cáo
- Buổi 9: Tổng kết khoá học Level 1
- Buổi 10: Giới thiệu về Power BI
- Buổi 11: Kết nối và xử lý dữ liệu
- Buổi 12: Data Model
- Buổi 13: Data Model
- Buổi 14: Tổng quan về DAX
- Buổi 15: Tổng quan về DAX
- Buổi 16: DAX Functions
- Buổi 17: Report view
- Buổi 18: Làm quen với Python
- Buổi 19: Python Basic
- Buổi 20: Python Basic (Tiếp)
- Buổi 21: Numpy
- Buổi 22: Pandas: Data Loading, Storage, and File Formats; Data Cleaning and Preparation
- Buổi 23: Pandas nâng cao
- Buổi 24: Pandas: Time Series
- Buổi 25: Trực quan hóa dữ liệu
- Buổi 26: Phân tích dữ liệu thăm dò (EDA)
- Buổi 27: Web Crawling using Selenium and Python & Capstone
- Buổi 28: Xác suất thống kê
- Buổi 29: Đạo hàm
- Buổi 30: Ma trận - Vector
- Buổi 31: Thuật toán trong Machine Learning
- Buổi 32: Thực hành & Quan sát chạy thuật toán
- Buổi 33: Giới thiệu về Machine Learning và Linear Regression
- Buổi 34: Polynomial và một số thuật ngữ quan trọng trong ML
- Buổi 35: Gradient Descent
- Buổi 36: Logistic Regression
- Buổi 37: KNN and Naive Bayes
- Buổi 38: Unsupervised learning: Kmean, Hierarchical Clustering
- Buổi 39: PCA and SVM
- Buổi 40: Decision Tree
- Buổi 41: Neutral network
- Buổi 42: Tổng kết
Giới thiệu SQL Server
Các lệnh mô tả bảng, dữ liệu (DDL - Data Definition Language)
- Hiểu tổng quan về SQL và các đối tượng chính trong cơ sở dữ liệu.
- Biết cách tạo, xóa cơ sở dữ liệu và bảng.
- Nắm vững cách thay đổi cấu trúc bảng và nhập dữ liệu vào cơ sở dữ liệu.
- Tổng quan về SQL
- Giới thiệu các đối tượng chính trong CSDL
- Các kiểu dữ liệu
- Tạo, xóa cơ sở dữ liệu
- Tạo, xóa bảng cơ sở dữ liệu
- Thay đổi cấu trúc bảng (thêm cột, xóa cột, đổi kiểu dữ liệu)
- Importing data
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
- Các lệnh tương tác với bảng, dữ liệu (DML - Data Manipulation Language)
- Các lệnh truy vấn dữ liệu
- Hiểu cấu trúc câu truy vấn cơ bản và cách chọn cột trong SQL.
- Biết cách lọc hàng, sử dụng các hàm tổng hợp và sắp xếp, nhóm dữ liệu.
- Nắm vững cách sử dụng các câu lệnh SQL khác như comment, alias, phép toán số học, và giới hạn kết quả.
- SQL Basic Query Structure
- Selecting columns
- Filtering rows
- Aggregate Functions (sum, avg, max, min...) - Sorting and grouping
- Having Clause
- Ohters (SQL Comments, Alias, Arithmetic Operators, Limit Your Results ...)
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử..
Ghép nối bảng
Mục tiêu:- Hiểu các khái niệm về ghép nối bảng trong SQL.
- Biết cách sử dụng các loại join (Left join, Right join, Inner join, Full outer join).
- Nắm vững cách sử dụng Union và Union All để kết hợp dữ liệu từ nhiều bảng.
- Left join, Right join, Inner join, Full outer join
- Union and union all
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Các hàm xử lý dữ liệu
Mục tiêu:- Hiểu và sử dụng các hàm xử lý chuỗi trong SQL.
- Hiểu và sử dụng các hàm xử lý thời gian trong SQL.
- Hiểu và sử dụng các hàm chuyển đổi dữ liệu trong SQL.
- Nắm vững cách sử dụng hàm Case When để xử lý các điều kiện phức tạp.
- Các hàm xử lý chuỗi
- Các hàm xử lý thời gian
- Các hàm chuyển đổi
- Hàm case when
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Phương pháp truy vấn dữ liệu trên các bảng phụ
Mục tiêu:- Hiểu và sử dụng phương pháp Subquery trong SQL.
- Hiểu và sử dụng Common Table Expressions (CTE) trong SQL.
- Nắm vững cách sử dụng bảng tạm để xử lý dữ liệu phức tạp.
- Phương pháp sử dụng Subquery
- Phương pháp sử dụng CTE
- Phương pháp sử dụng bảng tạm
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Thống kê bảng dữ liệu và chủ đề về ranking
Mục tiêu:- Hiểu và áp dụng phương pháp Pivot Table để thống kê dữ liệu.
- Sử dụng các phương pháp phân tích và ranking để lấy top cao nhất, top thấp nhất theo các yêu cầu cụ thể.
- Phương pháp Pivot table
- Phương pháp phân tích, ranking lấy top cao nhất, top thấp nhất theo các yêu cầu cụ thể.
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Các lệnh thêm, sửa, xóa dữ liệu trong bảng
Mục tiêu:- Hiểu và sử dụng các câu lệnh chèn dữ liệu INSERT.
- Biết cách cập nhật dữ liệu bằng câu lệnh UPDATE.
- Hiểu và sử dụng câu lệnh xóa dữ liệu DELETE.
- Nắm vững cách cập nhật dữ liệu có ràng buộc.
- Câu lệnh chèn dữ liệu INSERT
- Câu lệnh cập nhật dữ liệu UPDATE
- Câu lệnh xóa dữ liệu DELETE
- Cập nhật dữ liệu có ràng buộc
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
- Tối ưu CSDL
- Kết nối đến các phần mềm trực quan hóa và trình bày report
- Hiểu các khái niệm khóa chính (Primary key), khóa ngoại (Foreign key), và chỉ mục (Index).
- Biết cách kết nối dữ liệu từ SQL Server tới Excel, Power BI, và Python.
- Nắm vững cách tự động hóa báo cáo với Power BI và Excel.
- Khóa chính (Primary key), Khóa ngoài ( Foreign key), Chỉ mục (Index)
- Kết nối data từ SQL Server tới Excel, Power BI, Python.
- Tự động hóa reporting với Power BI, Excel
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Tổng kết khoá học Level 1
Mục tiêu:- Ôn tập và review toàn bộ kiến thức đã học.
- Hướng dẫn cách tra cứu Google khi sử dụng SQL trong các hệ quản trị cơ sở dữ liệu như PostgreSQL, MySQL, ...
- Review toàn bộ kiến thức
- Hướng dẫn cách tra cứu Google khi sử dụng SQL trong các hệ quản trị CSDL như Postgre SQL, My SQL, ...
Thực hành cuối khoá
Tổng quan về Business Intelligence (BI) và giới thiệu về hệ sinh thái Power BI
Mục tiêu:- Tổng quan Business Intelligence
- Hệ sinh thái Power BI
- Quy trình trực quan hóa dữ liệu
- Hướng dẫn cài đặt PBI, 1 số chú ý quan trọng.
- Giới thiệu các giải pháp BI, vai trò BI trong tổng thể hệ thống.
- Các thành phần trong hệ sinh thái Power BI
- Quy trình trực quan hóa dữ liệu
- Làm quen giao diện công cụ.
- Kết nối nguồn số liệu, xây dựng báo cáo, visual đơn giản
Thực hành
Kết nối và xử lý dữ liệu
Mục tiêu:- Thực hành Transform data ở mức cơ bản
- Làm quen với các khái niệm, thuật ngữ của Power Query Editor trong Power BI
- Giới thiệu công cụ Power Query Editor
- Kết nối 1 số nguồn số liệu khác nhau
- Thực hiện các Transform dữ liệu cơ bản với Power Query Editor
- Làm quen khái niệm ngôn ngữ M
Thực hành Transform Data với dataset của AdventureWorks
Data Model
Mục tiêu:- Khái niệm về Datamart
- Nguyên tắc thiết kế và các mô hình thiết kế Data Model
- Khái niệm về Datamart
- Các nguyên tắc thiết kế tối ưu
- Phân biệt Data Table (Fact) và Lookup Table (Dimension)
- Thiết kế mô hình Star-Schema, mô hình Snow-Flake
Thực hành khởi tạo và thiết kế model với dataset của AdventureWorks
Data Model (tiếp)
Mục tiêu:- Các kiến thức về data model và table relationships
- Quản lý các relationship của model
- Thực hành xây dựng Data model
- Tổng quan về Data Model, Relationships
- Khởi tạo kết nối giữa các bảng
- Relationships cardinality
- Quản lý Relationship
- Active và Inactive relationships
- Advandced Relationships
Thực hành khởi tạo và thiết kế model với dataset của AdventureWorks
Tổng quan về DAX
Mục tiêu:- Tổng quan về DAX
- Vai trò và Ứng dụng của DAX trong việc xây dựng Report
- Cách thức khởi tạo DAX
- Giới thiệu về Data Analysis Expressions - DAX
- 03 Yếu tố thành phần của DAX
- Khởi tạo New Column và Measures
Viết các Measures và tạo calculated columns và calculated table với dataset AdventureWorks
Tổng quan về DAX (tiếp)
Mục tiêu:- Measures, Calculated Column, Calculated Table
- Filter context
- Measures, Calculated Column, Calculated Table với DAX
- Quick Measures
- Implicit và Explicit Measures
- Filter context
Viết các Measures và tạo calculated columns và calculated table với dataset AdventureWorks
DAX Functions
Mục tiêu:Sử dụng DAX nâng cao, chuyên sâu về các hàm thông dụng
Ứng dụng:- Chi tiết về DAX với Measure
- Các nhóm hàm DAX
- Các hàm DAX thường dùng:
+ CALENDAR, FORMAT..
+ SUM, SUMX, COUNT, COUNTX, CALCULATE,
+ SAMEPERIODYEAR, TOTYTD….
Viết các Measures và tạo calculated columns và calculated table với dataset AdventureWorks
Report view
Mục tiêu:- Các thành phần cùa Report View
- Các Visual type chính
- Conditional Formating
- Chi tiết từng thành phần trong Report View
- Các Visual type chính, mục đích sử dụng
- Conditional Formating
- Filtering
Thực hành thiết kế trình bày báo cáo cơ bản
Làm quen với Python
Mục tiêu:Giới thiệu về khóa học và khởi động với Python
Ứng dụng:- Nắm được 1 framework phân tích dữ liệu
- Làm quen với Google Colab
- Làm quen với Markdown
- Biết ngôn ngữ lập trình Python là gì, và một số lý do tại sao Python phổ biến
- Biết được cấu trúc cú pháp cơ bản trong Python (Language Semantic)
Ôn tập Python Basic
Python Basic
Mục tiêu:Nắm được kiến thức:
- Một số kiểu dữ liệu của Python;
- Các phép toán tử;
- Các kiểu dữ liệu dạng chuỗi;
- Các cấu trúc điều khiển trong Python
- Kiểu dữ liệu và chuỗi
- Toán tử
- Cấu trúc điều khiển
Ôn tập cú pháp Python
Python Basic (Tiếp)
Mục tiêu:Nắm được kiến thức:
- Một số hàm cơ bản: pass, range, zip, enumerate, sorted;
- List, set, Dict comprehension
- Cách tạo ra hàm
- Các xử lý lỗi trong python
- Hàm cơ bản
- List, set, Dict comprehension
- Cách tạo hàm
- Xử lý lỗi trong Python
Bài tập về nhà về cấu trúc mảng
Numpy
Mục tiêu:Nắm được cách xử lý mảng dữ liệu
Ứng dụng:Xử lý mảng dữ liệu
Case Study:Bài tập mảng một chiều mảng 2 chiều
Pandas
Mục tiêu:Nắm được cách trích xuất, làm sạch và xử lý dữ liệu trống
Ứng dụng:Trích xuất, làm sạch và xử lý dữ liệu
Case Study:Bài tập về nhà
Pandas: Data Wrangling: Join, Combine, and Reshape
Mục tiêu:Nắm được các kỹ thuật xử lý cấu trúc dữ liệu
Ứng dụng:Làm sạch dữ liệu
Case Study:Bài tập về nhà: Cleaning data
Pandas: Time Series
Mục tiêu:Hiểu được về dữ liệu thời gian, cách xử lý dữ liệu thời gian
Ứng dụng:Time series
Case Study:Xử lý dữ liệu chứng khoán
Trực quan hóa dữ liệu
Mục tiêu:- Nắm được kỹ thuật vẽ các biểu đồ cơ bản
- Cách thêm các thành phân trong biểu đồ
- Kỹ thuật vẽ multiple plot
- Một số kỹ năng quan trọng trong trực quan hóa dữ liệu
Data Visualization
Case Study:Trực quan hóa dữ liệu phân tích doanh thu
Phân tích dữ liệu thăm dò (EDA)
Mục tiêu:- Nắm được kỹ thuật khai phá dữ liệu
- Sử dụng các công cụ đã học để phân tích khai phá dữ liệu
EDA
Case Study:Phân tích EDA bộ dữ liệu IT salary
Web Crawling using Selenium and Python & Capstone
Mục tiêu:Học viên nắm được kỹ thuật Web Crawling
Ứng dụng:Kỹ thuật Web Crawling
Case Study:Dùng selenium để lấy dữ liệu từ SSI sau đó tiến hành các bước làm sạch, khai phá dữ liệu
Set theory, sơ đồ venn
Loại dữ liệu trong toán
Binning
Distribution và param mô tả dist.
Data matrix
Correlation
- Hiểu và áp dụng các khái niệm về lý thuyết tập hợp, sơ đồ Venn, loại dữ liệu, kỹ thuật binning, phân phối dữ liệu và các tham số mô tả, ma trận dữ liệu, và tương quan.
- Có khả năng phân tích và trực quan hóa dữ liệu một cách hiệu quả.
Xác suất thống kê
Case Study:Xác suất thống kê
Đạo hàm
Mục tiêu:Hiểu rõ khái niệm đạo hàm và nguyên tắc tính đạo hàm.
Áp dụng kiến thức vào các bài toán điển hình trong đạo hàm.
Khái niệm đạo hàm
Nguyên tắc tính
Bài toán điển hình trong đạo hàm
Thực hành Đạo hàm
Ma trận - Vector
Mục tiêu:- Hiểu và sử dụng hệ trục tọa độ cùng với các phép biến đổi bằng ma trận (cộng, nhân).
- Tính toán và áp dụng các khái niệm về khoảng cách trong không gian tọa độ.
Hệ trục toạ độ
Transform bằng matrix (cộng, nhân)
Khoảng cách
Thực hành Ma trận - Vector
Machine Learning Introduction (Dataset, Bias/Variance, Train/Test/Validation Split, Loss Function,...)
Mục tiêu:- Hiểu tổng quan về Machine Learning và cách tiếp cận các bài toán qua hai thuật toán tiêu biểu: Kmeans (unsupervised) và SVM (supervised).
- Nắm vững quy trình suy nghĩ và trình tự thực hiện thuật toán Kmeans và SVM trên một dataset, bao gồm cả các bài toán điển hình như phân nhóm khách hàng bằng Kmeans.
- Giới thiệu và thực hành với thư viện Sklearn để triển khai các thuật toán Machine Learning.
Bức tranh tổng quan của ML
Giới thiệu Kmeans (đại diện unsupervised)
Giới thiệu SVM (đại diện supervised)
- Flow of thinking: bài toán/vấn đề mà hai thuật toán này giải quyết là gì? Trình tự thực hiện thuật toán trên 1 dataset
- Nêu tên bài toán điển hình (vd: cluster khách hàng bằng Kmeans)
- Giới thiệu về Sklearn
Thực hành thuật toán
Thực hành:
EDA (EXPLORY DATA ANALYSIS)
- Hiểu và thực hành các kỹ thuật Phân tích Dữ liệu Thăm dò (Exploratory Data Analysis - EDA) để khám phá và tóm tắt đặc điểm chính của dữ liệu.
- Phát triển kỹ năng sử dụng EDA để chuẩn bị dữ liệu cho các bước phân tích và mô hình hóa tiếp theo.
Thực hành:
EDA (EXPLORY DATA ANALYSIS)
EDA
Giới thiệu về Machine Learning và Linear Regression
Mục tiêu:- Nắm được khái niệm cơ bản về ML, một số ứng dụng phổ biến và phân loại machine learning
- Biết về thư viện scikit learn các triển khai xây dựng mô hình trên scikitlearn
- Nắm được thuật toán linear regression và triển khai
- Một số thước đo cơ bản của bài toán regression
- Xây dựng mô hình trên Scikit-learn
- Triển khai thuật toán Linear Regression
Media Company Case Study (Linear Regression)
A digital media company (similar to Voot, Hotstar, Netflix, etc.) had launched a show. Initially, the show got a good response, but then witnessed a decline in viewership. The company wants to figure out what went wrong.
Polynomial và một số thuật ngữ quan trọng trong ML
Mục tiêu:- Hiểu được việc thuật toán Polynomial và cách triển khai
- Nắm được một số kỹ thuật xây dựng mô hình machine learning
- Triển khai thuật toán Polynomial
- Kĩ thuật xây dựng mô hình Machine Learning
Using Polynomial Regression with House Prices - Kaggle Competitions
Gradient Descent
Mục tiêu:- Nắm được về thuật toán, một số phiên bản của Gradient Descent
- Kỹ thuật Normalization Features
- Gradient Descent
- Kỹ thuật Normalization Features
House Prices - Advanced Regression Techniques
Logistic Regression
Mục tiêu:- Nắm được về thuật toán phân lớp bằng Logistic Regression và triển khai trên thư viện Scikit-learn
- Một số thước đo phổ biến của bài toán phân lớp và ưu nhược điểm của nó
- Thuật toán phân lớp bằng Logistic Regression
Case Study:Housing Prediction with Logistic Regression
KNN and Naive Bayes
Mục tiêu:- Nắm được cách triển khai thuật toán:
- KNN và tối ưu giá trị của k
- Naive Bayes
- KNN
- Naive Bayes
Housing classification with KNN
Unsupervised learning: Kmean, Hierarchical Clustering
Mục tiêu:Nắm được cách triển khai và tối ưu của thuật toán :
- Kmean
- Hierarchical
- Kmean
- Hierarchical
Online Retail K-means & Hierarchical Clustering:
Online retail is a transnational data set which contains all the transactions occurring between 01/12/2010 and 09/12/2011 for a UK-based and registered non-store online retail. The company mainly sells unique all-occasion gifts. Many customers of the company are wholesalers.
PCA and SVM
Mục tiêu:Nắm được và triển khai thuật toán:
- PCA
- SVM
- Giới thiệu về SVM : Thuật toán, phiên bản
- Giới thiệu về PCA: Thuật toán
- Các triển khai trong thư viện Scikit learn
PCA and SVM on MNIST dataset
Decision Tree
Mục tiêu:Nắm được và triển khai thuật toán:
- Decision Tree
- Random Forests
- XGBoost
- Giới thiệu về Decision tree
- Hàm entropy và thuật toán tối ưu của Decision tree
- Decision tree cho bài toán regression
- Emsemble tree: Giới thiệu về Bagging, boosting, random forests
- Cách triển khai bài toán decision tree, randomforest trên thư viện scikit-learn
- Giới thiệu về gradient boosting và thư viện XGBoost
- Một số ưu và nhược điểm của thuật toán
Titanic - Machine Learning from Disaster
Neutral network
Mục tiêu:- Phân biệt được giữa ML và Deep Learning
- Hiểu được cách xây dựng và tìm phương án tối ưu của mạng Neural Network
- Cách triển khai mạng Neural Network bằng thư viện TensorFlow
- Phân biệt giữa Machine learning vs Deep learning
- Giới thiệu về Neutral network
- Cách xây dựng mạng neutral
- Một số non-linear fuction cơ bản trong mạng neutral: softmax, relu, tanh...
- Feedforward and back propagation
- Triển khai neutral network trên thư viện tensorflow
Taylor Swift's YouTube Stats Symphony
Dive into the data-driven world of Taylor Swift's YouTube empire with the "Swift's YouTube Stats Symphony" dataset! This collection offers an analytical look at the performance metrics of each video from the global music icon's official channel, providing a wealth of insights into views, popularity, and engagement trends.
Tổng kết
Mục tiêu:- Ứng dụng các kiến thức đã học vào 1 dự án
- Tổng kết các kiến thức
Machine Learning & Deep Learning
Case Study:Project cuối khóa
Tại sao khóa học tại MCI phù hợp với bạn
1. Lộ trình khóa học thiết kế khoa học, theo quy trình làm việc thực tế giúp bạn tiếp thu và nắm chắc kiến thức theo trình tự khoa học2. Giáo trình đào tạo theo chuẩn Quốc tế kết hợp giữa lý thuyết và thực hành qua các case study thực tế
3. 100% Giảng viên tại MCI là các chuyên gia tư vấn tại Big4 các tập đoàn lớn tại Việt Nam, có chứng chỉ đào tạo nghiên cứu quốc tế trong lĩnh vực lập trình và dữ liệu
4. Giảng viên hướng dẫn tận tay giúp bạn thành thạo Python, Power BI, SQL trong thời gian ngắn nhất
5. Cam kết chất lượng đào tạo, miễn phí học lại trọn đời nếu chưa nắm rõ kiến thức
Đội ngũ giảng viên
Ngô Hoàng Quốc Tân
- Hơn 10 năm kinh nghiệm trong ngành Công nghệ thông tin và Phân tích dữ liệu tại Việt Nam
- Đảm nhận vị trí Chuyên viên Phân tích Kinh doanh Cao cấp tại Savills Việt Nam
- Đảm nhận vị trí Quản lý khoa học dữ liệu tại Tập đoàn Lộc Trời Việt Nam
- Chuyên viên phân tích kinh doanh tại Pycogroup Việt Nam
- Chuyên viên Phân tích dữ liệu cao cấp tại Công ty Lazada Việt Nam
Bùi Thanh Tú
- Chuyên viên Phân tích dữ liệu cao cấp tại Ngân hàng VPBank, Việt Nam
- Chuyên viên Phân tích dữ liệu tại Ngân hàng SeaBank, Việt Nam
- Có 4 năm kinh nghiệm trong Phân tích tài chính ngân hàng, 3 năm kinh nghiệm trong việc xây dựng Data
- Nhiều kinh nghiệm trong việc đào tạo SQL tại các Trung tâm và Tổ chức đào tạo Công Nghệ tại Việt Nam
Bùi Thế Anh
- 10 năm kinh nghiệm trong ngành Phân tích định lượng và Dữ liệu lớn tại Việt Nam
- Chuyên viên quản lý tối ưu kinh doanh cao cấp tại Tập đoàn One Mount Group
- Chuyên viên định lượng cao cấp tại Công ty Cổ phần Chứng khoán BIDV Việt Nam
- Chuyên viên Phân tích kinh doanh tại Tập đoàn Vingroup
- Tốt nghiệp Thạc sĩ tài chính tại Mỹ, trường University of Cincinnati, Carl H. Lindner College of Business, US
Lê Tiến Mạnh
- Hơn 6 năm kinh nghiệm trong lĩnh vực phân tích dữ liệu và hệ thống thông tin quản lý tại Ngân hàng và Công ty tài chính
- Hiện tại đang đảm nhận vị trí Giám đốc phân tích và quản trị danh mục xử lý nợ của ngân hàng SeaBank
- Đã từng đảm nhận vị trí Trưởng bộ phận báo cáo và phân tích tại Ngân hàng tài chính SHB Finance, Chuyên gia Hệ thống Báo cáo và Phân tích tại ngân hàng PVCOMBANK
- Chịu trách nhiệm Quản lý team báo cáo và hỗ trợ tại Ngân hàng Việt Nam Thịnh Vượng VPBank
- Giảng viên nội bộ Phân tích dữ liệu và Quản trị dữ liệu của Ngân hàng VPBank & PVCombank
Nguyễn Kim Quang
- Tốt nghiệp Thạc sĩ Tài chính ngân hàng
- Đã đảm nhận các vị trí Kế toán tín dụng, Chuyên viên thẩm định, thư ký Phó TGĐ, chuyên viên phân tích tài chính doanh nghiệp và dự án tại Quỹ đầu tư phát triển Thành phố Hà Nội.
- Hiện tại đang làm ví trí Phân tích tài chính doanh nghiệp và dự án tại Quỹ đầu tư phát triển Thành phố Hà Nội (từ 2008 đến nay)
- Có hơn 14 năm kinh nghiệm trong phân tích tài chính, phân tích dự báo rủi ro, bảo vệ phương án cho các dự án.
- Sử dụng thành thạo các công cụ SQL, Python đặc biệt các libraries phân tích và trực quan hóa dữ liệu, Machine Learning
- CÁC CHỨNG CHỈ
+ IBM Data Science Professional Certificate (IBM)
+ Python 3 Programming Specialization (University of Michigan)
+ SQL advanced certification (HackerRank)
+ STATSX0001: Statistical Learning (Stanford University)
+ Statistics with Python (University of Michigan)
Đặng Lê Khoa
- Chuyên viên cao cấp triển khai và tư vấn Công nghệ Tổng quát tại Hitachi Vantara Việt Nam
- Giảng viên tại CFD-Engineer Việt Nam
- Đảm nhận nhiệm vụ phân tích dữ liệu tại Cộng đồng kĩ sư Việt Nam CFD-Engineer
- Chứng chỉ:
1. Data Manipulation with Python (Advanced, score:166, percentile: 99%)
2. Importing & Cleaning Data with Python (Advanced, score:131, percentile: 85%)
3. Python Programming (Advanced, score:133, percentile: 86%)