Lịch học dự kiến diễn ra



Lớp: PYTHON LEVEL 1
Địa điểm: 59 Cao Thắng, Quận 3, HCM
Thời gian học: Thứ 2 - 19H00 - 21H30 & Thứ 6 - 19H00 - 21H30
Lịch khai giảng: March 24, 2025
Thời gian kết thúc: April 25, 2025
Giảng viên dự kiến: None
Lớp: SQL LEVEL 1
Địa điểm: Tầng 5, Tòa nhà Star City, 23 Lê Văn Lương, HN
Thời gian học: Thứ 2 - 19H00 - 21H30 & Thứ 6 - 19H00 - 21H30
Lịch khai giảng: March 21, 2025
Thời gian kết thúc: April 18, 2025
Giảng viên dự kiến: None
Lớp: SQL LEVEL 1
Địa điểm: 59 Cao Thắng, Quận 3, HCM
Thời gian học: Thứ 3 - 19H00 - 21H30 & Thứ 7 - 19H00 - 21H30
Lịch khai giảng: March 18, 2025
Thời gian kết thúc: April 15, 2025
Giảng viên dự kiến: None
Lớp: PYTHON LEVEL 1
Địa điểm: Tầng 5, Tòa nhà Star City, 23 Lê Văn Lương, HN
Thời gian học: Thứ 3 - 19H00 - 21H30 & Thứ 5 - 19H00 - 21H30
Lịch khai giảng: March 13, 2025
Thời gian kết thúc: April 15, 2025
Giảng viên dự kiến: Datnh.Py
Lớp: PYTHON LEVEL 1
Địa điểm: 59 Cao Thắng, Quận 3, HCM
Thời gian học: Thứ 5 - 19H00 - 21H30 & Chủ nhật - 19H00 - 21H30
Lịch khai giảng: March 13, 2025
Thời gian kết thúc: April 13, 2025
Giảng viên dự kiến: Tamtt.Py
Lớp: SQL LEVEL 2
Địa điểm: 59 Cao Thắng, Quận 3, HCM
Thời gian học: Thứ 2 - 19H00 - 21H30 & Thứ 6 - 19H00 - 21H30
Lịch khai giảng: March 21, 2025
Thời gian kết thúc: April 14, 2025
Giảng viên dự kiến: None
Lớp: SQL LEVEL 2
Địa điểm: Tầng 5, Tòa nhà Star City, 23 Lê Văn Lương, HN
Thời gian học: Thứ 4 - 19H00 - 21H30 & Chủ nhật - 19H00 - 21H30
Lịch khai giảng: March 23, 2025
Thời gian kết thúc: April 16, 2025
Giảng viên dự kiến: None
Data Engineer

Data Engineer Track

Đây là chương trình đào tạo full skill về Data Engineer giúp học viên nắm vững mọi kỹ năng cần thiết để thành công trong lĩnh vực kỹ thuật dữ liệu

Hình thức đào tạo online và offline, mỗi buổi học từ 2.5 - 3 tiếng

Tên 05 khóa học trong chương trình Data Engineer Track gồm:

1. SQL for Newbies: Data Analysis for Beginners (SQL Level 1) với 09 buổi học
2. Database and SQL for Data Science (SQL Level 2) với 08 buổi học
3. Python Foundation in Data Analytics (Python Level 1) với 10 buổi học
4. Mastering Data Warehouse & Data Lake: From Basics to Applications với 10 buổi học
5. Mastering AWS : From Basics to Applications với 10 buổi học

Cơ hội nghề nghiệp nổi bật sau khi tốt nghiệp chương trình đào tạo này là các vị trí hot sau:
• Data Analyst
• Data Engineer
• SQL Developer
• ETL Developer
• Data Analyst
• Big Data Engineer
• Cloud Data Engineer
• BI Developer
• Machine Learning Engineer

4.9 (379)

Đối tượng

Các bạn đang học tập và làm việc trong lĩnh vực Data, Software Engineer, có định hướng chuyển sang các vị trí Data Engineer

Yêu cầu đầu vào

Khóa học cho người mới bắt đầu

Bạn sẽ học những gì

• Nắm vững SQL để truy vấn, quản lý và tối ưu hóa dữ liệu, cải thiện hiệu suất.
• Thành thạo sử dụng các thư viện Python như Pandas và NumPy để xử lý, phân tích và làm sạch dữ liệu, cùng với lập trình hướng đối tượng để quản lý dữ liệu phức tạp.
• Hiểu sự khác biệt giữa Data Warehouse và Data Lake, và có khả năng thiết kế và triển khai các mô hình dữ liệu cũng như quản lý dữ liệu lớn.
• Biết cách triển khai và quản lý các dịch vụ AWS như S3, EC2, RDS, và Redshift, cùng với việc sử dụng AWS Lambda cho xử lý dữ liệu không đồng bộ.
• Có khả năng sử dụng các công cụ ETL để chuyển đổi và tải dữ liệu vào Data Warehouse/Data Lake, cùng với tối ưu hóa lưu trữ và truy vấn dữ liệu lớn.
• Hiểu và áp dụng các nguyên tắc bảo mật trên AWS: Học viên sẽ thiết lập các chính sách bảo mật và quyền truy cập cho các dịch vụ AWS, bảo đảm an toàn dữ liệu và tuân thủ các nguyên tắc bảo mật.
• Phát triển kỹ năng giải quyết vấn đề và tối ưu hóa quy trình: Học viên sẽ có khả năng áp dụng các kỹ thuật và công cụ học được để giải quyết vấn đề và tối ưu hóa quy trình xử lý dữ liệu trong môi trường thực tế.

Nội dung khóa học

    Chủ đề:

    Giới thiệu SQL Server
    Các lệnh mô tả bảng, dữ liệu (DDL - Data Definition Language)

    Mục tiêu:

    - Hiểu tổng quan về SQL và các đối tượng chính trong cơ sở dữ liệu.
    - Biết cách tạo, xóa cơ sở dữ liệu và bảng.
    - Nắm vững cách thay đổi cấu trúc bảng và nhập dữ liệu vào cơ sở dữ liệu.

    Ứng dụng:

    - Tổng quan về SQL
    - Giới thiệu các đối tượng chính trong CSDL
    - Các kiểu dữ liệu
    - Tạo, xóa cơ sở dữ liệu
    - Tạo, xóa bảng cơ sở dữ liệu
    - Thay đổi cấu trúc bảng (thêm cột, xóa cột, đổi kiểu dữ liệu)
    - Importing data

    Case Study:

    Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    - Các lệnh tương tác với bảng, dữ liệu (DML - Data Manipulation Language)
    - Các lệnh truy vấn dữ liệu

    Mục tiêu:

    - Hiểu cấu trúc câu truy vấn cơ bản và cách chọn cột trong SQL.
    - Biết cách lọc hàng, sử dụng các hàm tổng hợp và sắp xếp, nhóm dữ liệu.
    - Nắm vững cách sử dụng các câu lệnh SQL khác như comment, alias, phép toán số học, và giới hạn kết quả.

    Ứng dụng:

    - SQL Basic Query Structure
    - Selecting columns
    - Filtering rows
    - Aggregate Functions (sum, avg, max, min...) - Sorting and grouping
    - Having Clause
    - Ohters (SQL Comments, Alias, Arithmetic Operators, Limit Your Results ...)

    Case Study:

    Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    Ghép nối bảng

    Mục tiêu:

    - Hiểu các khái niệm về ghép nối bảng trong SQL.
    - Biết cách sử dụng các loại join (Left join, Right join, Inner join, Full outer join).
    - Nắm vững cách sử dụng Union và Union All để kết hợp dữ liệu từ nhiều bảng.

    Ứng dụng:

    - Left join, Right join, Inner join, Full outer join
    - Union and union all

    Case Study:

    Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    Các hàm xử lý dữ liệu

    Mục tiêu:

    - Hiểu và sử dụng các hàm xử lý chuỗi trong SQL.
    - Hiểu và sử dụng các hàm xử lý thời gian trong SQL.
    - Hiểu và sử dụng các hàm chuyển đổi dữ liệu trong SQL.
    - Nắm vững cách sử dụng hàm Case When để xử lý các điều kiện phức tạp.

    Ứng dụng:

    - Các hàm xử lý chuỗi
    - Các hàm xử lý thời gian
    - Các hàm chuyển đổi
    - Hàm case when

    Case Study:

    Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    Phương pháp truy vấn dữ liệu trên các bảng phụ

    Mục tiêu:

    - Hiểu và sử dụng phương pháp Subquery trong SQL.
    - Hiểu và sử dụng Common Table Expressions (CTE) trong SQL.
    - Nắm vững cách sử dụng bảng tạm để xử lý dữ liệu phức tạp.

    Ứng dụng:

    - Phương pháp sử dụng Subquery
    - Phương pháp sử dụng CTE
    - Phương pháp sử dụng bảng tạm

    Case Study:

    Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    Thống kê bảng dữ liệu và chủ đề về ranking

    Mục tiêu:

    - Hiểu và áp dụng phương pháp Pivot Table để thống kê dữ liệu.
    - Sử dụng các phương pháp phân tích và ranking để lấy top cao nhất, top thấp nhất theo các yêu cầu cụ thể.

    Ứng dụng:

    - Phương pháp Pivot table
    - Phương pháp phân tích, ranking lấy top cao nhất, top thấp nhất theo các yêu cầu cụ thể.

    Case Study:

    - Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    Các lệnh thêm, sửa, xóa dữ liệu trong bảng

    Mục tiêu:

    - Hiểu và sử dụng các câu lệnh chèn dữ liệu INSERT.
    - Biết cách cập nhật dữ liệu bằng câu lệnh UPDATE.
    - Hiểu và sử dụng câu lệnh xóa dữ liệu DELETE.
    - Nắm vững cách cập nhật dữ liệu có ràng buộc.

    Ứng dụng:

    - Câu lệnh chèn dữ liệu INSERT
    - Câu lệnh cập nhật dữ liệu UPDATE
    - Câu lệnh xóa dữ liệu DELETE
    - Cập nhật dữ liệu có ràng buộc

    Case Study:

    - Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    - Tối ưu CSDL
    - Kết nối đến các phần mềm trực quan hóa và trình bày report

    Mục tiêu:

    - Hiểu các khái niệm khóa chính (Primary key), khóa ngoại (Foreign key), và chỉ mục (Index).
    - Biết cách kết nối dữ liệu từ SQL Server tới Excel, Power BI, và Python.
    - Nắm vững cách tự động hóa báo cáo với Power BI và Excel.

    Ứng dụng:

    - Khóa chính (Primary key), Khóa ngoài ( Foreign key), Chỉ mục (Index)
    - Kết nối data từ SQL Server tới Excel, Power BI, Python.
    - Tự động hóa reporting với Power BI, Excel

    Case Study:

    - Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    Tổng kết khoá học Level 1

    Mục tiêu:

    - Ôn tập và review toàn bộ kiến thức đã học.
    - Hướng dẫn cách tra cứu Google khi sử dụng SQL trong các hệ quản trị cơ sở dữ liệu như PostgreSQL, MySQL, ...

    Ứng dụng:

    - Review toàn bộ kiến thức
    - Hướng dẫn cách tra cứu Google khi sử dụng SQL trong các hệ quản trị CSDL như Postgre SQL, My SQL, ...

    Case Study:

    Thực hành cuối khoá

    Chủ đề:

    - Thủ tục lưu trữ (stored procedures)
    - Các biến trong SQL
    - Tham số và các giá trị trả về

    Mục tiêu:

    - Kiến thức chung và thực hành

    Ứng dụng:

    - Quản trị dữ liệu lớn như quản lý nhân sự hay quản lý bán hàng...

    Case Study:

    - Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    Xử lý dữ liệu với hàm Scalar, điều kiện và vòng lặp

    Mục tiêu:

    - Hiểu và sử dụng các hàm Scalar, điều kiện kiểm tra IF/ELSE và CASE.
    - Nắm vững cấu trúc vòng lặp và mệnh đề WHILE.

    Ứng dụng:

    - Hàm Scalar
    - Điều kiện kiểm tra - mệnh đề IF/ELSE, CASE
    - Cấu trúc vòng lặp và mệnh đề WHILE

    Case Study:

    - Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    - Lệnh xóa trong SQL
    - Cập nhật dữ liệu trong SQL
    - Chèn dữ liệu

    Mục tiêu:

    - Quản trị và phân tích dữ liệu

    Ứng dụng:

    - Phân tích dữ liệu, liên kết các dữ liệu
    - Phương pháp logic trong việc tạo báo cáo khoa học

    Case Study:

    - Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    Quan hệ bảng, Transaction và bảng tạm trong SQL

    Mục tiêu:

    - Hiểu và tạo được quan hệ trong bảng, chỉ mục INDEX.
    - Biết cách thực hiện và quản lý giao dịch (Transaction) trong SQL.
    - Nắm vững cách sử dụng bảng tạm (Temporary Tables) và biến kiểu bảng.

    Ứng dụng:

    - Tạo quan hệ trong bảng và chỉ mục INDEX
    - Giao dịch Transaction trong SQL
    - Bảng tạm Temporary Tables và biến kiểu bảng

    Case Study:

    - Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    Trigger và ứng dụng trong SQL Server

    Mục tiêu:

    - Hiểu khái niệm và cách sử dụng Trigger trong SQL Server.
    - Ứng dụng Trigger để tự động hóa các tác vụ quản lý dữ liệu.

    Ứng dụng:

    - Ưu nhược điểm Trigger
    - Khởi taọ Trigger
    - Thực hành Trigger

    Case Study:

    - Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    - Thao tác con trỏ (cursors)
    - Gỡ lỗi câu lệnh
    - Chuỗi lệnh SQL động

    Mục tiêu:

    - Kiến thức chung và thực hành

    Ứng dụng:

    - Duyệt qua từng dòng dữ liệu của một bảng để thao tác với chúng.
    - Gỡ lỗi những procedures có nhiều câu lệnh phức tạp
    - Phân tích kết quả tìm kiếm với nhiều tham số đầu vào khác nhau sẽ tạo nhiều câu lệnh SQL khác nhau

    Case Study:

    - Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    Pivot và Unpivot

    Mục tiêu:

    - Kiến thức chung và thực hành

    Ứng dụng:

    - Khái niệm và ứng dụng của Pivot và Unpivot
    - Sự khác biệt giữa Pivot và Unpivot
    - Cú pháp và cách sử dụng câu lệnh PIVOT, UNPIVOT
    - Các ví dụ minh họa chuyển đổi hàng thành cột, cột thành hàng
    - Ứng dụng Pivot để tổng hợp dữ liệu và Unpivot để phân tích dữ liệu

    Case Study:

    - Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...

    Chủ đề:

    Tổng kết

    Mục tiêu:

    - Kiểm tra lại các nội dung đã học

    Ứng dụng:

    Review kiến thức, bài tập nhóm và đánh giá cá nhân

    Case Study:

    Kiểm tra

    Chủ đề:

    Giới thiệu về khóa học và khởi động với python

    Mục tiêu:

    - Nắm được 1 framework phân tích dữ liệu
    - Làm quen với Google Colab
    - Làm quen với Markdown
    - Biết ngôn ngữ lập trình python là gì, và một số lý do tại sao python phổ biến
    - Biết được cấu trúc cú pháp cơ bản trong python (Language Semantic)

    Ứng dụng:

    Phân tích dữ liệu lớn (Big Data)

    Case Study:

    Ôn tập python basic

    Chủ đề:

    Python Basic

    Mục tiêu:

    Nắm được kiến thức:
    - Một số kiểu dữ liệu của Python;
    - Các phép toán tử;
    - Các kiểu dữ liệu dạng chuỗi;
    - Các cấu trúc điều khiển trong Python

    Ứng dụng:

    Phân tích dữ liệu lớn (Big Data)

    Case Study:

    Ôn tập cú pháp Python

    Chủ đề:

    Python Basic (Tiếp)

    Mục tiêu:

    Nắm được kiến thức:
    - Một số hàm cơ bản: pass, range, zip, enumerate, sorted;
    - List, set, Dict comprehension
    - Cách tạo ra hàm
    - Các xử lý lỗi trong Python

    Ứng dụng:

    Phân tích dữ liệu lớn (Big Data)

    Case Study:

    Bài tập về nhà về cấu trúc mảng

    Chủ đề:

    Numpy

    Mục tiêu:

    Nắm được cách xử lý mảng dữ liệu

    Ứng dụng:

    Phân tích dữ liệu lớn (Big Data)

    Case Study:

    Bài tập mảng một chiều mảng 2 chiều

    Chủ đề:

    Pandas

    Mục tiêu:

    Nắm được cách trích xuất, làm sạch và xử lý dữ liệu trống

    Ứng dụng:

    Làm sạch dữ liệu

    Case Study:

    Bài tập về nhà

    Chủ đề:

    Pandas: Data Wrangling: Join, Combine, and Reshape

    Mục tiêu:

    Nắm được các kỹ thuật xử lý cấu trúc dữ liệu

    Ứng dụng:

    Làm sạch dữ liệu

    Case Study:

    Bài tập về nhà: Cleaning data

    Chủ đề:

    Pandas: Time Series

    Mục tiêu:

    Hiểu được về dữ liệu thời gian, cách xử lý dữ liệu thời gian

    Ứng dụng:

    Time Series

    Case Study:

    Xử lý dữ liệu chứng khoán

    Chủ đề:

    Trực quan hóa dữ liệu

    Mục tiêu:

    - Nắm được kỹ thuật vẽ các biểu đồ cơ bản
    - Cách thêm các thành phân trong biểu đồ
    - Kỹ thuật vẽ multiple plot
    - Một số kỹ năng quan trọng trong trực quan hóa dữ liệu

    Ứng dụng:

    Data Visualization

    Case Study:

    Trực quan hóa dữ liệu phân tích doanh thu

    Chủ đề:

    Phân tích dữ liệu thăm dò (EDA)

    Mục tiêu:

    - Nắm được kỹ thuật khai phá dữ liệu
    - Sử dụng các công cụ đã học để phân tích khai phá dữ liệu

    Ứng dụng:

    EDA

    Case Study:

    Phân tích EDA bộ dữ liệu IT salary

    Chủ đề:

    - Web Crawling Using Selenium
    - Capstone

    Mục tiêu:

    Học viên nắm được kỹ thuật Web Crawling

    Ứng dụng:

    Web Crawling

    Case Study:

    Dùng Selenium để lấy dữ liệu từ SSI sau đó tiến hành các bước làm sạch, khai phá dữ liệu

    Chủ đề:

    Big data

    Mục tiêu:

    -Học viên nắm được các khái niệm cơ bản, các thuật ngữ trong big data cũng như Data engineer

    Ứng dụng:

    -Quy trình làm việc của một Data engineer
    -Tìm hiểu một số mô hình hệ thống dữ liệu phổ biến ở Việt Nam

    Case Study:

    Thực hành: Phân tích tác động của Big Data đến ngành tài chính hoặc thương mại điện tử (ví dụ: quản lý rủi ro tín dụng của ngân hàng).

    Chủ đề:

    Hệ sinh thái Hadoop

    Mục tiêu:

    - Học viên tìm hiểu về Hadoop
    - Biết cấp lưu trữ xử lý dữ liệu trên Hadoop

    Ứng dụng:

    - Tổng quan hệ sinh thái Hadoop: HDFS, Hive, HBase, Spark.
    - Hiểu cách hoạt động của MapReduce.
    - Làm việc với HDFS: lưu trữ và truy xuất dữ liệu.
    - Làm việc với HBase: quản lý bảng dữ liệu lớn.

    Case Study:

    Thực hành: Xây dựng và chạy một ứng dụng MapReduce để xử lý dữ liệu logs từ một website thương mại điện tử: shoppee, tiki..

    Chủ đề:

    Apache Spark

    Mục tiêu:

    - Học viên nắm được cách xử lý dữ liệu rất lớn với Apache Spark

    Ứng dụng:

    - Tại sao nên sử dụng Apache Spark?
    - Kiến thức cơ bản về lập trình hàm.
    - Lập trình song song với RDDs (Resilient Distributed Datasets).
    - Phân phối dữ liệu song song trong Spark.

    Case Study:

    Thực hành: Sử dụng PySpark để xử lý và phân tích dữ liệu giao dịch bán hàng của một công ty bán lẻ lớn (case: dữ liệu khách hàng từ chuỗi siêu thị).

    Chủ đề:

    DataFrames và SparkSQL

    Mục tiêu:

    -Học viên nắm được các cú pháp của SparkSQL
    -ứng dụng SparkSQL vào xử lý try vấn dữ liệu

    Ứng dụng:

    - Giới thiệu về DataFrames và SparkSQL.
    - RDDs trong lập trình song song và Spark.
    - Catalyst và Tungsten.
    - Quy trình ETL với DataFrames.
    - Ứng dụng thực tế của SparkSQL.

    Case Study:

    Thực hành: Sử dụng DataFrames để thực hiện ETL dữ liệu khách hàng từ một hệ thống CRM lớn. Truy vấn dữ liệu khách hàng từ một dataset lớn bằng SparkSQL (case: phân tích dữ liệu khách hàng của một ngân hàng).

    Chủ đề:

    PySpark

    Mục tiêu:

    - Tìm hiểu kiến trúc apache spark
    - tối ưu hóa môi trường trong spark

    Ứng dụng:

    - Kiến trúc Apache Spark và các chế độ cụm.
    - Cách chạy ứng dụng Apache Spark và cài đặt cấu hình.
    - Giới thiệu Spark trên Kubernetes.
    - Giao diện người dùng Apache Spark.
    - Giám sát và gỡ lỗi các công việc Spark.
    - Hiểu về tài nguyên bộ nhớ và xử lý.

    Case Study:

    Thực hành: Cấu hình và chạy Spark trên Kubernetes để xử lý một dataset lớn từ cảm biến IoT. Giám sát hiệu suất ứng dụng Spark phân tích logs bán hàng online

    Chủ đề:

    Data Warehouses và Data Lakes

    Mục tiêu:

    - Nắm được kiến trúc Data Warehouses và Data Lakes

    Ứng dụng:

    - Tổng quan về Data Warehouse, Data Marts và Data Lakes.
    - Các hệ thống Data Warehouse phổ biến.
    - Cách lựa chọn hệ thống Data Warehouse.
    - Các khái niệm cơ bản về Data Lakes.

    Case Study:

    Thực hành: Thiết kế kiến trúc Data Warehouse cho một doanh nghiệp thương mại điện tử (case: xây dựng Data Warehouse cho một nền tảng như Lazada).

    Chủ đề:

    Thiết kế và triển khai Data Warehouse

    Mục tiêu:

    -Học viên nắm được cách triển khai một Data Warehouse

    Ứng dụng:

    - Kiến trúc Data Warehouse.
    - Mô hình hóa dữ liệu: Star Schema, Snowflake Schema.
    - Khu vực trung gian (Staging Areas) và xác minh chất lượng dữ liệu.
    - Nạp dữ liệu và truy vấn Data Warehouse.

    Case Study:

    Thực hành: Xây dựng một Star Schema cho hệ thống bán lẻ. Nạp dữ liệu vào Data Warehouse từ một hệ thống nguồn (case: dữ liệu bán hàng của siêu thị).

    Chủ đề:

    Phân tích dữ liệu với Power BI

    Mục tiêu:

    -Học viên nắm được sử dụng power Bi để xây dựng báo cáo về hệ thống

    Ứng dụng:

    - Giới thiệu công cụ BI và phân tích dữ liệu (Power BI).
    - Tạo báo cáo và bảng điều khiển.

    Case Study:

    Thực hành: Sử dụng Power BI để tạo một báo cáo động về báo cáo hiệu suất hoạt động của 1 hệ thống dữ liệu phân tích dữ liệu bán hàng và hiển thị các chỉ số KPI cho doanh nghiệp bán lẻ (case: chuỗi siêu thị).

    Chủ đề:

    Spark ML và Machine Learning

    Mục tiêu:

    - Nắm được về cú pháp Spark ML
    - các thuật toán ML cơ bản

    Ứng dụng:

    - Giới thiệu Spark ML.
    - Các kỹ thuật: hồi quy, phân loại, phân cụm.

    Case Study:

    Thực hành: Xây dựng một mô hình phân loại khách hàng dựa trên dữ liệu hành vi mua sắm (case: phân loại khách hàng VIP của công ty bán lẻ lớn: AMAZONE).

    Chủ đề:

    Dự án cuối khóa

    Mục tiêu:

    Hoàn thành Dự án cuối khóa

    Ứng dụng:

    - Ôn tập và tổng quan dự án.
    - Hướng dẫn làm bài tập cuối khóa

    Case Study:

    Thực hành: Thực hiện dự án hoàn chỉnh: xây dựng hệ thống ETL với Spark, phân tích dữ liệu giao dịch khách hàng, triển khai báo cáo trên Power BI với các chỉ số KPI từ một doanh nghiệp tài chính hoặc bán lẻ.

    Chủ đề:

    Giới thiệu về Điện toán đám mây và AWS

    Mục tiêu:

    -Hiểu khái niệm cơ bản về điện toán đám mây và các mô hình dịch vụ (IaaS, PaaS, SaaS).
    -Phân biệt các mô hình triển khai đám mây (Public, Private, Hybrid).
    -Khám phá vai trò và lợi ích của AWS trong hệ sinh thái công nghệ.
    -Làm quen với AWS Management Console và kiến trúc AWS cơ bản.

    Ứng dụng:

    - Cloud Computing là gì?
    - Các mô hình dịch vụ và triển khai của đám mây
    - AWS dẫn đầu trong lĩnh vực điện toán đám mây như thế nào?
    - Các sản phẩm điện toán đám mây khác nhau được cung cấp bởi AWS
    - Giới thiệu AWS S3, EC2, VPC, EBS, ELB, AMI
    - Kiến trúc AWS và AWS Management Console, Virtualization trong AWS (Xen hypervisor)
    - Auto-scaling là gì?
    - Các best practices EC2 và chi phí liên quan

    Case Study:

    Tìm hiểu các bước: Xây dựng nền tảng thương mại điện tử trên AWS để tối ưu hóa lưu trữ và chi phí cho chuỗi bán lẻ tại Việt Nam.

    Chủ đề:

    Elastic Compute và Storage Volumes

    Mục tiêu:

    -Tìm hiểu AWS EC2 và các loại instances phù hợp cho từng ứng dụng.
    -Thực hành khởi chạy và quản lý EC2 instances.
    -Hiểu cách hoạt động và các loại lưu trữ AWS (EBS, EFS, snapshots).
    -Phân biệt Public IP và Elastic IP.

    Ứng dụng:

    - Giới thiệu về EC2
    - Regions và Availability Zones (AZs)
    - Pre-EC2, các loại EC2 instance
    - So sánh Public IP và Elastic IP
    - Hướng dẫn cách khởi chạy một AWS EC2 instance
    - Giới thiệu AMIs, tạo và sao chép AMI
    - Giới thiệu EBS
    - Các loại EBS volume
    - EBS snapshots
    - Giới thiệu EFS
    - Instance tenancy: Reserved và Spot instances
    - Chi phí và Design Patterns

    Case Study:

    Triển khai EC2 và EBS để vận hành ứng dụng và lưu trữ dữ liệu giao dịch cho startup gọi xe.

    Chủ đề:

    Load Balancing, Autoscaling, và DNS

    Mục tiêu:

    -Hiểu các loại Elastic Load Balancer (Classic, Network, Application).
    -Thực hành cấu hình Auto Scaling để tối ưu hóa hiệu năng và chi phí.
    -Hiểu nguyên tắc hoạt động của DNS và các routing policies trên Route 53.

    Ứng dụng:

    - Giới thiệu Elastic Load Balancer
    - Các loại ELB: Classic, Network, và Application
    - Kiến trúc Load Balancer
    - Cross-zone load balancing
    - Giới thiệu Auto Scaling, scaling dọc và ngang, lifecycle của Auto Scaling
    - Các thành phần Auto Scaling, các lựa chọn và policy, instance termination
    - Sử dụng load balancer với Auto Scaling
    - Pre-Route 53 – Cách hoạt động của DNS
    - Routing policy, các thuật ngữ Route 53, chi phí

    Case Study:

    Sử dụng Auto Scaling và Load Balancer để xử lý lưu lượng truy cập cao vào dịp Tết cho nền tảng đặt vé xem phim.

    Chủ đề:

    Virtual Private Cloud

    Mục tiêu:

    -Hiểu vai trò của VPC trong AWS và cách thiết lập lớp mạng cho EC2.
    -Làm việc với các thành phần của VPC (route tables, internet gateway, NAT).
    -Thực hành bảo mật với Security Groups và NACL.
    -Tìm hiểu về VPC peering và các mô hình thiết kế VPC.

    Ứng dụng:

    - Amazon VPC là gì?
    - VPC như một lớp mạng cho EC2
    - Địa chỉ IP và CIDR notations
    - Các thành phần của VPC: Network interfaces, route tables, internet gateway, NAT
    - Bảo mật trong VPC: Security groups và NACL
    - Các loại VPC, subnet là gì, VPC peering với các kịch bản, VPC endpoints
    - Chi phí và design patterns của VPC

    Case Study:

    Xây dựng môi trường an toàn cho giao dịch trực tuyến của ngân hàng Việt Nam bằng cách sử dụng VPC.

    Chủ đề:

    Storage – Simple Storage Service (S3)

    Mục tiêu:

    -Hiểu cách S3 hỗ trợ lưu trữ dữ liệu phi cấu trúc trên AWS.
    -Làm quen với các tính năng của S3 như phiên bản hóa, lifecycle management, và cross-region replication.
    -Quản lý quyền truy cập và bảo mật dữ liệu trong S3.

    Ứng dụng:

    Giới thiệu về AWS Storage
    - Pre-S3 : Lưu trữ đám mây trực tuyến
    - API, mô hình nhất quán S3 (consistency models)
    - Hệ thống lưu trữ, bucket trong S3
    - Các đối tượng trong S3, metadata và các lớp lưu trữ
    - Phiên bản hóa đối tượng, quản lý vòng đời đối tượng
    - Cross-region replication, mã hóa dữ liệu, kết nối sử dụng VPC endpoint
    - Chi phí S3

    Case Study:

    Lưu trữ và phân phối video sự kiện trên S3

    Chủ đề:

    Amazon RDS, DynamoDB, và Redshift.

    Mục tiêu:

    -Hiểu các loại cơ sở dữ liệu trên AWS và khi nào sử dụng chúng.
    -Tìm hiểu và thực hành với Amazon RDS, DynamoDB, và Redshift.
    -Làm quen với ElastiCache để cải thiện hiệu năng ứng dụng.
    -Phân tích chi phí và lựa chọn thiết kế tối ưu.

    Ứng dụng:

    - Database là gì, các loại cơ sở dữ liệu, cơ sở dữ liệu trên AWS
    - Giới thiệu Amazon RDS
    - Multi-AZ deployments, tính năng của RDS
    - Read replicas trong RDS, Reserved DB instances
    - Chi phí và design patterns của RDS
    - Giới thiệu Amazon Aurora, lợi ích của Aurora, chi phí và design patterns
    - Giới thiệu DynamoDB, các thành phần của DynamoDB, chi phí và design patterns
    - Amazon Redshift là gì, lợi ích của Redshift
    - ElastiCache là gì, tại sao sử dụng ElastiCache?

    Case Study:

    Sử dụng RDS để lưu trữ dữ liệu học viên và ElastiCache để tăng tốc báo cáo tại trung tâm giáo dục.

    Chủ đề:

    CloudFormation

    Mục tiêu:

    -Hiểu và áp dụng Infrastructure-as-a-Code (IaC) với AWS CloudFormation.
    -Làm quen với SNS, SQS, và SES để quản lý thông báo và hàng đợi.
    -Xây dựng các mẫu templates trên CloudFormation.

    Ứng dụng:

    - Giới thiệu CloudFormation
    - Các thành phần của CloudFormation
    - CloudFormation templates
    - Khái niệm Infrastructure-as-a-code
    - Functions và Pseudo parameters
    - Giới thiệu Simple Notification Service (SNS), cách SNS hoạt động
    - Giới thiệu Simple Email Service (SES), cách SES hoạt động
    - Giới thiệu Simple Queue Service (SQS), cách SQS hoạt động

    Case Study:

    Gửi thông báo khuyến mãi và xác nhận đơn hàng qua SNS và SES cho chuỗi siêu thị.

    Chủ đề:

    IAM

    Mục tiêu:

    -Cấu hình IAM để quản lý quyền truy cập và bảo mật tài nguyên AWS.
    -Sử dụng CloudWatch để giám sát tài nguyên, thiết lập cảnh báo và logs.
    -Làm quen với CloudTrail để theo dõi hoạt động API và kiểm tra bảo mật.

    Ứng dụng:

    - Pre-IAM, tại sao cần quản lý truy cập
    - Amazon Resource Name (ARN), các tính năng của IAM
    - Multi-factor Authentication (MFA) trong IAM, JSON
    - Chính sách IAM, quyền hạn IAM, roles IAM, liên kết danh tính (identity federation), chi phí
    - Giới thiệu CloudWatch, metrics và namespaces, kiến trúc CloudWatch, dashboards, alarms, logs, chi phí và design patterns
    - Giới thiệu CloudTrail, theo dõi API usage

    Case Study:

    Quản lý quyền truy cập và giám sát giao dịch qua IAM và CloudWatch cho công ty fintech.

    Chủ đề:

    Lambda OpsWorks Elastic Beanstalk

    Mục tiêu:

    -Triển khai các chức năng serverless với AWS Lambda.
    -Tìm hiểu Elastic Beanstalk và cách tự động hóa triển khai ứng dụng.
    -So sánh CloudFormation và OpsWorks để quản lý hạ tầng.

    Ứng dụng:

    - AWS Lambda là gì?
    - Lambda khác với EC2 như thế nào?
    - Lợi ích và hạn chế của Lambda
    - Lambda hoạt động ra sao?
    - Các use case của Lambda, các khái niệm Lambda
    - Tích hợp S3 với Lambda
    - Elastic Beanstalk là gì, Elastic Beanstalk hoạt động như thế nào?, các khái niệm Elastic Beanstalk, chi phí Elastic Beanstalk
    - Quản lý cấu hình là gì?
    - AWS OpsWorks là gì?, lợi ích của OpsWorks
    - CloudFormation vs OpsWorks, các dịch vụ trong OpsWorks, AWS OpsWorks Stacks, chi phí OpsWorks

    Case Study:

    Tự động hóa xử lý đơn hàng qua Lambda và triển khai ứng dụng nhanh chóng với Beanstalk cho ứng dụng đặt món ăn.

    Chủ đề:

    AWS Migration

    Mục tiêu:

    -Hiểu quy trình và chiến lược di chuyển lên AWS (6R’s).
    -Thực hành di chuyển cơ sở dữ liệu và máy ảo lên AWS.
    -Sử dụng AWS Database Migration Service (DMS) để chuyển đổi dữ liệu.

    Ứng dụng:

    - Cloud Migration là gì?
    - Tại sao di chuyển là quan trọng?
    - Quy trình di chuyển trên AWS, chiến lược di chuyển 6 R’s
    - Di chuyển máy ảo (Virtual Machine Migration), di chuyển một máy ảo cục bộ lên AWS Cloud
    - Di chuyển cơ sở dữ liệu với Database Migration Service (DMS)
    - Di chuyển cơ sở dữ liệu cục bộ lên RDS
    - Di chuyển một máy chủ cơ sở dữ liệu on-premises sang RDS sử dụng DMS, và các dịch vụ di chuyển khác

    Case Study:

    Di chuyển hệ thống ERP lên AWS để giảm chi phí và tăng tính linh hoạt cho doanh nghiệp sản xuất.

Tại sao khóa học tại MCI phù hợp với bạn

1. Lộ trình khóa học thiết kế khoa học, theo quy trình làm việc thực tế giúp bạn tiếp thu và nắm chắc kiến thức theo trình tự khoa học
2. Giáo trình đào tạo theo chuẩn Quốc tế kết hợp giữa lý thuyết và thực hành qua các case study thực tế
3. 100% Giảng viên tại MCI là các chuyên gia tư vấn tại Big4 các tập đoàn lớn tại Việt Nam, có chứng chỉ đào tạo nghiên cứu quốc tế trong lĩnh vực lập trình và dữ liệu
4. Giảng viên hướng dẫn tận tay giúp bạn thành thạo Python, Power BI, SQL trong thời gian ngắn nhất
5. Cam kết chất lượng đào tạo, miễn phí học lại trọn đời nếu chưa nắm rõ kiến thức

Đội ngũ giảng viên


Nguyễn Hữu Minh

- 5 năm kinh nghiệm trong ngành Khoa học dữ liệu và Công nghệ thông tin tại Việt Nam
- Hiện đảm nhân vị trí Data Scientist, AI Researcher tại Công ty PIXTA Vietnam Co. Ltd
- Giải nhất cuộc thi Sinh viên Nghiên cứu Khoa học - Khoa Toán ứng dụng và Hệ thống thông tin
- Kĩ sư Toán và Thông tin tại trường Bách Khoa Hà Nội


Do Duy Nam

- Hơn 22 năm kinh nghiệm trong lĩnh vực Công nghệ thông tin và Dữ liệu lớn
- Nhà khoa học dữ liệu cao cấp Senior Data Specialist tại Công ty Cổ phần VNPAY JSC
- Giám đốc công ty LiveZone Vietnam Consulting JSC, đã ký và quản lý 1 team đa quốc gia vận hành dự án về phân tích kinh doanh (business intelligence) giá trị 1 triệu đô cho Công ty lọc hóa dầu Bình Sơn
- Phó Giám đốc Công ty DSI Vietnam, quản trị dự án Báo cáo, làm việc với PHP, Coldfusion, HTML chart
- Nhà khoa học dữ liệu cao cấp tại ACOM Financial Institute, Nhật Bản
Chứng chỉ:
1. MBA Degree at Gloucestershire Business School (United Kingdom)
2. DA-100: Microsoft Certified: Data Analyst Associate
3. Microsoft Certified Excellence Solution Developer
4. IBM Certified Solution Expert


Lê Văn Mạnh

Fields:
- Giảng viên Data Engineer, Python, SQL và AWS
Experience:
- Senior Data Engineer tại FPT Softwave
- Team Leader về Data Engineer tại F88
Certificate:
- AWS Certified Data Analytics- Specialty
- AWS Certified Database Specialty
- AWS Certified Solutions Architect


Lê Võ Minh Thư

- Tốt nghiệp Thạc sĩ khoa học chuyên ngành Hệ thống thông tin
- Hơn 16 năm kinh nghiệm Quản lý dự án và giảng viên tại các trường đại học. Hiện tại đang làm việc và giảng dạy tại trường đại học FPT