Lợi ích của học viên



  • Tặng miễn phí 01 tài khoản trên Hệ thống quản lý học tập của MCI
  • Được support từ đội ngũ IT và CTO của MCI về công nghệ, dữ liệu lớn và hàng trăm job trên Workspace
  • Tham gia cộng đồng học viên sôi động, chia sẻ và hợp tác cùng hàng ngàn chuyên gia.
  • Nhận chứng chỉ sau khóa học – Ghi nhận kỹ năng và kiến thức đã học.
  • Miễn phí học lại không giới hạn – Luôn cập nhật với xu hướng mới nhất.
Combo DE Professional

Combo Data Engineering Professional

Với sứ mệnh “Thúc đẩy các quốc gia, tổ chức và cá nhân phát triển nhanh, phát triển toàn diện và phát triển bền vững nhờ vào sức mạnh công nghệ”, MCI đồng hành cùng học viên trang bị kiến thức và kỹ năng để đáp ứng yêu cầu công việc của các vị trí Data Engineer. Chương trình cung cấp cho học viên những kiến thức về thiết kế và xây dựng hệ quản trị cơ sở dữ liệu quan hệ và phi quan hệ, thu thập dữ liệu trên mạng Internet, tự động hóa các quy trình làm việc với dữ liệu (Data Pipelines) thông qua kho dữ liệu (Data Warehouse) và hồ dữ liệu (Data Lake), làm việc với bộ dữ liệu lớn (Big Data) và một phần ứng dụng học máy (Machine Learning) vào các bài toán cần sử dụng dữ liệu lớn, triển khai một hệ thống databricks trên nền tảng AWS.

4.9 (457)

Đối tượng

Các bạn đang học tập và làm việc trong lĩnh vực Data, Software Engineer, có định hướng chuyển sang các vị trí Data Engineer

Yêu cầu đầu vào

Yêu cầu nắm vững kiến thức cơ bản về dữ liệu, cấu trúc dữ liệu, một số công cụ phân tích dữ liệu cơ bản như Python, SQL

Bạn sẽ học những gì

• Sử dụng các công cụ để lấy dữ liệu (batch, real-time: open-source…)
• Lưu trữ dữ liệu: Data warehouse & Data Lake (Hadoop HDFS, CEPH, Hive…)
• Thiết lập được các quy trình giám sát và tự động hóa trên các data pipelines với Apache Airflow
• Tạo & phân chia các layer trong data warehouse/data lake
• Xây dựng được các mô hình dữ liệu có cấu trúc (SQL) & phi cấu trúc (no-SQL)
• Thao tác và làm việc tốt với các kỹ thuật dữ liệu trên Cloud (AWS, Azure)
• Giám sát, kiểm soát chất lượng dữ liệu (data quality), data catalog, data lineage
• Xây dựng công cụ, platform để hỗ trợ cho ML
• Cách kết nối với các visualization tools

Nội dung khóa học

    Chủ đề:

    Setup các platform

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Setup các phần mềm như Python, SQL...
    - Giới thiệu về khóa học và chương trình học

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Sử dụng Python/Hadoop cho việc truy xuất các nguồn dữ liệu

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Truy xuất dữ liệu theo các dạng số liệu liên tục và số liệu rời rạc
    - Cách xử lý số liệu trên Python

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Hadoop và HDFS

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về Hadoop
    - Ứng dụng Hadoop trong việc lấy và lưu trữ dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    PySpark và PySpark Cluster setup

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về PySpark
    - Ứng dụng PySpark trong việc xử lý dữ liệu
    - Ứng dụng PySpark Cluster trong các trường hợp

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Streaming dữ liệu với Spark

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Ứng dụng xử lý dữ liệu streaming

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Kafka

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Khái niệm cơ bản về Kafka
    - Xử lý dòng dữ liệu thời gian thực
    - Am hiểu tính chất pub/sub và dữ liệu theo thời gian thực

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    ETL

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Sử dụng Python để thực hành quá trình ETL (Extract - Translate - Load) dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    ETL

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Sơ lược những trường hợp của ETL
    - ETL 2 lớp trước và sau Spark

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Thực hành

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Xác định yêu cầu một bài toán cụ thể
    - Thực hiện các bước từ truy xuất dữ liệu thay đổi và chỉnh sửa giao tiếp dữ liệu và lưu trữ dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Bài tập cuối khóa

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Bài tập lớn làm theo nhóm

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Ôn tập kiến thức level 1

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Ôn lại những kiến thức đã được học về ETL chuẩn bị cho Data warehouse
    - Cài đặt các phần cần thiết và set up máy

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Data Warehouse & Data Lake (Hive)

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về Kho dữ liệu
    - Ứng dụng ETL để thiết lập nên kho dữ liệu
    - Thiết lập Apache Hive

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Data Warehouse

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Khái niệm ETL trước và sau kho dữ liệu
    - Những thiết lập để lưu trữ dữ liệu hiệu quả
    - Những khái niệm của một kho dữ liệu tiêu chuẩn

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Data Warehouse

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Khái niệm ETL trước và sau kho dữ liệu
    - Những thiết lập để lưu trữ dữ liệu hiệu quả
    - Những khái niệm của một kho dữ liệu tiêu chuẩn

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Apache Airflow

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Khái niệm Apache Airflow
    - Các ứng dụng của Apache Airflow trong việc thiết lập một kho dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Apache Airflow

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Thực hành thiết lập một Flow dât cho Kho dữ liệu bằng Apache AirFlow

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Mô hình dữ liệu SQL và No-SQL

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Mô hình lưu trữ SQL và No-SQL
    - Thiết lập mô hình lưu trữ vào Data warehouse

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Trực quan hóa dữ liệu với Power BI

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Sử dụng PowerBI để cảm quan về Data lưu trữ
    - Thiết lập việc cảm quan lưu lượng lưu trữ cũng như những thứ liên quan để đảm bảo data flow

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Ôn tập kiến thức level 2

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Ôn tập

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Bài tập cuối khóa

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Bài tập cuối khoá 2 và các trường hợp thực tế

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Setup và giới thiệu về AWS

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về AWS
    - Cài đặt những phần cần thiết cho khoá học

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    AWS IAM (Identity and Access Management)

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về IAM
    - Phân quyền các user truy cập vào môi trường
    - Phân quyền cho các môi trường được phép khởi tạo và chạy

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    về Amazon Simple Storage Service (S3)

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về hệ thống lưu trữ của AWS (S3)
    - Khái niệm về lưu trữ trong S3 (bucket, key, object, region)
    - Quy trình sử dụng S3

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    về Amazon Simple Storage Service (S3)

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Những tình huống luu trữ
    - Phương pháp lưu trữ chống mất dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Amazon Elastic Compute Cloud (EC2)

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Tổng quan về mô hình thiết lập của EC2
    - Giới thiệu về Ami chuẩn bị cho thiết lập instance
    - Phương pháp tạo instance

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Amazon Elastic Compute Cloud (EC2)

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Những trường hợp đặc biệt
    - Đề án kết hợp S3 và EC2

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Database AWS

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Định nghĩa và cách hoạt động của Database trên AWS
    - Thiết lập một database trên AWS

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Thực hành về Database

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Thực hành thiết lập một database

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    DNS và Routing

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - DNS, Zone, Route, Route53 của AWS
    - Cách thiết lập Route 53

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    VPC

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - VPC, Subnet, Route Traffic, VPN Connection

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Load Balancer và HA

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Load Balancer
    - Cải thiện khả năng phân bổ lưu lượng

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Thực hành xây dựng hệ thống thực tế và tính chi phí vận hành

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Xây dựng hệ thống thực tế
    - Tính toán chi phí cho hệ thống

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    AWS Application

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Kết nối lại những gì đã học
    - Tích hợp application với những mục tiêu khác

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Monolithic vs Microservice

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Microservice, APIs, Monolithic
    - Thực hành microservieces

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Security

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Những cách giúp bảo mật dữ liệu trên AWS
    - Hệ thống kết hợp bảo mật

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Final test

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    Final test

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Final test

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    Final test

    Case Study:

    2023-05-22 18:57:57.159958

Tại sao khóa học tại MCI phù hợp với bạn

1. Lộ trình khóa học thiết kế khoa học, theo quy trình làm việc thực tế giúp bạn tiếp thu và nắm chắc kiến thức theo trình tự khoa học
2. Giáo trình đào tạo theo chuẩn Quốc tế kết hợp giữa lý thuyết và thực hành qua các case study thực tế
3. 100% Giảng viên tại MCI là các chuyên gia tư vấn tại Big4 các tập đoàn lớn tại Việt Nam, có chứng chỉ đào tạo nghiên cứu quốc tế trong lĩnh vực lập trình và dữ liệu
4. Giảng viên hướng dẫn tận tay giúp bạn thành thạo Python, Power BI, SQL trong thời gian ngắn nhất
5. Cam kết chất lượng đào tạo, miễn phí học lại trọn đời nếu chưa nắm rõ kiến thức

Đội ngũ giảng viên


Nguyễn Võ Đăng Khoa

- Thạc sĩ khoa học máy tính tại Học viện Kĩ thuật Quân sự
- 5 năm kinh nghiệm giảng dạy quản trị dữ liệu, lập trình tại các Trung tâm đào tạo và Tổ chức giáo dục công nghệ lại Việt Nam
- Hơn 11 năm kinh nghiệm trong tổ chức, quản lý và phát triển giáo dục


Nguyễn Hữu Minh

- 5 năm kinh nghiệm trong ngành Khoa học dữ liệu và Công nghệ thông tin tại Việt Nam
- Hiện đảm nhân vị trí Data Scientist, AI Researcher tại Công ty PIXTA Vietnam Co. Ltd
- Giải nhất cuộc thi Sinh viên Nghiên cứu Khoa học - Khoa Toán ứng dụng và Hệ thống thông tin
- Kĩ sư Toán và Thông tin tại trường Bách Khoa Hà Nội


Nguyễn Kim Quang

- Tốt nghiệp Thạc sĩ Tài chính ngân hàng
- Đã đảm nhận các vị trí Kế toán tín dụng, Chuyên viên thẩm định, thư ký Phó TGĐ, chuyên viên phân tích tài chính doanh nghiệp và dự án tại Quỹ đầu tư phát triển Thành phố Hà Nội.
- Hiện tại đang làm ví trí Phân tích tài chính doanh nghiệp và dự án tại Quỹ đầu tư phát triển Thành phố Hà Nội (từ 2008 đến nay)
- Có hơn 14 năm kinh nghiệm trong phân tích tài chính, phân tích dự báo rủi ro, bảo vệ phương án cho các dự án.
- Sử dụng thành thạo các công cụ SQL, Python đặc biệt các libraries phân tích và trực quan hóa dữ liệu, Machine Learning
- CÁC CHỨNG CHỈ
+ IBM Data Science Professional Certificate (IBM)
+ Python 3 Programming Specialization (University of Michigan)
+ SQL advanced certification (HackerRank)
+ STATSX0001: Statistical Learning (Stanford University)
+ Statistics with Python (University of Michigan)


Nguyen An

- Cử nhân CNTT trường ĐH Bách Khoa HCM, hiện tại đang theo học Thạc sĩ Khoa học máy tính
- Kinh nghiệm làm việc hơn 10 năm, hiện tại đang làm Data Engineer tại FPT Retail
- Kinh nghiệm 7 năm giảng dạy về Python, C/C++, Word, Excel, Powerpoint. Hiện tại đang giảng dạy bộ môn Data Engineer tại MCI
Certificate:
- IBM Data Engineer (Professional Certificate)
- Data Engineer (Career Path) - DataQuest


Lê Văn Mạnh

Fields:
- Giảng viên Data Engineer, Python, SQL và AWS
Experience:
- Senior Data Engineer tại FPT Softwave
- Team Leader về Data Engineer tại F88
Certificate:
- AWS Certified Data Analytics- Specialty
- AWS Certified Database Specialty
- AWS Certified Solutions Architect