Lợi ích của học viên



  • Tặng miễn phí 01 tài khoản trên Hệ thống quản lý học tập của MCI
  • Được support từ đội ngũ IT và CTO của MCI về công nghệ, dữ liệu lớn và hàng trăm job trên Workspace
  • Tham gia cộng đồng học viên sôi động, chia sẻ và hợp tác cùng hàng ngàn chuyên gia.
  • Nhận chứng chỉ sau khóa học – Ghi nhận kỹ năng và kiến thức đã học.
  • Miễn phí học lại không giới hạn – Luôn cập nhật với xu hướng mới nhất.
DWDL level 1

Big Data with Hadoop and Spark

bla bla

4.9 (485)

Đối tượng

bla bla

Yêu cầu đầu vào

Khóa học cho người mới bắt đầu

Bạn sẽ học những gì

bla bla

Nội dung khóa học

    Chủ đề:

    Setup các platform

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Setup các phần mềm như Python, SQL...
    - Giới thiệu về khóa học và chương trình học

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Sử dụng Python/Hadoop cho việc truy xuất các nguồn dữ liệu

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Truy xuất dữ liệu theo các dạng số liệu liên tục và số liệu rời rạc
    - Cách xử lý số liệu trên Python

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Hadoop và HDFS

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về Hadoop
    - Ứng dụng Hadoop trong việc lấy và lưu trữ dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    PySpark và PySpark Cluster setup

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Giới thiệu về PySpark
    - Ứng dụng PySpark trong việc xử lý dữ liệu
    - Ứng dụng PySpark Cluster trong các trường hợp

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Streaming dữ liệu với Spark

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Ứng dụng xử lý dữ liệu streaming

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Kafka

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Khái niệm cơ bản về Kafka
    - Xử lý dòng dữ liệu thời gian thực
    - Am hiểu tính chất pub/sub và dữ liệu theo thời gian thực

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    ETL

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Sử dụng Python để thực hành quá trình ETL (Extract - Translate - Load) dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    ETL

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Sơ lược những trường hợp của ETL
    - ETL 2 lớp trước và sau Spark

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Thực hành

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Xác định yêu cầu một bài toán cụ thể
    - Thực hiện các bước từ truy xuất dữ liệu thay đổi và chỉnh sửa giao tiếp dữ liệu và lưu trữ dữ liệu

    Case Study:

    2023-05-22 18:57:57.159958

    Chủ đề:

    Bài tập cuối khóa

    Mục tiêu:

    2023-05-22 18:58:23.245054

    Ứng dụng:

    - Bài tập lớn làm theo nhóm

    Case Study:

    2023-05-22 18:57:57.159958

Tại sao khóa học tại MCI phù hợp với bạn

1. Lộ trình khóa học thiết kế khoa học, theo quy trình làm việc thực tế giúp bạn tiếp thu và nắm chắc kiến thức theo trình tự khoa học
2. Giáo trình đào tạo theo chuẩn Quốc tế kết hợp giữa lý thuyết và thực hành qua các case study thực tế
3. 100% Giảng viên tại MCI là các chuyên gia tư vấn tại Big4 các tập đoàn lớn tại Việt Nam, có chứng chỉ đào tạo nghiên cứu quốc tế trong lĩnh vực lập trình và dữ liệu
4. Giảng viên hướng dẫn tận tay giúp bạn thành thạo Python, Power BI, SQL trong thời gian ngắn nhất
5. Cam kết chất lượng đào tạo, miễn phí học lại trọn đời nếu chưa nắm rõ kiến thức

Đội ngũ giảng viên


Do Duy Nam

- Hơn 22 năm kinh nghiệm trong lĩnh vực Công nghệ thông tin và Dữ liệu lớn
- Nhà khoa học dữ liệu cao cấp Senior Data Specialist tại Công ty Cổ phần VNPAY JSC
- Giám đốc công ty LiveZone Vietnam Consulting JSC, đã ký và quản lý 1 team đa quốc gia vận hành dự án về phân tích kinh doanh (business intelligence) giá trị 1 triệu đô cho Công ty lọc hóa dầu Bình Sơn
- Phó Giám đốc Công ty DSI Vietnam, quản trị dự án Báo cáo, làm việc với PHP, Coldfusion, HTML chart
- Nhà khoa học dữ liệu cao cấp tại ACOM Financial Institute, Nhật Bản
Chứng chỉ:
1. MBA Degree at Gloucestershire Business School (United Kingdom)
2. DA-100: Microsoft Certified: Data Analyst Associate
3. Microsoft Certified Excellence Solution Developer
4. IBM Certified Solution Expert


Đặng Lê Khoa

- Chuyên viên cao cấp triển khai và tư vấn Công nghệ Tổng quát tại Hitachi Vantara Việt Nam
- Giảng viên tại CFD-Engineer Việt Nam
- Đảm nhận nhiệm vụ phân tích dữ liệu tại Cộng đồng kĩ sư Việt Nam CFD-Engineer
- Chứng chỉ:
1. Data Manipulation with Python (Advanced, score:166, percentile: 99%)
2. Importing & Cleaning Data with Python (Advanced, score:131, percentile: 85%)
3. Python Programming (Advanced, score:133, percentile: 86%)

Các khóa học liên quan