Lịch học dự kiến diễn ra
Lớp: | DWDL LEVEL 1 |
---|---|
Địa điểm: | 59 Cao Thắng, Quận 3, HCM |
Thời gian học: | Thứ 2 - 19H00 - 21H30 & Thứ 6 - 19H00 - 21H30 |
Lịch khai giảng: | Jan. 3, 2025 |
Thời gian kết thúc: | Feb. 3, 2025 |
Giảng viên dự kiến: | None |
Lớp: | PYTHON LEVEL 1 |
---|---|
Địa điểm: | Tầng 5, Tòa nhà Star City, 23 Lê Văn Lương, HN |
Thời gian học: | Thứ 5 - 19H00 - 21H30 & Thứ 7 - 19H00 - 21H30 |
Lịch khai giảng: | Dec. 26, 2024 |
Thời gian kết thúc: | Jan. 25, 2025 |
Giảng viên dự kiến: | Khuongvd_SQL |
Lớp: | SQL LEVEL 1 |
---|---|
Địa điểm: | 59 Cao Thắng, Quận 3, HCM |
Thời gian học: | Thứ 5 - 19H00 - 21H30 & Chủ nhật - 19H00 - 21H30 |
Lịch khai giảng: | Dec. 29, 2024 |
Thời gian kết thúc: | Jan. 26, 2025 |
Giảng viên dự kiến: | Cuongnm_PBI |
Lớp: | SQL LEVEL 1 |
---|---|
Địa điểm: | Tầng 5, Tòa nhà Star City, 23 Lê Văn Lương, HN |
Thời gian học: | Thứ 3 - 19H00 - 21H30 & Thứ 5 - 19H00 - 21H30 |
Lịch khai giảng: | Dec. 31, 2024 |
Thời gian kết thúc: | Jan. 28, 2025 |
Giảng viên dự kiến: | None |
Lớp: | SQL LEVEL 2 |
---|---|
Địa điểm: | 59 Cao Thắng, Quận 3, HCM |
Thời gian học: | Thứ 3 - 19H00 - 21H30 & Thứ 7 - 19H00 - 21H30 |
Lịch khai giảng: | Dec. 28, 2024 |
Thời gian kết thúc: | Jan. 21, 2025 |
Giảng viên dự kiến: | Baottb_SQL |
Lớp: | SQL LEVEL 2 |
---|---|
Địa điểm: | Tầng 5, Tòa nhà Star City, 23 Lê Văn Lương, HN |
Thời gian học: | Thứ 3 - 19H00 - 21H30 & Thứ 6 - 19H00 - 21H30 |
Lịch khai giảng: | Jan. 3, 2025 |
Thời gian kết thúc: | Jan. 28, 2025 |
Giảng viên dự kiến: | Tuanta_SQL |
Data Engineer Track
Đây là chương trình đào tạo full skill về Data Engineer giúp học viên nắm vững mọi kỹ năng cần thiết để thành công trong lĩnh vực kỹ thuật dữ liệu
Hình thức đào tạo online và offline trong thời lượng 64 buổi học, mỗi buổi học từ 2.5 - 3 tiếng
Tên 07 khóa học nhỏ trong chương trình Data Engineer Track gồm:
1. SQL for Newbies: Data Analysis for Beginners (SQL Level 1) với 09 buổi học
2. Database and SQL for Data Science (SQL Level 2) với 08 buổi học
3. Python Foundation in Data Analytics (Python Level 1) với 10 buổi học
4. Big Data with Hadoop and Spark (DWDL Level 1) với 10 buổi học
5. Advanced Data Lakes and Data Warehouses (DWDL Level 2) với 10 buổi học
6. AWS Data Engineer for Beginners (AWS Level 1) với 08 buổi học
7. AWS Data Engineer for Beginners (AWS Level 2) với 09 buổi học
Cơ hội nghề nghiệp nổi bật sau khi tốt nghiệp chương trình đào tạo này là các vị trí hot sau:
• Data Analyst
• Data Engineer
• SQL Developer
• ETL Developer
• Data Analyst
• Big Data Engineer
• Cloud Data Engineer
• BI Developer
• Machine Learning Engineer
Đối tượng
Các bạn đang học tập và làm việc trong lĩnh vực Data, Software Engineer, có định hướng chuyển sang các vị trí Data EngineerYêu cầu đầu vào
Khóa học cho người mới bắt đầuBạn sẽ học những gì
• Nắm vững SQL để truy vấn, quản lý và tối ưu hóa dữ liệu, cải thiện hiệu suất.• Thành thạo sử dụng các thư viện Python như Pandas và NumPy để xử lý, phân tích và làm sạch dữ liệu, cùng với lập trình hướng đối tượng để quản lý dữ liệu phức tạp.
• Hiểu sự khác biệt giữa Data Warehouse và Data Lake, và có khả năng thiết kế và triển khai các mô hình dữ liệu cũng như quản lý dữ liệu lớn.
• Biết cách triển khai và quản lý các dịch vụ AWS như S3, EC2, RDS, và Redshift, cùng với việc sử dụng AWS Lambda cho xử lý dữ liệu không đồng bộ.
• Có khả năng sử dụng các công cụ ETL để chuyển đổi và tải dữ liệu vào Data Warehouse/Data Lake, cùng với tối ưu hóa lưu trữ và truy vấn dữ liệu lớn.
• Hiểu và áp dụng các nguyên tắc bảo mật trên AWS: Học viên sẽ thiết lập các chính sách bảo mật và quyền truy cập cho các dịch vụ AWS, bảo đảm an toàn dữ liệu và tuân thủ các nguyên tắc bảo mật.
• Phát triển kỹ năng giải quyết vấn đề và tối ưu hóa quy trình: Học viên sẽ có khả năng áp dụng các kỹ thuật và công cụ học được để giải quyết vấn đề và tối ưu hóa quy trình xử lý dữ liệu trong môi trường thực tế.
Nội dung khóa học
- Buổi 1: Tổng quan về SQL
- Buổi 2: Các lệnh tương tác và truy vấn dữ liệu
- Buổi 3: Ghép nối bảng
- Buổi 4: Các hàm xử lý dữ liệu
- Buổi 5: Phương pháp truy vấn dữ liệu trên các bảng phụ
- Buổi 6: Thống kê bảng dữ liệu và chủ đề về ranking
- Buổi 7: Các lệnh thêm, sửa, xóa dữ liệu trong bảng
- Buổi 8: Tối ưu CSDL và kết nối đến các phần mềm trực quan hóa và trình bày báo cáo
- Buổi 9: Tổng kết khoá học Level 1
- Buổi 10: Review SQL Level 1 và làm quen với thủ tục lưu trữ và biến trong SQL
- Buổi 11: Xử lý dữ liệu với hàm Scalar, điều kiện và vòng lặp
- Buổi 12: Xóa, cập nhật và thêm dữ liệu trong SQL
- Buổi 13: Quan hệ bảng, Transaction và bảng tạm trong SQL
- Buổi 14: Trigger và ứng dụng trong SQL Server
- Buổi 15: Dynamic SQL, Businesses Intelligence
- Buổi 16: Pivot và Unpivot
- Buổi 17: Review kiến thức, bài tập nhóm và đánh giá cá nhân
- Buổi 18: Làm quen với Python
- Buổi 19: Python Basic
- Buổi 20: Python Basic (Tiếp)
- Buổi 21: Numpy
- Buổi 22: Pandas: Data Loading, Storage, and File Formats; Data Cleaning and Preparation
- Buổi 23: Pandas nâng cao
- Buổi 24: Pandas: Time Series
- Buổi 25: Trực quan hóa dữ liệu
- Buổi 26: Phân tích dữ liệu thăm dò (EDA)
- Buổi 27: Web crawling using selenium and Python & Capstone
- Buổi 28: Setup các platform & giới thiệu về khóa học
- Buổi 29: Sử dụng Python/Hadoop cho việc truy xuất các nguồn dữ liệu
- Buổi 30: Giới thiệu về Hadoop và HDFS
- Buổi 31: Giới thiệu về PySpark và PySpark Cluster setup
- Buổi 32: Streaming dữ liệu với Spark
- Buổi 33: Giới thiệu về Kafka và thực hành
- Buổi 34: Giới thiệu về ETL
- Buổi 35: Thực hành ETL
- Buổi 36: Thực hành cơ bản một trường hợp dữ liệu cụ thể
- Buổi 37: Bài tập cuối khóa
- Buổi 38: Ôn lại kiến thức Khóa 1 & chuẩn bị các phần mềm cần thiết
- Buổi 39: Giới thiệu về Data Warehouse & Data Lake (Hive)
- Buổi 40: Thực hành về Data Warehouse (phần 1)
- Buổi 41: Thực hành về Data Warehouse (phần 2)
- Buổi 42: Giới thiệu và bước đầu thực hành về Apache Airflow (phần 1)
- Buổi 43: Thực hành về Apache Airflow (phần 2)
- Buổi 44: Mô hình dữ liệu SQL và No-SQL
- Buổi 45: Trực quan hóa dữ liệu với Power BI
- Buổi 46: Ôn tập kiến thức đã học (tiết dự trữ)
- Buổi 47: Bài tập cuối khóa (bài tập nhóm trước khi làm bài cuối 2 khóa)
- Buổi 48: Setup và giới thiệu về AWS (trong đó có giới thiệu về các chứng chỉ của AWS trong thực tế)
- Buổi 49: Giới thiệu và thực hành về AWS IAM (Identity and Access Management)
- Buổi 50: Giới thiệu về Amazon Simple Storage Service (S3)
- Buổi 51: Thực hành về Amazon Simple Storage Service (S3)
- Buổi 52: Giới thiệu về Amazon Elastic Compute Cloud (EC2)
- Buổi 53: Thực hành về Amazon Elastic Compute Cloud (EC2)
- Buổi 54: Giới thiệu về Database AWS
- Buổi 55: Thực hành về Database
- Buổi 56: Giới thiệu và thực hành về DNS và Routing
- Buổi 57: Giới thiệu và thực hành về VPC
- Buổi 58: Giới thiệu và thực hành về Load Balancer và HA
- Buổi 59: Thực hành xây dựng hệ thống thực tế và tính chi phí vận hành
- Buổi 60: AWS Application
- Buổi 61: Giới thiệu và thực hành về Monolithic vs Microservice
- Buổi 62: Security
- Buổi 63: Final test và chia sẻ các case study thực tế của Giảng viên (phần 1)
- Buổi 64: Final test và chia sẻ các case study thực tế của Giảng viên (phần 2)
Giới thiệu SQL Server
Các lệnh mô tả bảng, dữ liệu (DDL - Data Definition Language)
- Hiểu tổng quan về SQL và các đối tượng chính trong cơ sở dữ liệu.
- Biết cách tạo, xóa cơ sở dữ liệu và bảng.
- Nắm vững cách thay đổi cấu trúc bảng và nhập dữ liệu vào cơ sở dữ liệu.
- Tổng quan về SQL
- Giới thiệu các đối tượng chính trong CSDL
- Các kiểu dữ liệu
- Tạo, xóa cơ sở dữ liệu
- Tạo, xóa bảng cơ sở dữ liệu
- Thay đổi cấu trúc bảng (thêm cột, xóa cột, đổi kiểu dữ liệu)
- Importing data
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
- Các lệnh tương tác với bảng, dữ liệu (DML - Data Manipulation Language)
- Các lệnh truy vấn dữ liệu
- Hiểu cấu trúc câu truy vấn cơ bản và cách chọn cột trong SQL.
- Biết cách lọc hàng, sử dụng các hàm tổng hợp và sắp xếp, nhóm dữ liệu.
- Nắm vững cách sử dụng các câu lệnh SQL khác như comment, alias, phép toán số học, và giới hạn kết quả.
- SQL Basic Query Structure
- Selecting columns
- Filtering rows
- Aggregate Functions (sum, avg, max, min...) - Sorting and grouping
- Having Clause
- Ohters (SQL Comments, Alias, Arithmetic Operators, Limit Your Results ...)
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Ghép nối bảng
Mục tiêu:- Hiểu các khái niệm về ghép nối bảng trong SQL.
- Biết cách sử dụng các loại join (Left join, Right join, Inner join, Full outer join).
- Nắm vững cách sử dụng Union và Union All để kết hợp dữ liệu từ nhiều bảng.
- Left join, Right join, Inner join, Full outer join
- Union and union all
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Các hàm xử lý dữ liệu
Mục tiêu:- Hiểu và sử dụng các hàm xử lý chuỗi trong SQL.
- Hiểu và sử dụng các hàm xử lý thời gian trong SQL.
- Hiểu và sử dụng các hàm chuyển đổi dữ liệu trong SQL.
- Nắm vững cách sử dụng hàm Case When để xử lý các điều kiện phức tạp.
- Các hàm xử lý chuỗi
- Các hàm xử lý thời gian
- Các hàm chuyển đổi
- Hàm case when
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Phương pháp truy vấn dữ liệu trên các bảng phụ
Mục tiêu:- Hiểu và sử dụng phương pháp Subquery trong SQL.
- Hiểu và sử dụng Common Table Expressions (CTE) trong SQL.
- Nắm vững cách sử dụng bảng tạm để xử lý dữ liệu phức tạp.
- Phương pháp sử dụng Subquery
- Phương pháp sử dụng CTE
- Phương pháp sử dụng bảng tạm
Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Thống kê bảng dữ liệu và chủ đề về ranking
Mục tiêu:- Hiểu và áp dụng phương pháp Pivot Table để thống kê dữ liệu.
- Sử dụng các phương pháp phân tích và ranking để lấy top cao nhất, top thấp nhất theo các yêu cầu cụ thể.
- Phương pháp Pivot table
- Phương pháp phân tích, ranking lấy top cao nhất, top thấp nhất theo các yêu cầu cụ thể.
- Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Các lệnh thêm, sửa, xóa dữ liệu trong bảng
Mục tiêu:- Hiểu và sử dụng các câu lệnh chèn dữ liệu INSERT.
- Biết cách cập nhật dữ liệu bằng câu lệnh UPDATE.
- Hiểu và sử dụng câu lệnh xóa dữ liệu DELETE.
- Nắm vững cách cập nhật dữ liệu có ràng buộc.
- Câu lệnh chèn dữ liệu INSERT
- Câu lệnh cập nhật dữ liệu UPDATE
- Câu lệnh xóa dữ liệu DELETE
- Cập nhật dữ liệu có ràng buộc
- Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
- Tối ưu CSDL
- Kết nối đến các phần mềm trực quan hóa và trình bày report
- Hiểu các khái niệm khóa chính (Primary key), khóa ngoại (Foreign key), và chỉ mục (Index).
- Biết cách kết nối dữ liệu từ SQL Server tới Excel, Power BI, và Python.
- Nắm vững cách tự động hóa báo cáo với Power BI và Excel.
- Khóa chính (Primary key), Khóa ngoài ( Foreign key), Chỉ mục (Index)
- Kết nối data từ SQL Server tới Excel, Power BI, Python.
- Tự động hóa reporting với Power BI, Excel
- Xây dựng cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Tổng kết khoá học Level 1
Mục tiêu:- Ôn tập và review toàn bộ kiến thức đã học.
- Hướng dẫn cách tra cứu Google khi sử dụng SQL trong các hệ quản trị cơ sở dữ liệu như PostgreSQL, MySQL, ...
- Review toàn bộ kiến thức
- Hướng dẫn cách tra cứu Google khi sử dụng SQL trong các hệ quản trị CSDL như Postgre SQL, My SQL, ...
Thực hành cuối khoá
- Thủ tục lưu trữ (stored procedures)
- Các biến trong SQL
- Tham số và các giá trị trả về
- Kiến thức chung và thực hành
Ứng dụng:- Quản trị dữ liệu lớn như quản lý nhân sự hay quản lý bán hàng...
Case Study:- Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Xử lý dữ liệu với hàm Scalar, điều kiện và vòng lặp
Mục tiêu:- Hiểu và sử dụng các hàm Scalar, điều kiện kiểm tra IF/ELSE và CASE.
- Nắm vững cấu trúc vòng lặp và mệnh đề WHILE.
- Hàm Scalar
- Điều kiện kiểm tra - mệnh đề IF/ELSE, CASE
- Cấu trúc vòng lặp và mệnh đề WHILE
- Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
- Lệnh xóa trong SQL
- Cập nhật dữ liệu trong SQL
- Chèn dữ liệu
- Quản trị và phân tích dữ liệu
Ứng dụng:- Phân tích dữ liệu, liên kết các dữ liệu
- Phương pháp logic trong việc tạo báo cáo khoa học
- Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Quan hệ bảng, Transaction và bảng tạm trong SQL
Mục tiêu:- Hiểu và tạo được quan hệ trong bảng, chỉ mục INDEX.
- Biết cách thực hiện và quản lý giao dịch (Transaction) trong SQL.
- Nắm vững cách sử dụng bảng tạm (Temporary Tables) và biến kiểu bảng.
- Tạo quan hệ trong bảng và chỉ mục INDEX
- Giao dịch Transaction trong SQL
- Bảng tạm Temporary Tables và biến kiểu bảng
- Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Trigger và ứng dụng trong SQL Server
Mục tiêu:- Hiểu khái niệm và cách sử dụng Trigger trong SQL Server.
- Ứng dụng Trigger để tự động hóa các tác vụ quản lý dữ liệu.
- Ưu nhược điểm Trigger
- Khởi taọ Trigger
- Thực hành Trigger
- Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
- Thao tác con trỏ (cursors)
- Gỡ lỗi câu lệnh
- Chuỗi lệnh SQL động
- Kiến thức chung và thực hành
Ứng dụng:- Duyệt qua từng dòng dữ liệu của một bảng để thao tác với chúng.
- Gỡ lỗi những procedures có nhiều câu lệnh phức tạp
- Phân tích kết quả tìm kiếm với nhiều tham số đầu vào khác nhau sẽ tạo nhiều câu lệnh SQL khác nhau
- Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Pivot và Unpivot
Mục tiêu:- Kiến thức chung và thực hành
Ứng dụng:- Khái niệm và ứng dụng của Pivot và Unpivot
- Sự khác biệt giữa Pivot và Unpivot
- Cú pháp và cách sử dụng câu lệnh PIVOT, UNPIVOT
- Các ví dụ minh họa chuyển đổi hàng thành cột, cột thành hàng
- Ứng dụng Pivot để tổng hợp dữ liệu và Unpivot để phân tích dữ liệu
- Quản trị cơ sở dữ liệu trong ngành ngân hàng, bảo hiểm và thương mại điện tử...
Tổng kết
Mục tiêu:- Kiểm tra lại các nội dung đã học
Ứng dụng:Review kiến thức, bài tập nhóm và đánh giá cá nhân
Case Study:Kiểm tra
Giới thiệu về khóa học và khởi động với python
Mục tiêu:- Nắm được 1 framework phân tích dữ liệu
- Làm quen với Google Colab
- Làm quen với Markdown
- Biết ngôn ngữ lập trình python là gì, và một số lý do tại sao python phổ biến
- Biết được cấu trúc cú pháp cơ bản trong python (Language Semantic)
Phân tích dữ liệu lớn (Big Data)
Case Study:Ôn tập python basic
Python Basic
Mục tiêu:Nắm được kiến thức:
- Một số kiểu dữ liệu của Python;
- Các phép toán tử;
- Các kiểu dữ liệu dạng chuỗi;
- Các cấu trúc điều khiển trong Python
Phân tích dữ liệu lớn (Big Data)
Case Study:Ôn tập cú pháp Python
Python Basic (Tiếp)
Mục tiêu:Nắm được kiến thức:
- Một số hàm cơ bản: pass, range, zip, enumerate, sorted;
- List, set, Dict comprehension
- Cách tạo ra hàm
- Các xử lý lỗi trong Python
Phân tích dữ liệu lớn (Big Data)
Case Study:Bài tập về nhà về cấu trúc mảng
Numpy
Mục tiêu:Nắm được cách xử lý mảng dữ liệu
Ứng dụng:Phân tích dữ liệu lớn (Big Data)
Case Study:Bài tập mảng một chiều mảng 2 chiều
Pandas
Mục tiêu:Nắm được cách trích xuất, làm sạch và xử lý dữ liệu trống
Ứng dụng:Làm sạch dữ liệu
Case Study:Bài tập về nhà
Pandas: Data Wrangling: Join, Combine, and Reshape
Mục tiêu:Nắm được các kỹ thuật xử lý cấu trúc dữ liệu
Ứng dụng:Làm sạch dữ liệu
Case Study:Bài tập về nhà: Cleaning data
Pandas: Time Series
Mục tiêu:Hiểu được về dữ liệu thời gian, cách xử lý dữ liệu thời gian
Ứng dụng:Time Series
Case Study:Xử lý dữ liệu chứng khoán
Trực quan hóa dữ liệu
Mục tiêu:- Nắm được kỹ thuật vẽ các biểu đồ cơ bản
- Cách thêm các thành phân trong biểu đồ
- Kỹ thuật vẽ multiple plot
- Một số kỹ năng quan trọng trong trực quan hóa dữ liệu
Data Visualization
Case Study:Trực quan hóa dữ liệu phân tích doanh thu
Phân tích dữ liệu thăm dò (EDA)
Mục tiêu:- Nắm được kỹ thuật khai phá dữ liệu
- Sử dụng các công cụ đã học để phân tích khai phá dữ liệu
EDA
Case Study:Phân tích EDA bộ dữ liệu IT salary
- Web Crawling Using Selenium
- Capstone
Học viên nắm được kỹ thuật Web Crawling
Ứng dụng:Web Crawling
Case Study:Dùng Selenium để lấy dữ liệu từ SSI sau đó tiến hành các bước làm sạch, khai phá dữ liệu
Setup các platform
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Setup các phần mềm như Python, SQL...
- Giới thiệu về khóa học và chương trình học
2023-05-22 18:57:57.159958
Sử dụng Python/Hadoop cho việc truy xuất các nguồn dữ liệu
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Truy xuất dữ liệu theo các dạng số liệu liên tục và số liệu rời rạc
- Cách xử lý số liệu trên Python
2023-05-22 18:57:57.159958
Hadoop và HDFS
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Giới thiệu về Hadoop
- Ứng dụng Hadoop trong việc lấy và lưu trữ dữ liệu
2023-05-22 18:57:57.159958
PySpark và PySpark Cluster setup
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Giới thiệu về PySpark
- Ứng dụng PySpark trong việc xử lý dữ liệu
- Ứng dụng PySpark Cluster trong các trường hợp
2023-05-22 18:57:57.159958
Streaming dữ liệu với Spark
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Ứng dụng xử lý dữ liệu streaming
Case Study:2023-05-22 18:57:57.159958
Kafka
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Khái niệm cơ bản về Kafka
- Xử lý dòng dữ liệu thời gian thực
- Am hiểu tính chất pub/sub và dữ liệu theo thời gian thực
2023-05-22 18:57:57.159958
ETL
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Sử dụng Python để thực hành quá trình ETL (Extract - Translate - Load) dữ liệu
Case Study:2023-05-22 18:57:57.159958
ETL
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Sơ lược những trường hợp của ETL
- ETL 2 lớp trước và sau Spark
2023-05-22 18:57:57.159958
Thực hành
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Xác định yêu cầu một bài toán cụ thể
- Thực hiện các bước từ truy xuất dữ liệu thay đổi và chỉnh sửa giao tiếp dữ liệu và lưu trữ dữ liệu
2023-05-22 18:57:57.159958
Bài tập cuối khóa
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Bài tập lớn làm theo nhóm
Case Study:2023-05-22 18:57:57.159958
Ôn tập kiến thức level 1
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Ôn lại những kiến thức đã được học về ETL chuẩn bị cho Data warehouse
- Cài đặt các phần cần thiết và set up máy
2023-05-22 18:57:57.159958
Data Warehouse & Data Lake (Hive)
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Giới thiệu về Kho dữ liệu
- Ứng dụng ETL để thiết lập nên kho dữ liệu
- Thiết lập Apache Hive
2023-05-22 18:57:57.159958
Data Warehouse
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Khái niệm ETL trước và sau kho dữ liệu
- Những thiết lập để lưu trữ dữ liệu hiệu quả
- Những khái niệm của một kho dữ liệu tiêu chuẩn
2023-05-22 18:57:57.159958
Data Warehouse
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Khái niệm ETL trước và sau kho dữ liệu
- Những thiết lập để lưu trữ dữ liệu hiệu quả
- Những khái niệm của một kho dữ liệu tiêu chuẩn
2023-05-22 18:57:57.159958
Apache Airflow
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Khái niệm Apache Airflow
- Các ứng dụng của Apache Airflow trong việc thiết lập một kho dữ liệu
2023-05-22 18:57:57.159958
Apache Airflow
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Thực hành thiết lập một Flow dât cho Kho dữ liệu bằng Apache AirFlow
Case Study:2023-05-22 18:57:57.159958
Mô hình dữ liệu SQL và No-SQL
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Mô hình lưu trữ SQL và No-SQL
- Thiết lập mô hình lưu trữ vào Data warehouse
2023-05-22 18:57:57.159958
Trực quan hóa dữ liệu với Power BI
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Sử dụng PowerBI để cảm quan về Data lưu trữ
- Thiết lập việc cảm quan lưu lượng lưu trữ cũng như những thứ liên quan để đảm bảo data flow
2023-05-22 18:57:57.159958
Ôn tập kiến thức level 2
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Ôn tập
Case Study:2023-05-22 18:57:57.159958
Bài tập cuối khóa
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Bài tập cuối khoá 2 và các trường hợp thực tế
Case Study:2023-05-22 18:57:57.159958
Setup và giới thiệu về AWS
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Giới thiệu về AWS
- Cài đặt những phần cần thiết cho khoá học
2023-05-22 18:57:57.159958
AWS IAM (Identity and Access Management)
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Giới thiệu về IAM
- Phân quyền các user truy cập vào môi trường
- Phân quyền cho các môi trường được phép khởi tạo và chạy
2023-05-22 18:57:57.159958
về Amazon Simple Storage Service (S3)
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Giới thiệu về hệ thống lưu trữ của AWS (S3)
- Khái niệm về lưu trữ trong S3 (bucket, key, object, region)
- Quy trình sử dụng S3
2023-05-22 18:57:57.159958
về Amazon Simple Storage Service (S3)
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Những tình huống luu trữ
- Phương pháp lưu trữ chống mất dữ liệu
2023-05-22 18:57:57.159958
Amazon Elastic Compute Cloud (EC2)
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Tổng quan về mô hình thiết lập của EC2
- Giới thiệu về Ami chuẩn bị cho thiết lập instance
- Phương pháp tạo instance
2023-05-22 18:57:57.159958
Amazon Elastic Compute Cloud (EC2)
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Những trường hợp đặc biệt
- Đề án kết hợp S3 và EC2
2023-05-22 18:57:57.159958
Database AWS
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Định nghĩa và cách hoạt động của Database trên AWS
- Thiết lập một database trên AWS
2023-05-22 18:57:57.159958
Thực hành về Database
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Thực hành thiết lập một database
Case Study:2023-05-22 18:57:57.159958
DNS và Routing
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- DNS, Zone, Route, Route53 của AWS
- Cách thiết lập Route 53
2023-05-22 18:57:57.159958
VPC
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- VPC, Subnet, Route Traffic, VPN Connection
Case Study:2023-05-22 18:57:57.159958
Load Balancer và HA
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Load Balancer
- Cải thiện khả năng phân bổ lưu lượng
2023-05-22 18:57:57.159958
Thực hành xây dựng hệ thống thực tế và tính chi phí vận hành
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Xây dựng hệ thống thực tế
- Tính toán chi phí cho hệ thống
2023-05-22 18:57:57.159958
AWS Application
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Kết nối lại những gì đã học
- Tích hợp application với những mục tiêu khác
2023-05-22 18:57:57.159958
Monolithic vs Microservice
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Microservice, APIs, Monolithic
- Thực hành microservieces
2023-05-22 18:57:57.159958
Security
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:- Những cách giúp bảo mật dữ liệu trên AWS
- Hệ thống kết hợp bảo mật
2023-05-22 18:57:57.159958
Final test
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:Final test
Case Study:2023-05-22 18:57:57.159958
Final test
Mục tiêu:2023-05-22 18:58:23.245054
Ứng dụng:Final test
Case Study:2023-05-22 18:57:57.159958
Tại sao khóa học tại MCI phù hợp với bạn
1. Lộ trình khóa học thiết kế khoa học, theo quy trình làm việc thực tế giúp bạn tiếp thu và nắm chắc kiến thức theo trình tự khoa học2. Giáo trình đào tạo theo chuẩn Quốc tế kết hợp giữa lý thuyết và thực hành qua các case study thực tế
3. 100% Giảng viên tại MCI là các chuyên gia tư vấn tại Big4 các tập đoàn lớn tại Việt Nam, có chứng chỉ đào tạo nghiên cứu quốc tế trong lĩnh vực lập trình và dữ liệu
4. Giảng viên hướng dẫn tận tay giúp bạn thành thạo Python, Power BI, SQL trong thời gian ngắn nhất
5. Cam kết chất lượng đào tạo, miễn phí học lại trọn đời nếu chưa nắm rõ kiến thức
Đội ngũ giảng viên
Nguyễn Hữu Minh
- 5 năm kinh nghiệm trong ngành Khoa học dữ liệu và Công nghệ thông tin tại Việt Nam
- Hiện đảm nhân vị trí Data Scientist, AI Researcher tại Công ty PIXTA Vietnam Co. Ltd
- Giải nhất cuộc thi Sinh viên Nghiên cứu Khoa học - Khoa Toán ứng dụng và Hệ thống thông tin
- Kĩ sư Toán và Thông tin tại trường Bách Khoa Hà Nội
Do Duy Nam
- Hơn 22 năm kinh nghiệm trong lĩnh vực Công nghệ thông tin và Dữ liệu lớn
- Nhà khoa học dữ liệu cao cấp Senior Data Specialist tại Công ty Cổ phần VNPAY JSC
- Giám đốc công ty LiveZone Vietnam Consulting JSC, đã ký và quản lý 1 team đa quốc gia vận hành dự án về phân tích kinh doanh (business intelligence) giá trị 1 triệu đô cho Công ty lọc hóa dầu Bình Sơn
- Phó Giám đốc Công ty DSI Vietnam, quản trị dự án Báo cáo, làm việc với PHP, Coldfusion, HTML chart
- Nhà khoa học dữ liệu cao cấp tại ACOM Financial Institute, Nhật Bản
Chứng chỉ:
1. MBA Degree at Gloucestershire Business School (United Kingdom)
2. DA-100: Microsoft Certified: Data Analyst Associate
3. Microsoft Certified Excellence Solution Developer
4. IBM Certified Solution Expert
Lê Văn Mạnh
Fields:
- Giảng viên Data Engineer, Python, SQL và AWS
Experience:
- Senior Data Engineer tại FPT Softwave
- Team Leader về Data Engineer tại F88
Certificate:
- AWS Certified Data Analytics- Specialty
- AWS Certified Database Specialty
- AWS Certified Solutions Architect
Lê Võ Minh Thư
- Tốt nghiệp Thạc sĩ khoa học chuyên ngành Hệ thống thông tin
- Hơn 16 năm kinh nghiệm Quản lý dự án và giảng viên tại các trường đại học. Hiện tại đang làm việc và giảng dạy tại trường đại học FPT