Lịch học dự kiến diễn ra
Lớp: | PYTHON LEVEL 1 |
---|---|
Địa điểm: | Tầng 5, Tòa nhà Star City, 23 Lê Văn Lương, HN |
Thời gian học: | Thứ 5 - 19H00 - 21H30 & Thứ 7 - 19H00 - 21H30 |
Lịch khai giảng: | Dec. 26, 2024 |
Thời gian kết thúc: | Jan. 25, 2025 |
Giảng viên dự kiến: | Khuongvd_SQL |
Python Foundation in Data Analytics
Đây là 1 khóa học Python từ cơ bản đến nâng cao, ứng dụng trong phân tích dữ liệu lớn (Big Data Analyst) và quản trị rủi ro kinh doanh. Hình thức đào tạo online và offline trong thời lượng 10 buổi học, mỗi buổi học từ 2.5 - 3 tiếng.
Tên khóa học: Python Foundation in Data Analytics (Python Level 1)
Cơ hội nghề nghiệp nổi bật sau khi tốt nghiệp khóa học này là các vị trí:
• Data Analyst (Chuyên viên Phân tích Dữ liệu)
• Machine Learning (ML) Engineer (Kĩ sư Học máy)
• Artificial Intelligence (AI) Engineer (Kĩ sư Trí tuệ Nhân tạo)
• Data Scientist (Nhà Khoa học Dữ liệu)
Đối tượng
• Sinh viên khối kinh tế, kĩ thuật có định hướng tham gia ngành Data Science, Data Analytics đang bắt đầu tìm hiểu các kiến thức liên quan Python, Machine Learning, Deep Learning và học cách ứng dụng Python vào các dự án thực tế tại doanh nghiệp.• Người đã đi làm mong muốn cải thiện kỹ năng làm việc với dữ liệu, kỹ năng giải quyết và ra quyết định với các bài toán thực tế trong công việc dựa trên phân tích dữ liệu chuyên sâu và hiệu quả với Python.
• Các bạn có mong muốn chuyển ngang sang ngành Data Analysis, Data Science & Machine Learning để có mức thu nhập cao hơn lên tới 1000$/tháng và phát triển sự nghiệp rộng mở hơn.
Yêu cầu đầu vào
Không yêu cầu đầu vàoBạn sẽ học những gì
• Nắm vững các kiến thức cơ bản về Python và các cấu trúc dữ liệu.• Sử dụng thành thạo thư viện Numpy để xử lý dữ liệu số học và mảng.
• Xử lý dữ liệu hiệu quả với Pandas, bao gồm tải, lưu trữ, làm sạch và định dạng dữ liệu.
• Trực quan hóa dữ liệu với các thư viện như Matplotlib và Seaborn.
• Phân tích dữ liệu thăm dò (EDA) để hiểu rõ dữ liệu và phát hiện các mẫu ẩn.
• Sử dụng Selenium và Python để thực hiện web crawling và thu thập dữ liệu từ web.
Nội dung khóa học
- Buổi 1: Làm quen với Python
- Buổi 2: Python Basic
- Buổi 3: Python Basic (Tiếp)
- Buổi 4: Numpy
- Buổi 5: Pandas: Data Loading, Storage, and File Formats; Data Cleaning and Preparation
- Buổi 6: Pandas nâng cao
- Buổi 7: Pandas: Time Series
- Buổi 8: Trực quan hóa dữ liệu
- Buổi 9: Phân tích dữ liệu thăm dò (EDA)
- Buổi 10: Web Crawling Using Selenium And Kaggle API & Capstone
Giới thiệu về khóa học và khởi động với Python
Mục tiêu:- Nắm được 1 framework phân tích dữ liệu
- Làm quen với Google Colab
- Làm quen với Markdown
- Biết ngôn ngữ lập trình Python là gì, và một số lý do tại sao Python phổ biến
- Biết được cấu trúc cú pháp cơ bản trong Python (Language Semantic)
Phân tích dữ liệu lớn (Big Data)
Case Study:Ôn tập Python Basic
Python Basic
Mục tiêu:Phân tích dữ liệu
Ứng dụng:- Các phép toán tử trong Python
- Các kiểu dữ liệu dạng chuỗi trong Python
- Giới thiệu các cấu trúc điều kiện trong Python
- Cấu trúc vòng lặp (for, while)
- Lệnh break, continue, và pass.
Ôn tập cú pháp Python
Python Basic (Tiếp)
Mục tiêu:Nắm được kiến thức:
- Một số hàm cơ bản: pass, range, zip, enumerate, sorted;
- List, set, Dict comprehension
- Cách tạo ra hàm
- Các xử lý lỗi trong Python
- Mảng dữ liệu nhiều chiều
- Hàm dựa trên cấu trúc mảng
- Tính toán tuyến tính
- Số ngẫu nhiên
- Một số hàm thống kê cơ bản trong Numpy
Bài tập về nhà về cấu trúc mảng
Numpy
Mục tiêu:Nắm được cách xử lý mảng dữ liệu
Ứng dụng:- Mảng dữ liệu nhiều chiều
- Hàm dựa trên cấu trúc mảng
- Tính toán tuyến tính
- Số ngẫu nhiên
- Một số hàm thống kê cơ bản trong numpy
Bài tập mảng một chiều mảng 2 chiều
Pandas
Mục tiêu:Nắm được cách trích xuất, làm sạch và xử lý dữ liệu trống
Ứng dụng:- Đọc và viết dữ liệu dạng text
- Kết hợp và nối các cơ sở dữ liệu
- Đọc dữ liệu từ file excel
- Tương tác với cơ sở dữ liệu
- Xử lý dữ liệu bị mất
- Chuyển đổi dữ liệu
Bài tập về nhà
Pandas: Data Wrangling: Join, Combine, and Reshape
Mục tiêu:Nắm được các kỹ thuật xử lý cấu trúc dữ liệu
Ứng dụng:- Thay đổi cấu trúc dữ liệu và xoay các chiều dữ liệu
- Các cơ chế tổng hợp nhóm (GroupBy)
- Tập hợp dữ liệu
- Phân tách và nối dữ liệu
- Bảng pivot
- Cách xử lý dạng bảng ""wide"" to ""long"" và ""long"" to ""wide""
Bài tập về nhà: Cleaning data
Pandas: Time Series
Mục tiêu:Hiểu được về dữ liệu thời gian, cách xử lý dữ liệu thời gian
Ứng dụng:- Dữ liệu ngày, tháng
- Kiến thức cơ bản về chuỗi thời gian
- Vùng dữ liệu, tần suất và shifting (leading và lagging)
- Xử lý các vùng thời gian khác nhau, thời kỳ
- Resampling và thay đổi tần suất
- Kĩ thuật cửa sổ trượt (moving window functions)
Xử lý dữ liệu chứng khoán
Trực quan hóa dữ liệu
Mục tiêu:- Nắm được kỹ thuật vẽ các biểu đồ cơ bản
- Cách thêm các thành phân trong biểu đồ
- Kỹ thuật vẽ multiple plot
- Một số kỹ năng quan trọng trong trực quan hóa dữ liệu
- Giới thiệu về thư viện matplotlib, seaborn
- Giới thiệu về bộ dữ liệu penguins, titanic
- Một số biểu đồ cơ bản trong matplotlib: line, scatter, bar, histogram...
- Một số biểu đồ cơ bản trong seaborn: line, scatter, bar, histograme...
- Cách thêm các thành phân trong biểu đồ: axis label, titlel, legend..
- Multiple plot
- Optional - Một số kỹ thuật quan trọng trong trực quan hóa dữ liệu, data storytelling
Trực quan hóa dữ liệu phân tích doanh thu
Phân tích dữ liệu thăm dò (EDA)
Mục tiêu:- Nắm được kỹ thuật khai phá dữ liệu
- Sử dụng các công cụ đã học để phân tích khai phá dữ liệu
- Giới thiệu về 4 loại phân tích dữ liệu (descriptive, diagnostic, predictive, prescriptive )
- Giới thiệu về kỹ thuật phân tích dữ liệu thăm dò
- Sử dụng các công cụ thể phân tích trên dữ liệu cụ thể
Phân tích EDA bộ dữ liệu IT salary
- Web Crawling Using Selenium
- Hướng dẫn sử dụng Kaggle API cơ bản
- Tương tác với các tập dữ liệu qua API
- Capstone
Học viên nắm được kỹ thuật Web Crawling
Ứng dụng:- Giới thiệu về Selenium
- Ứng dụng kết nối Kaggle API để tương tác với dữ liệu
- Sử dụng Selenium để lấy dữ liệu từ website
- Thực hành 1 project phân tích dữ liệu bao gồm trích xuất, làm sạch, khai phá dữ liệu
Dùng Selenium để lấy dữ liệu từ SSI sau đó tiến hành các bước làm sạch, khai phá dữ liệu
Dùng API để tương tác với dữ liệu lớn của kaggle
Tại sao khóa học tại MCI phù hợp với bạn
1. Lộ trình khóa học thiết kế khoa học, theo quy trình làm việc thực tế giúp bạn tiếp thu và nắm chắc kiến thức theo trình tự khoa học2. Giáo trình đào tạo theo chuẩn Quốc tế kết hợp giữa lý thuyết và thực hành qua các case study thực tế
3. 100% Giảng viên tại MCI là các chuyên gia tư vấn tại Big4 các tập đoàn lớn tại Việt Nam, có chứng chỉ đào tạo nghiên cứu quốc tế trong lĩnh vực lập trình và dữ liệu
4. Giảng viên hướng dẫn tận tay giúp bạn thành thạo Python trong thời gian ngắn nhất
5. Cam kết chất lượng đào tạo, miễn phí học lại trọn đời nếu chưa nắm rõ kiến thức
Đội ngũ giảng viên
Nguyễn Hữu Minh
- 5 năm kinh nghiệm trong ngành Khoa học dữ liệu và Công nghệ thông tin tại Việt Nam
- Hiện đảm nhân vị trí Data Scientist, AI Researcher tại Công ty PIXTA Vietnam Co. Ltd
- Giải nhất cuộc thi Sinh viên Nghiên cứu Khoa học - Khoa Toán ứng dụng và Hệ thống thông tin
- Kĩ sư Toán và Thông tin tại trường Bách Khoa Hà Nội
Đỗ Văn Hiếu
- Đã có 8 năm kinh nghiệm trong Phân tích dữ liệu tại Prudential, VNG, Zalo...
- Đảm nhận vị trí chuyên viên phân tích dữ liệu cao cấp tại Công ty Prudential Việt Nam
- Trưởng nhóm Phân tích dữ liệu tại Tập đoàn VNG Việt Nam
- Trưởng nhóm Phân tích kinh doanh tại Công ty Zalo Việt Nam
- Cuộc thi/Dự án trên Kaggle:
1. Phân tích và dự đoán giá nhà ở - House Prices - Advanced Regression Techniques
2. Thị giác máy tính - Nhận diện và phân biệt chữ số viết tay - Computer vision - Digit numbers classification (MNIST Dataset)
Nguyễn Kim Quang
- Tốt nghiệp Thạc sĩ Tài chính ngân hàng
- Đã đảm nhận các vị trí Kế toán tín dụng, Chuyên viên thẩm định, thư ký Phó TGĐ, chuyên viên phân tích tài chính doanh nghiệp và dự án tại Quỹ đầu tư phát triển Thành phố Hà Nội.
- Hiện tại đang làm ví trí Phân tích tài chính doanh nghiệp và dự án tại Quỹ đầu tư phát triển Thành phố Hà Nội (từ 2008 đến nay)
- Có hơn 14 năm kinh nghiệm trong phân tích tài chính, phân tích dự báo rủi ro, bảo vệ phương án cho các dự án.
- Sử dụng thành thạo các công cụ SQL, Python đặc biệt các libraries phân tích và trực quan hóa dữ liệu, Machine Learning
- CÁC CHỨNG CHỈ
+ IBM Data Science Professional Certificate (IBM)
+ Python 3 Programming Specialization (University of Michigan)
+ SQL advanced certification (HackerRank)
+ STATSX0001: Statistical Learning (Stanford University)
+ Statistics with Python (University of Michigan)
Trần Tâm
- Hiện tại đang làm việc với vị trí Data Analyst tại một trong những kỳ lân công nghệ hàng đầu Việt Nam VNpay.
- Đã từng làm việc cho Tập đoàn Vinfast với vị trí Kỹ sư
- Chứng chỉ đã đạt được: PL300 của Microsoft
Nguyễn Hữu Đạt
- Hơn 5 năm kinh nghiệm giảng dạy các bộ môn lập trình : Scratch, Minecraft, Python
- Hiện tại đang giữ vị trí Phó phòng Đào tạo tại Công ty cổ phần Công nghệ và Truyền thông VTC Netviet
- Software: Python Excel, AutoCAD, Production Management Software
- Tools & Techniques: Python, Selenium, Kivy, Django, MS Office, SwiftUI, Flutter, PHP