MCI BLOG


Nơi chia sẻ về những câu chuyện thú vị và những kinh nghiệm về lập trình phần mềm, phân tích dữ liệu, khoa học dữ liệu và kĩ sư dữ liệu..
Câu chuyện nghề nghiệp trong ngành công nghệ thông tin và khoa học dữ liệu của Học viện Công nghệ MCI dành cho độc giả.

VÉN MÀN 7 BƯỚC CHUẨN BỊ ĐỂ TRỞ THÀNH DATA ANALYST PHẦN 01

Trang Lê - Sept. 5, 2022, 4:44 p.m.

Trong kỷ nguyên 4.0, dữ liệu được coi là mỏ vàng của các doanh nghiệp để thu hút khách hàng tiềm năng. Chính vì vậy, cơn sốt “Data Analyst” chưa bao giờ giảm nhiệt mà còn phát triển ở nhiều lĩnh vực khác nhau: Ngân hàng, kinh doanh, marketing cho tới các lĩnh vực về y tế và chăm sóc khách hàng.  Theo báo cáo của Vietnam Salary, mức lương trung bình ở vị trí Fresher dao động khoảng 11 triệu - 15 triệu/ tháng. Chính vì thế, không khó để nhận ra ngày một nhiều ứng viên quan tâm đến vị trí Data Analyst. Vậy để sở hữu mức thu nhập cao cũng như làm việc tại công ty/ tập đoàn lớn, ứng viên cần chuẩn bị những gì để trở thành Data Analyst chuyên nghiệp. Cùng MCI tìm hiểu trong bài viết dưới đây nhé!

Xem nhanh

7 bước chuẩn bị để trở thành Data Analyst chuyên nghiệp

1. LÊN KẾ HOẠCH HỌC TẬP

Hiển nhiên rằng để làm việc trong một lĩnh vực nào đó, bạn phải bắt đầu bằng cách học những kiến thức cơ bản. Trước hết bạn phải tìm hiểu tổng quan về ngành phân tích dữ liệu, dữ liệu và dữ liệu lớn là gì để bạn xác định đây có phải ngành nghề phù hợp với bản thân mình hay không. 

Vài năm trước đây, ngành Phân tích dữ liệu thường yêu cầu ứng viên có bằng cấp chuyên môn cao hoặc những ngành nghề có liên quan như Công nghệ thông tin. Nhà tuyển dụng thường ưu tiên những ứng viên có các chứng chỉ liên quan đến data như:

  • DA-100 Microsoft Certified Data Analyst Associate
  • Certified Analytics Professional
  • Cloudera Certified Associate: Data Analyst.

Tuy nhiên, tới thời điểm hiện tại những yêu cầu này không còn là bắt buộc với vị trí Data Analyst. Dù background của bạn là marketing, tài chính, sale hay các ngành nghề chăm sóc sức khỏe như y tế đều có thể trở thành Data Analyst.

Vậy lộ trình học tốt nhất cho Data Analyst là gì ?

Trước hết hãy nâng cấp CV cá nhân bằng những kiến thức cơ bản về dữ liệu như toán xác suất thống kê, khoa học máy tính, trực quan hóa dữ liệu,...Bí quyết của đa số Data Analyst thường sử dụng để lập kế hoạch học tập phù hợp với bản thân là đọc Job Description. Mỗi JD đều yêu cầu ứng viên có kiến thức và kỹ năng rõ ràng giúp bạn dễ dàng có cái nhìn tổng quan nhất về vị trí này. Ngoài ra, hãy tham khảo phần yêu cầu ứng viên để nắm rõ những công cụ nào bắt buộc bạn phải có để hỗ trợ công việc tốt hơn. 

2. KỸ NĂNG CHUYÊN MÔN

Không riêng gì Data Analytics, bất kì ngành nghề, lĩnh vực nào cũng yêu cầu ứng viên có kỹ năng chuyên môn cụ thể liên quan đến ngành. Dù những kỹ năng này bạn được học ở giảng đường Đại học, học ở các trung tâm hay tích lũy từ kinh nghiệm làm việc đều hoàn toàn có thể trở thành thế mạnh của bạn khi ứng tuyển. Chính vì vậy, hãy xác định rõ những kỹ năng chuyên môn ngành Data Analytics yêu cầu là gì và trau dồi kỹ năng đó. 

  • Kỹ năng thống kê

Thống kê được hiểu một cách đơn giản là quá trình thu thập, phân tích, khám phá những xu hướng, quy luật vận động, các mối quan hệ của những đối tượng nghiên cứu, … Nắm vững kỹ năng thống kê sẽ giúp bạn định hướng phân tích và hiểu rõ dữ liệu bạn đang làm việc. Tùy thuộc vào lĩnh vực của mỗi công ty sẽ yêu cầu mức độ thành thạo kỹ năng thống kê của ứng viên

  • Thành thạo R hoặc Python

Ngôn ngữ R được phát hành vào năm 1994 do một nhóm các nhà thống kê nghiên cứu. Cho tới thời điểm hiện nay, R vẫn là một trong những ngôn ngữ được sử dụng rộng rãi bởi các chuyên gia thống kê và phân tích dữ liệu. Trong phân tích dữ liệu, ngôn ngữ lập trình R hỗ trợ cho việc tính toán và đồ họa thống kê bởi các tính năng tích hợp của nó. Bên cạnh đó, ngôn ngữ R còn cung cấp cho user thư viện lớn giúp giải quyết mọi quy trình trong phân tích dữ liệu. 

Năm 1991, ngôn ngữ Python được phát hành và sử dụng rộng rãi cho tới hiện tại. Khác với ngôn ngữ R, Python tập trung vào khả năng đọc mã và được sử dụng rộng rãi từ lĩnh vực dữ liệu đến kỹ sư phần mềm. Python có một kho thư viện lớn của bên thứ ba cung cấp đầy đủ chức năng cho khoa học dữ liệu.

  • Ngôn ngữ truy vấn SQL

SQL là cụm từ viết tắt của Structured Query Language - ngôn ngữ truy vấn có cấu trúc. Đây là ngôn ngữ tập hợp các lệnh để tương tác với database. Với tính năng lưu trữ, thao tác và truy xuất dữ liệu được lưu trữ trong relational database, SQL là ngôn ngữ hầu như Data Analyst nào cũng phải nắm vững. Ngoài ra, SQL còn là ngôn ngữ cơ sở dữ liệu chuẩn của các hệ thống quản lý cơ sở dữ liệu quan hệ như MySQL, MS Access, Oracle, Postgres và SQL Server,...

Đa số các doanh nghiệp hiện này đều sử dụng SQL để xây dựng hệ thống lưu trữ cơ sở dữ liệu. Các dữ liệu sẽ được diễn tả thành nhiều bảng và có mối quan hệ mật thiết với nhau. 

  • Data visualization

Trực quan hóa dữ liệu là làm cho các xu hướng và mẫu trong dữ liệu thành các dạng đồ họa để dễ dàng đưa ra quyết định trong quản lý và kinh doanh. Các dạng đồ họa của trực quan hóa dữ liệu thường ở dạng đồ thị, biểu đồ và sử dụng các phương pháp, công cụ để minh họa dữ liệu được tốt nhất. Từ những đồ họa này sẽ dễ dàng quan sát và truyền đạt rõ ràng insights từ dữ liệu đến người xem, người đọc. 

Bằng việc sử dụng trực quan hóa dữ liệu, quản lý/ điều hành sẽ không mất nhiều thời gian vào việc phân tích báo cáo và có thêm thời gian để triển khai các chiến lược dựa vào những thông tin trong đồ họa. 

  • Data Cleaning và Data Preparation

Như bạn đã biết. data cleaning còn được định nghĩa là quy trình làm sạch dữ liệu. Quy trình này sẽ giúp Data Analyst xử lý và loại bỏ những dữ liệu như sau:

  • Không chính xác
  • Không phù hợp định dạng
  • Bị trùng lặp
  • Không đầy đủ thông tin
  • Không liên quan
  • Không có giá trị

Vì những dữ liệu này sẽ khiến kết quả phân tích cuối cùng bị ảnh hưởng và không đáp ứng mục đích của việc phân tích. 

Gắn liền với data cleaning, data preparation là quá trình làm sạch và chuyển đổi dữ liệu thô trước khi xử lý và phân tích. Data Preparation thường bao gồm các bước từ chuẩn hóa định dạng dữ liệu, kết hợp với các bộ dữ liệu khác nhau cho tới loại bỏ các giá trị ngoại lai (outliers). 

Ngoài những kỹ năng về mặt chuyên môn, nhà tuyển dụng còn tìm kiếm ứng viên có những kỹ năng mềm như:

  • Kỹ năng giao tiếp
  • Kỹ năng thuyết trình 
  • Kỹ năng giải quyết vấn đề 
  • Kỹ năng làm việc nhóm

3. THỰC HÀNH CÁC DỰ ÁN VỚI DỮ LIỆU THỰC

Không phương pháp học nào tốt hơn việc “học đi đôi với làm”. Khi áp dụng những kiến thức về mặt lý thuyết vào trong các project sẽ giúp bạn hiểu rõ hơn từng quy trình phân tích dữ liệu. Bạn có thể tham gia các cuộc thi như Hackathon vừa giúp nâng tầm CV vừa giúp bạn kết nối với cộng đồng Data Analyst. Ngoài ra, bạn có thể sử dụng những bộ dữ liệu miễn phí để thực hiện project cho riêng mình. 

Bạn tham khảo một số trang web có sẵn dataset để thực hành: