Lập Trình Python Có Ứng Dụng Gì Trong Ngành Machine Learning & Deep Learning?

Gần đây thuật ngữ Machine learning đang được nhắc đến rất rộng rãi không chỉ trong lĩnh vực công nghệ mà còn trong dịch vụ tài chính, marketing, kinh doanh…Vậy Machine learning là gì, ứng dụng ra sao thì hôm nay mình sẽ tổng hợp một số khái niệm cơ bản để các bạn cùng tham khảo nhé:

      Theo Wikipedia, Machine learning is the subfield of computer science that “gives computers the ability to learn without being explicitly programmed”. Hay nói đơn giản, Machine Learning là một lĩnh vực nhỏ của Khoa Học Máy Tính, nó có khả năng tự học hỏi dựa trên dữ liệu đưa vào mà không cần phải được lập trình cụ thể.

      Theo Giáo sư Tom Mitchell – Carnegie Mellon University: Machine Learning là 1 chương trình máy tính được xem là học hỏi từ kinh nghiệm E từ các tác vụ T và với độ đo hiệu suất P nếu hiệu suất của nó áp dụng trên tác vụ T và được đo lường bởi P tăng từ kinh nghiệm E.

      Để dễ hiểu thì mình cùng tham khảo 1 ví dụ nhé. Nếu bạn nào đã chơi cờ vua trên máy tính thì đều biết mình có thể lựa chọn chế độ chơi với bạn chơi hoặc với máy tính. Vậy làm sao để máy tính chơi được cờ vua? Thì ở đây, chương trình sẽ xây dựng những chiến thuật hợp lý nhất dựa trên những ván cờ trước đó của con người. Chương trình cũng có khả năng tự học (Reinforcement learning – học củng cố) từ kinh nghiệm chơi cờ trước đó của máy tính hoặc con người (kinh nghiệm E) với nhiệm vụ chiến thắng ván cờ (tác vụ T) và P là khả năng chiến thắng ván cờ.

      Các phương pháp máy học sử dụng trong Machine learning rất nhiều nhưng hôm nay mình chỉ giới thiệu 2 nhóm bài toán chính là:

–          Hồi quy: ứng dụng dự báo doanh thu doanh nghiệp, đánh giá hiệu quả hoạt động doanh nghiệp…

–          Phân loại: dự báo xác suất trả nợ của khách hàng, dự báo doanh nghiệp phá sản…

–          Ngoài ra còn có phân cụm, liên kết… thường ứng dụng trong Marketing bán chéo sản phẩm…

      Quy trình thực hiện

 1.  Trước tiên cần chuẩn bị dữ liệu và nhãn (nếu có). Số lượng dữ liệu trong từng đặc trưng (feature) nên cân bằng để tránh trường hợp overfitting. Sau đó chia dữ liệu thành các tập:

–          Tập train (70%)

–          Tập test (30%)

–          Tập validation (tập ngoài để đánh giá hiệu năng mô hình)

2. Huấn luyện mô hình (train model) dựa trên 2 thuật toán cơ bản là học có giám sát (biết trước giá trị đầu vào, đầu ra) và không giám sát (không biết giá trị đầu ra. Áp dụng trong phân nhóm khách hàng).

3. Đánh giá hiệu năng mô hình dựa trên các tham số AR, precision, recall…

Trên đây là bài tổng hợp sơ bộ của mình, nếu các bạn có góp ý hay bổ sung gì có thể để lại ở bình luận để mình giải đáp và cùng trao đổi nha!

Let’s Learn Together 🙂 !