MCI BLOGS
Nơi chia sẻ về những câu chuyện thú vị và những kinh nghiệm về lập
trình phần mềm, phân tích dữ liệu, khoa học dữ liệu và kĩ sư dữ
liệu..
Câu chuyện nghề nghiệp trong ngành công nghệ thông tin và
khoa học dữ liệu của Học viện Công nghệ MCI dành cho độc giả.
CHATGPT VÀ NHỮNG ĐIỀU BẠN CHƯA BIẾT
ChatGPT - công nghệ mới được nhắc đến khắp mọi nơi trong thời gian gần đây là gì? ChatGPT có thể làm gì? Có ưu, nhược điểm gì không và cách thức vận hành thế nào?
Xem nhanh
ChatGPT - công nghệ mới được nhắc đến khắp mọi nơi trong thời gian gần đây là gì? ChatGPT có thể làm gì? Có ưu, nhược điểm gì không và cách thức vận hành thế nào?
1. ChatGPT là gì?
ChatGPT là một hệ thống chatbot dựa trên AI được OpenAI ra mắt vào tháng 11 năm 2022. OpenAI được biết đến với việc tạo ra Whisper, một hệ thống nhận dạng giọng nói tự động và DALLE•2, một trình tạo art và hình ảnh AI.
ChatGPT sử dụng công nghệ GPT-3 của công ty. Nó là viết tắt của Generative Pre-training Transformer 3 và là một mô hình ngôn ngữ tự hồi quy sử dụng deep learning để tạo ra văn bản giống con người. Đây là một mô hình AI xử lý ngôn ngữ và hiện là một trong những mô hình phổ biến nhất.
Mô hình đào tạo GPT-3 sử dụng phương pháp đào tạo 'generative pretraining', nghĩa là nó được đào tạo theo cách có thể dự đoán mã thông báo nào tiếp theo. Để điều này xảy ra, mô hình yêu cầu một văn bản nhắc ban đầu và sau đó nó sẽ tiếp tục tạo văn bản bằng cách sử dụng lời nhắc ban đầu đó.
Mô hình được tối ưu hóa bằng cách sử dụng Reinforcement Learning với Human Feedback (RLHF) để đạt được đối thoại đàm thoại. Mô hình được đào tạo bằng cách sử dụng nhiều loại dữ liệu do mọi người viết để đạt được phản hồi giống con người.
Nó tạo ra sự tương tác tự nhiên, giống như con người với một chatbot.
2. ChatGPT có thể làm gì?
GPT-3 là một mô hình ngôn ngữ có 175 tỷ tham số, vì vậy có thể khó thu hẹp tất cả các khả năng của GPT-3. Nó là một mô hình tập trung hoàn toàn vào ngôn ngữ, vì vậy nó có sự hiểu biết sâu sắc về văn viết và văn nói.
Một số trường hợp sử dụng của ChatGPT là:
- Viết nội dung ngắn hạn như thơ
- Viết nội dung dài như tài liệu nghiên cứu.
- Giải thích các chủ đề theo thuật ngữ hoặc kiến thức chuyên sâu
- Brainstorming các chủ đề và ý tưởng
- Giao tiếp được cá nhân hóa, ví dụ: phản hồi email
- Trợ lý ảo nói với giọng điệu tự nhiên và hấp dẫn
- Tóm tắt nội dung dài ở dạng ngắn hơn
- Bản dịch ngôn ngữ
- Nội dung marketing
Sức mạnh của ChatGPT nằm ở tốc độ tạo ra nội dung được viết tốt trong vài giây và khả năng xử lý các chủ đề phức tạp cũng như đơn giản hóa chúng.
3. ChatGPT hoạt động như thế nào?
OpenAI đã sử dụng Reinforcement Learning từ Human Feedback (RLHF). Họ bắt đầu với việc đào tạo một mô hình ban đầu bằng cách sử dụng supervised fine-tuning. Các human trainers AI đóng vai cả người dùng và trợ lý AI, đồng thời cung cấp các cuộc hội thoại để giúp xây dựng các phản hồi tự nhiên và hấp dẫn.
Reinforcement learning sử dụng tín hiệu/hệ thống phần thưởng giúp cải thiện mô hình máy học. OpenAI đã thu thập dữ liệu so sánh, hai hoặc nhiều phản hồi mô hình được xếp hạng theo chất lượng. OpenAI đã thực hiện các cuộc trò chuyện diễn ra giữa các AI trainers và chatbot, chọn ngẫu nhiên một tin nhắn do mô hình viết, lấy mẫu một số lần hoàn thành thay thế và yêu cầu các AI trainers xếp hạng chất lượng của nó. Điều này cho phép họ sử dụng các mô hình phần thưởng này và tinh chỉnh chúng bằng cách sử dụng Proximal Policy Optimization (Tối ưu hóa chính sách gần nhất).
4. Hạn chế của ChatGPT
ChatGPT đi kèm với những hạn chế.
- ChatGPT có kiến thức rất hạn chế về các sự kiện thế giới đã xảy ra trong năm qua
- Nó có thể hiểu sai những gì bạn đang cố gắng hỏi
- Nó có thể xuất thông tin không chính xác
- Nó có thể trở nên quá tải đối với ChatGPT nếu bạn thêm quá nhiều yếu tố