Trí tuệ nhân tạo(AI) đang bùng nổ mạnh mẽ, len lỏi vào mọi khía cạnh đời sống, từ y tế, giáo dục đến tài chính, bán lẻ. Nổi bật trong bức tranh AI rực rỡ ấy là sự xuất hiện của Chat GPT, đánh dấu một bước ngoạn mục cho AI tạo sinh (generative AI). Bài viết này sẽ đưa bạn đi sâu vào một nền tảng cốt lõi của AI – Học máy (Machine Learning), hé mở bức màn bí ẩn về trí thông minh nhân tạo trong kỷ nguyên số.
Machine learning là gì ?
-
Học máy hay máy học là một lĩnh vực con của AI, tập trung vào việc nghiên cứu và phát triển các thuật toán giúp hệ thống máy tính “học” tự động từ dữ liệu để giải quyết các vấn đề cụ thể.
-
Trong khi đó, để giải quyết một bài toán, lập trình truyền thống đòi hỏi con người phải thiết kế thuật toán và viết từng dòng code chi tiết để hướng dẫn máy tính thực hiện. Hay nói cách khác, học máy cho phép máy tính tự “học” cách thức hoạt động dựa trên một tập dữ liệu mẫu mà không cần được lập trình dựa trên bất cứ thuật toán được định sẵn nào. Đây chính là điểm khác nhau cơ bản giữa học máy và lập trình truyền thống.
-
Hãy tưởng tượng một hệ thống có thể tự “học” cách phân loại thư rác trong email hay đề xuất video phù hợp với sở thích của bạn. Đó chính là sức mạnh của Machine Learning!
Vì sao lại cần Machine Learning?
Để hiểu rõ tầm quan trọng của Machine Learning, hãy so sánh cách giải quyết bài toán lọc thư rác bằng phương pháp truyền thống và áp dụng Machine Learning.
Bài toán lọc thư rác:
-
Đầu vào là nội dung của một email.
-
Hãy xác định xem email đó có phải là thư rác hay không.
Cách truyền thống:
-
Đầu tiên cần xác định các từ và cấu trúc thông dụng trong spam. Ví dụ như: miễn phí, ưu đãi, đăng ký ngay, hạn chót,…
-
Viết thuật toán phát hiện thư rác dựa trên danh sách thu thập được.
-
Lặp lại quá trình để cải thiện độ chính xác.
Các hạn chế của cách truyền thống
-
Tốn thời gian và công sức để liệt kê và bảo trì danh sách thư rác.
-
Khó khăn trong việc cập nhật khi xuất hiện thư rác mới với các từ ngữ mới.
Sử dụng Machine Learning:
-
Giả sử ta có được một tập dữ liệu biết được đâu là thư rác.
-
Sử dụng tập dữ liệu này để huấn luyện hệ thống học máy, máy sẽ “học” để xác định các mẫu, cấu trúc thường xuất hiện trong thư rác.
Ưu điểm so với cách truyền thống:
-
Chương trình ngắn gọn, dễ bảo trì và hiệu quả hơn.
-
Tự động cập nhật và học hỏi từ các thư rác mới mà không cần can thiệp thủ công.
Mặc dù, Machine Learning vẫn tồn tại một số nhược điểm như là: yêu cầu có tập dữ liệu mẫu, thời gian huấn luyện lâu,… Nhưng nhìn chung, Machine Learning đã khắc phục những hạn chế của phương pháp truyền thống, mở ra tiềm năng to lớn cho việc ứng dụng vào nhiều lĩnh vực khác nhau.
Sau đây chúng ta hãy cùng tìm hiểu về các loại hình học máy phổ biến:
-
Học có giám sát
-
Học không giám sát
-
Học bán giám sát
-
Học tăng cường
-
…
Phân loại Machine Learning?
Học có giám sát
Học có giám sát(supervised learning) là một phương pháp trong học máy, nơi máy tính học từ các dữ liệu đã được gán nhãn. Để dễ hiểu hơn, hãy tưởng tượng bạn đang học phân loại các loại quả.
- Dữ liệu gán nhãn: Bạn có một số quả và mỗi quả đều được ghi chú tên. ví dụ: “Đây là táo”, “Đây là cam”.
-
Tập huấn luyện: Bạn xem xét một loạt quả khác nhau (gọi là mẫu dữ liệu) và ghi nhớ các đặc điểm của chúng (như màu sắc, kích thước).
-
Đặc trưng đầu vào: Các đặc điểm như màu sắc, kích thước của quả được gọi là đặc trưng đầu vào. Ví dụ, quả màu đỏ, tròn có thể là táo, còn quả màu cam, hình cầu có thể là cam.
-
Đầu ra: Kết quả bạn muốn dự đoán, ví dụ, loại quả (táo, cam).
-
Trong quá trình học, máy tính sẽ cố gắng tìm ra quy luật hoặc mối quan hệ giữa các đặc trưng đầu vào (màu sắc, kích thước) và nhãn đầu ra (tên loại quả). Sau khi học xong, khi gặp một quả mới, máy tính có thể dựa vào những gì đã học để dự đoán đó là loại quả gì. Nói cách khác, trong học có giám sát, máy tính học từ các ví dụ đã biết để có thể dự đoán đúng khi gặp các ví dụ mới.
Các ứng dụng: phân loại email, dự báo tài chính, dịch máy, nhận diện giọng nói,…

Học không giám sát
Học không giám sát (unsupervised learning) là một phương pháp trong học máy mà không cần dữ liệu được gán nhãn. Để dễ hiểu hơn, hãy tưởng tượng bạn đang học cách phân loại rau củ mà không biết trước tên của chúng.
-
Dữ liệu không gán nhãn: Bạn có một rổ rau củ, nhưng không có nhãn ghi chú nào cho biết mỗi loại rau củ là gì. Bạn chỉ biết rằng chúng khác nhau về hình dạng, màu sắc, kích thước, v.v.
-
Phát hiện cấu trúc hoặc nhóm: Bạn bắt đầu quan sát và phân loại các rau củ dựa trên những đặc điểm bạn thấy. Bạn có thể nhận ra rằng một số rau củ có hình tròn, một số khác thì dài và thuôn. Bạn cũng có thể thấy rằng có rau củ màu xanh, màu đỏ, hoặc màu tím.
-
Phân cụm: Đây là quá trình bạn nhóm các rau củ vào các cụm khác nhau dựa trên các đặc điểm giống nhau. Ví dụ, bạn có thể đặt tất cả rau củ màu đỏ vào một nhóm, tất cả rau củ màu xanh vào một nhóm khác, và cứ thế.
Các ứng dụng: phân cụm khách hàng, phát hiện gian lận, hệ thống gợi ý,…

Học bán giám sát
Học bán giám sát(semi-supervised learning) là một phương pháp học máy kết hợp giữa học có giám sát và học không giám sát. Để dễ hiểu hơn, hãy xem xét hình ảnh dưới đây về phân loại hoa quả.
-
Dữ liệu đầu vào: Bạn có một tập hợp các loại quả như táo, cam, chuối. Một số trong số chúng đã được gán nhãn (có tên gọi), trong khi một số khác thì không.
-
Gán nhãn một phần: Một phần nhỏ của các loại quả đã có nhãn, ví dụ: một số quả cam và chuối được đánh dấu rõ ràng là “Orange” và “Banana”.
-
Dữ liệu không gán nhãn: Một số quả khác, như quả táo, không có nhãn. Bạn không biết chắc chắn chúng là gì.
-
Mô hình học máy: Mô hình học máy sẽ sử dụng cả dữ liệu đã gán nhãn và dữ liệu không gán nhãn để học. Dữ liệu đã gán nhãn giúp mô hình hiểu rõ hơn về các đặc điểm của cam và chuối. Sau đó, mô hình sẽ áp dụng những gì đã học từ dữ liệu gán nhãn để cố gắng phân loại các quả không gán nhãn.
-
Dự đoán: Sau khi học từ cả dữ liệu gán nhãn và không gán nhãn, mô hình có thể dự đoán rằng quả không gán nhãn là một quả táo.
Các ứng dụng: nhận diện ảnh và video, xử lí ngôn ngữ tự nhiên,…

Học tăng cường
Học tăng cường (reinforcement learning) là một phương pháp trong học máy, nơi máy tính học từ các tương tác với môi trường và nhận hình phạt/phần thưởng dựa trên các tương tác đó. Để dễ hiểu hơn, hãy tưởng tượng bạn đang huấn luyện một chú chó.
-
Tác vụ: Bạn muốn chú chó học cách ngồi khi bạn ra lệnh. Việc ngồi xuống là tác vụ mà bạn muốn chú chó thực hiện.
-
Hành động: Chú chó có thể thực hiện nhiều hành động khác nhau như ngồi, đứng, hay chạy nhảy.
-
Phần thưởng và hình phạt: Bạn có thể thưởng chú chó bằng một món ăn ngon nếu nó ngồi xuống theo lệnh, hoặc phớt lờ hoặc nhẹ nhàng khiển trách nếu nó không làm đúng. Phần thưởng và hình phạt giúp chú chó hiểu được hành động nào là tốt và hành động nào là không tốt.
-
Học qua thử và sai: Chú chó sẽ thử nhiều hành động khác nhau và học từ phản hồi mà nó nhận được. Qua thời gian, nó sẽ nhận ra rằng ngồi xuống theo lệnh sẽ mang lại phần thưởng, và sẽ có xu hướng thực hiện hành động này nhiều hơn.
-
Học tăng cường khác biệt so với học có giám sát và học không giám sát ở chỗ nó không yêu cầu dữ liệu gán nhãn trước mà học thông qua tương tác với môi trường. Qua quá trình thử và sai, máy tính dần dần tìm ra chiến lược tối ưu để đạt được mục tiêu đề ra.
Các ứng dụng: robot tự động, hệ thống gợi ý,…

Nguồn: https://en.wikipedia.org/wiki/Machine_learning