AI – INTRODUCTION TO MACHINE LEARNING

Bạn muốn bắt đầu học Trí Tuệ Nhân Tạo (AI) nhưng không biết bắt đầu từ đâu? Bạn cảm thấy choáng ngợp trước lượng kiến thức khổng lồ và không rõ nên học theo lộ trình nào để hiệu quả?

Khóa học “Big-O AI Introduction to Machine Learning” sẽ đưa bạn từ cơ bản đến thành thạo các thuật toán ML kinh điển (KNN, Linear Regression, SVM, Decision Tree) qua 16 bài học kết hợp lý thuyết và thực hành. Mỗi buổi học bao gồm phần giải thích cách hoạt động của mô hình và bài tập ứng dụng thực tế như phát hiện spam, dự đoán giá nhà, phân tích dữ liệu Netflix/Tesla, cùng 2 Kaggle Challenge.

Khóa học kết thúc với phần giới thiệu Neural Networks và LLM, trang bị nền tảng để bạn tự tin khám phá deep learning nâng cao.

Đặc biệt: Có buổi talkshow với chuyên gia ML/Data Scientist từ các công ty hàng đầu để định hướng sự nghiệp.

Sau khi kết thúc khoá học, bạn sẽ học được cách:

  •  Xử lý và trực quan hoá dữ liệu: Học cách chuẩn bị và làm sạch dữ liệu, cũng như cách sử dụng các công cụ và kỹ thuật để trực quan hoá dữ liệu .

  • Các thuật toán cơ bản trong học máy : Hiểu vững cách các thuật toán máy học cơ bản hoạt động và cách áp dụng chúng. 

  • Tối ưu hoá mô hình : Học các kĩ thuật nâng cao hiệu quả mô hình như điều chỉnh siêu tham số (Hyperparameter Tuning), Ensemble, v.v.

  • Mạng nơ-ron : hiểu được nguyên lý hoạt động của mạng nơ-ron từ đó có kiến thức vững chắc để tìm hiểu về Deep Learning.

Ngôn ngữ minh họa: Ngôn ngữ được sử dụng rộng rãi nhất hiện nay Python.

Ngoài ra để được hỗ trợ tư vấn rõ hơn về khóa học AI bạn có thể liên hệ qua fanpage sau: Big-O Coding

Để đăng ký khóa học và tham khảo học phí các bạn có thể điền thông tin tại đây

ĐỐI TƯỢNG HỌC PHÙ HỢP

  • Tiên quyết: Học viên đã biết lập trình Python căn bản. 

  • Tuỳ chọn: Có thể nắm được cơ cách dùng các mô hình máy học thông qua gọi thư viện nhưng vẫn chưa hiểu chi tiết cách hoạt động của các mô hình.

  • Nếu bạn chưa thuộc đối tượng học phù hợp của lớp học Big-O vui lòng gọi cho chúng tôi qua số điện thoại: 0937.401.483 để được tư vấn học các lớp phù hợp với bạn.

BÀI TẬP MINH HỌA KHÓA HỌC

  • Bài tập được chia làm hai dạng: Bài tập trắc nghiệm củng cố kiến thức lý thuyết và bài tập lập trình thực hành để phát triển kỹ năng coding.
  • Đa dạng từ bài tập triển khai thuật toán từ đầu (nắm vững nguyên lý hoạt động) đến ứng dụng giải quyết các bài toán thực tế như phân tích cảm xúc văn bản, dự đoán tài chính, phát hiện bất thường.
  • Điểm nổi bật: 2 Kaggle Challenge mô phỏng môi trường làm việc chuyên nghiệp, giúp học viên vận dụng tổng hợp kiến thức để xử lý dữ liệu phức tạp và phát triển tư duy giải quyết vấn đề như các Data Scientist thực tế.

THỜI GIAN VÀ ĐỊA ĐIỂM HỌC

  • Thời gian: 2,5 tháng (10 tuần)
  • Hình thức học: Online.
  • Học online qua: Zoom.
  • Số lượng học viên mỗi lớp: Tối đa 25  đến 30 học viên.
  • Mỗi lớp có 1 Giảng Viên chính và các trợ giảng.
  • Đặc biệt có giờ Office Hours (giờ học phụ đạo) hàng tuần cho học viên ôn lại bài học nếu không theo kịp tiến độ bài học.

SỰ KHÁC BIỆT CỦA CÁC KHÓA HỌC TẠI BIG-O CODING

1. CHƯƠNG TRÌNH GIẢNG DẠY:

  • Được giảng dạy bởi chuyên gia về AI, Thuật Toán với nhiều năm kinh nghiệm (xem thêm phần “đội ngũ giảng dạy“).
  • Được gặp gỡ và trao đổi với những bạn thành công đi trước chia sẻ kinh nghiệm học tập Thuật Toán và kinh nghiệm làm việc.
  • Mỗi lớp học ngoài Giảng Viên chính đều có 5 trợ giảng: Trợ giảng phụ trách tại lớp và trợ giảng phụ trách diễn đàn riêng của lớp đảm bảo mọi thắc mắc của học viên sẽ được trả lời nhanh chóng mọi lúc mọi nơi.

2. MỤC TIÊU ĐẠT ĐƯỢC SAU KHÓA HỌC:

  • Hệ thống toàn bộ kiến thức nền tảng vững chắc Machine Learning.
  • Thành thạo quy trình phát triển ML hoàn chỉnh: Từ tiền xử lý dữ liệu, xây dựng pipeline, đến đánh giá và tối ưu hóa mô hình một cách chuyên nghiệp.
  • Nắm vững các mô hình máy học cốt lõi và có thể triển khai từ đầu, tự tin giải thích cách hoạt động cho nhà tuyển dụng hoặc đồng nghiệp.
  • Có nền tảng vững chắc để tự tin bước vào các vai trò entry-level: Junior Data Scientist, ML Engineer hoặc chuyển đổi sự nghiệp sang lĩnh vực AI.
  • Hiểu được bức tranh lớn của AI hiện đại – từ thuật toán cơ bản đến Neural Networks và LLM, đủ để theo kịp xu hướng công nghệ và tự học các kiến thức nâng cao.

ĐỀ CƯƠNG CHI TIẾT

Tìm hiểu các bước chuẩn bị dữ liệu cơ bản cho bài toán học máy: khám phá tập dữ liệu, xử lý các dạng dữ liệu phổ biến (chuỗi, số, thiếu dữ liệu), và trực quan hóa dữ liệu bằng thư viện Python như matplotlib và seaborn.
Bài tập ứng dụng: Khám phá và trực quan hóa dữ liệu chương trình truyền hình trên Netflix.
Giới thiệu khái niệm phân loại, cách hoạt động của thuật toán KNN, và cách đo khoảng cách giữa các điểm dữ liệu.
Bài tập ứng dụng: Ứng dụng KNN vào bài toán phát hiện điểm dữ liệu ngoại lai.
Tìm hiểu 3 thành phần chính của một hệ thống học máy: dữ liệu, mô hình, và quá trình huấn luyện. Giới thiệu các độ đo trong bài toán phân lớp và hồi quy. Giới thiệu kĩ thuật đánh giá một mô hình học máy.
Bài tập ứng dụng: Phát triển mô hình học máy cho bài toán phát hiện email spam.
Giới thiệu dạng hàm tuyến tính và mô hình hồi quy tuyến tính đơn giản. Tìm hiểu cách đo sai số bằng hàm mất mát (MSE) và các phương pháp tối ưu hoá bằng giải tích. Phân tích đầu ra của mô hình để đưa ra quyết định dựa trên dữ liệu.
Bài tập ứng dụng: Dự đoán chi phí y tế cá nhân với hồi quy đơn (đa) biến. Ứng dụng Lasso Regression để chọn lựa các đặc trưng.
Tìm hiểu phương pháp tối ưu hóa Gradient Descent trong học máy: khái niệm đạo hàm, cách tính gradient, và cơ chế cập nhật tham số. Phân tích ảnh hưởng của learning rate, số epoch, và batch size. Giới thiệu các biến thể như Stochastic và Mini-batch Gradient Descent.
Bài tập ứng dụng:
  • Cài đặt Gradient Descent với chức năng tính đạo hàm tự động từ pytorch.
  • Ứng dụng thuật toán Gradient Descent để tìm tham số cho mô hình dự đoán cổ phiếu Tesla.
Tìm hiểu thuật toán Logistic Regression và cách áp dụng nó cho bài toán phân loại nhị phân và bài toán phân loại đa lớp.
Bài tập ứng dụng: Áp dụng Logistic Regression vào dự đoán khả năng vỡ nợ.
Khám phá mô hình Naive Bayes thông qua kiến thức xác suất: biến ngẫu nhiên, xác suất có điều kiện, và định lý Bayes. Áp dụng Naive Bayes vào các bài toán phân loại với nhiều dạng dữ liệu khác nhau.
Bài tập ứng dụng: Xây dựng mô hình cho bài toán Sentiment Analysis từ văn bản.
Giới thiệu các kỹ thuật trích xuất và tạo đặc trưng mới nhằm tăng hiệu quả mô hình: biến đổi đặc trưng, tạo tương tác giữa các biến, và encoding nâng cao. Giới thiệu pipeline để xây dựng một mô hình máy học hoàn chỉnh.
Bài tập ứng dụng: Xây dựng mô hình dự đoán giá nhà.

Tham gia Kaggle challenge xây dựng mô hình dự đoán khoản cho vay (Loan Approval Prediction).

Tìm hiểu ý tưởng về phân tách tuyến tính tối ưu bằng đường biên lớn nhất (maximum margin). Giới thiệu ý tưởng giải quyết mối quan hệ phi tuyến bằng kernel. Giới thiệu mối quan hệ của SVM với hinge loss.
Bài tập ứng dụng: Khám phá sự tác động của các siêu tham số lên khả năng dự đoán của mô hình SVM.
Hiểu cách Decision Tree hoạt động, từ việc chia nhánh dữ liệu dựa trên các thuộc tính đến ứng dụng trong các bài toán học máy khác nhau.
Bài tập ứng dụng: Ứng dụng Decision Tree cho feature engineering vào xây dựng mô hình để phát hiện mã độc phần mềm.
Học cách tối ưu hoá mô hình bằng cách điều chỉnh siêu tham số. Tìm hiểu ba phương pháp Ensemble chính: bagging, boosting và stacking; cùng với những thuật toán liên quan trong mỗi phương pháp.
Bài tập ứng dụng: Xây dựng mô hình dự đoán khả năng bệnh tiểu đường.
Giới thiệu học không giám sát và thuật toán phân cụm phổ biến như K-means và Hierarchical Clustering. Trực quan hóa kết quả phân cụm và đánh giá chất lượng phân cụm bằng silhouette score.
Bài tập ứng dụng: Sử dụng K-Means cho bài toán nén ảnh.
Tìm hiểu kĩ thuật giảm chiều dữ liệu Principal Component Analysis (PCA) và cách ứng dụng để tối ưu hiệu suất mô hình và trực quan hoá dữ liệu.
Bài tập ứng dụng: Ứng dụng rút trích đặc trưng cho bài toán nhận diện khuôn mặt.
Tìm hiểu nguyên lý hoạt động của mạng nơ-ron, cấu trúc cơ bản và các khái niệm căn bản như forward propagation và backward propagation. Giới thiệu cách huấn luyện và hoạt động của các mô hình ngôn ngữ lớn hiện nay.
Bài tập ứng dụng: Xây dựng mạng nơ-ron cho bài toán phân loại chữ viết tay.
Tham gia Kaggle challenge xây dựng mô hình dự đoán tiền chi trả bảo hiểm (Insurance Regression).

Nghe chia sẻ kinh nghiệm từ các kĩ sư Machine Learning/Data Scientist của các công ty lớn.