AI – INTRODUCTION TO MACHINE LEARNING

Bạn muốn bắt đầu học Trí Tuệ Nhân Tạo (AI) nhưng không biết bắt đầu từ đâu? Bạn cảm thấy choáng ngợp trước lượng kiến thức khổng lồ và không rõ nên học theo lộ trình nào để hiệu quả?

Khoá học “Big O AI – Introduction to Machine Learning” sẽ giúp bạn gỡ rối với một lộ trình học tập bài bản, được chọn lọc kỹ lưỡng. Khoá học sẽ giúp bạn xây dựng một nền tảng vững chắc để từ đó có thể tự tin hơn trên hành trình chinh phục kiến thức về AI.

Sau khi kết thúc khoá học, bạn sẽ học được cách:

  •  Xử lý và trực quan hoá dữ liệu: Học cách chuẩn bị và làm sạch dữ liệu, cũng như cách sử dụng các công cụ và kỹ thuật để trực quan hoá dữ liệu .

  • Các thuật toán cơ bản trong học máy : Hiểu vững cách các thuật toán máy học cơ bản hoạt động và cách áp dụng chúng. 

  • Tối ưu hoá mô hình : Học các kĩ thuật nâng cao hiệu quả mô hình như điều chỉnh siêu tham số (Hyperparameter Tuning), Ensemble, v.v.

  • Mạng nơ-ron : hiểu được nguyên lý hoạt động của mạng nơ-ron từ đó có kiến thức vững chắc để tìm hiểu về Deep Learning.

Ngôn ngữ minh họa: Ngôn ngữ được sử dụng rộng rãi nhất hiện nay Python.

Ngoài ra để được hỗ trợ tư vấn rõ hơn về khóa học AI bạn có thể liên hệ qua fanpage sau: Big-O Coding

Để đăng ký khóa học và tham khảo học phí các bạn có thể điền thông tin tại đây

ĐỐI TƯỢNG HỌC PHÙ HỢP

  • Tiên quyết: Học viên đã biết lập trình Python căn bản. 

  • Tuỳ chọn: Nắm được những kiến thức toán giải tích, đại số và xác suất căn bản như đạo hàm, vector, xác suất, v.v. Đã sử dụng qua các thư viện phổ biến trong ML như numpy, pandas, sklearn, v.v.

  • Nếu bạn chưa thuộc đối tượng học phù hợp của lớp học Big-O vui lòng gọi cho chúng tôi qua số điện thoại: 0937.401.483 để được tư vấn học các lớp phù hợp với bạn.

BÀI TẬP MINH HỌA KHÓA HỌC

  • Bài tập được chia làm hai dạng: bài tập trắc nghiệm và bài tập lập trình được cung cấp dưới dạng jupyter notebook.
  • Đa dạng các loại bài tập khác nhau phù hợp với mỗi bài giảng: bài tập triển khai thuật toán từ đầu để hiểu chi tiết về thuật toán, bài tập ứng dụng các thuật toán vào giải quyết bài toán thực tế, v.v.
  • Đối với bài thi cuối kì, học viên được làm quen với Machine Learning challenge, nhằm giúp học viên vận dụng tất cả các kiến thức được học để giải quyết bài toán với dữ liệu thực tế.

THỜI GIAN VÀ ĐỊA ĐIỂM HỌC

  • Thời gian: 2 tháng (8 tuần)
  • Hình thức học: Online.
  • Học online qua: Zoom.
  • Số lượng học viên mỗi lớp: Tối đa 25  đến 30 học viên.
  • Mỗi lớp có 1 Giảng Viên chính và 5 trợ giảng.
  • Đặc biệt có giờ Office Hours (giờ học phụ đạo) hàng tuần cho học viên ôn lại bài học nếu không theo kịp tiến độ bài học.

SỰ KHÁC BIỆT CỦA CÁC KHÓA HỌC TẠI BIG-O CODING

1. CHƯƠNG TRÌNH GIẢNG DẠY:

  • Được giảng dạy bởi chuyên gia về AI, Thuật Toán với nhiều năm kinh nghiệm (xem thêm phần “đội ngũ giảng dạy“).
  • Được gặp gỡ và trao đổi với những bạn thành công đi trước chia sẻ kinh nghiệm học tập Thuật Toán và kinh nghiệm làm việc.
  • Mỗi lớp học ngoài Giảng Viên chính đều có 5 trợ giảng: Trợ giảng phụ trách tại lớp và trợ giảng phụ trách diễn đàn riêng của lớp đảm bảo mọi thắc mắc của học viên sẽ được trả lời nhanh chóng mọi lúc mọi nơi.

2. MỤC TIÊU ĐẠT ĐƯỢC SAU KHÓA HỌC:

  • Hệ thống toàn bộ kiến thức nền tảng vững chắc Machine Learning.
  • Xử lý và trực quan hoá dữ liệu: Nắm vững cách chuẩn bị và làm sạch dữ liệu, cũng như cách sử dụng các công cụ và kỹ thuật để trực quan hoá dữ liệu .
  • Các thuật toán cơ bản trong học máy: Hiểu vững cách các thuật toán máy học cơ bản hoạt động và cách áp dụng chúng. 
  • Tối ưu hoá mô hình: Nắm vững các kĩ thuật nâng cao hiệu quả mô hình như điều chỉnh siêu tham số (Hyperparameter Tuning), Ensemble, v.v.
  • Mạng nơ-ron : Hiểu được nguyên lý hoạt động của mạng nơ ron từ đó có kiến thức vững chắc để tìm hiểu về Deep Learninng

ĐỀ CƯƠNG CHI TIẾT

Nhắc lại những kiến thức cần lưu ý trong Python, làm quen với các thư viện phổ biến trong Machine Learning như Numpy, Pandas, v.v. và cách sử dụng chúng trong việc khám phá và làm sạch dữ liệu.
Bài tập ứng dụng: Khám phá dữ liệu Netflix TV Shows.
Giới thiệu khái niệm, phân biệt bài toán hồi quy và phân loại. Tìm hiểu thuật toán KNN, cách hoạt động và cách ứng dụng thuật toán trong cả bài toán hồi quy và phân loại.
Các bài tập ứng dụng:
  • Điều chỉnh tham số mô hình.
  • Ứng dụng KNN để phát hiện dữ liệu ngoại lai.
Tìm hiểu 3 thành phần cơ bản của hệ thống máy học.
Các metrics cho bài toán phân lớp: Confusion matrix, Accuracy, Precision, Recall, F-score, ROC-curve
Các metrics cho bài toán hồi quy: MAE, MSE, RMSE, R2.
Bias-variance trade-off.
Phương pháp đánh giá mô hình Cross-validation.
Các bài tập ứng dụng:
  • Phát hiện spam với KNN.
  • Tăng độ chính xác với kĩ thuật loại bỏ stop words.
Giới thiệu dạng hàm tuyến tính.
Giới thiệu hàm mất mát.
Giải bài toán tối ưu với Least-square.
Regularization.
Các bài tập ứng dụng: Xây dựng mô hình hồi quy dự đoán chi phí bảo hiểm y tế.
  • Hồi quy đơn biến.
  • Hồi quy đa biến.
  • Ứng dụng Lasso Regression để chọn lựa đặc trưng.
Ôn tập các kiến thức bổ trợ: Đạo hàm và Gradient.
Giới thiệu các thuật toán nâng cao: Momentum và Adaptive Learning Rate.
Các bài tập ứng dụng:
  • Bài toán minh hoạ 1: Robot tưới cây.
  • Bài toán minh hoạ 2: Linear regression (giới thiệu Mini-batch GD).
  • Điều chỉnh tham số cho thuật toán Gradient Descent.
  • Cài đặt thuật toán Gradient Descent với Momentum
Tìm hiểu thuật toán Logistic Regression và cách áp dụng nó cho bài toán phân loại nhị phân và bài toán phân loại đa lớp.
Bài toán minh hoạ 1: Binary classification.
  • Giới thiệu hàm sigmoid.
  • Thiết kế hàm mất mát với MLE: Logloss.
  • Tối ưu với gradient-descent.
Bài toán minh hoạ 2: Multiclass classification.
  • Giới thiệu Softmax.
  • Giới thiệu Cross-Entropy loss.
  • Tối ưu với Gradient-descent.
Nhắc lại về các khái niệm trong xác suất thống kê có liên quan mạnh mẽ đến Machine Learning như biến ngẫu nhiên, xác suất đồng thời, xác suất có điều kiện, định lý Bayes.
Tìm hiểu thuật toán Naive Bayes, và cách áp dụng nó vào các dữ liệu với những phân phối khác nhau.
Tìm hiểu một số phân phối:
  • Bernouli Distribution.
  • Gaussian Distribution.
  • Multinomial Distribution.
Các bài tập ứng dụng:
  • Tiền xử lý dữ liệu văn bản.
  • Multinomial Naive Bayes from Scratch.

Kỳ thi giữa kỳ của khóa học.

Giới thiệu ý tưởng Maximl Margin Classifier.
Giới thiệu Support Vector Classifier.
Giới thiệu kernel trick và SVM.
Các bài tập ứng dụng:
  • Chọn siêu tham số C.
  • Sử dụng kernel trick cho bài toán Minary Classification.
  • Sử dụng kernel trick cho bài toán Multiclass Classification.
Tìm hiểu các thành phần cơ bản trong Decision Tree, từ việc chia nhánh dữ liệu dựa trên các thuộc tính đến ứng dụng trong các bài toán học máy khác nhau.
Bài toán phân lớp.
  • Xây dựng DT với Recusive Binary Splitting.
  • Giới thiệu độ đo vẩn đục : Gini Index, Entropy.
Bài toán hồi quy.
  • Giới thiệu RSS
Giới thiệu tổng quan bài toán phân cụm.
Thuật toán K-means: ví dụ minh hoạ cho phân cụm khách hàng.
Chọn số lượng cụm trong K-means.
Giới thiệu phân cụm phân cấp.
Các bài tập ứng dụng:
  • Sử dụng kĩ thuật Elbow để chọn cụm K.
  • Giới thiệu thuật toán Kmeans++.
  • Ứng dụng Kmeans vào bài toán nén ảnh.
Giới thiệu bài toán giảm chiều dữ liệu.
Giới thiệu ý tưởng chính Principal Component Analysis (PCA).
Ôn tập kiến thức bổ trợ: Chuyển đổi hệ cơ sở trong không gian vector.
Thuật toán Principal Component Analysis (PCA): Minh hoạ bài toán phân nhóm khách hàng.
Giới thiệu phương pháp: Tìm số lượng thành phần chính tối ưu.
Các bài tập ứng dụng:
  • Eigenface và ứng dụng trong bài toán phân loại.
  • Tìm số lượng thành phần của PCA với tỉ lệ phương sai tích luỹ.
Giới thiệu phương pháp Ensemble.
Tìm hiểu ba phương pháp Ensemble chính:
  • Bagging: Random forest.
  • Boosting: AdaBoost, GradientBooost.
  • Stacking.
Giới thiệu các phương pháp tìm kiếm tham số: Grid Search, Random Search, Bayesian Optimization.
Các bài tập ứng dụng: Ứng dụng các kĩ thuật cho bài toán dự đoán bệnh tiểu đường.
  • Hyperparameter tuning.
  • Sử dụng các ensemble model.
Giới thiệu Deep Learning.
Giới thiệu các thành phần chính Artificial Neural Networks (ANN).
Các kiến trúc mạng Artificial Neural Networks (ANN).
Tìm hiểu Hàm mất mát và thuật toán Backpropagation.
Một số vấn đề: Exploding/Vanishing Gradient, Overfitting.
Các bài tập ứng dụng:
  • Sử dụng Pytorch để xây dựng mô hình NN.
  • Dữ liệu: Moon dataset -> Chuyển sang MNIST.
Giới thiệu tổng quan.
Data Exploration.
Data Preprocessing: Missing Values, Outliers, Normalization và Scale dữ liệu.
Feature Engineering: Feature Transformation, Feature Extraction, Feature Selection..
Class Imbalance và các cách giải quyết.
Giới thiệu Pipeline.
AutoML.
Bài tập ứng dụng: Áp dụng các kĩ thuật và mô hình cho bài toán dự đoán giá nhà.

Kỳ thi cuối kỳ.