Về Chương 5
Mô Phỏng Pipeline ML

Mô Phỏng Pipeline Machine Learning

Trải nghiệm quy trình scikit-learn: Data → Split → Train → Evaluate

📊 Bước 1: Chuẩn bị DataFrame
#arearoomsprice 🎯
0502150
1803230
21204350
3652180
4953280
51405420
6753210
71104320
X = features (đầu vào)  |  y 🎯 = target (đầu ra cần dự đoán)

Hồi quy (Regression)

Mục tiêu: Dự đoán giá trị liên tục (ví dụ: giá nhà).

Thuật toán: LinearRegression — tìm đường thẳng khớp nhất.

Chỉ số: R² (khả năng giải thích) và RMSE (sai số trung bình).

sklearn Pipeline
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import r2_score, mean_squared_error
import numpy as np
 
# Bước 1: Chuẩn bị dữ liệu
X = df[['area', 'rooms']]
y = df['price']

Lý thuyết & Ứng dụng: Vòng Đời Machine Learning Chuyên Nghiệp