Split - Apply - Combine

Nguyên lý đằng sau mọi phép toán nhóm (groupby). Giống như việc phân loại và cân trái cây.

Bước 0: Dữ liệu trộn lẫn
df.groupby('Loại')['Trọng lượng'].sum()
🍎150g
🍊200g
🍎130g
🍊210g
🍐180g
1. Dữ liệu ban đầu là một đống lộn xộn. Ta không thể tính tổng trọng lượng của từng loại trái cây ngay lập tức.

Triết lý GroupBy

groupby() không bao giờ đứng một mình. Bản thân df.groupby() chỉ tạo ra một đối tượng trung gian (các giỏ trống).

Nó luôn đòi hỏi phải đi kèm một Hàm tổng hợp (Aggregate Function) như .sum(), .mean(), hoặc .count().

Nếu bạn không bảo nó "cân" hay "đếm", thì việc chia giỏ trở nên vô nghĩa.

Story Mode: Sự thay đổi cấu trúc bảng