Hiểu cách LLM xử lý Context Window và tính toán Top-K Softmax.
LLM tính toán xác suất của toàn bộ từ vựng (Vocab Size ~ 100,000 từ) để đoán token tiếp theo.
*Click vào các option bên trái để mô phỏng quá trình AI "rẽ nhánh" tự suy luận.