Về Chương 1
Neural Attention Map

Self-Attention Map

Hướng dẫn:Click vào bất kỳ từ nào trên khung hiển thị để xem mô hình phân bổ sự chú ý của nó đối với các từ khác.

Công thức Toán học

Attention(Q, K, V) = softmax( (Q * Kᵀ) / √dₖ ) * V

Trong đó, Q (Query) tìm kiếm các từ tương ứng; K (Key) chứa các từ đặc trưng; V (Value) chứa thông tin ngữ nghĩa. Phép nhân ma trận tìm mức độ liên kết giữa chúng.

Đang chọn từ: "it"
The1%
animal65%
did1%
not1%
cross2%
the1%
street5%
because2%
it15%
was1%
too2%
tired5%

Ma Trận Tự Chú Ý (Self-Attention Heatmap Matrix)

Từ KhóaTheanimaldidnotcrossthestreetbecauseitwastootired
it
0.01
0.65
0.01
0.01
0.02
0.01
0.05
0.02
0.15
0.01
0.02
0.05
animal
0.05
0.70
0.02
0.01
0.05
0.01
0.02
0.01
0.05
0.02
0.01
0.05
street
0.01
0.02
0.01
0.01
0.20
0.15
0.50
0.01
0.05
0.01
0.01
0.02
tired
0.01
0.35
0.01
0.02
0.05
0.01
0.02
0.05
0.10
0.05
0.15
0.18
cross
0.02
0.12
0.05
0.08
0.45
0.02
0.18
0.01
0.03
0.01
0.01
0.02