Về Chương 3
Two-Stage Retrieval & Re-ranking Pipeline

Two-Stage Retrieval & Re-ranking

Trực quan hóa quy trình RAG 2 bước: Bước 1 (Tìm kiếm vector nhanh lấy Top 50) và Bước 2 (Dùng Cross-Encoder xếp hạng lại lấy Top 3 chất lượng nhất).

Bước 1: Vector SearchBước 2: Cross-Encoder RerankerTop 3 cho LLM Prompt
Doc d1

Cẩm nang ôn thi MOS Word 2026

Tài liệu ôn luyện Word chi tiết bám sát barem điểm thi.

Vector Cos
0.85
Doc d2

Hướng dẫn đăng ký thi MOS cấp Trường

Thủ tục và form mẫu đăng ký dự thi cho sinh viên Đại học Huế.

Vector Cos
0.82
Doc d3

Giải pháp chuyển đổi số Hue University

Đề án nâng cấp hạ tầng CNTT toàn đại học.

Vector Cos
0.76
Doc d4

Cú pháp nâng cao trong Microsoft Excel

Mẹo sử dụng hàm LOOKUP, XLOOKUP và Array Formulas phục vụ thi MOS.

Vector Cos
0.68
Doc d5

Quy chế thi chứng chỉ ngoại ngữ quốc tế

Quy định quy đổi điểm IELTS/TOEFL.

Vector Cos
0.62
Sẵn sàng chạy Pipeline...
Dùng Re-ranker:

⚡ Hiệu Năng Truy Xuất

Retrieval Precision
95%
Latency Overhead
+80ms

Giải thích Thuật Toán

Bi-Encoder (Stage 1) mã hóa độc lập Query và Document thành các vector nhúng rồi so sánh nhanh. Tốc độ cực nhanh (phù hợp tìm kiếm hàng triệu tài liệu) nhưng độ chính xác ngữ nghĩa trung bình.

Cross-Encoder (Stage 2) nhận đầu vào là cặp (Query + Document) kết hợp rồi phân tích qua cơ chế Attention toàn bộ từ vựng cùng lúc. Độ chính xác cực cao nhưng tài nguyên tính toán lớn (chỉ áp dụng xếp hạng lại trên tập nhỏ Top 50).