Bài báo khoa học: Tăng cường trích xuất dữ liệu với LLMs và hệ thống Rag, nhóm tác giả: Võ Thị Ngọc Hà – Trường Đại học Quang Trung, Trần Trọng Kiên – Trung tâm chuyển đổi số tỉnh Bình Dương và Khâu Văn Bích – Trường Đại học Trần Đại Nghĩa, được đăng trên Tạp chí Khoa học Lạc Hồng ngày 15/03/2025.
Bài báo khoa học nghiên cứu về các mô hình ngôn ngữ lớn (Large Language Models – LLMs) có khả năng mô phỏng tốt các nhiệm vụ của con người nhưng hạn chế trong trích xuất dữ liệu chính xác. Để khắc phục, LLMs được tích hợp với Hệ thống tạo dữ liệu kết hợp truy xuất (Retrieval-Augmented Generation – RAG), sử dụng các thuật toán phân đoạn, tìm kiếm và xếp hạng để cải thiện truy xuất thông tin từ văn bản không có cấu trúc. Nghiên cứu thực nghiệm đã tối ưu hóa các phương pháp phân đoạn và đề xuất khung lý thuyết, mở đường cho sự phát triển và mở rộng ứng dụng của các hệ thống RAG trong tương lai.
Hãy cùng Khoa Khoa học máy tính & Công nghệ thông tin – Trường Đại học Quang Trung tìm hiểu chi tiết Bài báo khoa học này, cũng như chúc mừng ThS. Võ Thị Ngọc Hà – Giảng viên Khoa KHMT&CNTT, Trường Đại học Quang Trung đã xuất sắc đạt thành tựu trong nghiên cứu khoa học được đăng trên tạp chí khoa học uy tín.
