Xây dựng hệ thống Chatbot ứng dụng học sâu vào xử lý ngôn ngữ tự nhiên

Giới thiệu chung

Chủ dự án
Nguyễn Dương Phúc Tài
Lĩnh vực
Công nghệ thông tin
Quốc gia
Việt Nam
Mô tả ngắn
Lấy cảm hứng từ những thành công gần đây của học sâu trên Xử lý ngôn ngữ tự nhiên, chúng tôi đề xuất phương pháp tiếp cận dựa trên học sâu để phát triển một chatbot tư vấn tuyển sinh của các trường đại học Việt Nam.

Giới thiệu chi tiết

Hướng nghiệp là một trong những việc quan trọng nhất đối với học sinh, là bước khởi đầu giúp các em dễ dàng tìm ra thế mạnh của mình và thành công trong nghề nghiệp sau này. Theo khảo sát của bộ phận tuyển sinh và định hướng nghề của các trường năm 2017, có đến 15 – 20% sinh viên sau khi tốt nghiệp mới biết bản thân chọn sai ngành. Vấn đề này vì thông tin và phương thức tuyển sinh của Trường thường xuyên cập nhật qua từng năm gây khó khăn trong việc chọn lọc thông tin. Một chatbot hiểu được sự ảnh hưởng mà lời nói của nó đối với người đối thoại có thể là một bước tiến quan trọng để đạt được chatbot ở cấp độ con người. Hệ thống đề xuất trong dự án luôn cung cấp thông tin chính xác và chatbot như một giải pháp để phản hồi ngay lập tức 24/7. Điểm khác biệt trong nghiên cứu của chúng tôi là kiến trúc hệ thống bao gồm lõi xử lý ngôn ngữ tự nhiên và hệ thống quản lý đối thoại. Đối với nhiệm vụ nhận dạng ý định của người dùng, phương pháp đối sánh mẫu được áp dụng để liên kết với mô hình phân loại văn bản bằng cách sử dụng kiến trúc Bi-LSTM. Ngoài ra, chúng tôi sử dụng Deep Q-Network để đào tạo mô hình quản lý hệ thống đối thoại, kiến trúc DQN được xây dựng gồm một tác nhân và các lớp tuyến tính với hàm mất mát MSE. Chúng tôi đã huấn luyện các mô hình và thử nghiệm với một tập con của bộ dữ liệu câu hỏi về Trường Đại học Bách khoa Thành phố Hồ Chí Minh (ĐHBK). Kết quả thực nghiệm đạt 89% f1-score trung bình của nhiệm vụ phân loại văn bản, và kết quả đánh giá quản lý đối thoại đạt tỷ lệ thành công 86%. Bản thân tôi tin rằng hệ thống hỏi và đáp là giải pháp tốt nhất không chỉ trong thời đại xã hội xa cách do đại dịch COVID-19 mà còn có tiềm năng lâu dài trong tương lai.
***
Contact us: taindp98@gmail.com