So sánh văn bản dựa trên mô hình Vector

So sánh văn bản dựa trên mô hình Vector
Nơi đăng: tap chi khoa hoc cong nghe DHDN (Ngon ngu), Số: , Trang: , Năm: 2017, Loại bài viết: Bài báo, Quốc gia: Việt Nam.

Tóm tắt:

Trong bài báo này chúng  tôi  trình bày các kết quả nghiên cứu  liên quan đến việc so sánh mức độ giống nhau của hai văn bản. Việc so sánh này phục vụ mục đích xác định mức độ giống nhau của một văn văn này với một văn bản khác. Phương pháp của chúng tôi đề xuất là chuyển các văn bản thành các véc-tơ. Mỗi phần tử của véc-tơ là trọng số  tương ứng  với  từ  chỉ mục  xuất hiện  trong  văn bản. Việc  so  sánh mức độ giống nhau  của hai  văn bản được chuyển về tính góc tạo bởi hai véc-tơ. Góc này đặc trưng cho mức độ giống/khác nhau giữa hai văn bản. Chúng tôi đã phát triển công cụ phục vụ so sánh hai văn bản hoặc một văn bản với một tập n văn bản cho trước. Kết quả đạt được phản ánh đúng mức độ giống/khác nhau và đáp ứng mục tiêu đặt ra.