Tin tức
Hotline: (84 04) 382 49874      
Hỗ trợ online: Chát với hỗ trợ Online - Yahoo Chát với hỗ trợ Online - Skype  Liên Hệ  Tiếng Anh
http://techmartvietnam.vn/Portals/_default/Skins/NVPortal/Images/xuctien.jpg
http://techmartvietnam.vn/Portals/_default/Skins/NVPortal/Images/xuctien.jpg

Hệ thống hỗ trợ tra cứu tài liệu thông minh 3:51 PM,9/13/2016

Nhóm nghiên cứu Trần Nguyễn Minh Thư, Huỳnh Quang Nghi, Trường đại học Cần Thơ đã ứng dụng phương pháp lọc cộng tác của hệ thống gợi ý, kết hợp với công cụ chỉ mục từ khóa tìm kiếm Elastic Search vào chức năng tìm kiếm tài liệu. Kết quả là một hệ thống gợi ý tài liệu - RecoLRC đảm bảo tìm kiếm tốt theo từ khóa, đồng thời tạo ra danh sách các gợi ý dựa trên tên tài liệu, từ khóa và lịch sử mượn sách.

Trung tâm học liệu, Trường đại học Cần Thơ là thư viện điện tử đầu tiên tại đồng bằng sông Cửu Long, cung cấp các bộ sưu tập phong phú về tài liệu (sách, tạp chí khoa học, tài liệu số, tài liệu nghe nhìn, cơ sở dữ liệu...). Trung tâm học liệu hiện có khoảng 150.000 nhan đề sách (titles), các cơ sở dữ liệu (CSDL) trực tuyến như ProQuest Central, Sage, Hinari… Độc giả có thể dùng hệ thống thư mục trực tuyến (OPAC) hiện có khoảng 150.000 biểu ghi thư mục (bibliographic records) để truy cập thông tin về sách in và CSDL luận văn của Trường đại học Cần Thơ.

Trung tâm học liệu được xây dựng từ thư viện trung tâm của Trường đại học Cần Thơ, được tài trợ từ các tổ chức quốc tế như OMS, IRRI, MCC, SAREC, ALA (Mỹ), chương trình MHO. Do quá trình hình thành và phát triển trải qua một thời gian dài, được hỗ trợ từ nhiều tổ chức khác nhau nên việc lưu trữ CSDL của trung tâm còn chưa được thống nhất. Hệ thống quản lý tài liệu của trung tâm gồm 2 phần tách biệt, mỗi phần được quản lý bởi một hệ quản trị CSDL khác nhau với một số thông tin tương đối giống nhau. Cụ thể là các CSDL của các loại sách in, sách tham khảo, giáo trình môn học... được lưu trên hệ quản trị CSDL Oracle, còn các luận văn đại học, luận văn cao học... thì hiện được lưu trữ trên hệ quản trị CSDL MySQL. Việc lưu trữ CSDL còn rời rạc dẫn đến khi tra cứu tài liệu của độc giả mất thời gian hơn. Thay vì chỉ tìm kiếm 1 lần thì với 2 CSDL như hiện tại, độc giả cần phải thực hiện việc tìm kiếm 2 lần để có đầy đủ các tài liệu cho nội dung cần nghiên cứu. Ngoài việc gây khó khăn cho độc giả thì với 2 CSDL như vậy cũng làm cho việc quản lý, bảo trì phức tạp và mất nhiều thời gian hơn. Bên cạnh cách tổ chức thì chức năng tra cứu tài liệu hiện tại của trung tâm được xây dựng hiện nay là tìm kiếm chính xác từ khóa được nhập. Vì vậy, kết quả tìm kiếm chưa đáp ứng tốt nhu cầu.

Để khắc phục vấn đề này, nhóm nghiên cứu sử dụng một kho dữ liệu (data warehouse) chung để xây dựng một hệ thống gợi ý hỗ trợ tra cứu tài liệu - RecoLRC. Trên hệ thống RecoLRC, độc giả không phải vào 2 địa chỉ url khác nhau để tìm kiếm tài liệu cùng một chủ đề nhưng khác thể loại. Bên cạnh đó, họ cũng áp dụng hệ thống gợi ý vào chức năng tìm kiếm nhằm làm phong phú thêm kết quả tìm kiếm, để hỗ trợ tốt nhất cho các độc giả trong quá trình tra cứu sách.

Với phương pháp tiếp cận Kimball, nhóm nghiên cứu tích hợp CSDL Oracle và MySQL hiện có của Trung tâm học liệu thành một kho dữ liệu. Để hỗ trợ tích hợp các CSDL khác nhau cho hệ thống RecoLRC, họ xây dựng các “Data Reader” để đọc dữ liệu tương ứng từ các CSDL khác nhau đưa vào CSDL chung được xây dựng bằng Mongo DB. Lịch trình đọc dữ liệu bởi các “Data Reader” sẽ được thực hiện định kỳ theo lịch biểu đã đặt sẵn hoặc thực hiện khi cần thiết. Với CSDL chung, nhóm nghiên cứu sử dụng các tiêu chí sau để xây dựng hệ thống gợi ý: tên tài liệu, từ khóa và lịch sử mượn sách của thư viện. Hệ thống RecoLRC được xây dựng kết hợp phương pháp lọc cộng tác (dựa vào lịch sử mượn sách của độc giả) và Elastic Search (dựa vào tên tài liệu, từ khóa, tóm tắt). Thông tin về năm xuất bản và nhà xuất bản được sử dụng để cập nhật lại bảng xếp hạng của các tài liệu gợi ý.

Để sử dụng phương pháp lọc cộng tác, nhóm nghiên cứu dựa vào bảng lịch sử mượn sách của độc giả tại Trung tâm học liệu. “Tài liệu” ở đây được xác định bởi mã “nhan đề tài liệu”. “Nhan đề tài liệu” là tập hợp nhiều quyển tài liệu giống nhau, do trung tâm trang bị nhiều quyển sách giống nhau để phục vụ đồng thời được nhiều độc giả. Dựa vào các thông tin “mã số độc giả”, “mã nhan đề tài liệu” và “thời gian mượn” tài liệu, sẽ xác định được các giao dịch mượn tài liệu. Với thông tin này, nhóm nghiên cứu xây dựng phương pháp lọc cộng tác dựa trên item, tài liệu để tạo ra danh sách gợi ý.

Nguồn: Khoa học phổ thông

Send Print  Back
The news brought
Xây dựng thành công bộ bản đồ thông tin không gian vườn quốc gia và khu bảo tồn thiên nhiên 9/13/2016
Hệ thống dịch tiếng nói 2 chiều Việt - Anh, Anh - Việt 9/9/2016
Ổ USB "miễn dịch" với virus 9/9/2016
Hệ thống thông tin quản lý, giám sát tài nguyên vườn quốc gia và khu bảo tồn thiên nhiên khu vực Tây Bắc 9/9/2016
Thúc đẩy hợp tác với Tập đoàn Bưu chính Viễn thông Việt Nam 8/30/2016
VINASA đề cử các sản phẩm CNTT tham dự Giải thưởng quốc tế APICTA 8/30/2016
Kính áp tròng "trò chuyện" với smartphone, smartwatch qua wifi 8/24/2016
Ngày hội toán học mở "Bản giao hưởng số PI" 8/23/2016
Bkav ra mắt công nghệ chống mất trộm thông tin 8/22/2016
Doanh nghiệp viễn thông sẽ được cấp phép 4G vào tháng tới 8/19/2016
CEO GotIt! đoạt giải thưởng nhà sáng lập startup của năm tại Việt Nam 8/19/2016
Cậu học trò mang “ánh sáng” công nghệ đến người khiếm thị 8/19/2016
TP Hồ Chí Minh: Khởi tranh giải thưởng Công nghệ Thông tin – Truyền thông 8/18/2016
Thanh tra bản quyền CNTT sau vụ tin tặc tấn công sân bay 8/18/2016
Ford giới thiệu phần mềm mô phỏng miễn phí SYNC 3 AppLink 8/16/2016













Trang chủ   |    CN/TB chào bán   |    CN/TB tìm mua   |    Tin tức   |    Giới thiệu   |    Liên hệ Register   |    Login   
Số lượt truy cập: 120515703 Bản quyền thuộc Cục Thông tin Khoa học và Công nghệ Quốc gia.
Địa chỉ trụ sở chính: 24 Lý Thường Kiệt - Quận Hoàn Kiếm - Hà Nội.
Tel: (84-04) 38249874 - 39342945 | Fax: (08-04) 38249874 | Email: techmart@vista.gov.vn