Thuật toán giúp công cụ tìm kiếm 'made in Vietnam' đạt kết quả tối ưu
3:29 CH,12/01/2024
Weoja là sản phẩm công cụ tìm kiếm của Công ty TNHH Công nghệ 44+, hoàn toàn do các kỹ sư Việt Nam phát triển. Điều đặc biệt nhất của công cụ tìm kiếm này là “100% không thu thập thông tin cá nhân của người dùng” song vẫn mang lại kết quả tối ưu, đáp ứng nhu cầu tìm kiếm thông tin của người dùng.

Ông Lê Bắc Nam, Founder của dự án Weoja, cho biết công cụ tìm kiếm “made in Vietnam” này được đội ngũ nghiên cứu và phát triển trong suốt hơn 6 năm. Để có thể trả về những kết quả tìm kiếm tối ưu nhất mà không theo dõi, thu thập thông tin cá nhân của người dùng, Weoja sử dụng thuật toán tìm kiếm độc quyền và xếp hạng trang web của riêng mình, được gọi là WeoAlgorithm (Thuật Toán WEO).

Thuật toán này cung cấp kết quả tìm kiếm một cách chất lượng dựa trên thông tin có sẵn trong cơ sở dữ liệu mà không cần theo dõi người dùng cá nhân.

Theo đó, bot thu thập dữ liệu và lập chỉ mục WeoBot của Weoja hoạt động bằng cách sử dụng các công nghệ web scraping và data crawling để thu thập thông tin từ các trang web. Thông tin thu thập sẽ được gửi về máy chủ của Weoja và lập chỉ mục theo các tiêu chí khác nhau, chẳng hạn như thông tin nội dung, ngôn ngữ và vị trí.

Thuật toán tìm kiếm WeoAlgorithm sẽ sử dụng cơ sở dữ liệu và công nghệ WeoBot để tìm kiếm thông tin dựa trên nhiều phương pháp khác nhau, như tìm kiếm theo từ khóa, tìm kiếm theo cụm từ, tìm kiếm theo ngôn ngữ, tìm kiếm theo ngữ điệu, ngữ cảnh. Kết quả tìm kiếm của Weoja được thu thập từ các nguồn đa dạng và được sắp xếp theo cách phù hợp với nhu cầu của người dùng.

Chẳng hạn, tìm kiếm theo ngữ điệu, ngữ cảnh là một tính năng của Weoja cho phép người dùng tìm kiếm thông tin theo cách mà họ muốn, bằng cách sử dụng các từ khóa có chứa ngữ điệu hoặc ngữ cảnh. Ví dụ, nếu người dùng muốn tìm kiếm những bài viết vui vẻ về một chủ đề nào đó, họ có thể thêm từ khóa "vui" hoặc "hài hước" vào trước hoặc sau chủ đề đó.

Nếu người dùng muốn tìm kiếm những bài viết có liên quan đến một sự kiện hoặc một thời điểm nào đó, họ có thể thêm từ khóa "sự kiện" hoặc "thời gian" vào trước hoặc sau chủ đề. Tìm kiếm theo ngữ điệu, ngữ cảnh giúp người dùng tìm kiếm thông tin một cách dễ dàng và chính xác hơn.

Ông Lê Bắc Nam cho biết Weoja đang tiếp tục phát triển thuật toán tìm kiếm và bot thu thập dữ liệu của mình để cải thiện chất lượng và độ chính xác của kết quả tìm kiếm.

Weoja sử dụng công nghệ tự động để thu thập thông tin về các trang web, ngoài ra chúng tôi có sử dụng con người để sắp xếp, đánh giá sự chính xác của thông tin. Chúng tôi sẽ đào tạo dữ liệu thông tin cho WeoBot bằng cách dạy cho nó cách người dùng tìm kiếm như thế nào, cách xử lý và ngữ cảnh mà người dùng thường xuyên sử dụng”, founder của dự án Weoja chia sẻ.

Nói về Weoja, ông Lê Bắc Nam dùng cụm từ “tìm kiếm sạch”. Điều này đồng nghĩa với việc người dùng khi sử dụng công cụ tìm kiếm này có thể thu về các kết quả tìm kiếm thông tin một cách khách quan, trung lập mà không bị ảnh hưởng bởi các yếu tố như quảng cáo, theo dõi người dùng, dữ liệu cá nhân, hoặc các bên thứ ba khác.

Nguồn: https://vtc.vn/



Bản quyền thuộc Cục Thông tin Khoa học và Công nghệ Quốc gia.
Địa chỉ trụ sở chính: 24 Lý Thường Kiệt - Quận Hoàn Kiếm - Hà Nội.
Tel: (84-04) 38249874 - 39342945 | Fax: (08-04) 38249874 | Email: techmart@vista.gov.vn