fbpx

TÓM LẠI LÀ: CON AI NÀY CÓ THỂ TÓM TẮT CẢ BÀI NGHIÊN CỨU VÀO CHỈ MỘT CÂU

Công cụ mới của trang tìm kiếm giúp tóm tắt các nghiên cứu, hứa hẹn giúp việc đọc lướt (skim-reading) trở nên dễ dàng hơn.

Các nhà sáng lập của một trang tìm kiếm học thuật đã tiết lộ một phần mềm tự động tóm tắt các bài báo khoa học vào một câu, việc mà họ cho rằng có thể giúp các nhà khọc học tăng tốc độ đọc lướt.

Công cụ miễn phí này, thứ mà được nhóm phát triển gọi là “TLDR” (Too long, didn’t read – Dài quá, ngại đọc), đã được đưa vào hoạt động từ cuối năm 2020 với các kết quả tìm kiếm tại Semantic Scholar, một trang tìm kiếm được lập ra bởi Viện Trí tuệ Nhân tạo Allen (AI2) – một tổ chức phi lợi nhuận tại Seattle, Washington. Hiện tại, phần mềm chỉ đang tóm tắt mười triệu bài báo trong lĩnh vực khoa học máy tính được bảo trợ bởi Semantic Scholar, nhưng việc tóm tắt các bài báo trong các lĩnh vực khác được kỳ vọng sẽ được tiến hành trong thời gian tới, sau khi phần mềm đã được tinh chỉnh, theo lời Dan Weld, người quản lý nhóm Semantic Scholar tại AI2.

Hình: Kết quả tìm kiếm trên Semantic Scholar với tóm tắt 1 câu từ TLDR summaries khi xem trên điện thoại | Semantic Scholar

Các kiểm tra ban đầu cho thấy công cụ này thực sự giúp người đọc lựa chọn giữa các kết quả tìm kiếm nhanh hơn so với việc đọc nhan đề và tóm tắt của tác giả, đặc biệt nếu đọc trên điện thoại, Dan Weld nói. “Mọi người có vẻ thực sự thích thú với nó.”

Một ấn phẩm tiền xuất bản mô tả công cụ này đã được công bố vào tháng 4 trên arXiv – một server cho các ấn phẩm tiền xuất bản, và đã được chấp nhận cho công bố chính thức sau khi có phản biện đồng nghiệp từ một hội nghị về xử lý ngôn ngữ tự nhiên (natural-language-processing) tổ chức vào tháng này. Các nhà nghiên cứu đã công khai code của họ để mọi người có thể sử dụng miễn phí, cùng với đó là một trang web để mọi người đều có thể chạy và sử dụng thử công cụ này.

“Tôi dự đoán rằng công cụ kiểu này sẽ trở thành tiên chuẩn với các tìm kiếm học thuật trong tương lai không xa. Thực tế là, với sự cần thiết của nó, tôi ngạc nhiên là chúng ta phải tốn nhiều thời gian đến vậy để đưa nó vào thực tế,” theo lời Jevin West, một nhà khoa học thông tin tại đại học Washington, Seattle, người đã kiểm tra công cụ này theo thỉnh cầu của tạp chí Nature. “Nó không hoàn hảo, nhưng chắc chắn là một bước đi đúng hướng,” ông nói.

Weld đã được truyền cảm hứng để tạo ra phần mềm TLDR một phần bởi những câu Twit ngắn gọn mà đồng nghiệp của anh chia sẻ để gây sự chú ý với các bài báo. Như các phần mềm tạo ngôn ngữ khác, công cụ này sử dụng nhiều mạng thần kinh được học một lượng lớn văn bản. Nhóm phát triển cũng bao gồm hàng vạn bài báo nghiên cứu tương ứng với nhan đề của chúng, để mạng lưới có thể học và tạo ra các câu súc tích. Các nhà nghiên cứu sau đó tính chỉnh phần mềm để tóm tắt nội dung bằng cách sử dụng một bộ dữ liệu mới với khoảng vài nghìn bài báo trong lĩnh vực khoa học máy tính đi kèm với tóm tắt của chúng, một số được viết bởi chính tác giả của các bài báo trong khi số còn lại được viết bởi các sinh viên đại học. Nhóm phát triển đã thu thập các ví dụ để huấn luyện và cải tiến công năng phần mềm trong 16 lĩnh vực khác, mà trước tiên có lẽ sẽ là lĩnh vực y sinh.

Phần mềm TLDR không phải là công cụ duy nhất giúp tóm tắt các nghiên cứu khoa học: từ 2018, trang web Paper Digest đã cho ra lò các tóm tắt của nhiều bài báo, nhưng nó có vẻ chỉ trích ra các câu chủ chốt từ văn bản, chứ không thực sự tạo ra các câu mới, Weld chú thích. TLDR có thể tự nó tạo ra câu tóm tắt từ phần tóm tắt, giới thiệu và kết luận của bài báo. Câu tóm tắt của nó thường được tạo ra từ các cụm từ chủ chốt trong văn bản, vì vậy sẽ hướng đến các chuyên gia trong lĩnh vực, những người đã hiểu rõ các biệt ngữ của bài báo. Nhưng Weld cũng nói rằng nhóm cũng đang cố gắng để có thể tạo ra các tóm tắt hướng đến đối tượng không phải chuyên gia.

Những nhà nghiên cứu cũng lên kế hoạch để cho phép các nhà xuất bản sử dụng công nghệ này, và để mở rộng dịch vụ nhằm cung cấp các chỉ dẫn nghiên cứu được cá nhân hóa trong đó tổng hợp các bài báo quan trọng trong lĩnh vực nhất định. “Chúng tôi đã tới giai đoạn mà trí tuệ nhân tạo có thể tự tạo ra các tóm tắt ở mức độ chấp nhận được,” Weld cho biết.

Minh Vũ dịch

Nguồn: Jeffrey M. Perkel & Richard Van Noorden. (November 23, 2020). tl;dr: this AI sums up research papers in a sentence. Nature

Đăng ký Nhận bản tin

Bài viết liên quan

error: Content is protected !!

Để lại thông tin để nhận tư vấn