fbpx

DẤU HIỆU CỦA VIỆC “GIAN LẬN TRÍCH DẪN” TRÊN CÁC BÀI BÁO KHOA HỌC

Một thuật toán được phát triển để phát hiện các mẫu trích dẫn bất thường giúp tìm ra các nhà khoa học đã thao túng danh sách tài liệu tham khảo.

“Nếu có ai đó cố gắng thao túng những trích dẫn tới họ, họ sẽ để lại dấu vết”, Jonathan Wren, một nhà tin sinh học thuộc Tổ chức Nghiên cứu Y học Oklahoma (OMRF) cho biết. Anh cùng đồng nghiệp của mình là Constantin Georgescu đã phân tích mẫu trích dẫn của 20.000 tác giả khoa học và đăng tải phát hiện của mình trên trang preprint bioRxiv. Trong đó họ tìm thấy 80 nhà khoa học có những trích dẫn có sự thao túng danh sách tài liệu tham khảo liên tục và lặp đi lặp lại và khoảng 16% các tác giả trong mẫu phân tích của họ “đã từng thao túng danh sách tài liệu tham khảo vào một thời điểm nào đó trong sự nghiệp nghiên cứu”.

Nghiên cứu này chưa được phản biện và nhận được nhiều sự phản đối, nhưng phương pháp nghiên cứu có vẻ đúng về mặt kỹ thuật, điều này được nhận định bởi 2 nhà chuyên gia thư mục lượng không tham gia nghiên cứu trên. 

“Nếu có ai đó cố gắng thao túng những trích dẫn tới họ, họ sẽ để lại dấu vết”

Thao túng trích dẫn 

Các nhà nghiên cứu thường phàn nàn rằng những người bình duyệt (reviewers) yêu cầu họ thêm các tài liệu tham khảo không cần thiết vào các bài báo. Việc này được gọi là trích dẫn mang tính cưỡng chế (coercive citation). Các cuộc khảo sát cho thấy khoảng 1/5 hoặc nhiều hơn các nhà khoa học đã trải qua điều này. Năm ngoái, nhà xuất bản Elsevier cho biết sau khi kiểm tra hồ sơ phản biện đồng nghiệp tại các tạp chí của mình, họ tiếp tục điều tra một số nhà khoa học mà họ nghi ngờ cố tình thao túng quy trình bình duyệt để nâng cao lượng trích dẫn tới các công bố của họ. Các tác giả đôi khi cũng thỏa thuận để trích dẫn lẫn nhau.

Wren bắt đầu ý tưởng nghiên cứu của mình sau khi phát hiện ra trường hợp của Kuo-Chen Chou, một nhà lý sinh người Mỹ liên tục thao túng quá trình phản biện để tăng lượng trích dẫn cho mình. Chou sau đó đã bị cấm không được tiếp tục làm người phản biện cho tạp chí Bioinformatics (nơi Wren là trợ lý biên tập) và cấm khỏi ban biên tập của Journal of Theoretical Biology và Nature. Chou nói với Nature rằng anh ta không tham gia vào việc “cưỡng chế trích dẫn từ người bình duyệt”.

Sau khi phát hiện ra hành vi của Chou, Wren bắt đầu nhận được email từ các nhà nghiên cứu yêu cầu anh kiểm tra hồ sơ của các học giả khác mà họ cho rằng có thể liên quan đến việc gian lận trích dẫn. Nhưng vì hầu hết các quy trình bình duyệt đều được bảo mật, Wren hy vọng sẽ phát hiện ra những trường hợp như vậy bằng cách kiểm tra hồ sơ trích dẫn. Việc tự trích dẫn (self-citation) số lượng lớn rất dễ đo lường, nhưng để quyết định được thế nào sẽ được coi là một mẫu trích dẫn bất thường liên quan đến các tác giả khác thì khó hơn nhiều.

Wren và Georgescu đã xem xét nhiều chỉ số “cảnh báo” tiềm năng, chẳng hạn như khi các nhà nghiên cứu thường xuyên nhận được khối lượng trích dẫn liên tiếp trong các bài báo của người khác hoặc nhận được nhiều trích dẫn hơn hẳn từ một tạp chí. Họ phát hiện ra một điểm quan trọng tương quan với nhiều chỉ số cảnh báo là độ lệch tổng thể hay sự bất bình đẳng trong phân phối lượng trích dẫn mà các nhà khoa học nhận được từ công trình của người khác: một số nhà nghiên cứu được trích dẫn một số lượng lớn bất thường với chỉ một vài bài báo.

Nghiên cứu có một số giới hạn như không thể truy cập vào cơ sở dữ liệu về công trình nghiên cứu của tất cả các nhà khoa học mà phải phân tích hồ sơ công khai trong cơ sở dữ liệu PubMed, hay chỉ xem xét những tác giả có chữ cái tên đệm viết tắt trên bài báo để giảm khả năng nhận dạng sai. Tuy vậy những hạn chế này cũng giúp đưa ra ý tưởng về việc mẫu trích dẫn nào là có vấn đề. Khoảng 80 tác giả trong số hơn 20000 được phân tích – bao gồm Chou – có các mẫu trích dẫn cho thấy một sự phân bố trích dẫn lệch nghiêm trọng cùng với các chỉ số cảnh báo khác. Các nhà nghiên cứu có những mẫu trích dẫn kỳ lạ này cũng có xu hướng tự trích dẫn cao.

Khi được yêu cầu phản hồi cho việc này, Chou nói với Nature rằng nghiên cứu này là “vô nghĩa”, bởi vì “số lượng trích dẫn không quan trọng”.

Wren không trực tiếp nêu tên các nhà nghiên cứu trong bài báo vì vấn đề pháp lý, tuy nhiên ông đã phân tích chi tiết một số hồ sơ trích dẫn riêng lẻ và sẵn sàng cung cấp cho những ai có yêu cầu. Một trong những nhà nghiên cứu trong dữ liệu bổ sung mà Wren gửi cho Nature là Dimitrios Roukos, một nhà nghiên cứu về ung thư tại Đại học Ioannina ở Hy Lạp. Từ năm 2009 đến năm 2014, Roukos thu được lợi gần 2.000 trích dẫn từ 71 bài báo trên một tạp chí, Surgical Endoscopy. Mỗi nghiên cứu đã trích dẫn công trình của anh ấy khoảng 20-30 lần và đều được viết bởi các đồng nghiệp hoặc người cố vấn. Roukos đã từ chối bình luận bất cứ điều gì về vấn đề này.

Sự sai lệch không mong muốn

Phân tích chỉ cho thấy các mẫu trích dẫn bất thường và không thể đánh giá được liệu rằng một nhà nghiên cứu có thực sự sắp xếp để gia tăng trích dẫn cho công bố của họ hay không. Wren lưu ý rằng có thể có những lời biện minh vô hại cho những phân bố kỳ lạ này. Chẳng hạn, chúng có thể bị phân bố lệch bởi các bài siêu đánh giá (mega-review) về một lĩnh vực trong đó cần trích dẫn nhiều các nhà nghiên cứu quan trọng, mặc dù ông đã cố gắng kiểm soát điều này bằng cách xóa các bài đánh giá đó khỏi phân tích. Ông vẫn nhìn nhận các mẫu trích dẫn bị lệch là một điều cần được nghiên cứu thêm.

Wren cho biết biểu đồ phân bố độ lệch tổng thể các trích dẫn bởi những tác giả khác của các nhà khoa học cần cho ra một đường cong đối xứng, nhưng thực tế là không như vậy. Trên cơ sở đó, ông gợi ý rằng khoảng 16% tác giả nói chung đã tham gia vào một số kiểu thao túng danh sách tài liệu tham khảo vào lúc này hay lúc khác, ngay cả khi không thể kết luận rằng hồ sơ cá nhân của họ là có sự thao túng. Nhưng Ludo Waltman, một nhà thư mục lượng học tại Đại học Leiden ở Hà Lan, nói rằng ông không tán thành với cách phân tích tạo ra sự phân biệt trắng đen giữa các hồ sơ tham khảo ‘bị thao túng’ và ‘không bị thao túng’ trong khi có nhiều lý do phức tạp cho việc trích dẫn người khác.

Wren cho biết anh ấy muốn những người biên tập và nhà bình duyệt phát triển một cơ sở dữ liệu giúp làm rõ những tham khảo nào đã được thêm vào trong quá trình phản biện. Cả Waltman và Vincent Lariviere, nhà nghiên cứu thư mục lượng học tại Đại học Montreal ở Canada, đều nói rằng việc làm các bản báo cáo phản biện đồng nghiệp một cách minh bạch hơn có thể giúp giải quyết vấn đề này.

Waltman nói, một vấn đề cơ bản góp phần thúc đẩy việc gian lận trích dẫn là do thành tích của các nhà khoa học thường chỉ được tính dựa trên đơn thuần là số lượng trích dẫn.Theo ông, đây mới là tận cùng vấn đề mà cần phải có sự thay đổi.

Tài liệu tham khảo

Van Noorden, R. (2020, August 14). Signs of ‘citation hacking’ flagged in scientific papers. Nature. https://www.nature.com/articles/d41586-020-02378-2

Đăng ký Nhận bản tin

error: Content is protected !!