fbpx

NHỮNG LƯU Ý KHI ĐỌC PHẦN THỐNG KÊ TRONG MỘT BÀI BÁO

Những con số có sức mạnh riêng của chúng. Trên bề mặt, chúng có vẻ không bị nhập nhằng và mơ hồ như ngôn từ, nên chúng có thể là những bằng chứng thuyết phục nhằm củng cố cho bất cứ luận điểm nào. Tuy nhiên, thống kê không phải là thần dược. Dù chúng có thể trông đơn giản và thẳng thắn nhưng, nếu không sử dụng cẩn thận, số liệu thống kê có thể mang lại nhiều hơn là giải quyết các rắc rối.

Nhiều người nghĩ rằng các số liệu thống kê tự nó có thể thể hiện thông tin. Nhưng những con số thực chất cũng mơ hồ như ngôn từ, và vì vậy chúng cũng đòi hỏi sự giải thích. Chúng ta thường chấp nhận chúng như là những phúc âm, mà không bao giờ đặt ra câu hỏi về tính xác thực hoặc sự phù hợp.

Mặc dù điều này có vẻ như là một điểm tích cực khi bạn nhét chúng vào bài báo và cầu nguyện cho người đọc phục tùng trước quyền lực của chúng, hãy luôn nhớ rằng trước khi là người viết thống kê, chúng ta cũng là người đọc. Và để trở thành người đọc hiệu quả, ta phải hỏi những câu hỏi khó. Dưới đây, chúng tôi đã tập hợp các câu hỏi khó hữu ích cho những con số mà bạn tìm thấy.

Tranh: Björn Öberg/Behance | CC BY-ND-ND 4.0

1. Liệu các bằng chứng có đến từ nguồn đáng tin cậy không?

Đây là một câu hỏi quan trọng không chỉ với các số liệu thống kê, mà với bất kỳ bằng chứng nào mà bạn sử dụng trong bài báo của mình. Như chúng ta sẽ thấy trong bài viết này, các tác giả có nhiều cách để “nắn bóp” và trình bày sai các số liệu để đi đến kết quả mong muốn. Do đó, bạn nên lấy số liệu thống kê của mình từ các nguồn đáng tin cậy. Điều này không có nghĩa là các nguồn đáng tin cậy không thể có sai lầm, mà chỉ là họ ít có khả năng sử dụng các hành vi lừa đảo hơn mà thôi. Với một nguồn tin đáng tin cậy, bạn có thể không cần phải lo lắng nhiều về các câu hỏi tiếp theo. Tuy nhiên, hãy nhớ rằng đọc số liệu thống kê giống như đang ở giữa một cuộc chiến: đừng tin ai cả; và hãy nghi ngờ mọi người.

2. Dữ liệu đến từ đâu?

Dữ liệu và số liệu thống kê không phải từ trên trời rơi xuống để mọi người sử dụng. Chúng luôn là sản phẩm của quá trình nghiên cứu. Do đó, để hiểu các số liệu thống kê, bạn cũng nên biết chúng đến từ đâu. Ví dụ: nếu số liệu thống kê đến từ một cuộc khảo sát hoặc thăm dò ý kiến, một số câu hỏi cần đặt ra bao gồm:

Ai đã đặt câu hỏi trong cuộc khảo sát / thăm dò ý kiến?

Những câu hỏi chính xác là gì?

Ai là người đã diễn giải dữ liệu?

Vấn đề gì đã thúc đẩy cuộc khảo sát / thăm dò ý kiến?

Điều gì (chính sách / thủ tục) có khả năng ảnh hưởng đến kết quả của cuộc thăm dò?

Ai là người đạt được lợi ích từ các diễn giải cụ thể của dữ liệu?

Tất cả những câu hỏi này giúp bạn định hướng về những thiên kiến hoặc điểm yếu có thể có trong dữ liệu bạn đang đọc. Mục tiêu việc trả lời những câu hỏi này không phải là để tìm ra dữ liệu “thuần túy, khách quan” mà là để làm rõ những thiên kiến có thể xuất hiện, qua đó  tìm ra cách thức chính xác hơn để diễn giải các bằng chứng. 

3. Bài viết đã trình bày toàn bộ dữ liệu có được hay chưa?

Trong hầu hết các trường hợp, câu trả lời cho câu hỏi này đơn giản là không. Do đó, cách tốt hơn để suy nghĩ về vấn đề này là hỏi liệu tất cả dữ liệu đã được trình bày trong ngữ cảnh hay chưa. Nhưng sẽ phức tạp hơn nhiều khi bạn xem xét vấn đề lớn hơn, đó là liệu văn bản hoặc nguồn tin có trình bày đủ bằng chứng để bạn tự đưa kết luận hay không. Một nguồn đáng tin cậy không nên loại trừ dữ liệu mâu thuẫn hoặc làm suy yếu tính thuyết phục của thông tin được trình bày.

Ví dụ, vào những ngày bão tuyết, bạn chắc chắn sẽ nhớ những phát thanh viên trong bản tin buổi tối cảnh báo mọi người tránh ra ngoài vì nó rất nguy hiểm. Để chứng minh luận điểm này, họ cho bạn thông tin rằng Đội tuần tra đường cao tốc đã báo cáo 25 vụ tai nạn trong ngày. Ý định của họ với những con số này là để khiến bạn sợ ra khỏi nhà. Mặc dù con số này nghe có vẻ cao, nhưng một số nghiên cứu đã cho thấy rằng số vụ tai nạn thực chất giảm xuống vào những ngày có thời tiết khắc nghiệt. Có thể là bởi với ít người ra đường hơn thì ngay cả trong điều kiện nguy hiểm, số vụ tai nạn cũng sẽ ít hơn so với một ngày “trung bình”. Đó có thể là một cách giải thích. Bài học quan trọng ở đây là ngay cả khi cách diễn giải phổ biến là “chính xác”, dữ liệu vẫn có thể không thực sự phản ánh điều đó. Việc này có nghĩa là bạn không có cách nào để xác minh xem cách diễn giải trên thực tế có đúng hay không.

Nói chung, thường có một sự so sánh ẩn trong việc sử dụng các số liệu thống kê. Làm thế nào bạn có thể thực hiện một so sánh có giá trị mà không có tất cả các dữ kiện? Đó là một câu hỏi hay. Bạn có thể phải tìm đến một hoặc nhiều nguồn khác để tìm ra tất cả dữ liệu bạn cần.

4. Dữ liệu đã được diễn giải một cách chính xác hay chưa?

Nếu tác giả cung cấp cho bạn số liệu thống kê của họ, điều bạn nên làm là tự diễn giải ý nghĩa của chúng. Có nghĩa là, mặc dù việc đọc và hiểu cách diễn giải của tác giả là hữu ích, nhưng nó chỉ đơn thuần là một cách diễn giải trong số vô vàn cách diễn giải có thể tồn tại, chứ không phải là kết luận chung về vấn đề. Hơn nữa, đôi khi các tác giả (bao gồm cả bạn, vì vậy hãy cẩn thận) có thể sử dụng số liệu thống kê thực sự tốt nhưng lại đưa ra những cách diễn giải thực sự tồi. Dưới đây là hai sai lầm phổ biến cần chú ý:

Nhầm lẫn giữa tương quan và nhân quả. Chỉ bởi vì hai thứ biến thiên cùng nhau không có nghĩa là một trong số chúng gây ra cái kia. Đó có thể do không gì hơn ngoài sự trùng hợp ngẫu nhiên, hoặc cả hai đều có thể do yếu tố thứ ba gây ra. Một mối quan hệ như vậy được gọi là giả (spurious). Ví dụ kinh điển đó là một nghiên cứu cho thấy càng nhiều lính cứu hỏa được cử đến để dập lửa thì đám cháy càng gây ra nhiều thiệt hại hơn. Nhưng trước khi chúng ta bắt đầu đóng cửa các trạm cứu hỏa, có lẽ nên tham khảo các cách giải thích khác. Phát hiện có vẻ mâu thuẫn này có thể dễ dàng giải thích bằng cách chỉ ra một yếu tố thứ ba gây ra cả hai: quy mô của đám cháy. Bài học ở đây là gì? Tương quan không phải nhân quả. Vì vậy, điều quan trọng không chỉ là suy nghĩ về việc chỉ ra rằng hai biến số cùng thay đổi, mà còn về cơ chế nhân quả.

Bỏ qua biên độ sai số. Khi kết quả khảo sát được báo cáo, chúng thường bao gồm một khoảng sai số. Bạn có thể thấy điều này được viết là “sai số cộng hoặc trừ 5 điểm phần trăm.” Điều đó có nghĩa là gì? Chuyện đơn giản là các cuộc khảo sát thường được thực hiện trên các mẫu của một quần thể lớn hơn, và do đó chúng không bao giờ chính xác. Luôn luôn có một khoảng tin cậy mà trong đó phần đông được dự kiến sẽ rơi vào. Giả sử nói rằng số sinh viên một trường đại học cảm thấy khó khăn khi sử dụng số liệu thống kê trong bài viết của họ là 60%, cộng hoặc trừ 4%, điều đó có nghĩa là, giả sử khoảng tin cậy bình thường là 95%, thì với 95% chắc chắn chúng ta có thể nói rằng con số thực tế là từ 56% đến 64%.

Vì sao việc này lại quan trọng? Bởi vì nếu sau khi giới thiệu tài liệu này cho các sinh viên, một cuộc thăm dò mới cho thấy chỉ có 56%, cộng hoặc trừ 3%, gặp khó khăn với thống kê. Vậy thực sự kỹ năng viết của sinh viên trong trường đã được cải thiện? Không hẳn, bởi vì a) đây có thể là một mối quan hệ giả (xem ở trên) và b) sự thay đổi thực tế là không đáng kể vì nó nằm trong biên độ sai số đối với các kết quả ban đầu. Bài học ở đây là gì? Biên độ sai số rất quan trọng, vì vậy bạn không thể chỉ so sánh các tỷ lệ phần trăm đơn giản.

Cuối cùng, bạn nên nhớ rằng dữ liệu mà bạn đang xem có thể không phải là dữ liệu sơ cấp. Nghĩa là, nếu bạn tìm thấy một bài luận trích dẫn một số thống kê hỗ trợ cho lập luận của nó, thì khả năng cao là tác giả của bài luận đang sử dụng dữ liệu của người khác. Do đó, bạn không chỉ cần xem xét nguồn của mình mà còn cả nguồn của tác giả nữa.

Minh Vũ dịch

Nguồn

The Writing Center (n.d.). Statistics. https://writingcenter.unc.edu/tips-and-tools/statistics/

error: Content is protected !!

Để lại thông tin để nhận tư vấn