Nghiên cứu ChatGPT thiếu chính xác, kêu gọi thận

16/03/2026 10:24

Nghiên cứu của Đại học Bang Washington ChatGPT thiếu chính xác và nhất quán kêu gọi sự thận trọng

PULLMAN, Washington – Một nghiên cứu do giáo sư Mesut Cicek, Đại học Bang Washington, dẫn đầu đã tiết lộ ChatGPT thiếu cả độ chính xác lẫn sự nhất quán khi được yêu cầu đánh giá tính đúng sai của các giả thuyết khoa học. Nhóm nghiên cứu đã đưa 719 giả thuyết từ các bài báo khoa học đăng trên Tạp chí Kinh doanh Rutgers (từ năm 2021) vào hệ thống AI, đồng thời lặp lại mỗi câu hỏi 10 lần để kiểm tra độ tin cậy. Kết quả cho thấy, vào năm 2024, ChatGPT trả lời đúng 76,5% trường hợp, tăng lên 80% vào năm 2025. Tuy nhiên, khi so sánh với khả năng đoán mò ngẫu nhiên (50% chính xác), AI chỉ vượt trội hơn khoảng 60% trong cả hai năm – mức độ được mô tả là gần như ‘điểm D’ thấp hơn, không đủ đáng tin cậy. Đặc biệt, ChatGPT gặp khó khăn khi câu trả lời đúng là sai, chỉ nhận diện đúng 16,4% trường hợp. ‘Chúng tôi không chỉ nói về độ chính xác, mà còn nói về sự không nhất quán, vì nếu bạn đặt cùng một câu hỏi nhiều lần, bạn sẽ nhận được các câu trả lời khác nhau’, giáo sư Cicek chia sẻ. Ông mô tả tình trạng AI ‘đúng’, ‘sai’ xen kẽ như ‘nó trả lời ‘đúng’, sau đó lại nói ‘sai’, ‘đúng’, ‘sai’…’. Nghiên cứu nhấn mạnh rằng, mặc dù AI có khả năng tạo ra ngôn ngữ trôi chảy, nhưng chúng không thể thay thế tư duy phản biện của con người. ‘Các công cụ AI hiện tại không hiểu thế giới như chúng ta, chúng không có ‘não’, chỉ ghi nhớ và cung cấp cái nhìn, nhưng không hiểu rõ điều họ đang nói gì’, ông nói thêm. Các nhà khoa học khuyến nghị doanh nghiệp nên kiểm tra kỹ lưỡng kết quả AI, duy trì thái độ hoài nghi và đào tạo nhân viên về giới hạn của công nghệ này.

chia sẽ trên Twitter: Nghiên cứu của Đại học Bang Washington ChatGPT thiếu chính xác và nhất quán kêu gọi sự thận trọng

Nghiên cứu của Đại học Bang Washington ChatGPT thiếu chính xác và nhất quán kêu gọi sự thận trọng