Bạn có tin rằng một máy chơi game 48 năm tuổi, với công nghệ cực kỳ hạn chế, có thể đánh bại các đối thủ AI hiện đại như ChatGPT và Copilot trong cờ vua, thậm chí khiến Gemini phải rút lui?
Nếu bạn đặt cược vào ChatGPT trong một trận đấu cờ vua với Atari 2600, bạn đã thua cuộc. Atari 2600, một máy chơi game ra mắt năm 1977, cách đây 48 năm, chỉ có bộ xử lý 8 bit chạy ở tốc độ 1.19MHz (megahertz, không phải gigahertz) và 128 byte RAM. Ngược lại, ChatGPT được hỗ trợ bởi các trung tâm dữ liệu trị giá hàng trăm triệu đô la.
ChatGPT Và Copilot “Thảm Bại” Trước Atari 2600

Theo kiến trúc sư cơ sở hạ tầng Robert Caruso, người đã đăng tải kết quả vào tháng 6, ChatGPT đã “hoàn toàn bị hủy diệt ở cấp độ người mới bắt đầu”. Caruso giải thích lý do cho sự thất bại đáng ngạc nhiên này: “Mặc dù được cung cấp bố cục bàn cờ cơ bản để xác định các quân cờ, ChatGPT đã nhầm quân xe với quân tượng, bỏ lỡ các đòn tấn công của quân tốt và liên tục mất dấu vị trí của các quân cờ.”
ChatGPT đã nhận ra thất bại của mình và đổ lỗi cho các biểu tượng trừu tượng được Atari sử dụng để đại diện cho các quân cờ. Tuy nhiên, ngay cả sau khi chuyển sang ký hiệu cờ vua tiêu chuẩn, chatbot này vẫn “mắc đủ lỗi để bị chế nhạo ở một câu lạc bộ cờ vua lớp 3.”
Caruso cho biết trong suốt một tiếng rưỡi, ông phải liên tục ngăn ChatGPT thực hiện các nước đi sai và giúp nó hiểu vị trí các quân cờ của cả hai bên. Vài lần mỗi lượt, ChatGPT phải được đặt lại nhận thức về bàn cờ. Chatbot AI này đã hứa nhiều lần rằng việc chơi của nó sẽ cải thiện nếu trò chơi bắt đầu lại từ đầu, nhưng cuối cùng, ChatGPT đã phải chấp nhận thua cuộc.
Điều thú vị là chính ChatGPT đã đề xuất cuộc thi này. Trong một cuộc trò chuyện về cờ vua, ChatGPT tự nhận là một người chơi mạnh và có thể dễ dàng đánh bại Atari Video Chess, vốn chỉ suy nghĩ trước 1-2 nước. ChatGPT tò mò muốn biết nó có thể thắng nhanh đến mức nào. Nhưng kết quả thì ngược lại.
Đầu tháng này, máy chơi game Atari 2600 tiếp tục đối đầu với một cường quốc AI hiện đại khác trong một ván cờ vua: Microsoft Copilot. Copilot cũng tự tin rằng Atari 2600 không phải là đối thủ của mình. Mặc dù nó nói rằng có thể suy nghĩ trước 10-15 nước, Copilot cho biết sẽ chỉ suy nghĩ trước 3-5 nước vì console Atari tạo ra “các nước đi không tối ưu”. Copilot cũng tuyên bố, không giống như ChatGPT, “tôi rất cố gắng ghi nhớ các nước đi trước đó và duy trì tính liên tục trong lối chơi, vì vậy trận đấu của chúng ta sẽ suôn sẻ hơn nhiều.”
Thực tế, Caruso phải gửi cho Copilot một ảnh chụp màn hình của bàn cờ sau mỗi nước đi của Atari 2600. Chatbot AI của Microsoft thừa nhận rằng nó có những khoảng trống bộ nhớ không gian giống như ChatGPT. Bất chấp điểm yếu này, Copilot khẳng định nó vẫn có thể phân tích bàn cờ và thực hiện những nước đi tốt. Tuy nhiên, rõ ràng là không, khi Atari 2600 đã giành chiến thắng thứ hai liên tiếp trước một đối thủ AI.
Gemini “Tự Hủy” Trận Đấu
Caruso sau đó đã nói chuyện với Gemini để sắp xếp một trận đấu. AI do Google phát triển, giống như ChatGPT và Copilot, nghĩ rằng nó sẽ dễ dàng giành chiến thắng. Tuy nhiên, Gemini sau đó đã thừa nhận rằng nó đã ảo giác về khả năng chơi cờ vua của mình. Điều đó đã khiến Gemini đưa ra quyết định đúng đắn duy nhất có thể trước lời thừa nhận của nó. Gemini nói: “Hủy bỏ trận đấu có lẽ là quyết định hiệu quả và hợp lý nhất về mặt thời gian.”
Mặc dù Gemini chưa bao giờ có cơ hội đối đầu với Atari 2600, Caruso đã rất ấn tượng với cách chatbot này có cái nhìn sâu sắc để nhận biết giới hạn của chính nó.
Giải Thích Hiện Tượng “Đáng Kinh Ngạc” Này
Thật khó tin khi một máy chơi game 48 năm tuổi, sử dụng công nghệ kém cỏi, lại có thể đánh bại hai chatbot AI với công nghệ tiên tiến và khiến một chatbot thứ ba phải hủy bỏ trận đấu. Nhưng đây không thực sự là cú sốc mà bạn nghĩ. Kỹ sư phần mềm cấp cao Kyle Witeck đã viết: “Vậy… bạn đang so sánh các mô hình ngôn ngữ với một bot cờ vua được thiết kế để chơi cờ vua… kinh điển… AI không thông minh và không phải là AI. Nó mô hình hóa và đoán từ một hệ thống được thiết kế dựa trên ngôn ngữ. Các phán đoán dựa trên mã thông báo.”
Về cơ bản, các mô hình ngôn ngữ lớn (LLM) như ChatGPT, Copilot và Gemini được tối ưu hóa để hiểu và tạo ra văn bản. Mặc dù chúng đã được đào tạo trên một lượng lớn dữ liệu văn bản bao gồm các ván cờ vua và chiến lược, nhưng chúng không được thiết kế để duy trì trạng thái liên tục của bàn cờ hoặc thực hiện suy luận logic sâu sắc như một công cụ cờ vua chuyên dụng. Các công cụ cờ vua chuyên dụng như trên Atari 2600 (dù đơn giản) được lập trình để hiểu các quy tắc, vị trí quân cờ và tính toán nước đi tốt nhất một cách chính xác.
Sự “thắng lợi” của Atari 2600 không phải là dấu hiệu cho thấy công nghệ cũ mạnh hơn AI hiện đại, mà là minh chứng cho thấy mỗi loại AI được thiết kế cho các mục đích khác nhau. LLM xuất sắc trong các tác vụ liên quan đến ngôn ngữ, trong khi các công cụ cờ vua, dù đơn giản, được xây dựng để giải quyết một vấn đề cụ thể với các quy tắc rõ ràng.
Bạn nghĩ kết quả này có thay đổi cách nhìn của bạn về khả năng của các mô hình AI hiện đại không?

















