ChatGPT giờ đây có thể “suy nghĩ” bằng hình ảnh, xử lý đầu vào siêu dài – và rẻ hơn các phiên bản trước

OpenAI đang phát hành một “thiên hà” các mô hình mới, tất cả đều hướng đến việc hoàn thành công việc tốt hơn, nhanh hơn… và rẻ hơn.

Các mô hình OpenAI mới nhất có tên là o3 và o4-mini – chúng được thiết kế để mang lại những nâng cấp mạnh mẽ cho ChatGPT bằng cách cho phép người dùng giải quyết các vấn đề phức tạp hơn với độ chính xác và linh hoạt cao hơn. Hai mô hình mới hiện có thể tìm kiếm trên web, đọc các tệp đã tải lên, diễn giải hình ảnh, viết mã và sử dụng tất cả các công cụ trong ChatGPT.

Lần đầu tiên, ChatGPT có thể “suy nghĩ” bằng hình ảnh, không chỉ nhìn thấy chúng, OpenAI thông báo. Người dùng có thể tải lên ghi chú trên bảng trắng, sơ đồ sách giáo khoa hoặc bản phác thảo (ngay cả những bản có chất lượng thấp) và mô hình sẽ hiểu và phân tích chúng. Nó cũng có thể sử dụng các công cụ như Python hoặc tìm kiếm trên trình duyệt khi cần, giúp nó thực hiện tốt hơn nhiều các tác vụ như lập kế hoạch, dự báo hoặc giải quyết các vấn đề nhiều bước.

Mô hình o3 là mô hình tiên tiến và mạnh mẽ nhất, phù hợp nhất cho các tác vụ chuyên sâu như viết mã, tư vấn và giải quyết các vấn đề kỹ thuật. Nó có sẵn cho người dùng ChatGPT trả phí. o4-mini, mặc dù nhỏ hơn và rẻ hơn, nhưng vẫn hoạt động ấn tượng và hỗ trợ mức sử dụng cao hơn. Cả hai mô hình đều không miễn phí:

[Hình ảnh: Nguồn ảnh – OpenAI]

Gia đình ChatGPT 4.1

Ngoài ra, OpenAI đã phát hành một dòng mô hình mới:

GPT-4.1
GPT-4.1 mini
GPT-4.1 nano

Các mô hình này được cho là có khả năng hơn các phiên bản trước như GPT-4o, đặc biệt khi nói đến việc tuân theo hướng dẫn, viết mã và làm việc với lượng lớn văn bản hoặc dữ liệu. Chúng cũng có các mức giá khác nhau, giúp bạn dễ dàng chọn mô hình phù hợp tùy thuộc vào tốc độ, chi phí và độ phức tạp:

[Hình ảnh: Nguồn ảnh – OpenAI]

Mô hình GPT-4.1 đầy đủ hiện là tùy chọn hàng đầu của OpenAI, mang lại độ chính xác cao hơn trong việc tuân theo hướng dẫn, giải quyết các vấn đề phức tạp và viết mã trên nhiều ngôn ngữ. Nó có thể xử lý đầu vào cực kỳ dài – lên đến 1 triệu token, gấp khoảng tám lần kích thước của toàn bộ codebase React (một thư viện JavaScript để xây dựng giao diện người dùng). Điều này có nghĩa là các nhà phát triển giờ đây có thể cung cấp toàn bộ dự án, tài liệu khổng lồ hoặc nhiều nguồn thông tin, và mô hình vẫn có thể theo dõi các chi tiết liên quan mà không bị nhầm lẫn hoặc lạc lối.

GPT-4.1 cũng giỏi hơn trong việc hiểu những gì người dùng muốn và tuân theo các hướng dẫn tùy chỉnh – chẳng hạn như tạo ra phản hồi theo một định dạng cụ thể hoặc tránh một số chủ đề nhất định. Điều này làm cho nó đáng tin cậy và linh hoạt hơn để xây dựng các ứng dụng thông minh, chẳng hạn như công cụ hỗ trợ khách hàng, trợ lý phân tích tài liệu hoặc đối tác viết mã AI. Nó cũng hoạt động tốt hơn nhiều so với GPT-4o trong phát triển web frontend và các tác vụ suy luận phức tạp, những người tạo ra nó tuyên bố.

GPT-4.1 mini cung cấp chất lượng gần như tương đương GPT-4o nhưng với độ trễ giảm đáng kể và chi phí thấp hơn 83%.

GPT-4.1 nano là mô hình nhanh nhất và rẻ nhất mà OpenAI từng phát hành. Mặc dù nhỏ hơn, nó vẫn mang lại hiệu suất tốt đáng ngạc nhiên cho các tác vụ như tự động hoàn thành, phân loại và trợ lý nhẹ. Nó lý tưởng cho các ứng dụng cần tốc độ và chi phí thấp nhưng không yêu cầu khả năng suy luận nâng cao.

[Hình ảnh: Nguồn ảnh – OpenAI]

Cả ba mô hình đều có sẵn thông qua API (giao diện lập trình ứng dụng). Quyền truy cập API có nghĩa là các nhà phát triển và doanh nghiệp có thể kết nối các mô hình của OpenAI – như o3 và o4-mini – trực tiếp với các ứng dụng, trang web hoặc phần mềm của riêng họ. Thay vì sử dụng ChatGPT thông qua giao diện trò chuyện của OpenAI, họ có thể xây dựng trải nghiệm tùy chỉnh nơi mô hình hoạt động ẩn. Ví dụ: một công ty có thể sử dụng o4-mini để cung cấp năng lượng cho một trợ lý ảo trên trang web của họ, trả lời các câu hỏi của khách hàng hoặc phân tích dữ liệu theo thời gian thực.

GPT-4.1 rẻ hơn GPT-4o trung bình 26%, và bộ nhớ đệm prompt – sử dụng lại các đầu vào lặp lại – giờ đây tiết kiệm hơn nữa, điều này sẽ rất tốt cho các nhà phát triển.

Xem thêm:

ChatGPT giờ đây có thể “suy nghĩ” bằng hình ảnh, xử lý đầu vào siêu dài – và rẻ hơn các phiên bản trước

Bài viết cùng chủ đề:

Apple “bơm” thêm tính năng cho iOS 27 Beta 2: Nhắn tin với Android giờ mượt không khác gì iMessage!

Tin buồn cho không ít iFan sau WWDC 2026

Doanh Số Xiaomi 17T Series Tăng Vọt 40%: Khi “Bậc Thầy Telephoto” Chinh Phục Phân Khúc Cận Cao Cấp

[WWDC 2026] Toàn cảnh sự kiện Apple lớn nhất năm: “Siri AI” lột xác nhờ Google Gemini, kỷ nguyên “Liquid Glass” thống trị và lời chia tay đầy cảm xúc của Tim Cook

Toàn cảnh WWDC 2026: Kỷ nguyên mới của Siri “Siêu trí tuệ” bắt đầu!

[Computex 2026] ASUS ProArt “Khởi Cực” Kỷ Nguyên AI Với Siêu Chip NVIDIA RTX Spark Mới

Xiaomi “Tổng Tấn Công” Thị Trường Việt Nam: Loạt AIoT Cao Cấp Và Hệ Sinh Thái Gia Dụng Mijia Đỉnh Cao Lên Sóng

Xiaomi 17T Series Ra Mắt Tại Việt Nam: Bước Chuyển Mình Sang Flagship Nhiếp Ảnh Với Camera Leica 5x Telephoto, Pin 7.000 mAh, Giá Từ 20 Triệu Đồng

Hé lộ siêu phẩm Xiaomi 17T Series trước ngày ra mắt: “Bậc thầy Telephoto” Leica, thiết kế độc bản cùng Đại sứ Chi Pu

Google I/O 2026: Tương lai AI của Google rất đỉnh, nhưng liệu bạn có dám đánh đổi dữ liệu cá nhân?

11 lý do để gom lúa chờ iPhone 18 Pro, iOS 26.5 chính thức phát hành và loạt rò rỉ trước thềm WWDC 2026

ASUS ra mắt card đồ họa RTX 5070 và 5060 Ti phiên bản T1: “Vũ khí” của những nhà vô địch

Canon “thả xích” EOS R6 V và ống kính Power Zoom dòng L đầu tiên: Cặp bài trùng mới cho giới sáng tạo nội dung!

[Tin Đồn] macOS 27: Apple sẽ tinh chỉnh giao diện “Liquid Glass” và tích hợp AI cho Safari

[TIN ĐỒN] Apple “mở cửa” iOS 27: Cho phép người dùng tự chọn mẫu AI yêu thích – Chia tay sự độc quyền của Apple Intelligence?

Xiaomi tung bộ ba REDMI Watch 6, Headphones Neo và Buds 8 tại Việt Nam: Hệ sinh thái AIoT “đỉnh” hơn bao giờ hết!

Đây có thể là vấn đề lớn nhất của nhiều người dùng Google Maps

Tin buồn cho không ít iFan sau WWDC 2026

Doanh Số Xiaomi 17T Series Tăng Vọt 40%: Khi “Bậc Thầy Telephoto” Chinh Phục Phân Khúc Cận Cao Cấp

[WWDC 2026] Toàn cảnh sự kiện Apple lớn nhất năm: “Siri AI” lột xác nhờ Google Gemini, kỷ nguyên “Liquid Glass” thống trị và lời chia tay đầy cảm xúc của Tim Cook

Toàn cảnh WWDC 2026: Kỷ nguyên mới của Siri “Siêu trí tuệ” bắt đầu!

[Computex 2026] ASUS ProArt “Khởi Cực” Kỷ Nguyên AI Với Siêu Chip NVIDIA RTX Spark Mới

Xiaomi “Tổng Tấn Công” Thị Trường Việt Nam: Loạt AIoT Cao Cấp Và Hệ Sinh Thái Gia Dụng Mijia Đỉnh Cao Lên Sóng

Chịu trách nhiệm nội dung

Liên Hệ Hợp Tác

Địa Chỉ Văn Phòng