Mẹo nhỏ: Để tìm kiếm chính xác các ấn phẩm của blog, hãy search trên Google với cú pháp: "Từ khóa" + "blog". (Ví dụ: thiệp tân linh mục blog). Tìm kiếm ngay

ChatGPT giờ đây có thể “suy nghĩ” bằng hình ảnh, xử lý đầu vào siêu dài – và rẻ hơn các phiên bản trước

OpenAI đang phát hành một “thiên hà” các mô hình mới, tất cả đều hướng đến việc hoàn thành công việc tốt hơn, nhanh hơn… và rẻ hơn.

Các mô hình OpenAI mới nhất có tên là o3 và o4-mini – chúng được thiết kế để mang lại những nâng cấp mạnh mẽ cho ChatGPT bằng cách cho phép người dùng giải quyết các vấn đề phức tạp hơn với độ chính xác và linh hoạt cao hơn. Hai mô hình mới hiện có thể tìm kiếm trên web, đọc các tệp đã tải lên, diễn giải hình ảnh, viết mã và sử dụng tất cả các công cụ trong ChatGPT.

Lần đầu tiên, ChatGPT có thể “suy nghĩ” bằng hình ảnh, không chỉ nhìn thấy chúng, OpenAI thông báo. Người dùng có thể tải lên ghi chú trên bảng trắng, sơ đồ sách giáo khoa hoặc bản phác thảo (ngay cả những bản có chất lượng thấp) và mô hình sẽ hiểu và phân tích chúng. Nó cũng có thể sử dụng các công cụ như Python hoặc tìm kiếm trên trình duyệt khi cần, giúp nó thực hiện tốt hơn nhiều các tác vụ như lập kế hoạch, dự báo hoặc giải quyết các vấn đề nhiều bước.

Mô hình o3 là mô hình tiên tiến và mạnh mẽ nhất, phù hợp nhất cho các tác vụ chuyên sâu như viết mã, tư vấn và giải quyết các vấn đề kỹ thuật. Nó có sẵn cho người dùng ChatGPT trả phí. o4-mini, mặc dù nhỏ hơn và rẻ hơn, nhưng vẫn hoạt động ấn tượng và hỗ trợ mức sử dụng cao hơn. Cả hai mô hình đều không miễn phí:

Image source – OpenAI - ChatGPT can now think with images, handle super long inputs – and it's cheaper than previous versions

[Hình ảnh: Nguồn ảnh – OpenAI]

Gia đình ChatGPT 4.1

Ngoài ra, OpenAI đã phát hành một dòng mô hình mới:

  • GPT-4.1
  • GPT-4.1 mini
  • GPT-4.1 nano

Các mô hình này được cho là có khả năng hơn các phiên bản trước như GPT-4o, đặc biệt khi nói đến việc tuân theo hướng dẫn, viết mã và làm việc với lượng lớn văn bản hoặc dữ liệu. Chúng cũng có các mức giá khác nhau, giúp bạn dễ dàng chọn mô hình phù hợp tùy thuộc vào tốc độ, chi phí và độ phức tạp:

Image source – OpenAI - ChatGPT can now think with images, handle super long inputs – and it's cheaper than previous versions

[Hình ảnh: Nguồn ảnh – OpenAI]

Mô hình GPT-4.1 đầy đủ hiện là tùy chọn hàng đầu của OpenAI, mang lại độ chính xác cao hơn trong việc tuân theo hướng dẫn, giải quyết các vấn đề phức tạp và viết mã trên nhiều ngôn ngữ. Nó có thể xử lý đầu vào cực kỳ dài – lên đến 1 triệu token, gấp khoảng tám lần kích thước của toàn bộ codebase React (một thư viện JavaScript để xây dựng giao diện người dùng). Điều này có nghĩa là các nhà phát triển giờ đây có thể cung cấp toàn bộ dự án, tài liệu khổng lồ hoặc nhiều nguồn thông tin, và mô hình vẫn có thể theo dõi các chi tiết liên quan mà không bị nhầm lẫn hoặc lạc lối.

GPT-4.1 cũng giỏi hơn trong việc hiểu những gì người dùng muốn và tuân theo các hướng dẫn tùy chỉnh – chẳng hạn như tạo ra phản hồi theo một định dạng cụ thể hoặc tránh một số chủ đề nhất định. Điều này làm cho nó đáng tin cậy và linh hoạt hơn để xây dựng các ứng dụng thông minh, chẳng hạn như công cụ hỗ trợ khách hàng, trợ lý phân tích tài liệu hoặc đối tác viết mã AI. Nó cũng hoạt động tốt hơn nhiều so với GPT-4o trong phát triển web frontend và các tác vụ suy luận phức tạp, những người tạo ra nó tuyên bố.

GPT-4.1 mini cung cấp chất lượng gần như tương đương GPT-4o nhưng với độ trễ giảm đáng kể và chi phí thấp hơn 83%.

GPT-4.1 nano là mô hình nhanh nhất và rẻ nhất mà OpenAI từng phát hành. Mặc dù nhỏ hơn, nó vẫn mang lại hiệu suất tốt đáng ngạc nhiên cho các tác vụ như tự động hoàn thành, phân loại và trợ lý nhẹ. Nó lý tưởng cho các ứng dụng cần tốc độ và chi phí thấp nhưng không yêu cầu khả năng suy luận nâng cao.

Image source – OpenAI - ChatGPT can now think with images, handle super long inputs – and it's cheaper than previous versions

[Hình ảnh: Nguồn ảnh – OpenAI]

Cả ba mô hình đều có sẵn thông qua API (giao diện lập trình ứng dụng). Quyền truy cập API có nghĩa là các nhà phát triển và doanh nghiệp có thể kết nối các mô hình của OpenAI – như o3 và o4-mini – trực tiếp với các ứng dụng, trang web hoặc phần mềm của riêng họ. Thay vì sử dụng ChatGPT thông qua giao diện trò chuyện của OpenAI, họ có thể xây dựng trải nghiệm tùy chỉnh nơi mô hình hoạt động ẩn. Ví dụ: một công ty có thể sử dụng o4-mini để cung cấp năng lượng cho một trợ lý ảo trên trang web của họ, trả lời các câu hỏi của khách hàng hoặc phân tích dữ liệu theo thời gian thực.

GPT-4.1 rẻ hơn GPT-4o trung bình 26%, và bộ nhớ đệm prompt – sử dụng lại các đầu vào lặp lại – giờ đây tiết kiệm hơn nữa, điều này sẽ rất tốt cho các nhà phát triển.

Bài viết cùng chủ đề: