Vào tháng Năm, Google đã tiết lộ thế hệ thứ ba của mô hình tạo hình ảnh của mình, Imagen 3. Đến tháng Tám, gã khổng lồ công nghệ này đã công bố kế hoạch cung cấp cho người dùng trên toàn thế giới và giờ đây lời hứa đó đã thành hiện thực.
Bất kể bạn ở đâu, giờ bạn có thể truy cập Imagen 3
Google đã chính thức triển khai tạo hình ảnh với Imagen 3 cho tất cả người dùng Gemini trên toàn cầu. Mô hình cập nhật này có chi tiết sắc nét hơn, màu sắc rực rỡ hơn và ít lỗi hơn so với các phiên bản trước.
Image generation with Imagen 3 is now available to all Gemini users around the world.
Imagen 3 is our highest quality image generation model yet and brings an even higher degree of photorealism, better instruction following, and fewer distracting artifacts than ever before. pic.twitter.com/E8CrcyFcz5
— Google Gemini App (@GeminiApp) October 9, 2024
Có lẽ một trong những nâng cấp nổi bật trong Imagen 3 là khả năng kết xuất văn bản của nó – một điều đã trở thành trò đùa đối với các mô hình văn bản thành hình ảnh khác như DALL-E và Adobe Firefly. Google đang quảng bá khả năng này như một cách để tạo ra các hình ảnh được cá nhân hóa có chứa văn bản, hoàn hảo cho mọi thứ từ thiệp chúc mừng đến ảnh với những thông điệp đặc biệt.
Để thử nghiệm các tính năng của Imagen 3, chỉ cần khởi chạy Gemini trên thiết bị di động hoặc máy tính để bàn – tùy theo sở thích của bạn. Sau đó, bắt đầu lời nhắc của bạn bằng các từ như “vẽ”, “tạo” hoặc “tạo”, cùng với phong cách bạn đang hướng đến. Hãy nhớ rằng càng bao gồm nhiều chi tiết, mô hình càng hiểu rõ được tầm nhìn của bạn. Gemini sẽ cho bạn biết rằng nó đang “Tạo hình ảnh của bạn với Imagen 3.”
Chỉ cần một lời nhắc: tạo hình ảnh có chứa người không phải là một tùy chọn miễn phí ngay bây giờ. Nếu bạn muốn tạo những loại hình ảnh đó, bạn sẽ cần đăng ký Gemini Advanced. Cấp cao trả phí cung cấp cho bạn:
Truy cập vào thế hệ tiếp theo của Google, 1.5 Pro Cửa sổ ngữ cảnh 1 triệu mã thông báo, có thể xử lý tải lên tối đa 1.500 trang Quyền truy cập ưu tiên vào các tính năng mới nhất Khả năng chạy và chỉnh sửa mã Python trực tiếp trong Gemini Advanced Dung lượng lưu trữ hào phóng 2 TB thông qua Google One Tích hợp Gemini trong Gmail, Docs và hơn thế nữa (có sẵn ở một số ngôn ngữ)
Tôi phải nói rằng khả năng của Imagen 3 khá đáng chú ý. Đó là lý do tại sao tôi thực sự nghĩ rằng chúng ta cần có nhãn rõ ràng hơn cho nội dung do AI tạo ra và tôi tin rằng các cơ quan quản lý trên toàn cầu phải tăng cường giải quyết vấn đề này để ngăn chặn sự lan truyền thông tin sai lệch. Ví dụ, không lâu trước đây, Liên minh châu Âu đã đưa ra Hiệp ước AI của EU – một thỏa thuận tự nguyện giữa các công ty công nghệ và EU nhằm thúc đẩy sự phát triển AI có trách nhiệm và đạo đức. Bây giờ, liệu nó có hiệu quả hay không vẫn còn chưa chắc chắn.
- Google Photos sắp có tính năng mới giúp bạn “ưu ái” người thân yêu
- Màn hình OLED và Chip M3 sẽ có trên IPad Pro 2024 11″ và 13″
- Đối đầu với Apple, Google có thể mở cửa hàng đầu tiên bên ngoài Hoa Kỳ
- Motorola Mở Beta Program Cho Tính Năng Nâng Cao Của Moto AI
- Google Clock bổ sung tiện ích hẹn giờ mới

















