Mẹo nhỏ: Để tìm kiếm chính xác các ấn phẩm của blog, hãy search trên Google với cú pháp: "Từ khóa" + "blog". (Ví dụ: thiệp tân linh mục blog). Tìm kiếm ngay

Google Đang Thử Nghiệm Cách Chỉnh Sửa Hình Ảnh Thông Minh Hơn, Trực Quan Hơn Trong Gemini

Bất kể bạn ủng hộ hay phản đối hình ảnh được chỉnh sửa bằng AI, bạn không thể phủ nhận rằng đây là xu hướng mà nhiếp ảnh trên điện thoại đang hướng tới. Mặc dù các công cụ hình ảnh Gemini của Google đã mạnh mẽ, vẫn còn một bước khó chịu là bạn phải mô tả bằng lời (prompt) để AI thực hiện các điều chỉnh bạn muốn.


Google Đang Khắc Phục Quy Trình Làm Việc Bị Ngắt Quãng

Mô hình Nano Banana Pro (dựa trên Gemini 3 Pro Image) đã mang lại những cải tiến lớn về chất lượng hình ảnh và chức năng chỉnh sửa so với các mô hình trước. Mô hình này thể hiện kết quả vượt trội, ngay cả khi gặp các tác vụ chỉnh sửa hình ảnh phức tạp. Nhưng nếu bạn cần chú thích (annotate) một hình ảnh, làm nổi bật một khu vực hoặc để lại ghi chú đánh dấu (markup notes), bạn vẫn phải mở một ứng dụng khác.

Đó chính xác là quy trình làm việc mà Google đang cố gắng khắc phục theo các rò rỉ mới nhất.

Gemini image editor showing a robot scene being modified.

Leaker TestingCatalog đã chia sẻ rằng Google hiện đang xây dựng các công cụ chú thích hình ảnh trực tiếp vào Gemini phiên bản web. Người dùng sẽ có thể vẽ trên hình ảnh, khoanh tròn các yếu tố và thêm các lớp văn bản ngay bên trong giao diện được sử dụng để tạo và chỉnh sửa hình ảnh. Điều này giúp loại bỏ bước thừa là phải xuất hình ảnh và làm việc trên một ứng dụng khác.

Thông tin này theo sau những phát hiện trước đó từ ứng dụng di động Gemini, nơi các yếu tố giao diện người dùng liên quan đến đánh dấu đã được ẩn trong mã. Giờ đây, chúng ta đang thấy khả năng tương tự được chuyển sang trải nghiệm trình duyệt, nơi hầu hết người dùng thực hiện các chỉnh sửa nặng hơn.


Cách Trực Quan Hơn Để Chỉ Định Thay Đổi Cho Gemini

Phiên bản di động cho thấy các cửa sổ bật lên, báo hiệu rằng các chú thích có thể được liên kết với chỉnh sửa dựa trên lời nhắc và định vị cục bộ. Nói cách khác, thay vì mô tả một chỉnh sửa bằng văn bản, người dùng có thể đánh dấu khu vực bằng hình ảnh và sau đó chỉ định cho Gemini biết phải làm gì tiếp theo (ví dụ: khoanh tròn một chiếc mũ và yêu cầu “Đổi mũ này thành màu xanh lá cây”).

Điều này sẽ làm cho các lời nhắc phức tạp dễ thực hiện hơn nhiều. Người dùng có thể sử dụng các điểm đánh dấu trực quan để cho AI biết khu vực nào của hình ảnh cần chỉnh sửa.

Việc này giải quyết một trong những vấn đề chính với các công cụ hình ảnh AI hiện tại, vốn để lại nhiều phần của quy trình cho phỏng đoán, dẫn đến nhiều giả định không chính xác. Khả năng đánh dấu trực quan một khu vực cụ thể sẽ cung cấp cho Gemini một cách rõ ràng hơn, được kiểm soát tốt hơn để diễn giải hướng dẫn, đặc biệt đối với các chỉnh sửa liên quan đến các chi tiết nhỏ hoặc nhiều yếu tố chồng chéo.


Một Tính Năng Nhỏ Nhưng Có Cảm Giác Lớn

Khả năng chú thích trực tiếp trên hình ảnh có thể nghe có vẻ nhỏ, nhưng đối với các công cụ hình ảnh AI, nó là một điều lớn. Hầu hết người dùng phải dựa vào các ứng dụng đánh dấu bên ngoài khi họ muốn làm nổi bật một vùng hoặc chỉ ra chính xác những gì cần thay đổi. Việc tích hợp bước đó vào Gemini sẽ hợp lý hóa toàn bộ quy trình làm việc chỉnh sửa.

Nó cũng làm cho công cụ này trở nên thân thiện hơn với người mới bắt đầu. Thay vì phải soạn các lời nhắc hoàn hảo, người dùng có thể chỉ cần đánh dấu những gì họ muốn được sửa.

Google vẫn chưa công bố tính năng này, nhưng với giao diện người dùng chú thích xuất hiện trên cả di động và web, giai đoạn thử nghiệm có vẻ đang diễn ra tốt đẹp. Khi nó ra mắt, quy trình chỉnh sửa của Gemini có thể trở nên trực quan và mạnh mẽ hơn đáng kể.


Bạn nghĩ tính năng vẽ và khoanh tròn để chỉnh sửa (visual marking) này có thể giúp Gemini cạnh tranh trực tiếp hơn với các công cụ chỉnh sửa AI dựa trên cọ vẽ (brush-based editing) như trong Photoshop không?

Bài viết cùng chủ đề: