Google DeepMind запускает Gemini 2.5 Flash Image, также называемый «нано-банан», для приложения Gemini и для разработчиков через Gemini API, Google AI Studio и Vertex AI. Это обновление часто ссылается на инструменты изображения AI: небольшие изменения, которые в конечном итоге изменяют все изображение. Google описывает этот релиз как улучшение качества и контроля по сравнению с более ранними версиями.

Главной особенностью является последовательность персонажей. Вы можете держать человека, питомца или продукт одинаково в разных сценах, даже когда вы меняете наряды, прически, периоды времени или настройки. Модель также может объединять несколько изображений в одно, вносить конкретные изменения с помощью инструкций естественного языка и использовать мировые знания Gemini во время создания и редактирования изображений.

Вы можете использовать этот инструмент, чтобы разместить одного и того же персонажа в разных настройках, показать продукт с разных ракурсов или сохранить образы бренда последовательными в кампаниях. Многошайное редактирование позволяет вам продолжать вносить изменения, такие как добавление мебели и декора в комнату, чтобы опробовать идеи. Вы также можете смешивать дизайн, добавлять шаблон от одного изображения к объекту в другом или смешивать человека и питомца в новую сцену.

Цены прозрачны для разработчиков: Gemini 2.5 Flash Image стоит 30 долларов за один миллион выходных токенов. Каждое изображение имеет 1,290 выходных токенов, что составляет примерно $0,039 за изображение. Другие условия ввода и вывода следуют стандартной цене Gemini 2.5 Flash.

Для безопасности сгенерированные изображения включают видимый знак ИИ и невидимый цифровой водяной знак SynthID. Google говорит, что SynthID все еще может быть обнаружен после общих правок, что должно помочь проверить происхождение изображений, поскольку синтетические носители становится все труднее распознать.

Google говорит, что ранние предварительные просмотры оценивают это как ведущую модель редактирования изображений. Встроенное редактирование приложения Gemini теперь хранит тонкие детали на ваших фотографиях. Вы можете загрузить фотографию, запросить изменения, объединить изображения со своим питомцем, поменять фоны, чтобы попробовать новые обои, или поместить себя в разные сцены. Вы также можете использовать отредактированное изображение в Gemini для создания короткого видео.


Для рекламы на Cyberstate.kz пишите нам на почту: editor@cyberstate.kz

от Bolat Mukashev

Bolat Mukashev bolat.mukashev@gmail.com

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *