Google випустила Nano Banana 2 Lite та відкрила Gemini Omni Flash для розробників

Зміст

Google продовжує революціонізувати сферу штучного інтелекту, представляючи новітні інструменти, що розширюють межі генеративного ШІ. Компанія анонсувала дві потужні моделі: Nano Banana 2 Lite для генерації зображень та Gemini Omni Flash для створення та редагування відео, що обіцяють значні зміни у роботі творчих професіоналів та розробників. Nano Banana 2 Lite, найшвидша та найдоступніша модель у своєму класі, вже інтегрована в численні сервіси Google, від Gemini до Google Photos, роблячи високоякісну генерацію зображень доступною за рекордно низькою вартістю та з вражаючою швидкістю.

Нові горизонти генерації зображень з Nano Banana 2 Lite

Швидкість, вартість та якість – ключові переваги

Nano Banana 2 Lite створена з акцентом на потреби користувачів, яким важлива оперативність та економічність процесу генерації. Зазначається, що модель генерує зображення всього за чотири секунди, а вартість однієї картинки роздільною здатністю 1000 пікселів становить вражаючі $0,034. Попри фокус на швидкодії, Google стверджує, що Nano Banana 2 Lite не поступається у точності виконання запитів, стабільності персонажів між різними генераціями та якості відображення тексту на зображеннях. Це робить її ідеальним інструментом для широкого спектру завдань, від швидкого прототипування до створення контенту для соціальних мереж.

“Nano Banana 2 Lite вже доступна в Google AI Studio, через Gemini API та Gemini Enterprise Agent Platform. Водночас модель почала з’являтися і в споживчих сервісах Google, зокрема в Gemini, AI Mode у Search, NotebookLM, Google Photos та Google Ads.”

Інтеграція та доступність

Модель вже інтегрована в такі популярні сервіси Google, як Gemini, AI Mode у Search, NotebookLM, Google Photos та Google Ads, що забезпечує її широку доступність для користувачів. Крім того, розробники мають доступ до Nano Banana 2 Lite через Google AI Studio, Gemini API та Gemini Enterprise Agent Platform, що відкриває нові можливості для створення інноваційних додатків.

Gemini Omni Flash: революція у відеогенерації

Генерація та редагування відео за допомогою природної мови

Одночасно з Nano Banana 2 Lite, Google представила Gemini Omni Flash – модель, призначену для генерації та редагування відео за допомогою природної мови. Ця модель, вперше анонсована на конференції Google I/O, дозволяє створювати відео на основі тексту, зображень і відеофрагментів, а також редагувати їх, використовуючи лише текстові команди.

Ключові можливості та обмеження

Серед основних функцій Gemini Omni Flash – редагування відео природною мовою, використання різних типів вхідних даних для збереження стилістики сцени, синхронізація тексту з відеорядом та застосування знань Gemini для побудови сюжетів. Наразі модель генерує відео тривалістю до 10 секунд, проте підтримка довших роликів планується в майбутньому. Вартість використання Gemini Omni Flash становить $0,10 за секунду відео, що відповідає ціні моделі Veo 3.1 Fast.

Комбіноване використання та безпека

Синергія моделей для нових творчих рішень

Google демонструє потенціал синергії між Nano Banana 2 Lite та Gemini Omni Flash, показуючи, як швидко створені зображення можуть бути перетворені на короткі анімовані відео. Компанія розробила кілька тестових застосунків для демонстрації таких сценаріїв, включаючи сервіс для віртуальних подорожей, інструмент для дизайну інтер’єрів та платформу для створення рекламних відео з фотографій товарів.

Цифровий водяний знак SynthID

Усі матеріали, створені або модифіковані за допомогою цих моделей, автоматично позначаються цифровим водяним знаком SynthID. Ця технологія допомагає ідентифікувати контент, створений штучним інтелектом, що є важливим кроком для забезпечення прозорості та боротьби з дезінформацією.

Персоналізована генерація зображень

Варто також зазначити, що нещодавно Google зробила персоналізовану генерацію зображень у Gemini безкоштовною для користувачів у США. Ця функція використовує дані користувача з сервісів Google для створення зображень, що враховують його інтереси та вподобання, що свідчить про постійне прагнення компанії до індивідуалізації користувацького досвіду.