OpenAI випустила генератор зображень ChatGPT Images 2.0: нарешті “розуміє” текст і шукає в інтернеті

Зміст

Нова версія генератора зображень від OpenAI, ChatGPT Images 2, вже доступна користувачам і пропонує значні покращення, включно з функцією “мислення”, яка дозволяє моделі використовувати веб-пошук для створення кількох візуалізацій на основі одного запиту. Ця інноваційна можливість, як пояснює The Verge, дає змогу ChatGPT Images 2 створювати складніші зображення, точніше дотримуватися інструкцій користувача, зберігати обрані деталі та коректно генерувати текст. Функції “мислення” відкриті для передплатників платних версій ChatGPT, таких як Plus, Pro, Business і Enterprise, надаючи їм доступ до розширених можливостей. У цьому режимі генератор зображень здатен не лише залучати інформацію з інтернету, але й створювати візуальні пояснення на основі завантажених файлів, а також аналізувати структуру зображення перед його створенням, що свідчить про значний крок уперед у розвитку генеративних технологій.

Поглиблені можливості ChatGPT Images 2

Розширений функціонал для творців

ChatGPT Images 2.0 вирізняється здатністю генерувати до восьми зображень одночасно в режимі “мислення”, забезпечуючи при цьому послідовність у відтворенні персонажів, об’єктів та стилю в кожній сцені. В OpenAI переконані, що ця функція суттєво спростить процес створення коміксів, серій графічних матеріалів для соціальних мереж або комплексних дизайн-проєктів, надаючи митцям потужний інструмент для реалізації їхніх ідей.

Водночас, усі користувачі ChatGPT, незалежно від типу підписки, отримують оновлення, які покращують передачу ключових рис фотографій, а також розширюють можливості роботи з піксель-артом, манґою, кінематографічними сценами та іншими стилями. Це означає, що навіть без преміум-доступу користувачі зможуть насолоджуватися вдосконаленою генерацією зображень.

Технічні вдосконалення та підтримка мов

Сервіс в оновленій версії підтримує роздільну здатність до 2K, що забезпечує високу якість зображень, та пропонує ширший спектр форматів — від широкоформатних (3:1) до вертикальних (1:3). Це надає користувачам гнучкість у виборі форматів для своїх проєктів.

Крім того, було суттєво покращено генерацію тексту різними мовами. Окрім англійської, значно підвищено якість генерації тексту японською, корейською, китайською, гінді та бенгальською мовами, що робить інструмент більш універсальним для глобальної аудиторії.

“Вперше OpenAI випустила ChatGPT Images торік з великим оновленням у грудні, яке пришвидшило генерацію та покращило редагування. Відтоді конкуренція лише посилюється з появою таких інструментів, як Nano Banana Pro від Google та MAI-Image-2 від Microsoft.”

Конкурентне середовище та доступність

Поява ChatGPT Images 2.0 відбувається на тлі зростаючої конкуренції на ринку генеративних технологій. Перший випуск ChatGPT Images відбувся минулого року, а значне оновлення в грудні прискорило процес генерації та покращило можливості редагування. З того часу з’явилися такі потужні конкуренти, як Nano Banana Pro від Google та MAI-Image-2 від Microsoft, що свідчить про динамічний розвиток цієї галузі.

ChatGPT Images 2.0 доступний для всіх користувачів ChatGPT та Codex відсьогодні, відкриваючи нові горизонти для творчості та інновацій.

Додаткова інформація про розвиток генеративних моделей

Розвиток генеративних моделей штучного інтелекту, таких як ChatGPT Images 2, є одним із найдинамічніших напрямків у сучасній IT-індустрії. Ці технології знаходять своє застосування не лише у створенні зображень, але й у генерації тексту, музики, коду та інших форм контенту. OpenAI, будучи одним із лідерів у цій сфері, постійно вдосконалює свої моделі, прагнучи зробити їх більш потужними, інтуїтивно зрозумілими та доступними для широкого кола користувачів.

Застосування веб-пошуку в генеративних моделях, як це реалізовано в ChatGPT Images 2, є значним проривом. Це дозволяє моделям отримувати актуальну інформацію з мережі, що робить згенеровані зображення більш релевантними та точними, особливо коли йдеться про створення візуалізацій на основі поточних подій або специфічних запитів. Можливість аналізувати структуру зображень перед генерацією також відкриває нові перспективи для контролю над кінцевим результатом.

Конкуренція між такими компаніями, як OpenAI, Google та Microsoft, стимулює подальші інновації та призводить до швидшого впровадження нових функцій. Кожна компанія прагне запропонувати унікальні рішення, що відповідають зростаючим потребам користувачів у креативних інструментах. Ці зусилля спрямовані на те, щоб зробити штучний інтелект не просто інструментом, а повноцінним партнером у творчому процесі.