США почали відставати від Китаю у гонці ШІ-відео – FT

Зміст

Китайські компанії, що спеціалізуються на штучному інтелекті, активно випереджають своїх американських конкурентів у галузі генерації відео, яка наразі є одним із найдинамічніших напрямків розвитку генеративного ШІ. Ця тенденція, як зазначає Financial Times, є особливо відчутною у сферах реклами, електронної комерції та розваг, де спостерігається стрімке зростання потреби у швидкому та економічно вигідному створенні відеоконтенту.

Ключову роль у цьому значному прориві відіграють такі китайські гіганти, як ByteDance та Kuaishou, які володіють унікальною перевагою – безпрецедентним доступом до величезних масивів коротких відео, що генеруються їхніми популярними платформами, подібними до TikTok та Kuaishou. Саме ці дані стають основою для навчання їхніх ШІ-моделей, що дозволяє їм досягати вищого рівня розуміння руху, сцен, об’єктів та загальної динаміки відео, чого складно досягти західним компаніям, які не мають аналогічних платформ та обсягів відеоданих.

Внаслідок цього, китайські моделі, такі як Kling, Seedance 2.0 та Hailuo, здобувають позитивні відгуки від користувачів та творців контенту, демонструючи кращу здатність до створення плавних рухів, стабільного зображення та точного виконання текстових запитів. Багато розробників відзначають, що ці інструменти є більш зручними у практичному використанні завдяки меншій кількості обмежень та блокувань запитів.

З іншого боку, провідні американські компанії, зокрема OpenAI, Google та Anthropic, хоча й зберігають лідерство у сфері великих мовних моделей та генерації коду, помітно відстають у сегменті відеогенерації. Наприклад, модель Veo 3 від Google, хоч і вважається потужною, має суттєві обмеження, пов’язані з системами безпеки та політикою контенту, що іноді впливає на гнучкість та якість кінцевого результату порівняно з китайськими аналогами.

“Китайські компанії, що спеціалізуються на штучному інтелекті, активно випереджають своїх американських конкурентів у галузі генерації відео, яка наразі є одним із найдинамічніших напрямків розвитку генеративного ШІ.”

Економічний аспект також відіграє важливу роль. Китайські сервіси часто пропонуються за більш доступними цінами, з гнучкими тарифними планами або оплатою за фактичне використання, що робить їх привабливими для індивідуальних творців та невеликих студій. У той же час, моделі, розроблені в США та Європі, частіше мають вищі обмеження та можуть відхиляти запити через правила безпеки або авторського права.

Незважаючи на досягнення, галузь стикається з певними викликами. Використання великих обсягів відеоданих ставить під сумнів питання авторських прав та призводить до юридичних суперечок щодо навчальних матеріалів. Крім того, відеогенерація вимагає значних обчислювальних ресурсів, що робить її надзвичайно дорогою. Раніше навіть OpenAI була змушена відмовитися від свого відеопроєкту через високі витрати на інфраструктуру.

Тим не менш, технологія вже здійснює суттєвий вплив на індустрію. Компанії тепер мають можливість генерувати тисячі відео для товарів та рекламних кампаній, що раніше було економічно недоцільним. Це знаменує собою початок нової ери масової автоматизації відеовиробництва, де штучний інтелект стає незамінним інструментом у створенні цифрового контенту.

Подальші перспективи та виклики

Вплив на медіа та маркетинг

Швидкий розвиток ШІ-генерації відео відкриває нові можливості для медіа-індустрії та маркетингових компаній. Зокрема, з’являється можливість персоналізації відеоконтенту для різних сегментів аудиторії в реальному часі. Це може призвести до значного підвищення ефективності рекламних кампаній та рівня залученості споживачів.

Етичні та юридичні питання

Питання авторського права: використання великих обсягів даних для навчання моделей викликає дискусії щодо легальності та права власності на створений контент.
Регулювання контенту: необхідність розробки чітких правил та норм для запобігання створенню шкідливого або дезінформаційного відеоконтенту.

Технологічні обмеження

Незважаючи на прогрес, існують певні технічні обмеження, зокрема:

Реалізм зображення: досягнення фотореалістичного рівня якості відео залишається складним завданням.
Контроль над деталями: точне відтворення специфічних деталей або складних рухів може бути проблематичним.
Витрати на обчислення: висока вартість навчання та експлуатації потужних ШІ-моделей.

Однак, попри ці виклики, потенціал генерації відео за допомогою ШІ є величезним, і очікується, що ця технологія продовжить стрімко розвиватися, трансформуючи цифрову екосистему.