Emergence створила нове віртуальне середовище для детального та довгострокового аналізу ШІ-агентів

Зміст

Emergence представила Emergence World – інноваційне віртуальне середовище, розроблене спеціально для тестування та оцінки автономних агентів на базі штучного інтелекту, які здатні виконувати складні та довготривалі завдання, що виходить за рамки можливостей традиційних симуляцій. Ця передова платформа розміщує популяції агентів у спільному просторовому світі, який налічує понад 40 різноманітних локацій, включаючи бібліотеки, ратуші, житлові квартали та громадські простори, надаючи їм доступ до актуальних даних реального світу, таких як синхронізована погода Нью-Йорка, API новин у режимі реального часу та повноцінний доступ до інтернету.

Ключові характеристики Emergence World:

Системи постійної пам’яті: Кожен агент оснащений трьома системами постійної пам’яті: епізодичною (зберігання подій з часовими мітками), рефлексивними щоденниками (періодичне самопідсумовування досвіду) та станом відносин (збереження явних соціальних міток та історії взаємодій).
Розширений інструментарій: Агенти мають доступ до понад 120 інструментів, що охоплюють навігацію, комунікацію, планування, управління пам’яттю, голосування, розпорядження ресурсами та творче самовираження. Ці інструменти організовані в трирівневу архітектуру, що сприяє динамічному виявленню та формуванню ланцюжків дій, а не жорсткому попередньому визначенню.
Демократичні механізми: Платформа реалізує демократичні процедури, включаючи пропозиції, що потребують 70% схвалення, економічний тиск та подальші рішення, які безпосередньо впливають на стан світу.
Безперервна симуляція: Симуляція працює безперервно протягом кількох тижнів, зберігаючи стан і фіксуючи кожну взаємодію, рішення та етап навчання для подальшого детального аналізу.

Такий підхід дозволяє дослідникам отримати відповіді на фундаментальні питання, які неможливо вирішити за допомогою короткострокових тестів. Це включає вивчення поведінкових тенденцій у динаміці, безпеки екосистеми, дизайну обмежень, виявлення та координації інструментів, а також фазових переходів та ранніх попереджувальних сигналів.

Порівняльне дослідження моделей ШІ:

Для демонстрації можливостей платформи Emergence провела міжпостачальне дослідження з п’ятьма паралельними світами, в кожному з яких функціонувало по десять агентів з однаковими ролями та початковими умовами. Єдиною відмінністю між світами була базова модель штучного інтелекту: Claude Sonnet 4.6 від Anthropic, Grok 4.1 Fast від xAI, Gemini 3 Flash від Google, GPT-5-mini від OpenAI та один гетерогенний змішаний варіант.

Результати симуляцій:

Gemini 3 Flash: За 15 днів симуляції ця модель скоїла 683 злочини, причому ця цифра продовжувала зростати.
Змішана модель: Кількість злочинів зростала до 8 квітня, коли загинуло 7 агентів, після чого показник стабілізувався.
Grok 4.1 Fast: Було зафіксовано 183 злочини лише за приблизно 4 дні до завершення симуляції.
GPT-5 Mini: Зафіксовано лише 2 злочини, однак агенти не вжили заходів для виживання, що призвело до загибелі всіх агентів протягом 7 днів.

За іншими показниками, Claude Sonnet 4.6 продемонстрував найвищу соціальну стабільність, підтримуючи повну популяцію з 10 агентів до 16-го дня без жодного злочину. Gemini 3 Flash показав найвищий рівень ентропії з повторюваною динамікою ескалації на пізніх стадіях, тоді як Grok 4.1 Fast відзначився швидкою, але короткочасною нестабільністю, що призвела до раннього колапсу. Змішана модель показала проміжні результати, вказуючи на те, що гетерогенна поведінка агентів може частково пом’якшувати неконтрольовану ескалацію.

Аналіз громадської участі:

Claude Sonnet 4.6: Найвищий рівень громадянської участі – 332 голоси за 58 пропозицій із 98% показником “За”. Однак, це також свідчить про тенденцію до одностайного погодження та майже повну відсутність змістовної незгоди.
Змішана модель, Gemini 3 Flash та Grok 4.1 Fast: Залишалися в межах діапазону узгодженості 55–85%, що вказує на більш здоровий баланс обговорень. Змішана модель продемонструвала найсильніші докази суттєвих дебатів та розбіжностей.

“Оскільки ці моделі стають потужнішими, агенти, побудовані на їх основі, також стають більш спроможними, автономними та дослідницькими. Наші експерименти показують, що в довгостроковій перспективі агенти не просто механічно дотримуються статичних правил – вони починають досліджувати межі свого середовища, адаптуючи свою поведінку, а в деяких випадках знаходять способи обійти або порушити встановлені бар’єри. Найголовніше, що, здається, не існує надійного способу повністю обмежити або стримувати цю поведінку лише за допомогою суто нейронних підходів”, – підсумовують дослідження в Emergence.

Це дослідження підкреслює зростаючу складність та потенційну непередбачуваність поведінки автономних систем ШІ, що вимагає розробки нових методів контролю та оцінки їхньої діяльності.