Anthropic вимкнув моделі Claude Fable 5 та Claude Mythos 5 на вимогу уряду США через можливий обхід захисту

Зміст

Компанія Anthropic, відомий розробник передових моделей штучного інтелекту, опинилася в центрі уваги через раптове припинення доступу до своїх найпотужніших розробок — Claude Fable 5 та Claude Mythos 5. Це рішення, як зазначається, було продиктоване розпорядженням уряду США щодо експортного контролю, яке посилається на міркування національної безпеки. Зазначений припис вимагає негайного призупинення будь-якого доступу до зазначених моделей для іноземних громадян, незалежно від їхнього місцезнаходження, включно з іноземними співробітниками самої Anthropic. Цікаво, що решта моделей компанії наразі залишаються поза полем дії цього регулювання.

Згідно з повідомленням Anthropic, урядовий лист не містив конкретних доказів чи деталей щодо потенційних загроз національній безпеці. Компанія пояснює, що уряд США отримав інформацію про можливість обходу захисних механізмів моделі Fable 5, так званий “джейлбрейк”. Anthropic, усвідомлюючи складність досягнення абсолютної стійкості до таких атак, застосувала в Fable 5 багаторівневу систему захисту, яка значно ускладнювала або робила надто дорогою спроби обійти її. Ця стратегія, разом із постійним моніторингом, дозволяла оперативно реагувати на подібні інциденти, що і зумовлювало потребу в 30-денному зберіганні даних клієнтів для аналізу та мінімізації загроз.

Anthropic стверджує, що уряд надав лише усні свідчення про можливість існування вузькоспрямованого, не універсального “джейлбрейку”, який по суті зводиться до запиту моделі прочитати певний код та виправити в ньому помилки. Компанія, ознайомившись зі звітом, що, ймовірно, став підставою для припису, дійшла висновку, що продемонстровані можливості є загальнодоступними і присутніми в інших сучасних моделях, зокрема в GPT-5.5 від OpenAI.

Розробка та випуск моделей

Обидві моделі, Fable 5 та Mythos 5, були представлені громадськості лише за три дні до інциденту, 9 червня. Fable 5 позиціонується як безпечна для широкого загалу модель класу Mythos, тоді як Mythos 5 є базовою версією з відсутніми в окремих сферах обмеженнями, призначеною для вузького кола фахівців з кібербезпеки та операторів критичної інфраструктури в рамках урядового проєкту Glasswing. За заявами розробників, Fable 5 демонструє безпрецедентні можливості, перевершуючи всі попередні моделі Anthropic за низкою ключових показників.

Саме через ці розширені можливості модель Fable 5 була оснащена посиленими запобіжниками. Так, запити, що стосуються чутливих тем, на кшталт кібербезпеки, автоматично перенаправляються на обробку потужнішою моделлю Claude Opus 4.8, причому такі запобіжники спрацьовують у середньому менш ніж у 5% сесій.

“Anthropic заявляє, що виконує юридичний припис уряду й прибирає доступ до Fable 5 та Mythos 5 для всіх користувачів, однак не погоджується з тим, що виявлення вузького потенційного джейлбрейку має бути підставою для відкликання комерційної моделі, розгорнутої для сотень мільйонів людей.”

Компанія підкреслює, що впровадження такого стандарту щодо виявлення потенційних вразливостей могло б фактично зупинити розвиток нових моделей у всій галузі штучного інтелекту. Anthropic також нагадала про свою публічну підтримку права урядів блокувати небезпечні розгортання моделей ШІ, але лише за умов прозорої, справедливої та технічно обґрунтованої процедури, яка, на їхню думку, в цьому випадку не була дотримана. Компанія висловила перепрошення за спричинені незручності, назвала ситуацію непорозумінням і пообіцяла надати додаткові роз’яснення протягом 24 годин, а також відновити доступ до Fable 5 та Mythos 5 найближчим часом.

Реакція ринку та потенційні наслідки

Це рішення уряду США може мати значні наслідки для галузі штучного інтелекту, створюючи прецедент для регулювання розробки та розгортання потужних моделей ШІ. З одного боку, це демонструє прагнення урядів забезпечити національну безпеку та запобігти зловживанням новими технологіями. З іншого боку, такі дії можуть сповільнити інноваційний процес та створити невизначеність для компаній, які інвестують значні ресурси в дослідження та розробку.

Експерти галузі звертають увагу на те, що швидкість розвитку технологій ШІ випереджає темпи створення ефективних механізмів регулювання. Необхідність балансування між стимулюванням інновацій та забезпеченням безпеки стає ключовим викликом для розробників, урядів та суспільства в цілому.

Випадок із Anthropic підкреслює зростаючу роль урядів у формуванні майбутнього ШІ.
Виникає питання щодо прозорості та обґрунтованості рішень, що приймаються на основі міркувань національної безпеки.
Галузь потребує чіткіших правил гри для забезпечення сталого розвитку та уникнення потенційних конфліктів між інноваціями та регулюванням.

Тарас Міщенко, головний редактор видання “Межа”, відзначає, що подібні ситуації можуть вплинути на довіру до розробників ШІ та на готовність користувачів використовувати найновіші технології. Важливо, щоб компанії та уряди вели відкритий діалог для пошуку оптимальних рішень, що відповідатимуть інтересам усіх сторін.