Anthropic презентувала модель Claude Opus 4.7 для покращеного програмування з мінімальним втручанням людини

Зміст

Компанія Anthropic здійснила значний прорив у сфері штучного інтелекту, представивши свою нову флагманську модель Claude Opus 4.7, яка вже стала доступною для широкого кола користувачів. Ця інноваційна розробка демонструє суттєві покращення у роботі з програмним кодом, обробці візуальної інформації та здатності точно виконувати поставлені інструкції, що відкриває нові горизонти для застосування ШІ в різних галузях.

Ключові інновації Claude Opus 4.7

Однією з найважливіших модернізацій у Claude Opus 4.7 є значне розширення можливостей обробки зображень. Нова модель здатна опрацьовувати візуальний контент з найдовшою стороною зображення до 2576 пікселів, що приблизно відповідає 3,75 мегапікселям. Цей показник утричі перевищує можливості попередніх версій, що значно спрощує роботу з деталізованими скриншотами, а також полегшує аналіз складних схем, діаграм та документів. Дослідження показують, що покращена робота з візуальними даними є одним з пріоритетних напрямків розвитку сучасних ШІ-систем, оскільки це дозволяє їм краще розуміти та інтерпретувати світ навколо нас.

Висока точність виконання інструкцій також стала однією з ключових переваг Claude Opus 4.7. За заявами розробників з Anthropic, модель демонструє виняткову ефективність у виконанні довготривалих та комплексних завдань, чітко дотримуючись заданих директив. Більше того, Opus 4.7 здатна до самостійної перевірки результатів перед наданням остаточної відповіді, що мінімізує ймовірність помилок і підвищує надійність її роботи.

Прорив у сфері програмування

У сфері розробки програмного забезпечення незалежні тестування підтвердили значний прогрес нової моделі. GitHub відзначив приріст продуктивності на 13% у власному наборі з 93 завдань, серед яких були чотири, що раніше виявлялися непідвладними попереднім версіям моделей Anthropic. Це свідчить про те, що Claude Opus 4.7 може стати потужним інструментом для програмістів, допомагаючи їм швидше та ефективніше вирішувати складні кодові задачі.

Інші провідні компанії також відзначили позитивні зміни. Notion повідомила про зростання продуктивності нової моделі на 14% при одночасному зниженні споживання токенів та триразовому зменшенні кількості збоїв. Тестування в CursorBench показало вражаючі результати: 70% успішних виконань проти 58% у попередньої версії Opus 4.6. Rakuten зазначила, що Opus 4.7 вирішує втричі більше виробничих завдань порівняно з попередньою версією, що підтверджується внутрішнім аналізом SWE-Bench. Компанія Vercel, у свою чергу, відзначила нову поведінку моделі, яка полягає у формуванні доказу коректності перед написанням системного коду, що може суттєво підвищити якість та надійність розробки.

Додаткові нововведення від Anthropic

Окрім основної моделі Opus 4.7, Anthropic представила низку інших важливих оновлень, спрямованих на розширення функціональності та гнучкості використання своїх продуктів.

Рівень зусиль xhigh у API: Впроваджено новий рівень зусиль “xhigh” (надвисокий), що розташовується між існуючими рівнями “високий” та “максимальний”. Це дозволяє користувачам більш точно налаштовувати баланс між ефективністю міркувань моделі та затримкою обробки, особливо під час вирішення складних завдань.
Бета-версія механізму task budgets: Запущено бета-версію механізму task budgets, який надає користувачам інструменти для ефективного контролю над витратами токенів, оптимізуючи використання ресурсів.
Claude Code з командою /ultrareview: Оновлений Claude Code тепер включає команду /ultrareview, яка призначена для поглибленої перевірки коду. Ця команда аналізує внесені зміни, виявляючи потенційні помилки та недоліки, що сприяє підвищенню якості програмного забезпечення.
Підвищення базового рівня зусиль: Базовий рівень зусиль моделі тепер встановлено на “xhigh” для всіх тарифних планів, що означає покращену продуктивність навіть на стандартних налаштуваннях.
Режим “авто” для підписників Max: Для користувачів тарифного плану Max став доступний режим “авто”, який дозволяє моделі самостійно приймати рішення замість користувача, що може бути корисним для автоматизації певних процесів.

Безпека та вартість використання

Anthropic підкреслює, що Opus 4.7 не є найпотужнішою розробкою компанії. Вище за неї розташована закрита модель Claude Mythoss Preview, яка призначена для пошуку програмних вразливостей і наразі доступна лише партнерам Anthropic для проведення аудиту безпеки їхніх систем. Щодо Opus 4.7, компанія застосувала диференційне обмеження кіберможливостей та активно тестує нові захисні механізми, що блокують ризиковані запити, забезпечуючи підвищений рівень безпеки.

Вартість використання Claude Opus 4.7 залишилася незмінною: 5 доларів США за мільйон токенів на вході та 25 доларів США за мільйон токенів на виході. Однак, важливо враховувати, що реальна вартість використання може зрости через новий токенізатор. Цей токенізатор перетворює текст у 1,0–1,35 раза більше токенів залежно від типу контенту. Крім того, при використанні високих рівнів зусиль модель генерує значно більше внутрішніх міркувань, особливо на пізніх етапах реалізації агентських сценаріїв, що також може впливати на загальну кількість використаних токенів.

Представлення Claude Opus 4.7 свідчить про стрімкий розвиток технологій штучного інтелекту та прагнення компаній, подібних до Anthropic, створювати все більш потужні, точні та безпечні інструменти для вирішення широкого спектру завдань. Подальший розвиток подібних моделей, безумовно, матиме значний вплив на майбутнє технологій та їх інтеграцію в усі сфери людської діяльності.