Чи варто довіряти Pangram? The Atlantic дослідив надійність найпопулярнішого у США ШІ-детектора

Зміст

Інструмент Pangram, що набуває все більшої популярності у виявленні текстів, написаних штучним інтелектом, викликає все більше дискусій щодо своєї надійності та потенційних помилок, які можуть мати серйозні наслідки для репутації людей.

Pangram: Золотий стандарт чи небезпечна ілюзія?

Точність під сумнівом

Інструменти виявлення ШІ стали достатньо ефективними для широкого використання, але недостатньо надійними, щоб їм повністю довіряти. Таким чином, Pangram та інші детектори є дзеркальними відображеннями продуктів, на які вони полюють.

Нещодавній приклад з промовою Папи Римського, яку Pangram позначив як згенеровану на 46%, підкреслює зростаючу проблему. Водночас, як зазначає The Atlantic, інструмент, який “здебільшого працює точно”, може виявитися небезпечнішим за “той, що працює погано”, адже його вплив на репутації зростає. Розробники Pangram стверджують, що помилки трапляються приблизно “раз на 10 000 випадків”, а незалежні дослідження Чиказького університету частково підтверджують цю цифру, демонструючи майже повну відсутність хибнопозитивних результатів на вибірці з 3000 текстів.

Сліпі плями детектора

Попри заявлену точність, Pangram не позбавлений хиб. Наприклад, нещодавно один із романів великого видавництва було знято з продажу через позначення його як згенерованого ШІ. Подібні звинувачення, обґрунтовані тим самим інструментом, поширились на статті The New York Times та оповідання, відзначені літературною премією.

Маскування та непрозорість

Проблему ускладнює постійний “ШІ-перегон”, коли розробники чатботів прагнуть зробити їх тексти якомога природнішими. Додатковою перешкодою є поява інструментів для маскування, як-от Walter Writes AI, які переформатовують згенерований текст, роблячи його менш вразливим для детектування. Більше того, системи на кшталт Pangram працюють непрозоро, не пояснюючи логіку своїх висновків, що ускладнює перевірку та розуміння їхніх рішень.

Помилкові звинувачення та їх наслідки

Репутаційні втрати

Масштаби можливих помилок, навіть за умови низького відсотка хибнопозитивних результатів, можуть бути значними. Видання наводить приклад журналістки Тейлор Лоренц, яку помилково звинуватили у використанні ШІ для написання статті для Vanity Fair, що згодом визнав і сам CEO Pangram. Редактор The Wall Street Journal Джеймс Таранто назвав Pangram “машиною для наклепу” після того, як сервіс помилково позначив три редакційні колонки як згенеровані ШІ.

Паралелі з війною щодо плагіату

Ці суперечки порівнюються з “війною навколо плагіату” 2023-2024 років, коли звинувачення, часто побудовані на звітах алгоритмів, виявлялися безпідставними, що призвело до серйозних наслідків для академічного світу.

Майбутнє виявлення ШІ

Наразі Pangram та подібні детектори слугують відправною точкою для подальшого аналізу, а не остаточним суддею. Однак, в умовах зростаючої залежності від таких інструментів у школах та медіа, важливо усвідомлювати їхні обмеження та потенціал для помилок, щоб уникнути несправедливих звинувачень та зберегти довіру до процесу перевірки контенту.

Додаткова інформація

Розробники та їхня позиція

Макс Сперо, CEO Pangram, наголошує на великій відповідальності, яка лягає на плечі компанії, називаючи контент згенерованим ШІ. Він запевняє, що компанія робить це лише тоді, коли має високу впевненість у результатах. Водночас, здатність детектора гарантовано підтверджувати людське авторство є менш надійною, з рівнем хибнонегативних результатів близько одного на 70.

Контекст розвитку технологій

Поява інструментів для маскування тексту, які допомагають зробити згенерований ШІ контент більш людським, свідчить про динамічний розвиток цієї сфери. Прикладом є Walter Writes AI, який, за даними The Atlantic, ефективно обходить детектори, роблячи тексти, створені за допомогою ChatGPT та Claude, майже невразливими для Pangram.