Збанкрутілі стартапи заробляють сотні тисяч доларів на продажі робочого листування ШІ-розробникам – Forbes

Збанкрутілі стартапи заробляють сотні тисяч доларів на продажі робочого листування ШІ-розробникам – Forbes

У світі штучного інтелекту, де швидкість розвитку вражає, виник новий, дещо несподіваний ринок – архіви комунікацій та робочих процесів збанкрутілих або закритих стартапів. Лабораторії, що розробляють передові моделі ШІ, активно скуповують ці “цифрові сліди” минулих компаній, перетворюючи колишні жарти у Slack, завдання в Jira та ділове листування на цінний ресурс для навчання штучного інтелекту. Цей процес, що нагадує “золоту лихоманку” цифрової епохи, приносить колишнім засновникам стартапів значні прибутки, сягаючи сотень тисяч доларів за архів.

Початково, навчання моделей штучного інтелекту базувалося на загальнодоступних даних з інтернету, таких як Reddit, Wikipedia та оцифровані книги. Однак, за словами колишнього головного науковця OpenAI Іллі Суцкевера, цей ресурс вичерпався до кінця 2024 року, що стало поштовхом до пошуку нових, більш специфічних джерел. Для створення сучасного агентного ШІ, який здатний виконувати реальні завдання, розробникам потрібні дані, що відображають автентичні робочі процеси. Саме тому архіви закритих стартапів стали своєрідним “викопним паливом” для цієї галузі.

Новий бізнес-тренд: продаж архівних даних стартапів

Засновниця компанії з транскрибування cielo24, Шанна Джонсон, поділилася досвідом виявлення неочікуваного активу після закриття свого проєкту. “Цифрові сліди”, накопичені за 13 років роботи – від жартів у Slack до багатотерабайтних архівів Google – виявилися надзвичайно цінними для навчання ШІ. Джонсон отримала “сотні тисяч доларів” за продаж цих даних, зазначивши, що, хоча закриття компанії досі викликає сум, приємно усвідомлювати, що зібрана інформація може бути корисною і “жити далі”.

Цей випадок не є поодиноким. Компанія SimpleClosure запустила платформу Asset Hub, яка дозволяє засновникам стартапів продавати свої робочі дані. На старті проєкту спостерігався “божевільний” інтерес з боку розробників ШІ, що свідчить про значний попит на такі ресурси. Керівник SimpleClosure, Дорі Йона, описує ситуацію як “відчуття золотої лихоманки”, де всі намагаються отримати доступ до реальних даних.

“Є відчуття золотої лихоманки — всі намагаються отримати доступ до реальних даних”, — каже керівник SimpleClosure Дорі Йона.

SimpleClosure наразі перебуває у бета-версії, активно працюючи над видаленням персональних даних, що є складним, але критично важливим процесом. Незважаючи на це, за останній рік компанія провела близько 100 угод, виплативши засновникам понад 1 мільйон доларів, причому одна компанія зазвичай отримує від 10 000 до 100 000 доларів.

Конкурентна компанія Sunset також спеціалізується на купівлі та продажі даних. За словами керівника Брендона Магоні, вартість архіву залежить від розміру та віку бізнесу, а також від рівня “насиченості” даних. Наприклад, завдання в Jira, пов’язане з конкретним комітом, є ціннішим, ніж окремий документ, а дані з таких галузей, як фінанси чи медицина, оцінюються вище.

Етичні аспекти та ризики продажу даних

Проте, не всі розглядають цей новий ринок виключно як бізнес-можливості. Марк Ротенберг, засновник Центру штучного інтелекту та цифрової політики, висловлює серйозні занепокоєння щодо приватності. Він наголошує, що навіть якщо співробітники передали права на робочі матеріали, це не означає, що їхні внутрішні комунікації можуть бути продані третім сторонам.

“Проблеми приватності тут дуже серйозні. Люди не очікують, що їхні Slack-повідомлення будуть використані таким чином… Це не абстрактні дані — це конкретні люди”.

Організація Ротенберга вже звернулася до Федеральної торгової комісії США з вимогою перевірити законність таких практик. Існує реальний ризик помилкової анонімізації, що може призвести до розкриття даних окремих організацій та людей. Дослідження, проведене за участі OpenAI та Google у 2020 році, показало, що штучний інтелект може дослівно відтворювати фрагменти навчальних даних, що підкреслює потенційну небезпеку.

На тлі цього, виникають питання щодо майбутнього регулювання ринку даних для ШІ та захисту приватності користувачів. Деякі експерти вважають, що необхідні чіткіші правила щодо збору, використання та продажу корпоративних даних, а також механізми контролю за процесом анонімізації.

Варто зазначити, що ринок даних для ШІ є надзвичайно динамічним. За даними аналітиків, обсяг цього ринку може сягнути мільярдів доларів найближчими роками. Такі компанії, як OpenAI, Google та Microsoft, активно інвестують у розробку нових моделей ШІ, що потребують величезних обсягів даних для навчання.

Водночас, поява нових джерел даних, таких як архіви стартапів, може суттєво прискорити розвиток ШІ, але також ставить перед суспільством нові етичні виклики. Пошук балансу між інноваціями та захистом прав особистості залишається ключовим завданням для всіх учасників процесу.