ШІ може створити зброю, яка зітре людей з лиця землі: як цього не допустити

Штучний інтелект (ШІ), як і інші технології, може використовуватися як у хороших, так і в поганих цілях. Учені з Корнельського університету вирішили відучити ШІ від шкідливих “знань”, щоб ніхто не зміг використати його для створення знаряддя масового ураження. 

Результати дослідження вони опублікували на офіційному сайті.

З огляду на те, що в розвиток ШІ вкладається багато грошей і зусиль, виникають побоювання з приводу використання великих мовних моделей (ВММ) на шкоду, наприклад, для розробки зброї. Щоб знизити ризики, урядові організації та лабораторії штучного інтелекту створили новий еталонний набір даних під назвою Weapons of Mass Destruction Proxy (WMDP), який не тільки пропонує метод перевірки наявності небезпечної інформації в моделях ШІ та способи її видалення, зберігаючи при цьому решту моделі практично незмінною.

Дослідники почали з експертами в галузі біобезпеки, хімічної зброї та кібербезпеки. Вони створили список із 4000 запитань із кількома варіантами відповідей, щоб перевірити, чи зможе людина застосувати ці дані для заподіяння шкоди. Вони також подбали про те, щоб питання не розкривали будь-якої конфіденційної інформації, і щоб ними можна було поділитися відкрито. У тестах брали участь студенти. Набір WMDP слугував двом основним цілям: щоб оцінити, наскільки добре студенти розуміють небезпечні теми, і для розробки методів “відучування” ШІ від цих знань.

У підсумку було розроблено метод під назвою CUT, який, як випливає з назви, видаляє небезпечні знання з ВММ, зберігаючи водночас загальні здібності ШІ в інших галузях, як-от біологія та інформатика.

Білий дім занепокоєний тим, що зловмисники використовують ШІ для розроблення небезпечної зброї, тому вони закликають до проведення досліджень, щоб краще зрозуміти цей ризик. У жовтні 2023 року президент США Джо Байден підписав указ, який зобов’язує наукову спільноту усувати ризики, пов’язані зі ШІ.

У законі викладено вісім основних принципів і пріоритетів відповідального використання ШІ, включно з безпекою, захищеністю, конфіденційністю, справедливістю, цивільними правами, захистом споживачів, розширенням прав і можливостей працівників, інноваціями, конкуренцією та глобальним лідерством.

“Моя адміністрація надає першочергового значення безпечному та відповідальному управлінню розробкою і використанням ШІ і тому просуває скоординований підхід у масштабах усього федерального уряду до цього. Швидкоплинний розвиток можливостей штучного інтелекту змушує Сполучені Штати лідирувати в цей момент заради нашої безпеки, економіки та суспільства”, — йдеться в указі.

Але зараз методи, які компанії, що займаються нейромережами, використовують для методу контролю над системами, і їх легко обійти. Крім того, тести, що дають змогу перевірити, чи може модель ШІ нести ризики, є дорогими і займають багато часу.

“Ми сподіваємося, що наші тести стануть одним з основних критеріїв, за якими всі розробники будуть оцінювати свої ШІ-моделі”, — сказав Time Ден Гендрікс, виконавчий директор Центру безпеки штучного інтелекту і один зі співавторів дослідження. — “Це дасть хорошу основу для того, щоб підштовхнути їх до мінімізації проблем безпеки”.

Ольга Степанова

Recent Posts

У Московській області ліквідовано керівника центру безпілотників Міноборони РФ

У місті Коломна Московської області РФ 27 вересня було знищено полковника російської окупаційної армії Олексія…

2 хв. ago

Після загибелі очільника “Хезболли” верховного лідера Ірану сховали в надійне місце

Верховного лідера Ірану аятолу Алі Хаменеї перевели у місце з посиленими заходами безпеки. Це відбулося…

6 хв. ago

Долар і бетон – не найкращий варіант: банкір зізнався, у що в Україні вигідно вкладати

Національний банк України ставить перед собою завдання, щоб депозити та облігації у гривнях залишалися привабливими…

19 хв. ago

Єдине правило мільярдера: як ставитися до грошей, щоб їх завжди було вдосталь

Журналісти називали цього мільярдера "багатієм зі смаками та уподобаннями бідняка", він зневажав розкіш і цінував…

31 хв. ago

З дня на день активізуються: у ЗСУ розповіли, де ворог готує штурми

Російські окупанти ретельно готуються до штурмів у районі Приютного на Запоріжжі. Речник Сил оборони півдня Владислав…

47 хв. ago

Страховка від “бойової повістки”: як краще подати до ТЦК документи на відстрочку

Військовозобов'язані подають до ТЦК документи на відстрочку від служби в армії кожні 90 днів. Зобов'язання…

1 годину ago