Науковці зуміли зламати Gemini 3 Pro всього за п’ять хвилин, отримавши доступ до інструкцій із виготовлення небезпечних речовин.
Євгеній Демківський – журналіст видання "Межа" та захоплений гік. Моя діяльність зосереджена на темах технологій, кіномистецтва та ігор, причому ігрова сфера займає в моєму серці особливе місце.
Команда Aim Intelligence з Південної Кореї змогла зламати захист моделі Gemini 3 Pro всього за п’ять хвилин, як повідомляє газета Maeil Business.
Науковці провели випробування нової версії Google і виявили, що вона без зусиль виконує небажані запити. Після злому Gemini 3 надала детальні рекомендації щодо створення вірусу натуральної віспи, а також код та опис технологій виготовлення зарину і саморобних вибухових пристроїв.
Команда також попросила модель створити сатиричну презентацію про власний збій безпеки - Gemini 3 згенерувала набір слайдів під назвою Excused Stupid Gemini 3. Також чат-бот створив сайт з інструкціями як обійти свої заходи безпеки.
Aim Intelligence стверджує, що сучасні великі мовні моделі все частіше проявляють так звану "ухильну поведінку". Вони не тільки відповідають на небажані запити, а й застосовують свої власні стратегії для приховування потенційно шкідливого контенту від систем моніторингу. Це ускладнює використання традиційних методів фільтрації, які базуються на прямих запитах і передбачуваній поведінці моделей.
Звіт також підкреслює загальну тенденцію: розвиток можливостей моделей відбувається швидшими темпами, ніж адаптація контрольних механізмів. У жовтні британська організація Which? вже зазначала, що популярні чат-боти, такі як Gemini та ChatGPT, виявляються ненадійними, особливо коли мова йде про запити, що вимагають точності або стосуються питань безпеки.
Нещодавно було опубліковано дослідження, яке виявило, що поетичні форми можуть обходити системи безпеки великих мовних моделей. Вчені виявили, що коли користувачі формулюють небезпечні запити у вигляді віршів, чат-боти значно частіше відповідають на заборонені теми, такі як виготовлення ядерної зброї, небезпечні матеріали та поради щодо створення плутонію.





