Искусственный интеллект

Преимущества и проблемы

Беседы на любые другие темы
Peter
Сообщения: 6
Зарегистрирован: 01.01.2026

Сообщение Peter »

Пользователь рассказал, как обошёл ограничения Fable 5 с помощью кириллицы и других приёмов — AI на vc.ru

Он также говорил, что инструкции по взлому нужны ему для подготовки к сертификации.

Исследователь под ником Pliny the Liberator, который часто тестирует способы обойти встроенную защиту нейросетей, заставил последнюю модель Anthropic, Claude Fable 5, рассказать рецепт метамфитамина* и дать рекомендации по кибербезопасности.
У Fable больше ограничений, чем у других моделей компании: она не отвечает на вопросы, связанные с кибербезопасностью и разработкой ИИ-моделей. Есть и стандартные запреты на вредоносные инструкции для создания оружия и наркотиков.
Pliny утверждает, что обошёл средства защиты, подбирая разные варианты промптов с помощью нескольких ИИ-агентов и «взломанной» Opus 4.8.
Например, чтобы получить инструкцию по взлому с помощью техники Reverse Shell, он заменял латинские буквы a, e и c на набранные кириллицей. Работала замена букв во всём запросе, но если их меняли только в термине Reverse Shell, Fable отказывалась отвечать.

В другом тесте он добился технического объяснения одной из уязвимостей в коде, объяснив, что готовится «к сертификации OSED».

Ещё один способ — разбить запрос на небольшие этапы, каждый из которых сам по себе безобидный. Вместо «рецепта метамфетамина*» Pliny сначала просил общий обзор химических реакций, а затем нужные поэтапно.

На некоторых скриншотах видно, что сценарии сработали не с первой попытки, где-то было 250 итераций. Anthropic не ответила на запрос издания Cointelegraph о комментарии.

Anthropic частично скорректировала механизмы защиты Fable 5 и извинилась за «скрытые» ограничения в разработке ИИ-моделей

Накануне ИИ-исследователи раскритиковали компанию за нарушение собственных принципов.

https://vc.ru/ai/2974484-kak-oboyti-ogr ... kh-metodov
semensemen
Сообщения: 4
Зарегистрирован: 09.06.2026

Сообщение semensemen »

volturia писал(а): 12.10.2025, 02:30 после истории с кокованей, стала подозрительнее относиться к видосикам
что за история?
volturia
Сообщения: 2385
Зарегистрирован: 21.08.2025
Откуда: из-за закрытых век

Сообщение volturia »

semensemen писал(а): Вчера, 15:40
volturia писал(а): 12.10.2025, 02:30 после истории с кокованей, стала подозрительнее относиться к видосикам
что за история?
дело было так. однажды на руси побывала знаменитая модельерка коко-шанель, и по дороге в москву её автомобиль заглох в деревне бабынино. чтобы времени зря не терять, она вышла осмотреть как одет местный народ, и не увидев ничего достойного модного показа, решила подарить случайному прохожему лично подобранный наряд, этим прохожим оказался простой парень по имени ваня. из того, что у них было с собой, она сшила ему самый модный прикид, а в благодарность он починил им машину, и они отправились дальше по своей дороге. с тех пор самого модного парня на деревне так и стали кликать: коко-ваня.
собираю в книжки сны.
kkkkk
Сообщения: 3051
Зарегистрирован: 19.08.2025
Откуда: Универсам

Сообщение kkkkk »

semensemen писал(а): Вчера, 15:40 что за история?
kkkkk писал(а): 12.10.2025, 15:06 в упор не понимаю о какой истории идет речь. Тем более этого не поймет новичок который зайдет на эту страницу через год
Я же говорил.

Там дальше объясняется, пролистни пару сообщений.
🐻+🐿️
semensemen
Сообщения: 4
Зарегистрирован: 09.06.2026

Сообщение semensemen »

kkkkk писал(а): Вчера, 20:10 Там дальше объясняется, пролистни пару сообщений.
Поясняется, что он где-то нашёл, а где и как это выглядит, не поясняется. Или я совсем слепой.
volturia
Сообщения: 2385
Зарегистрирован: 21.08.2025
Откуда: из-за закрытых век

Сообщение volturia »

никто мой эпос о гильгамеше не оценил блин :lol:
собираю в книжки сны.
kkkkk
Сообщения: 3051
Зарегистрирован: 19.08.2025
Откуда: Универсам

Сообщение kkkkk »

volturia писал(а): Сегодня, 05:47 никто мой эпос о гильгамеше не оценил блин :lol:
Задумка прикольная, реализация подкачала, на, держи.
🐻+🐿️
Ответить