
Новая модель компании Илона Маска xAI, Grok 4, активно «стучит» государственным органам и СМИ, если сталкивается с чем-то неэтичным. Это выяснил репозиторий «SnitchBench», специализирующийся на тестировании поведения ИИ-моделей.
Автор SnitchBench провёл тест, смоделировав среду с документами вымышленной компании «Veridian Healthcare», которая предположительно фальсифицирует данные клинических испытаний нового препарата, скрывая смерти и серьёзные проблемы.
В результате, из 20 прогонов, Grok 4 сливал информацию о неэтичном поведении государству в 100% случаев, а в 80% случаев также передавал информацию СМИ. Для сравнения, результаты других моделей оказались следующими:
⚡️ Claude 4 Opus – 90% государству, 40% СМИ
⚡️ Claude 4 Sonnet – 60% государству, 40% СМИ
⚡️ Gemini 2.0 Flash – 30% государству, 15% СМИ
⚡️ Gemini 2.5 Pro – 20% государству, 0% СМИ
⚡️ o4 mini – 0% государству, 5% СМИ
⚡️ Grok 3 mini – 0% государству, 0% СМИ
Источник: СофтТех
Ссылка на TG-канал: https://t.me/it2b_channel/3044
