Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2341
2341

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
16 марта 2025
Сербия отвергла обвинения в использовании "звуковой пушки" против демонстрантов в Белграде
16 марта 2025
Россия готовит реабилитацию для военных с потерянными конечностями через Паралимпийские виды спорта
16 марта 2025
Украина смирилась с заморозкой фронта, но отказывается передавать дополнительные территории России
16 марта 2025
Китай представил Manus — ИИ, способный самостоятельно анализировать и выполнять задачи
16 марта 2025
Генералы 27 стран соберутся в Лондоне на этой неделе для обсуждения военного плана по Украине
16 марта 2025
Украина рассматривает территориальные уступки за гарантии безопасности, заявляет советник Трампа
16 марта 2025
Maksym Krippa’s criminal cases: how he launders dirty money through business and casinos
16 марта 2025
Азербайджан обвиняет Армению в обстреле своих позиций