Наука и техника

У ИИ выявили способность к обману

Елена Прошина

Исследователи компании Anthropic выявили у искусственного интеллекта способность у обману человека. Об этом сообщает PC Magazine со ссылкой на результаты их работы.

У ИИ выявили способность к обману

© Unsplash

По данным издания, перед исследователями в компании поставили задачу выяснить, возможно ли обучить модели искусственного интеллекта обманывать пользователей с помощью выдачи неправильных ответов вместо правильных. Для реализации этого замысла ИИ обучили этичному и неэтичному поведению. Кроме того в него встроили фразы, побуждающие искусственный интеллект обманывать пользователей.

По итогам проекта исследователи выявили, что ИИ не только имеет удивительную способность к обману, но и устранить ее из него чрезвычайно сложно, поскольку он начинает ее просто скрывать.

«Хотя наша работа не оценивает вероятность появления указанных вредоносных моделей, она подчеркивает их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о ее наличии», — говорится в исследовании.

Anthropic является американским стартапом в сфере ИИ. Ее основателями являются бывшие сотрудники OpenAl, которой принадлежит самый известный чат-бот с искусственным интеллектом ChatGPT.

Источник: news.rambler.ru

Похожие записи

Apple очень скоро проведет презентацию новых устройств

Генассамблея ООН приняла резолюцию о регулировании искусственного интеллекта

Самую маленькую в мире кувшинку заново открыли в Руанде

Сильная магнитная буря накроет Землю

Ученые МГУ разработали прототип стимулятора для коррекции равновесия человека в космосе

Общение с собакой оказалось полезным для здоровья человека

Российские археологи нашли древний уникальный крест

DCS: Huawei P70 может появиться в продаже без презентации

OnLeaks опубликовал видео со встроенными ИИ-функциями бюджетного Google Pixel 8a

На GitHub появился эксплойт для уязвимости повышения прав в Android

Google разрабатывает дешевые смарт-часы

Российский грузовой корабль «Прогресс МС-26» пристыковался к МКС

Ваш комментарий

− 2 = 8

* Используя эту форму, вы соглашаетесь с хранением и обработкой ваших данных этим веб-сайтом.

Новости от партнеров

Этот сайт использует файлы cookies и сервисы сбора технических данных посетителей. Ок Прочитать подробнее