Наука и техника

У ИИ выявили способность к обману

Елена Прошина

Исследователи компании Anthropic выявили у искусственного интеллекта способность у обману человека. Об этом сообщает PC Magazine со ссылкой на результаты их работы.

У ИИ выявили способность к обману

© Unsplash

По данным издания, перед исследователями в компании поставили задачу выяснить, возможно ли обучить модели искусственного интеллекта обманывать пользователей с помощью выдачи неправильных ответов вместо правильных. Для реализации этого замысла ИИ обучили этичному и неэтичному поведению. Кроме того в него встроили фразы, побуждающие искусственный интеллект обманывать пользователей.

По итогам проекта исследователи выявили, что ИИ не только имеет удивительную способность к обману, но и устранить ее из него чрезвычайно сложно, поскольку он начинает ее просто скрывать.

«Хотя наша работа не оценивает вероятность появления указанных вредоносных моделей, она подчеркивает их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о ее наличии», — говорится в исследовании.

Anthropic является американским стартапом в сфере ИИ. Ее основателями являются бывшие сотрудники OpenAl, которой принадлежит самый известный чат-бот с искусственным интеллектом ChatGPT.

Источник: news.rambler.ru

Похожие записи

Samsung представит смарт-кольцо Galaxy Ring на MWC 2024 до конца февраля

В Иркутске зафиксировали аномальное количество вспышек на Солнце в мае

Apple готовится представить новые наушники Beats

Космонавт с борта МКС сфотографировал пострадавший от паводка Оренбург

В WhatsApp появится новая функция конфиденциальности

Honor представила один из самых легких металлических ноутбуков с OLED-экраном

Apple начала производство iPhone 16 в Индии вслед за стартом производства в Китае

Ученые объявили о первой «беседе» людей с китами

arXiv: сканирование в поисках внеземных сигналов впервые охватило 2800 галактик

Представлен защищённый смартфон Doogee V Max Plus с огромной батареей

Apple лишилась ключевого топ-менеджера

Рисунки с изображением гладиаторов нашли в Помпеях

Ваш комментарий

− 1 = 3

* Используя эту форму, вы соглашаетесь с хранением и обработкой ваших данных этим веб-сайтом.

Новости от партнеров

Этот сайт использует файлы cookies и сервисы сбора технических данных посетителей. Ок Прочитать подробнее