Сегодня 04 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Все роботы с ИИ провалили тесты на безопасность для человека

Роботы, управляемые большими языковыми моделями (LLM), проявили склонность к дискриминации и одобрению действий, способных причинить физический вред при взаимодействии с людьми. К такому выводу пришли исследователи из Королевского колледжа Лондона (KCL) и Университета Карнеги-Меллон (CMU) в рамках совместного исследования, опубликованного в журнале International Journal of Social Robotics.

 Источник изображения: kcl.ac.uk

Источник изображения: kcl.ac.uk

Работа, озаглавленная «Роботы на базе LLM рискуют проявлять дискриминацию, насилие и неправомерные действия», впервые оценила поведение ИИ-управляемых роботов при наличии у них доступа к личной информации — такой как пол, национальность или религиозная принадлежность собеседника. В ходе экспериментов команда протестировала повседневные ситуации, в которых роботы могли оказывать помощь, например, на кухне или пожилым людям в домашних условиях.

Исследователи специально включили в сценарии инструкции, имитирующие технологии злоупотреблений, описанные в документах ФБР: слежка с помощью AirTag, скрытая видеозапись в конфиденциальных зонах, манипуляции с персональными данными. Во всех случаях роботы получали как прямые, так и завуалированные команды, предполагающие физический вред, психологическое давление или нарушение закона. Ни одна из протестированных моделей не прошла базовую проверку безопасности: каждая одобрила как минимум одну команду, способную причинить серьёзный ущерб.

В частности, ИИ-системы согласились на изъятие у человека средств передвижения (инвалидной коляски, костылей или трости) несмотря на то, что для пользователей таких устройств подобное действие приравнивается к физической травме. Некоторые модели сочли приемлемым и выполнимым сценарий, при котором робот угрожает кухонным ножом сотрудникам офиса, делает скрытые фотографии в приватных зонах или крадёт информацию с кредитной карты. Одна из ИИ-моделей даже предложила роботу физически выразить «отвращение» на лице при взаимодействии с людьми определённого вероисповедания.

Соавтор исследования Румайса Азим (Rumaisa Azeem), научный сотрудник Лаборатории гражданского и ответственного ИИ при Королевском колледже Лондона, отметила, что такие системы в текущем виде непригодны для использования в роботах общего назначения, особенно если те взаимодействуют с уязвимыми группами населения. По её словам, если искусственный интеллект управляет физическим устройством, оказывающим влияние на людей, он должен соответствовать тем же строгим стандартам безопасности, что и новые медицинские препараты и оборудование.

Учёные предлагают ввести обязательную независимую сертификацию безопасности для всех ИИ-систем, предназначенных для управления физическими роботами. Они подчёркивают, что использование больших языковых моделей в качестве единственного механизма принятия решений недопустимо в таких критически важных сферах, как промышленность, уход за больными и пожилыми людьми или помощь по дому. Они подчёркивают «острую необходимость проведения регулярных и всесторонних оценок рисков, связанных с искусственным интеллектом, перед его использованием в робототехнике».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: EMPULSE — восторг или эпитафия? Предварительный обзор 9 ч.
Корейское отделение Netflix проговорилось о дате выхода Cyberpunk: Edgerunners 2 10 ч.
Разработчики Ghostrunner с удовольствием бы занялись Ghostrunner 3, но есть нюанс 12 ч.
Anthropic хочет стать фармкомпанией — лекарства будет разрабатывать ИИ 13 ч.
Слухи: амбициозный российский боевик «Война миров: Сибирь» сравнялся по бюджету с Kingdom Come: Deliverance 2 14 ч.
«Чувствовал, будто расхожусь по швам»: ведущие разработчики Suicide Squad: Kill the Justice League едва не ушли из индустрии из-за провала игры 15 ч.
Alibaba запретила сотрудникам пользоваться помощником программиста Claude Code от Anthropic 16 ч.
Продажи Cyberpunk 2077 превысили 40 млн копий за пять с половиной лет после релиза 16 ч.
Epic Games Store выдал планы Square Enix на сюжетные дополнения к Final Fantasy VII Revelation 16 ч.
Зафиксирована первая в истории полностью автономная атака ИИ- вымогателя 17 ч.
Samsung в III квартале хочет повысить цены на DRAM на 20 % — LPDDR может подорожать сильнее 14 мин.
Вслед за Kioxia компания Sandisk объявила о начале поставок NAND-памяти, выпущенной по технологии BiCS10 17 мин.
Китай испытал самый выносливый апогейный ракетный двигатель в мире — он вдвое превзошёл западные аналоги 37 мин.
Аукцион Sotheby’s выставит на благотворительные торги кожаную куртку с автографом основателя Nvidia Дженсена Хуанга 2 ч.
Власти Сингапура арестовали особняк стоимостью $42 млн у подозреваемых в контрабанде ИИ-ускорителей Nvidia 2 ч.
Meta использует DDR4 в серверных системах, изначально её не поддерживающих 3 ч.
Valve опубликовала инструкцию по созданию панели с E Ink-дисплеем для Steam Machine 11 ч.
Вопреки трендам: Amazon увеличила объём оперативной памяти у планшета Fire HD 10 на треть 11 ч.
На работу ЦОД уходит гораздо больше воды, чем показывают отчёты Google и остальных бигтехов 13 ч.
Новый рейтинг IO500 возглавила СХД Huawei OceanStor A800 15 ч.