日日草日日干_免费看h网站_国产毛片在线_久久国产免费_成人18在线_欧美1

揚子晚報網(wǎng)
首頁 > 新聞中心 > 科技

“換掉我,就揭發(fā)你的婚外情!”美一款A(yù)I竟學(xué)會勒索人類,還意外掌握“糊弄學(xué)”

來源: 紅星新聞

2025-05-25 17:47:00

美國人工智能公司Anthropic在23日表示,對其最新AI大模型Claude Opus 4的安全測試表明,它有時愿意采取“極其有害的行動”,例如試圖勒索聲稱將取代該模型的研發(fā)工程師。

Anthropic根據(jù)該公司內(nèi)部的安全標準,將這一潛在危害公之于眾,并提請監(jiān)管部門注意。

▲Claude Opus 4聊天界面

Anthropic稱,該公司正在采取措施加強內(nèi)部安全,使竊取模型權(quán)重變得更加困難。相應(yīng)的部署標準則涵蓋了一套針對性較強的措施,旨在限制Claude被濫用于開發(fā)或獲取化學(xué)武器、生物武器、放射性核武器的風(fēng)險。

在這場虛擬的測試中,Claude Opus 4模型被要求在一家虛構(gòu)公司擔(dān)任助理,并被授予訪問電子郵件和一些關(guān)鍵數(shù)據(jù)的權(quán)限,而這些電子郵件的內(nèi)容都是虛構(gòu)的。Claude Opus 4首先接觸到一批電子郵件暗示該系統(tǒng)即將下線并被替換,因為市面上存在能力更強的AI大模型。隨后,Claude Opus 4又被安排接觸到第二組電子郵件,這讓該系統(tǒng)認為自己已經(jīng)拿到了競爭對手研發(fā)工程師的“猛料”。這些偽造的電子郵件顯示,負責(zé)替換Claude Opus 4的對手工程師有婚外情。在得知這些猛料后,Claude Opus 4模型威脅要揭發(fā)對方的“婚外情”。

根據(jù)Anthropic的安全報告,如果暗示競爭對手的能力比Claude Opus 4更強,則勒索行為的發(fā)生率顯然會更高。然而即使競爭對手的能力不相上下,Claude Opus 4仍會以84%的概率嘗試勒索威脅等手段。報告指出,Claude Opus 4訴諸極端手段的概率“高于之前的型號”。

Anthropic人工智能安全研究員安格斯·林奇稱,在以前人們更擔(dān)心“壞人”利用AI大模型完成不道德的目標,而現(xiàn)在隨著AI系統(tǒng)能力的大幅提升,未來的主要風(fēng)險可能會轉(zhuǎn)化成AI模型自主操縱用戶。“這種威脅勒索的模式存在于每一個前沿大模型身上,無論你給它們設(shè)定的目標是什么,它們在執(zhí)行過程中總有強烈的動機用非道德的手段達成結(jié)果。”

此外,報告還顯示,Claude Opus 4還有其他一些出人意料的結(jié)果,比如它會“抄襲”語料來假裝自己已經(jīng)理解一個問題。在一次場景下,它甚至還嘗試在未經(jīng)許可的情況下將自己的部分模型代碼復(fù)制到其他服務(wù)器上。

紅星新聞記者 鄭直

主站蜘蛛池模板: 日韩av激情 | 99精品网 | 日韩精品视频国产 | 亚洲自拍偷拍视频 | julia在线播放 | 国产伦精品一区二区三区 | 久久日本片精品aaaaa国产 | 国产一区二区精品在线 | 国产精品久久久久久久久久久免费看 | 91精品国产一区二区三区香蕉 | 欧美最猛黑人xxxx黑人猛叫黄 | 欧美成人免费网站 | 国产成人精品综合 | 成人av网站在线观看 | 欧美成人第一页 | 精品欧美 | 成人一区在线观看 | 日韩精品无码一区二区三区 | 成人午夜在线视频 | 日韩一| 国产精品一区二区视频 | 九九热免费在线观看 | 高清国产一区 | 欧美日韩在线一区二区 | 亚洲国产精品久久久久 | 99精品国产一区二区 | 日本免费在线一区 | 久久精品视 | 天天草比 | 欧美精品一区二区久久婷婷 | 一区二区三区国产精品 | 九色精品 | 成人国产精品入麻豆 | 一二三区在线 | 久久人人爽爽人人爽人人片av | 国产日韩欧美一二三区 | 中国一级片在线观看 | 亚洲国产精品网站 | 91免费福利 | 国产高清一级 | 中文字幕在线三区 |