新研究:新技術(shù)助力人工智能減少“胡謅”
人工智能(AI)中廣泛使用的大語言模型不時(shí)出現(xiàn)的“一本正經(jīng)地胡謅”是其難以克服的問題。近日,英國牛津大學(xué)研究團(tuán)隊(duì)開發(fā)出一種名為“語義熵”的新方法,有望大幅提升AI回答的可靠性。
5月30日,在瑞士日內(nèi)瓦舉行的2024年“人工智能造福人類全球峰會(huì)” 上,參會(huì)者和一個(gè)用于社會(huì)關(guān)懷的機(jī)器人互動(dòng)。新華社記者連漪攝
大語言模型的“胡謅”在業(yè)界被稱為“幻覺”,牛津大學(xué)計(jì)算機(jī)科學(xué)系的研究人員提出“語義熵”方法試圖解決這一問題。在熱力學(xué)中,熵描述的是系統(tǒng)的混亂或者說不穩(wěn)定程度。這項(xiàng)研究中,熵衡量了大語言模型回答的不確定性,不確定性高意味著大語言模型的回答可能存在虛構(gòu)。
該研究成果已發(fā)表在近期出版的英國《自然》雜志上。論文中說,如果AI對同一個(gè)問題,給出了許多語義相似的答案,那說明它對自己的回答比較有把握;反之,如果答案五花八門,那就意味著AI自己也“心里沒底”,很可能是在“胡謅”。
研究人員利用“語義熵”方法,讓大語言模型對同一問題生成多個(gè)答案,然后將語義相近的答案聚類,最后根據(jù)聚類結(jié)果計(jì)算熵值。熵值越高,表示大語言模型的回答越不確定。
值得注意的是,這一方法不僅考慮了大語言模型回答的字面差異,更關(guān)注語義層面的一致性。這使得“語義熵”能夠更準(zhǔn)確地識(shí)別AI的“胡謅”,而不會(huì)被表達(dá)方式的多樣性所迷惑。
研究結(jié)果表明,“語義熵”方法在多個(gè)數(shù)據(jù)集和任務(wù)中都表現(xiàn)出色,能有效檢測大語言模型的錯(cuò)誤回答,并通過拒絕回答不確定的問題來提高整體準(zhǔn)確率。更重要的是,這一方法無需修改AI模型本身,可以直接應(yīng)用于現(xiàn)有的大語言模型。
研究人員說,“語義熵”技術(shù)有望在問答系統(tǒng)、文本生成、機(jī)器翻譯等多個(gè)領(lǐng)域發(fā)揮重要作用,幫助AI生成更可靠、更有價(jià)值的內(nèi)容。這不僅將提升AI在實(shí)際應(yīng)用中的表現(xiàn),也將增強(qiáng)用戶對AI系統(tǒng)的信任。
隨便看看:
- [業(yè)內(nèi)]廣東全面實(shí)施“數(shù)字灣區(qū)”建設(shè) 加快灣區(qū)數(shù)能產(chǎn)業(yè)集聚發(fā)展
- [業(yè)內(nèi)]專家提醒:瘧疾可防可治 需防蚊蟲叮咬
- [業(yè)內(nèi)]AI 繪畫,一步一步教你免費(fèi)安裝Stable Diffusi
- [業(yè)內(nèi)]科技賦能,讓“城市大腦”思考起來
- [業(yè)內(nèi)]工信部:中國對6G發(fā)展持開放態(tài)度,已成立工作組推動(dòng)關(guān)鍵技術(shù)研
- [業(yè)內(nèi)]研究發(fā)現(xiàn)戒酒藥可阻礙一種耐藥性T細(xì)胞生存
- [業(yè)內(nèi)]報(bào)告顯示:我國制造強(qiáng)國建設(shè)穩(wěn)中有進(jìn)
- [業(yè)內(nèi)]研究發(fā)現(xiàn)壓力會(huì)影響疫苗有效性
- [業(yè)內(nèi)]累計(jì)服務(wù)用戶超20萬 蘇寧易購海爾第九屆“717燃購生活節(jié)”
- [業(yè)內(nèi)]科技企業(yè)如何推動(dòng)中國實(shí)踐綠色計(jì)算?
相關(guān)推薦:
網(wǎng)友評論:
推薦使用友言、多說、暢言(需備案后使用)等社會(huì)化評論插件
- 萬和空氣能閃耀2025熱泵行業(yè)年會(huì),斬獲四項(xiàng)大獎(jiǎng)榮
- 漢桑科技王斌:“智聲”驅(qū)動(dòng)未來 加速邁向全球高端音
- 探索 Web3.0:互聯(lián)網(wǎng)的未來新范式
- 力德動(dòng)力30kw微渦發(fā)電機(jī)成功完成高原考核
- 突破溫度與凈化邊界,美的空氣機(jī)打造舒適生活空間
- 原創(chuàng)科技守味二十四節(jié)氣!卡薩帝冰箱濟(jì)南啟動(dòng)非遺守護(hù)
- 最新盤點(diǎn)!中國超聲波焊接機(jī)TOP10,首位靈科,其
- 科技與美學(xué)的突破:伯恩光學(xué)聯(lián)合三星重塑智能手機(jī)形態(tài)
- 阿爾西溫控技術(shù)自主破局!國產(chǎn)創(chuàng)新撕破海外壟斷壁壘,
- 樂創(chuàng)技術(shù)五軸點(diǎn)膠+視覺補(bǔ)償:破解AR/VR光學(xué)模塊
- 熱點(diǎn)搶先看|2024南方網(wǎng)通第二十五屆渠道商交流會(huì)
- 《大數(shù)據(jù)平臺(tái)云化改造實(shí)踐指南(2024)》發(fā)布,天
- 覺卿諦語智能科技在全國12355心理健康大會(huì)上展示
- 當(dāng)好“兩個(gè)稀土基地”建設(shè)主力軍,北方嘉軒永磁電機(jī)大
- 大模型助力工業(yè)智能化發(fā)展
- 工商業(yè)光伏發(fā)電施工指南-太陽庫光伏
- 科技賦能,避震嬰兒車或成為行業(yè)硬通貨
- 龍旗科技進(jìn)軍AI PC市場,激發(fā)行業(yè)創(chuàng)新活力
- 科技賦能教育:核桃編程亮相“科創(chuàng)中國·北京創(chuàng)新薈”
- 英偉達(dá)搶占高位,市場急需尋求新機(jī)遇,這三支AI股值