詳細(xì)信息 |
ChatGPT有標(biāo)注策略導(dǎo)致的局限 |
編輯: 來源:哈爾濱工業(yè)大學(xué)自然語言處理研究所 時間:2023/3/31 |
ChatGPT 通過基于人類反饋的強化學(xué)習(xí)使模型 的生成結(jié)果更符合人類預(yù)期,然而這也導(dǎo)致了模型的行為和偏好一定程度上反映的是標(biāo)注人員的偏好,在標(biāo)注人員分布不均的情況下,可能會引入新的 偏見問題。同樣地,標(biāo)注人員標(biāo)注時會傾向于更長的答案,因為這樣的答案 看起來更加全面,這導(dǎo)致了 ChatGPT 偏好于生成更長的回答,在部分情況 下顯得啰嗦冗長。 此外,作為突圍型產(chǎn)品,ChatGPT 確實表現(xiàn)優(yōu)秀。然而在目前微調(diào)小 模型已經(jīng)達到較好效果的前提下,同時考慮到 ChatGPT 的訓(xùn)練和部署困難 程度,ChatGPT 可能在以下任務(wù)場景下不太適用或者相比于目前的微調(diào)小 模型范式性價比較低: 1. ChatGPT 的通用性很強,對多種自然語言處理任務(wù)都有處理能力。然 而針對特定的序列標(biāo)注等傳統(tǒng)自然語言理解任務(wù),考慮到部署成本和 特定任務(wù)的準(zhǔn)確性,在 NLU 任務(wù)不需要大規(guī)模語言模型的生成能力, 也不需要更多額外知識的前提下,如果擁有足夠數(shù)據(jù)進行微調(diào),微調(diào) 小模型可能仍是更佳的方案; 2. 在一些不需要大規(guī)模語言模型中額外知識的任務(wù)上,例如機器閱讀理 解,回答問題所需的知識已經(jīng)都存在于上下文中; 3. 由于除英語之外的其它語言在預(yù)訓(xùn)練語料庫中占比很少,因此翻譯目 標(biāo)非英文的機器翻譯任務(wù)和多語言任務(wù)在追求準(zhǔn)確的前提下可能并不 適用; 4. 大規(guī)模語言模型的現(xiàn)實世界先驗知識太強,很難被提示覆蓋,這導(dǎo)致 我們很難糾正 ChatGPT 的事實性錯誤,使其使用場景受限; 5. 對于常識、符號和邏輯推理問題,ChatGPT 更傾向于生成“不確定” 的回復(fù),避免直接面對問題正面回答。在追求w性答案的情況下可 能并不適用; 6. ChatGPT 目前還只能處理文本數(shù)據(jù),在多模態(tài)任務(wù)上還無法處理。
|
【聲明:轉(zhuǎn)載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內(nèi)容僅供參考,如有侵權(quán),請聯(lián)系刪除! |
推薦信息 |
ChatGPT有大規(guī)模語言模型自身的局限
可信性無法保證;無法實時地融入新知識,可回答的知識范圍有明顯的邊界;成本高昂部署困難;在特定的專業(yè)領(lǐng)域上表現(xiàn)欠佳;每次生成結(jié)果有細(xì)微的不同
ChatGPT相較于微調(diào)小模型的優(yōu)點
通過大量指令激發(fā)的泛化能力在零樣本和少樣本場景下具有顯著優(yōu)勢,在未 見過的任務(wù)上也可以有所表現(xiàn),在微調(diào)小模型的范式下實現(xiàn)的泛化能力
ChatGPT相較于其它大規(guī)模語言模型的優(yōu)點
ChatGPT 使用了更多的多輪對話數(shù)據(jù)進行指令微調(diào),這使其擁有了建模對話歷史的能 力,能持續(xù)和用戶交互,基于人類反饋 的強化學(xué)習(xí)調(diào)整模型的輸出偏好
ChatGPT相較于普通聊天機器人的優(yōu)點
ChatGPT類似于市場上其他聊天機器人(微軟小冰,百度度秘等),可與人類自然交互 簡單直接;ChatGPT 的回答更準(zhǔn)確, 答案更流暢,能進行更細(xì)致的推理,能完成更多的任務(wù)
ChatGPT 的未來技術(shù)發(fā)展方向
無法產(chǎn)生本應(yīng)產(chǎn)生的正確回復(fù); 對于輸入措辭比較敏感;生成的回復(fù)通常過于冗長;其模型過于龐大使用成本過高;減少人類反饋信息的 RLAIF
ChatGPT 插件發(fā)布帶來的十大關(guān)注點
定義大模型的toC平臺商業(yè)模式;開放 API 標(biāo)準(zhǔn);未來應(yīng)用內(nèi)又可反向嵌入 ChatGPT;知識更新問題被解決;很大程度解決準(zhǔn)確性問題
ChatGPT的未來改進方向
ChatGPT雖然對話能力強,但是在數(shù)理計算對話中容易出現(xiàn)一本正經(jīng)胡說八道的情況,ChatGPT很強大,但其模型大小和使用成本也讓很多人望而卻步
ChatGPT的局限有哪些
ChatGPT無法處理復(fù)雜冗長或者特別專業(yè)的語言結(jié)構(gòu);ChatGPT需要非常大量的算力;ChatGPT還沒法在線的把新知識納入其中;ChatGPT仍然是黑盒模型 |
智能運輸機器人 |
AGV無人運輸機器人-料箱版 |
AGV無人運輸機器人-標(biāo)準(zhǔn)版 |
AGV無人運輸機器人-料箱版(鈑金材質(zhì)) |
AGV無人運輸機器人-貨架版(鈑金材質(zhì)) |
AGV無人運輸機器人-貨架版(亮面不銹鋼材質(zhì)) |
AGV無人運輸機器人-開放版 |
行業(yè)動態(tài) |
咨詢熱線:4006-935-088 / 4006-937-088
客服熱線:
4008-128-728
版權(quán)所有 @ 創(chuàng)澤智能機器人集團股份有限公司 魯ICP備18039973號-2 運營中心 / 北京·清華科技園九號樓 生產(chǎn)中心 / 山東省日照市開發(fā)區(qū)太原路71號 |