詳細(xì)信息 |
ChatGPT的未來改進(jìn)方向 |
編輯: 來源:創(chuàng)澤集團(tuán) 時(shí)間:2023/3/29 |
1 減少人類反饋的RLAIF 2020年底, OpenAI前研究副總裁Dario A modei帶著10名員工創(chuàng)辦了一個(gè)人工智能公司 Anthropic。Anthropic 的創(chuàng)始團(tuán)隊(duì)成員, 大多為 OpenAI 的早期及核心員工, 參與過OpenAI的 GPT-3、多模態(tài)神經(jīng)元、人類偏好的強(qiáng)化學(xué)習(xí)等。 CAI用人工智能反饋來代替人類對表達(dá)無害性的偏好, 即RLAIF, 人工智能根據(jù)一套constitution 原則來評(píng)價(jià)回復(fù)內(nèi)容。 2 補(bǔ)足數(shù)理短板 ChatGPT雖然對話能力強(qiáng), 但是在數(shù)理計(jì)算對話中容易出現(xiàn)一本正經(jīng)胡說八道的情況。 計(jì)算機(jī)學(xué)家Stephen Wolfram 為這一問題提出了解決方案。 Stephen Wolfram 創(chuàng)造了的 Wolfram 語言和計(jì)算知識(shí)搜索引擎 Wolfram | A lpha, 其后臺(tái)通過Mathematica實(shí)現(xiàn)。 ChatGPT 可以像人類使用 Wolfram|A lpha 一樣, 與 Wolfram|A lpha “對 話”, Wolfram|A lpha 則會(huì)用其符號(hào)翻譯能力將從 C hatGPT 獲得的自然語言表達(dá)“翻譯”為對 應(yīng)的符號(hào)化計(jì)算語言。 3 ChatGPT的小型化 雖然ChatGPT很強(qiáng)大, 但其模型大小和使用成本也讓很多人望而卻步。 有三類模型壓縮 (model compression) 可以降低模型的大小和成本。 D一種方法是量化 (quantization) , 即降低單個(gè)權(quán)重的數(shù)值表示的精度。比如Tansformer從 FP32降到INT8對其精度影響不大。 第二種模型壓縮方法是剪枝 (pruning) , 即刪除網(wǎng)絡(luò)元素, 包括從單個(gè)權(quán)重(非結(jié)構(gòu)化剪枝) 到 更G粒度的組件如權(quán)重矩陣的通道。這種方法在視覺和較小規(guī)模的語言模型中有效。 第三種模型壓縮方法是稀疏化。例如奧地利科學(xué)技術(shù)研究所 (ISTA)提出的SparseGPT ( arxiv.org/pdf/2301.0077 ) 可以將 GPT 系列模型單次剪枝到 50% 的稀疏性, 而無需任何重新 訓(xùn)練。對 GPT- 175B 模型, 只需要使用單個(gè) GPU 在幾個(gè)小時(shí)內(nèi)就能實(shí)現(xiàn)這種剪枝。
|
【聲明:轉(zhuǎn)載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其描述,文章內(nèi)容僅供參考,如有侵權(quán),請聯(lián)系刪除。】 |
推薦信息 |
ChatGPT的局限有哪些
ChatGPT無法處理復(fù)雜冗長或者特別專業(yè)的語言結(jié)構(gòu);ChatGPT需要非常大量的算力;ChatGPT還沒法在線的把新知識(shí)納入其中;ChatGPT仍然是黑盒模型
ChatGPT的訓(xùn)練過程分為三個(gè)階段
訓(xùn)練獎(jiǎng)勵(lì)模型通過人工標(biāo)注訓(xùn)練數(shù)據(jù) (約33K個(gè)數(shù)據(jù)) 來訓(xùn)練回報(bào)模型;采用PPO強(qiáng)化學(xué)習(xí)來優(yōu)化策略將在線學(xué)習(xí)轉(zhuǎn)化為離線學(xué)習(xí)靠獎(jiǎng)勵(lì)打分來更新預(yù)訓(xùn)練模型參數(shù)
讀文檔解惑:DocsGPT,https://docsgpt.arc53.com/
DocsGPT 提出基于產(chǎn)品的某個(gè)版本寫個(gè) xx 示例的要求,讓文檔變成一個(gè)更貼近用戶的好文檔,讓 GPT 幫你解答用戶的困惑
看論文:chatgpt-arxiv-extension讀論文的智能小助手
ArxivGPT能幫你讀論文,在一些地方給出注解,這個(gè)項(xiàng)目是基于上面的chatgpt-google-extension二次開發(fā)而來,以生成論文的讀后感,提高讀論文的效率
強(qiáng)化搜索:chatgpt-google-extension基于 ChatGPT 強(qiáng)化了 Google
chatgpt-google-extension項(xiàng)目基于 ChatGPT 強(qiáng)化了 Google 搜索能力,它的使用也很簡單,裝個(gè) Chrome 或者 Firefox 插件就能玩了
劃詞翻譯:openai-translator能翻譯潤色文字
openai-translator的翻譯更貼近人類的語言使用習(xí)慣,有了 ChatGPT 的加成不僅能翻譯,還能幫你潤色文字,有瀏覽器插件版,還有桌面版本
OpenAI 從 11 個(gè)方面對 GPT-4 風(fēng)險(xiǎn)進(jìn)行了一系列定性和定量評(píng)估。
OpenAI 從11個(gè)方面對GPT-4風(fēng)險(xiǎn)進(jìn)行了一系列定性和定量評(píng)估,進(jìn)一步了解 GPT-4 的能力,限制和風(fēng)險(xiǎn),并幫助提供解決方案,迭代測試和構(gòu)建模型的更安全版本等
GPT-4 進(jìn)行的部分考試 Uniform Bar Exam SAT Math
GPT-4 相比于GPT-3.5有了顯著提升,在學(xué)術(shù)和專業(yè)測試中甚至能夠達(dá)到與人 類相當(dāng)?shù)乃?GRE- Quantitative163;GRE- Verbal 169 |
智能運(yùn)輸機(jī)器人 |
AGV無人運(yùn)輸機(jī)器人-料箱版 |
AGV無人運(yùn)輸機(jī)器人-標(biāo)準(zhǔn)版 |
AGV無人運(yùn)輸機(jī)器人-料箱版(鈑金材質(zhì)) |
AGV無人運(yùn)輸機(jī)器人-貨架版(鈑金材質(zhì)) |
AGV無人運(yùn)輸機(jī)器人-貨架版(亮面不銹鋼材質(zhì)) |
AGV無人運(yùn)輸機(jī)器人-開放版 |
行業(yè)動(dòng)態(tài) |
咨詢熱線:4006-935-088 / 4006-937-088
客服熱線:
4008-128-728
版權(quán)所有 @ 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 魯ICP備18039973號(hào)-2 運(yùn)營中心 / 北京·清華科技園九號(hào)樓 生產(chǎn)中心 / 山東省日照市開發(fā)區(qū)太原路71號(hào) |