詳細(xì)信息 |
ChatGPT核心壁壘:算力、數(shù)據(jù)和工程能力 |
編輯: 來(lái)源:國(guó)聯(lián)證券 時(shí)間:2023/4/23 |
ChatGPT 的研發(fā)主要分為預(yù)訓(xùn)練(Pre-train)和精調(diào)(Fine-tune)兩個(gè)環(huán)節(jié)。 其中:1)預(yù)訓(xùn)練:使用無(wú)標(biāo)注、大規(guī)模的數(shù)據(jù)集,對(duì)模型進(jìn)行預(yù)訓(xùn)練。2)精調(diào):讓 模型與專業(yè)的標(biāo)注人員、AI 訓(xùn)練師進(jìn)行交互,推動(dòng)模型逐步學(xué)習(xí)人類通用的表達(dá)方 式和價(jià)值觀,從而終生成符合人類期望的回答。如果將 AI 大模型類比于學(xué)生,那么模型的預(yù)訓(xùn)練就是通過(guò)廣泛的通識(shí)性閱讀,使學(xué)生具備初步 的文字理解能力;模型的精調(diào)就是“教學(xué)”的過(guò)程,其中使用出色教材的效果往往勝 過(guò)大量普通書(shū)籍。 從 ChatGPT 的主要技術(shù)環(huán)節(jié),分析其核心壁壘所在: 1)算力資源:據(jù) TrendForce 數(shù)據(jù),以英偉達(dá) A100 口徑計(jì)算,ChatGPT 需要 2 萬(wàn) 塊 GPU 來(lái)處理訓(xùn)練數(shù)據(jù),隨著 ChatGPT 的商用化,需要的 GPU 數(shù)量可能超過(guò) 3 萬(wàn)塊。 目前國(guó)內(nèi) GPU 集群的存量資源有限,疊加美實(shí)體清單影響G端芯片采購(gòu)受阻,導(dǎo)致對(duì) 于國(guó)內(nèi)大模型廠商而言,模型的推理、部署、應(yīng)用等環(huán)節(jié)的算力資源緊缺。但從長(zhǎng)期 來(lái)看,國(guó)內(nèi) AI 大模型算力緊缺的問(wèn)題有望得到緩解。從市場(chǎng)角度,算力資源本質(zhì)上 是自由流通的商品,相較于模型技術(shù)、工程能力等硬性壁壘更易突破;從技術(shù)層面看, 大模型的研發(fā)、應(yīng)用環(huán)節(jié)所需算力未來(lái)均有優(yōu)化的空間。4 月 13 日微軟推出大模型 訓(xùn)練工具 DeepSpeed-Chat,其中包括開(kāi)源的 RLHF 框架,能基于單個(gè) GPU 訓(xùn)練超過(guò) 130 億參數(shù)的模型,訓(xùn)練速度提升 15 倍以上,垂類企業(yè)應(yīng)用大模型的算力門檻有望大幅降低。 2)參數(shù)量:一般認(rèn)為 1000 億的參數(shù)量J是語(yǔ)言類大模型產(chǎn)生“涌現(xiàn)”現(xiàn)象的門 檻,GPT3 的訓(xùn)練參數(shù)量達(dá) 1750 億,GPT4 參數(shù)量未公布。對(duì)于國(guó)內(nèi)大模型廠商,尤其 是擁有豐富自有數(shù)據(jù)資源的互聯(lián)網(wǎng)大廠而言,1000 億的參數(shù)量J并非難以達(dá)到。目 前百度、華為、阿里等頭部企業(yè)均已推出或發(fā)布千億參數(shù)以上的 AI 大模型,但在性 能上仍和 ChatGPT 有較大差距。 3)數(shù)據(jù)集的質(zhì)量:GPT3 的預(yù)訓(xùn)練數(shù)據(jù)集來(lái)自于 common crawl(網(wǎng)頁(yè)爬蟲(chóng)聚合類 數(shù)據(jù)平臺(tái))、維基百科等標(biāo)準(zhǔn)化程度較G的公開(kāi)數(shù)據(jù)庫(kù)。目前國(guó)內(nèi) AI 大模型的預(yù)訓(xùn)練 數(shù)據(jù)集也以公開(kāi)網(wǎng)頁(yè)爬取的數(shù)據(jù)為主,再結(jié)合公司自有的行業(yè)數(shù)據(jù)進(jìn)行訓(xùn)練。問(wèn)題在 于,相較于英文,目前互聯(lián)網(wǎng)上中文內(nèi)容的規(guī)模和質(zhì)量均存在較大差距。因此,國(guó)內(nèi) AI 大模型的預(yù)訓(xùn)練數(shù)據(jù)集中也以英文數(shù)據(jù)為主,使得在中文為主的用戶使用環(huán)境中 產(chǎn)生較多的適配性問(wèn)題。 目前來(lái)看解決的方法包括:一是建立標(biāo)準(zhǔn)化、G質(zhì)量的中文 語(yǔ)料庫(kù);二是加強(qiáng) AI 大模型的翻譯能力,使其生成的結(jié)果更符合中文用戶的使用習(xí) 慣。 4)工程能力:包括預(yù)訓(xùn)練、精調(diào)等訓(xùn)練環(huán)節(jié)的執(zhí)行能力和方法等,需要研發(fā)團(tuán) 隊(duì)通過(guò)長(zhǎng)時(shí)間的經(jīng)驗(yàn)積累、不斷試錯(cuò),再對(duì)模型結(jié)果進(jìn)行調(diào)優(yōu),這也是 OpenAI 的 ChatGPT 目前于國(guó)內(nèi)、乃至谷歌 BERT 等其他海外頭部大模型的核心壁壘之一。 例如在精調(diào)過(guò)程中,OpenAI 使用J少量的G質(zhì)量標(biāo)注數(shù)據(jù),顯著提升了 GPT-3.5 的 應(yīng)答能力。此外,中文和英文數(shù)據(jù)集在規(guī)模、質(zhì)量等方面存在差距,這也需要額外的 工程能力去彌補(bǔ),使得國(guó)產(chǎn) AI 大模型更適用于中文的使用環(huán)境。
|
【聲明:轉(zhuǎn)載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其描述,文章內(nèi)容僅供參考,如有侵權(quán),請(qǐng)聯(lián)系刪除! |
推薦信息 |
ChatGPT的推出,對(duì)于人工智能的發(fā)展具有三層重要意義
推動(dòng) AI 大模型整體的迭代速度加快,應(yīng)用場(chǎng)景拓寬;提升用戶體驗(yàn)推動(dòng)模型認(rèn)知能力的進(jìn)一步提升;推動(dòng) AGI 終局的可見(jiàn)度提升,落地預(yù)期或從2050年大幅提前
ChatGPT 破圈復(fù)盤(pán):AI 顯性化的三個(gè)階段
ChatGPT能力初步破圈,在學(xué)術(shù)論文,專業(yè)考試等 C 端應(yīng)用場(chǎng)景中初步破圈;現(xiàn)象級(jí)應(yīng)用誕生,下游生態(tài)全面開(kāi)啟;大模型生態(tài)起步
Midjourney是一款A(yù)I制圖工具,五次迭代五個(gè)版本對(duì)比
Midjourney第一代圖像色彩豐富;第二代角色臉部更勻稱;第三代將角色添加到背包中;第四代每幅圖像顯示出具有略微不同的氣候特征;第五代絕佳分辨率
智能寫(xiě)作:Notion AI將生成式AI融合進(jìn)在線文檔場(chǎng)景
Notion AI完成的類型:文章,列表和表格,社交媒體帖子,大綱,創(chuàng)意故事,詩(shī)歌,隨筆,會(huì)議議程,新聞稿,工作介紹,銷售郵件,招聘郵件
gpt視頻工具應(yīng)用方向辦公提效方式及代表公司
一鍵添加特效,配音,字幕,水印,自動(dòng)生成片頭等功能;計(jì)算出視頻中的若干高光時(shí)刻,形成高光混剪短視頻片段;輔助制作高呈現(xiàn)難度的數(shù)字特效
gpt音頻工具應(yīng)用方向辦公提效方式及代表公司
進(jìn)行詞曲協(xié)作,伴奏生成,歌聲合成等;將文本轉(zhuǎn)化為語(yǔ)音,并賦予不同的聲音形象;生成高品質(zhì)配音音頻內(nèi)容,并且可編輯豐富的發(fā)音人音色
gpt圖片工具應(yīng)用方向辦公提效方式及代表公司
根據(jù)簡(jiǎn)單描述,關(guān)鍵詞自動(dòng)生成圖像;對(duì)圖片進(jìn)行智能調(diào)色,美化,摳圖等操作;精準(zhǔn)識(shí)別圖像中的視覺(jué)內(nèi)容,應(yīng)用于智能相冊(cè)管理,圖片安全監(jiān)控等場(chǎng)景
gpt文字工具應(yīng)用方向辦公提效方式及代表公司
輸入標(biāo)題大綱,即可生成全文初稿;對(duì)文章中不合理的用詞,語(yǔ)序錯(cuò)亂,口語(yǔ)表達(dá)等問(wèn)題進(jìn)行全面檢查和潤(rùn)色建議;快速針對(duì)內(nèi)容編輯區(qū)全文段落進(jìn)行摘要生成 |
智能運(yùn)輸機(jī)器人 |
AGV無(wú)人運(yùn)輸機(jī)器人-料箱版 |
AGV無(wú)人運(yùn)輸機(jī)器人-標(biāo)準(zhǔn)版 |
AGV無(wú)人運(yùn)輸機(jī)器人-料箱版(鈑金材質(zhì)) |
AGV無(wú)人運(yùn)輸機(jī)器人-貨架版(鈑金材質(zhì)) |
AGV無(wú)人運(yùn)輸機(jī)器人-貨架版(亮面不銹鋼材質(zhì)) |
AGV無(wú)人運(yùn)輸機(jī)器人-開(kāi)放版 |
行業(yè)動(dòng)態(tài) |
咨詢熱線:4006-935-088 / 4006-937-088
客服熱線:
4008-128-728
版權(quán)所有 @ 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 魯ICP備18039973號(hào)-2 運(yùn)營(yíng)中心 / 北京·清華科技園九號(hào)樓 生產(chǎn)中心 / 山東省日照市開(kāi)發(fā)區(qū)太原路71號(hào) |