詳細(xì)信息

ChatGPT核心壁壘:算力、數(shù)據(jù)和工程能力

編輯：來(lái)源：國(guó)聯(lián)證券時(shí)間：2023/4/23

ChatGPT 的研發(fā)主要分為預(yù)訓(xùn)練（Pre-train）和精調(diào)（Fine-tune）兩個(gè)環(huán)節(jié)。其中：1）預(yù)訓(xùn)練：使用無(wú)標(biāo)注、大規(guī)模的數(shù)據(jù)集，對(duì)模型進(jìn)行預(yù)訓(xùn)練。2）精調(diào)：讓模型與專業(yè)的標(biāo)注人員、AI 訓(xùn)練師進(jìn)行交互，推動(dòng)模型逐步學(xué)習(xí)人類通用的表達(dá)方式和價(jià)值觀，從而終生成符合人類期望的回答。如果將 AI 大模型類比于學(xué)生，那么模型的預(yù)訓(xùn)練就是通過(guò)廣泛的通識(shí)性閱讀，使學(xué)生具備初步的文字理解能力；模型的精調(diào)就是“教學(xué)”的過(guò)程，其中使用出色教材的效果往往勝過(guò)大量普通書(shū)籍。

從 ChatGPT 的主要技術(shù)環(huán)節(jié)，分析其核心壁壘所在：

1）算力資源：據(jù) TrendForce 數(shù)據(jù)，以英偉達(dá) A100 口徑計(jì)算，ChatGPT 需要 2 萬(wàn) 塊 GPU 來(lái)處理訓(xùn)練數(shù)據(jù)，隨著 ChatGPT 的商用化，需要的 GPU 數(shù)量可能超過(guò) 3 萬(wàn)塊。目前國(guó)內(nèi) GPU 集群的存量資源有限，疊加美實(shí)體清單影響G端芯片采購(gòu)受阻，導(dǎo)致對(duì) 于國(guó)內(nèi)大模型廠商而言，模型的推理、部署、應(yīng)用等環(huán)節(jié)的算力資源緊缺。但從長(zhǎng)期來(lái)看，國(guó)內(nèi) AI 大模型算力緊缺的問(wèn)題有望得到緩解。從市場(chǎng)角度，算力資源本質(zhì)上是自由流通的商品，相較于模型技術(shù)、工程能力等硬性壁壘更易突破；從技術(shù)層面看，大模型的研發(fā)、應(yīng)用環(huán)節(jié)所需算力未來(lái)均有優(yōu)化的空間。4 月 13 日微軟推出大模型訓(xùn)練工具 DeepSpeed-Chat，其中包括開(kāi)源的 RLHF 框架，能基于單個(gè) GPU 訓(xùn)練超過(guò) 130 億參數(shù)的模型，訓(xùn)練速度提升 15 倍以上，垂類企業(yè)應(yīng)用大模型的算力門檻有望大幅降低。

2）參數(shù)量：一般認(rèn)為 1000 億的參數(shù)量J是語(yǔ)言類大模型產(chǎn)生“涌現(xiàn)”現(xiàn)象的門檻,GPT3 的訓(xùn)練參數(shù)量達(dá) 1750 億，GPT4 參數(shù)量未公布。對(duì)于國(guó)內(nèi)大模型廠商，尤其是擁有豐富自有數(shù)據(jù)資源的互聯(lián)網(wǎng)大廠而言，1000 億的參數(shù)量J并非難以達(dá)到。目前百度、華為、阿里等頭部企業(yè)均已推出或發(fā)布千億參數(shù)以上的 AI 大模型，但在性能上仍和 ChatGPT 有較大差距。

3）數(shù)據(jù)集的質(zhì)量：GPT3 的預(yù)訓(xùn)練數(shù)據(jù)集來(lái)自于 common crawl（網(wǎng)頁(yè)爬蟲(chóng)聚合類數(shù)據(jù)平臺(tái)）、維基百科等標(biāo)準(zhǔn)化程度較G的公開(kāi)數(shù)據(jù)庫(kù)。目前國(guó)內(nèi) AI 大模型的預(yù)訓(xùn)練數(shù)據(jù)集也以公開(kāi)網(wǎng)頁(yè)爬取的數(shù)據(jù)為主，再結(jié)合公司自有的行業(yè)數(shù)據(jù)進(jìn)行訓(xùn)練。問(wèn)題在于，相較于英文，目前互聯(lián)網(wǎng)上中文內(nèi)容的規(guī)模和質(zhì)量均存在較大差距。因此，國(guó)內(nèi) AI 大模型的預(yù)訓(xùn)練數(shù)據(jù)集中也以英文數(shù)據(jù)為主，使得在中文為主的用戶使用環(huán)境中產(chǎn)生較多的適配性問(wèn)題。

目前來(lái)看解決的方法包括：一是建立標(biāo)準(zhǔn)化、G質(zhì)量的中文語(yǔ)料庫(kù)；二是加強(qiáng) AI 大模型的翻譯能力，使其生成的結(jié)果更符合中文用戶的使用習(xí) 慣。

4）工程能力：包括預(yù)訓(xùn)練、精調(diào)等訓(xùn)練環(huán)節(jié)的執(zhí)行能力和方法等，需要研發(fā)團(tuán) 隊(duì)通過(guò)長(zhǎng)時(shí)間的經(jīng)驗(yàn)積累、不斷試錯(cuò)，再對(duì)模型結(jié)果進(jìn)行調(diào)優(yōu)，這也是 OpenAI 的 ChatGPT 目前于國(guó)內(nèi)、乃至谷歌 BERT 等其他海外頭部大模型的核心壁壘之一。例如在精調(diào)過(guò)程中，OpenAI 使用J少量的G質(zhì)量標(biāo)注數(shù)據(jù)，顯著提升了 GPT-3.5 的應(yīng)答能力。此外，中文和英文數(shù)據(jù)集在規(guī)模、質(zhì)量等方面存在差距，這也需要額外的工程能力去彌補(bǔ)，使得國(guó)產(chǎn) AI 大模型更適用于中文的使用環(huán)境。

【聲明：轉(zhuǎn)載此文出于傳遞更多信息之目的，并不意味著贊同其觀點(diǎn)或證實(shí)其描述，文章內(nèi)容僅供參考，如有侵權(quán)，請(qǐng)聯(lián)系刪除�！�

推薦信息

ChatGPT的推出，對(duì)于人工智能的發(fā)展具有三層重要意義
推動(dòng) AI 大模型整體的迭代速度加快,應(yīng)用場(chǎng)景拓寬;提升用戶體驗(yàn)推動(dòng)模型認(rèn)知能力的進(jìn)一步提升;推動(dòng) AGI 終局的可見(jiàn)度提升,落地預(yù)期或從2050年大幅提前

ChatGPT 破圈復(fù)盤(pán):AI 顯性化的三個(gè)階段
ChatGPT能力初步破圈,在學(xué)術(shù)論文,專業(yè)考試等 C 端應(yīng)用場(chǎng)景中初步破圈;現(xiàn)象級(jí)應(yīng)用誕生,下游生態(tài)全面開(kāi)啟;大模型生態(tài)起步

Midjourney是一款A(yù)I制圖工具,五次迭代五個(gè)版本對(duì)比
Midjourney第一代圖像色彩豐富;第二代角色臉部更勻稱;第三代將角色添加到背包中;第四代每幅圖像顯示出具有略微不同的氣候特征;第五代絕佳分辨率

智能寫(xiě)作：Notion AI將生成式AI融合進(jìn)在線文檔場(chǎng)景
Notion AI完成的類型:文章,列表和表格,社交媒體帖子,大綱,創(chuàng)意故事,詩(shī)歌,隨筆,會(huì)議議程,新聞稿,工作介紹,銷售郵件,招聘郵件

gpt視頻工具應(yīng)用方向辦公提效方式及代表公司
一鍵添加特效,配音,字幕,水印,自動(dòng)生成片頭等功能;計(jì)算出視頻中的若干高光時(shí)刻,形成高光混剪短視頻片段;輔助制作高呈現(xiàn)難度的數(shù)字特效

gpt音頻工具應(yīng)用方向辦公提效方式及代表公司
進(jìn)行詞曲協(xié)作,伴奏生成,歌聲合成等;將文本轉(zhuǎn)化為語(yǔ)音,并賦予不同的聲音形象;生成高品質(zhì)配音音頻內(nèi)容,并且可編輯豐富的發(fā)音人音色

gpt圖片工具應(yīng)用方向辦公提效方式及代表公司
根據(jù)簡(jiǎn)單描述,關(guān)鍵詞自動(dòng)生成圖像;對(duì)圖片進(jìn)行智能調(diào)色,美化,摳圖等操作;精準(zhǔn)識(shí)別圖像中的視覺(jué)內(nèi)容,應(yīng)用于智能相冊(cè)管理,圖片安全監(jiān)控等場(chǎng)景

gpt文字工具應(yīng)用方向辦公提效方式及代表公司
輸入標(biāo)題大綱,即可生成全文初稿;對(duì)文章中不合理的用詞,語(yǔ)序錯(cuò)亂,口語(yǔ)表達(dá)等問(wèn)題進(jìn)行全面檢查和潤(rùn)色建議;快速針對(duì)內(nèi)容編輯區(qū)全文段落進(jìn)行摘要生成

智能運(yùn)輸機(jī)器人

AGV無(wú)人運(yùn)輸機(jī)器人-料箱版

AGV無(wú)人運(yùn)輸機(jī)器人-標(biāo)準(zhǔn)版

AGV無(wú)人運(yùn)輸機(jī)器人-料箱版（鈑金材質(zhì)）

AGV無(wú)人運(yùn)輸機(jī)器人-貨架版（鈑金材質(zhì)）

AGV無(wú)人運(yùn)輸機(jī)器人-貨架版（亮面不銹鋼材質(zhì)）

AGV無(wú)人運(yùn)輸機(jī)器人-開(kāi)放版

行業(yè)動(dòng)態(tài)

» AMR企業(yè)未來(lái)發(fā)展的建議:加強(qiáng)產(chǎn)學(xué)研合作拓展應(yīng)用領(lǐng)域與場(chǎng)景突破關(guān)鍵技術(shù)

» 智能無(wú)人運(yùn)輸車AMR選型建議:安全性穩(wěn)定性兼容性成本和可維護(hù)性

» 物流企業(yè)自動(dòng)化搬運(yùn)項(xiàng)目:117臺(tái)XPL搬運(yùn)機(jī)器人用于快運(yùn)件轉(zhuǎn)運(yùn)+物料暫存

» 工具制造業(yè)5G智慧工廠:10+臺(tái)潛伏AGV+托盤(pán)式叉車用于線邊倉(cāng)轉(zhuǎn)運(yùn)