詳細(xì)信息 |
Math23K數(shù)據(jù)集-解決數(shù)學(xué)問題數(shù)據(jù)集 |
編輯: 來源:華泰證券 時間:2023/5/19 |
Math23K 數(shù)據(jù)集:于 2017 年由騰訊人工智能實驗室發(fā)布。Math23K 是為解決數(shù)學(xué)問題而 創(chuàng)建的數(shù)據(jù)集,數(shù)據(jù)包含從在線教育網(wǎng)站上抓取的 6 萬多個中文數(shù)學(xué)單詞問題,都是小學(xué) 生真正的數(shù)學(xué)應(yīng)用題,有 23,161 個標(biāo)有結(jié)構(gòu)化方程和答案的問題。
|
【聲明:轉(zhuǎn)載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內(nèi)容僅供參考,如有侵權(quán),請聯(lián)系刪除! |
推薦信息 |
CAIL2018數(shù)據(jù)集 中國法律數(shù)據(jù)
CAIL2018是第一個用于判決預(yù)測的大規(guī)模中國法律數(shù)據(jù)集,收錄 了中國最高人民法院公布 260 萬件刑事案件,由適用的法律條款指控和刑期組成
中國開源大語言模型數(shù)據(jù)集 WuDaoCorpora數(shù)據(jù)集
WuDaoCorpora數(shù)據(jù)集采用 20 多種規(guī)則從 100TB 原始網(wǎng)頁數(shù)據(jù)中清洗得出最終數(shù)據(jù)集,注重隱私數(shù)據(jù)信息的去除,支持多領(lǐng)域預(yù)訓(xùn)練模型的訓(xùn)練
中國開源大語言模型數(shù)據(jù)集 DuReader數(shù)據(jù)集
DuReader是一個大規(guī)模的開放域中文機器閱讀理解數(shù)據(jù)集,問題和文檔基于百度搜索和百度知道,答案是手動生成的,由200K問題,420K答案和1M文檔組成
中國多模態(tài)大模型數(shù)據(jù)集構(gòu)建
阿里M6大模型參數(shù)規(guī)模達到 1000 億,構(gòu)建了最大的中文多模態(tài)預(yù)訓(xùn)練數(shù)據(jù)集 M6-Corpus;百度ERNIE-ViLG大模型參數(shù)規(guī)模達到 100 億
中國三個大語言模型數(shù)據(jù)集構(gòu)建
百度Plato-XL大模型預(yù)訓(xùn)練語料規(guī)模達千億級 token,模型規(guī)模高達 110 億參數(shù);華為盤古大模型開源了盤古α和盤古α增強版兩個版本
國內(nèi)優(yōu)質(zhì)中文數(shù)據(jù)集的重要來源 垂直內(nèi)容平臺
知乎作為問答知識平臺,擁有超過4300萬創(chuàng)作者產(chǎn)生的超過3.5億條優(yōu)質(zhì)中文問答內(nèi)容;垂類內(nèi)容平臺的數(shù)據(jù)可以作為細(xì)分領(lǐng)域大模 型精確訓(xùn)練的基礎(chǔ)
國內(nèi)科技互聯(lián)網(wǎng)廠商訓(xùn)練大模型基于的數(shù)據(jù)基礎(chǔ)
百度文心大模型訓(xùn)練特有數(shù)據(jù)主要包括萬億級的網(wǎng)頁數(shù)據(jù);阿里通義大模型的訓(xùn)練數(shù)據(jù)主要來自阿里達摩院;騰訊混元大模型特有的訓(xùn)練數(shù)據(jù)主要來自微信公眾號
國內(nèi)缺乏高質(zhì)量數(shù)據(jù)集的主要原因
高質(zhì)量數(shù)據(jù)集需要巨大資金投入,當(dāng)前國內(nèi)數(shù)據(jù)挖掘和數(shù)據(jù)治理的力度不足;國內(nèi)相關(guān)公司成立較晚,數(shù)據(jù)積累相對國外公司更少 |
智能運輸機器人 |
AGV無人運輸機器人-料箱版 |
AGV無人運輸機器人-標(biāo)準(zhǔn)版 |
AGV無人運輸機器人-料箱版(鈑金材質(zhì)) |
AGV無人運輸機器人-貨架版(鈑金材質(zhì)) |
AGV無人運輸機器人-貨架版(亮面不銹鋼材質(zhì)) |
AGV無人運輸機器人-開放版 |
行業(yè)動態(tài) |
咨詢熱線:4006-935-088 / 4006-937-088
客服熱線:
4008-128-728
版權(quán)所有 @ 創(chuàng)澤智能機器人集團股份有限公司 魯ICP備18039973號-2 運營中心 / 北京·清華科技園九號樓 生產(chǎn)中心 / 山東省日照市開發(fā)區(qū)太原路71號 |