小米64億大語言模型亮相C-Eval、CMMLU評測


(相關(guān)資料圖)

近日,小米的大語言模型MiLM-6B首次亮相C-Eval、CMMLU兩大AI模型評測榜單。據(jù)悉,MiLM-6B在C-Eval總榜單中排名第10,同參數(shù)量級排名第1,而在CMMLU中文向大模型中則位列第1。C-Eval公布的數(shù)據(jù)顯示,MiLM-6B模型在各個測試科目中的平均成績表現(xiàn)良好。在STEM(科學、技術(shù)、工程和數(shù)學教育)的20個科目中,包括計量師、物理、化學、生物等多個項目都取得了較高的準確率。在10個社會科學科目中,除教育學和地理外,該模型在所有科目中都獲得了較為理想的準確率。在人文科學的11個科目中,MiLM-6B在歷史與法律基礎(chǔ)上也有著不錯的準確率表現(xiàn)。然而,盡管MiLM-6B模型在大多數(shù)科目中表現(xiàn)出了相對良好的準確度,但在法學、數(shù)學、編程、概率論、離散數(shù)學等科目上的表現(xiàn)仍有待提升。據(jù)了解,MiLM-6B是小米開發(fā)的一個大規(guī)模預(yù)訓練語言模型,參數(shù)規(guī)模為64億。

推薦DIY文章
當智能健身走向全民化:AEKE輕力量家庭智能健身房引領(lǐng)未來
海藝AI:迎合“AI時代”發(fā)展潮流,刷新繪圖市場傳統(tǒng)認知
布局產(chǎn)業(yè)新高地!海星醫(yī)藥健康創(chuàng)新園B區(qū)奠基儀式隆重舉行
未來五年500億投入打底,北汽藍谷錨定細分市場增量
【展會直擊】華秋慕尼黑上海電子展精彩ing,助力電子產(chǎn)業(yè)高質(zhì)量發(fā)展!
桂花網(wǎng)藍牙網(wǎng)關(guān)助力司乘人員職業(yè)健康監(jiān)測
精彩新聞