(相關(guān)資料圖)
近日,小米的大語言模型MiLM-6B首次亮相C-Eval、CMMLU兩大AI模型評測榜單。據(jù)悉,MiLM-6B在C-Eval總榜單中排名第10,同參數(shù)量級排名第1,而在CMMLU中文向大模型中則位列第1。C-Eval公布的數(shù)據(jù)顯示,MiLM-6B模型在各個測試科目中的平均成績表現(xiàn)良好。在STEM(科學、技術(shù)、工程和數(shù)學教育)的20個科目中,包括計量師、物理、化學、生物等多個項目都取得了較高的準確率。在10個社會科學科目中,除教育學和地理外,該模型在所有科目中都獲得了較為理想的準確率。在人文科學的11個科目中,MiLM-6B在歷史與法律基礎(chǔ)上也有著不錯的準確率表現(xiàn)。然而,盡管MiLM-6B模型在大多數(shù)科目中表現(xiàn)出了相對良好的準確度,但在法學、數(shù)學、編程、概率論、離散數(shù)學等科目上的表現(xiàn)仍有待提升。據(jù)了解,MiLM-6B是小米開發(fā)的一個大規(guī)模預(yù)訓練語言模型,參數(shù)規(guī)模為64億。