上證報(bào)中國(guó)證券網(wǎng)訊(記者 時(shí)娜)10月26日,SuperCLUE發(fā)布中文大模型10月榜單,GPT4繼續(xù)位列第一,vivo自研大模型以70.74的總分位列總排行榜第四,在國(guó)內(nèi)大模型中排行第一,排在其后的分別是月之暗面的Moonshot、百度的文心一言4.0和商湯科技的SenseChat 3.0。SuperCLUE指出,國(guó)內(nèi)第一梯隊(duì)大模型格局已基本形成,vivo自研大模型等頭部中文大模型已經(jīng)與GPT3.5極為接近,評(píng)分表現(xiàn)令人振奮。
SuperCLUE是業(yè)內(nèi)極具權(quán)威的中文通用大模型多層次綜合性測(cè)評(píng)基準(zhǔn),在本次評(píng)測(cè)中,SuperCLUE選取當(dāng)下國(guó)內(nèi)外最具代表性的20個(gè)通用大語(yǔ)言模型,設(shè)置了全新的3754道測(cè)試題,全面考察大模型在中文能力上的表現(xiàn),最終評(píng)選出總排行榜等5大榜單。
從榜單可以看出,國(guó)內(nèi)大模型產(chǎn)品競(jìng)爭(zhēng)依然激烈。vivo自研大模型在總排行榜、多輪開(kāi)放問(wèn)題OPEN排行、十大基礎(chǔ)能力榜單實(shí)現(xiàn)3榜領(lǐng)跑,文心一言4.0和SenseChat 3.0躋身三大能力客觀題OPT排行榜前三,各家大模型均在特定領(lǐng)域展現(xiàn)出相對(duì)競(jìng)爭(zhēng)優(yōu)勢(shì)。
據(jù)此前消息顯示,2023 vivo開(kāi)發(fā)者大會(huì)將于11月1日正式開(kāi)幕,vivo將在大會(huì)期間發(fā)布5款自研大模型矩陣,包括十億、百億、千億三個(gè)不同參數(shù)量級(jí)。