長沙仟茂科技有限公司財經(jīng)資訊 › 首頁 ›科技 › 查看內(nèi)容

登頂C-Eval和CMMLU兩大榜單夸克大模型打造下一代搜索技術(shù)新底座 ...

2024-4-4 03:35| 發(fā)布者: 仟茂傳媒| 查看: 1359| 評論: 0|來自: 互聯(lián)網(wǎng)

摘要: 近期，互聯(lián)網(wǎng)公司及手機廠商接連發(fā)布自研大模型，權(quán)威榜單顯示，國產(chǎn)大模型的各項性能再攀高峰。3月16日，記者在C-Eval和CMMLU兩大權(quán)威評測榜單中發(fā)現(xiàn)，夸克大模型成為雙榜第一，進一步展現(xiàn)國產(chǎn)大模型在數(shù)據(jù)精調(diào)及 ...

近期，互聯(lián)網(wǎng)公司及手機廠商接連發(fā)布自研大模型，權(quán)威榜單顯示，國產(chǎn)大模型的各項性能再攀高峰。3月16日，記者在C-Eval和CMMLU兩大權(quán)威評測榜單中發(fā)現(xiàn)，夸克大模型成為雙榜第一，進一步展現(xiàn)國產(chǎn)大模型在數(shù)據(jù)精調(diào)及模型框架上的能力提升。

作為國內(nèi)最權(quán)威的兩個大語言模型測試榜單，C-Eval是由清華大學(xué)、上海交通大學(xué)和愛丁堡大學(xué)合作構(gòu)建的綜合性考試評測集，覆蓋52個學(xué)科，是目前權(quán)威的中文AI大模型評測榜單之一。CMMLU 是由MBZUAI、上海交通大學(xué)、微軟亞洲研究院共同推出，包含67個主題，專門用于評估語言模型在中文語境下的知識和推理能力。

在CMMLU榜單評測中，夸克大模型以平均77.08分的成績位列總成績第一，并占據(jù)社會科學(xué)和其他兩個類目的首位。在C-Eval榜單中，夸克大模型平均分達到89分，穩(wěn)居行業(yè)第一，同時在社會科學(xué)、人文科學(xué)和其他三個類目中位列榜首。

3月14日，阿里巴巴智能信息事業(yè)群發(fā)布全棧自研、千億級參數(shù)的夸克大模型。據(jù)介紹，憑借數(shù)據(jù)、行業(yè)、知識正確性、平臺等四大優(yōu)勢，夸克大模型應(yīng)用會優(yōu)先落地在通識問答、專業(yè)搜索等信息服務(wù)領(lǐng)域，滿足年輕人學(xué)習(xí)知識和提升自我的需求。

據(jù)悉，堅持自研大模型的研發(fā)路線是服務(wù)于夸克的業(yè)務(wù)戰(zhàn)略，也是持續(xù)推動夸克App在產(chǎn)品體驗創(chuàng)新和邁向新一代搜索的技術(shù)底座。夸克將借助自研大模型全面升級，為年輕人工作、學(xué)習(xí)、生活提供更全面的服務(wù)。

（責(zé)任編輯：張曉波）