无码人妻精品一区二|京东快递查询快递单号|亚洲男人AV天堂午夜在|成人毛片18女人毛片免费看网站|人善交ZZZZXXXXX另类

登頂C-Eval和CMMLU兩大榜單 夸克大模型打造下一代搜索技術(shù)新底座 ...

2024-4-4 03:35| 發(fā)布者: 仟茂傳媒| 查看: 1359| 評論: 0|來自: 互聯(lián)網(wǎng)

摘要: 近期,互聯(lián)網(wǎng)公司及手機廠商接連發(fā)布自研大模型,權(quán)威榜單顯示,國產(chǎn)大模型的各項性能再攀高峰。3月16日,記者在C-Eval和CMMLU兩大權(quán)威評測榜單中發(fā)現(xiàn),夸克大模型成為雙榜第一,進一步展現(xiàn)國產(chǎn)大模型在數(shù)據(jù)精調(diào)及 ...

近期,互聯(lián)網(wǎng)公司及手機廠商接連發(fā)布自研大模型,權(quán)威榜單顯示,國產(chǎn)大模型的各項性能再攀高峰。3月16日,記者在C-Eval和CMMLU兩大權(quán)威評測榜單中發(fā)現(xiàn),夸克大模型成為雙榜第一,進一步展現(xiàn)國產(chǎn)大模型在數(shù)據(jù)精調(diào)及模型框架上的能力提升。

作為國內(nèi)最權(quán)威的兩個大語言模型測試榜單,C-Eval是由清華大學(xué)、上海交通大學(xué)和愛丁堡大學(xué)合作構(gòu)建的綜合性考試評測集,覆蓋52個學(xué)科,是目前權(quán)威的中文AI大模型評測榜單之一。CMMLU 是由MBZUAI、上海交通大學(xué)、微軟亞洲研究院共同推出,包含67個主題,專門用于評估語言模型在中文語境下的知識和推理能力。

在CMMLU榜單評測中,夸克大模型以平均77.08分的成績位列總成績第一,并占據(jù)社會科學(xué)和其他兩個類目的首位。在C-Eval榜單中,夸克大模型平均分達到89分,穩(wěn)居行業(yè)第一,同時在社會科學(xué)、人文科學(xué)和其他三個類目中位列榜首。

3月14日,阿里巴巴智能信息事業(yè)群發(fā)布全棧自研、千億級參數(shù)的夸克大模型。據(jù)介紹,憑借數(shù)據(jù)、行業(yè)、知識正確性、平臺等四大優(yōu)勢,夸克大模型應(yīng)用會優(yōu)先落地在通識問答、專業(yè)搜索等信息服務(wù)領(lǐng)域,滿足年輕人學(xué)習(xí)知識和提升自我的需求。

據(jù)悉,堅持自研大模型的研發(fā)路線是服務(wù)于夸克的業(yè)務(wù)戰(zhàn)略,也是持續(xù)推動夸克App在產(chǎn)品體驗創(chuàng)新和邁向新一代搜索的技術(shù)底座。夸克將借助自研大模型全面升級,為年輕人工作、學(xué)習(xí)、生活提供更全面的服務(wù)。

(責(zé)任編輯:張曉波 )