公眾號

關注微信公眾號

移動端

創頭條企服版APP

商標注冊云服務辦公孵化推廣通雙創地圖

智用研究院成功舉辦大模型評測技術研討會

創頭條 2023-09-13 13:00 搶發第一評

作者｜楊文

編輯｜六耳

來源 |?AI先鋒官

9月7日下午，中關村智用人工智能研究院（以下簡稱“智用研究院”）在北京舉辦了大模型評測技術研討會。中國中小企業國際合作協會企業技術能力評價專委會、朝陽區人工智能應用聯合會、西安交大人機所、阿里達摩院、360人工智能研究院、華為、曙光、智譜華章、可之科技、中科極限元、中國電信、河南投資集團、創興動力、朝科創等單位的專家參加了此次研討會。

智用研究院院長孫明俊表示：“組織大模型評測的目標是為了解決眾多垂類行業用戶對于大模型能力和特點的認知需求，建立一套具有中國特色、由豐富行業場景引導的評測體系，對大模型的垂直行業應用能力進行技術評判，推動產業的健康發展?！?/strong>

目前，市場上常見的大模型評測模式主要有做題打分、以GPT-4為基準、競技場模式、針對單項能力的評測等。這些評測模式涉及到大模型的效果評價、客觀評價、主觀評價。那么，如何將客觀評價和主觀評價進行有機協同就需要進一步思考。

因此，在研討會上，與會代表圍繞如何建立一套客觀、公正的大模型評測體系展開，就大模型的評測目標、指標、方法、數據安全、隱私保護等問題進行了全面討論。

智用研究院首席研究員錢雨表示：“生成式大語言模型的效果評價一直以來都是困擾自然語言處理領域的重要問題之一。目前市場上陸續出現了C-Eval、CMMLU、M3KE、SuperCLUE、FlagEva等針對AI大模型評測的新工具。然而，現在的AI大模型與以往NLU類模型不同的是覆蓋面更廣，市面上這些評測方法能否全面系統地進行評測尚且值得探究?！?/p>

“目前大模型分為通用大模型和行業大模型，究竟是要針對通用大模型還是行業大模型做評測也值得思考。”西安交大人機所教授丁寧認為，“做行業垂類大模型的評測很有價值，難度也很高?！?/p>

經過與會代表的充分討論，評測工作將主要關注大模型基于通用能力所擁有的垂直行業應用能力，并就評測主題內容、數據集來源、評測維度、評價方法和技巧等方面達成一致，全力實行小步搶跑，加快推出大模型評測的階段性成果。

除此之外，研討會上還成立了大模型評測工作組。技術組組長由西安交大人機所教授丁寧擔任，成員單位包括西安交大人機所等；組織組組長由智用研究院首席研究員錢雨擔任，副組長由創興動力集團董事長兼CEO陳志剛擔任，成員單位包括智用研究院、中國中小企業國際合作協會企業技術能力評價專委會、創興動力、朝科創等。

接下來，智用研究院將繼續組織相關會議，以形成最專業科學的大模型評測方法，并計劃于10月份對大模型評測體系進行重磅發布。

中關村智用人工智能研究院（簡稱“智用研究院”）是在北京市科委、中關村管委會指導下，由百度、小米、曠視和一流科技聯合發起創辦的民辦非企業機構，致力于推進各行各業智能化進程。

智用研究院通過對復雜系統決策、復雜信息推理、技術研判、復雜系統綜合應用等能力體系的研究，建立了人工智能產業信任機制和數字化轉型基礎設施，并打造出智算云平臺、行業大模型、邊緣計算服器等智能化基座。除此之外，還通過標準研究和檢測認證能力建設、行業智能化創新課題研究、技術產品轉化、人才培訓及投融資服務等手段，實現了高新技術從原始創新到落地應用協同推進的閉環支撐，大力推進智能化技術在實體經濟中的廣泛應用。

創興動力集團是國內領先的創新創業服務機構之一，擁有創新孵化載體、企業賦能加速、數字化、資訊、政策及產業服務等業務板塊。在AI方面，公司今年的算力運營服務發展迅速，同時推出了AI大模型應用精選與評測產品“AI先鋒官”，形成移動網站、微信小程序、微信公眾號等產品和傳播矩陣。截至目前，“AI先鋒官”通過跟蹤行業前沿資訊、專家專訪、精選評測70余款大模型應用產品及直播，成為行業人士聚集社區之一。

?.END.

聲明：該文章版權歸原作者所有，轉載目的在于傳遞更多信息，并不代表本網贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題，請在30日內與本網聯系。

您閱讀這篇文章花了0秒

轉發這篇文章只需要1秒鐘哦

10人分享了該篇文章：

展開


更多

分享至：
微信

QQ

微博

喜歡這篇 6

評論一下 0

相關文章

藍月亮離“中國寶潔”還有多遠？

2020-12-18 16:14 搶發第一評

25倍股歐普康視遭實控人減持持股已質押近兩成

2020-12-18 16:35 搶發第一評

極狐阿爾法 T：續航和駕駛體驗均衡的北汽新能源之子

2020-12-18 16:38 搶發第一評

沾上疫苗就漲停！常鋁股份收關注函：疑似蹭熱點配合股東減持

2020-12-18 16:48 搶發第一評

隆基股份遭股東李春安減持4033萬股超計劃減持數量

2020-12-18 16:53 搶發第一評



評論

試試以這些內容開始評論吧

數據可視化數據可視化數據可視化

登錄后發表評論

游客登錄后發表評論

熱文

1

數智引航:智匯滬上丨人工智能+”專場活動

2

小米再次召回11.7萬輛SU7，新能源車召回次數已接近燃油車

3

阿里云創始人王堅（演講全文）:今天AI的開源不是開放代碼，而是“開放資源”

4

阿里吳泳銘（演講全文）:AGI只是起點，AI的終極目標是ASI

5

OpenAI研究報告（全譯文）：大語言模型為什么有“幻覺”

6

阿里、百度全面啟用自研AI芯片

7

美國AI大模型開始斷供中國

8

追覓從造車造手機到造飛機，俞浩會是“馬斯克”還是“賈躍亭”？

9

10億人“用腳投票”，阿里高德奇襲美團點評

10

西貝流血，華與華遞刀：被反殺的“中國最貴咨詢公司”

最新視頻

1.3萬次播放

分眾83億收購新潮，行業憂慮此舉或將豎起“高墻”

搶發第一評 yuanbo

1.7萬次播放

重磅嘉賓寄語｜加拿大工程院院士杜如虛為2023中國創交會打Call！

搶發第一評 18600040560

2.6萬次播放

【視頻精彩回顧】科技創新與成果轉化大會暨聊城概念驗證中心合作簽約儀式

2
18600040560

最新專題

TOP “科創中國”創新創業聯合體

12 57.3萬 2

2 2023中國創新創業成果交易會

18 79.8萬 4

3 2023阿里云創峰會暨長三角（鎮江）數字經濟發展高峰論壇

9 71.8萬 0

4 科技創新與成果轉化大會暨聊城概念驗證中心合作簽約儀式

8 69.8萬 0

5 頌揚中國制造精神，尋訪隱形冠軍

7 60.2萬 0

熱文

1

數智引航:智匯滬上丨人工智能+”專場活動

2

小米再次召回11.7萬輛SU7，新能源車召回次數已接近燃油車

3

阿里云創始人王堅（演講全文）:今天AI的開源不是開放代碼，而是“開放資源”

4

阿里吳泳銘（演講全文）:AGI只是起點，AI的終極目標是ASI

5

OpenAI研究報告（全譯文）：大語言模型為什么有“幻覺”

6

阿里、百度全面啟用自研AI芯片

7

美國AI大模型開始斷供中國

8

追覓從造車造手機到造飛機，俞浩會是“馬斯克”還是“賈躍亭”？

9

10億人“用腳投票”，阿里高德奇襲美團點評

10

西貝流血，華與華遞刀：被反殺的“中國最貴咨詢公司”

首頁

資訊

推薦

創語錄

融資報

孵化載體

專精特新

企業資訊

北京市

北京

上海

天津

深圳

廣州

杭州

成都

更多城市

商標

視頻

政策

熱門政策

月報

海外政策

專題

活動

云課堂

雙創周

創響中國

100特色空間

×

#熱門搜索#

精選雙創服務

歷史搜索清空

創頭條是創興動力旗下的創新創業資訊和企服產品，國家高新技術企業。平臺匯聚百萬級企業用戶，基于企業號、雙創地圖、政策通、融資報、活動工具、企服市場等產品，提供資訊、數據、線上對接等企業服務，并以路演、產業大賽、峰會、培訓、產業對接等方式提供線下賦能服務。

創興動力

北京| 上海| 杭州| 鄭州| 大連| 金華| 石家莊| 邢臺| 濟南| 深圳| 佛山

關于我們

集團簡介

資訊合作

商務合作

加入我們

APP下載
Android & IOS

微信公眾號
掃碼關注

?2015-2025 創頭條版權所有京ICP備15013664號-2 京公網安備 11010802029378號站長統計 RSS

Tel：18514777506

關注微信公眾號

創頭條企服版APP