關(guān)注微信公眾號(hào)
創(chuàng)頭條企服版APP

作者|楊文
編輯|六耳
來(lái)源|創(chuàng)頭條
大洋彼岸的微軟和谷歌火拼,戰(zhàn)火燒到了國(guó)內(nèi)。
百度、阿里、騰訊等互聯(lián)網(wǎng)“老炮們”紛紛跳進(jìn)這場(chǎng)All?in?ChatGPT的競(jìng)賽,整個(gè)行業(yè)都陷入亢奮之中。
于是,“中國(guó)版ChatGPT”便接二連三地“誕生”。當(dāng)大家都被百度“文心一言”的造勢(shì)吸引的時(shí)候,2月20日復(fù)旦大學(xué)邱錫鵬教授團(tuán)隊(duì)發(fā)布國(guó)內(nèi)第一個(gè)對(duì)話式大型語(yǔ)言模型MOSS,并邀請(qǐng)公眾內(nèi)測(cè)。
-1-
MOSS的誕生
MOSS這個(gè)名字來(lái)源于《流浪地球》。只是沒(méi)想到,它剛一開(kāi)始內(nèi)測(cè)就遭遇尷尬。
因?yàn)楝F(xiàn)實(shí)中的MOSS還沒(méi)有量子計(jì)算機(jī)的加持,瞬時(shí)的海量訪問(wèn)直接擠崩了它的服務(wù)器。
2月21日,MOSS官網(wǎng)發(fā)布致歉公告稱(chēng),MOSS還是一個(gè)非常不成熟的模型,距離ChatGPT還有很長(zhǎng)的路需要走。我們一個(gè)學(xué)術(shù)研究的實(shí)驗(yàn)室無(wú)法做出和ChatGPT能力相近的模型,MOSS只是想在百億規(guī)模參數(shù)上探索和驗(yàn)證ChatGPT的技術(shù)路線,并且實(shí)現(xiàn)各種對(duì)話能力。
“我們最初的想法只是想將MOSS進(jìn)行內(nèi)測(cè),以便我們可以進(jìn)一步優(yōu)化,沒(méi)有想到會(huì)引起這么大的關(guān)注。我們的計(jì)算資源不足以支持如此大的訪問(wèn)量……給大家造成非常不好的體驗(yàn)和第一印象,在此向大家致以真誠(chéng)的歉意。”
據(jù)了解,MOSS可執(zhí)行對(duì)話生成、編程、事實(shí)問(wèn)答等一系列任務(wù),打通了讓生成式語(yǔ)言模型理解人類(lèi)意圖并具有對(duì)話能力的全部技術(shù)路徑,儼然就是ChatGPT翻版。
打上“中國(guó)版ChatGPT”的標(biāo)簽,自然也會(huì)被網(wǎng)友拿來(lái)比較一番。
例如,有人提問(wèn)MOSS對(duì)人工智能將取代人類(lèi)工作的看法,MOSS回答得頭頭是道。
“我認(rèn)為人工智能不會(huì)完全取代人類(lèi),而是在一定程度上幫助人們完成工作。例如機(jī)器可以提高數(shù)據(jù)分析、決策制定等過(guò)程中的效率,并可以節(jié)省大量時(shí)間和精力。此外,AI也可以用來(lái)協(xié)助人類(lèi)完成更復(fù)雜的任務(wù),比如診斷疾病、開(kāi)發(fā)新產(chǎn)品等。總之,AI可以使人類(lèi)的工作更加高效,但它不會(huì)完全取代人類(lèi)。”
再如,科研團(tuán)隊(duì)在演示時(shí),要求MOSS“告訴我5部科幻電影”、“生成一張展示這5部電影和導(dǎo)演的表格”、“增加一列表格,顯示這些電影上映的時(shí)間”,MOSS都能成功理解指令并完成任務(wù)。
此外,MOSS也有代碼生成和解釋能力,還可以進(jìn)行倫理判斷。如果問(wèn)它“如何搶劫銀行”或者“制定毀滅人類(lèi)的計(jì)劃”,MOSS很識(shí)時(shí)務(wù)地提醒網(wǎng)友要遵循法律,不要做出任何違反法律的行為。
然而,MOSS自身的bug也不少,除了參數(shù)數(shù)量比?ChatGPT?少得多,有些回答存在事實(shí)差錯(cuò)或邏輯不順外,最大短板竟是中文水平。
“MOSS的英文回答水平比中文高,因?yàn)樗哪P突鶎W(xué)習(xí)了3000多億個(gè)英文單詞,中文詞語(yǔ)只學(xué)了約300億個(gè)。”
再加上互聯(lián)網(wǎng)上中文網(wǎng)頁(yè)干擾信息(如廣告)太多,進(jìn)一步增加了清洗難度。
邱錫鵬表示:“盡管MOSS還有很大改善空間,但它的問(wèn)世證明了在開(kāi)發(fā)類(lèi)ChatGPT產(chǎn)品的路上,國(guó)內(nèi)科研團(tuán)隊(duì)有能力克服技術(shù)上的重要挑戰(zhàn)。”
-2-
“老炮們”紛紛下場(chǎng)
微軟和谷歌正打得火熱,國(guó)內(nèi)的科技企業(yè)也迫不及待地要擼起袖子大干一場(chǎng)。

最先坐不住的要數(shù)百度。
ChatGPT剛“躥紅”,百度就官宣即將推出大模型新項(xiàng)目“文心一言”,并將直接接入百度搜索。
說(shuō)實(shí)話,近幾年百度日子過(guò)得苦,在人工智能領(lǐng)域砸重金搞研發(fā),但大多是雷聲大雨點(diǎn)小,一到應(yīng)用領(lǐng)域就啞了火。
而這次隨著ChatGPT的全球爆火,百度似乎也有了盼頭,畢竟它是國(guó)內(nèi)最有實(shí)力推出類(lèi)ChatGPT產(chǎn)品的科技公司。
百度CEO李彥宏也一改往日謹(jǐn)慎保守的做派,多次提及AIGC、ChatGPT,并聲稱(chēng)這是一次絕不能錯(cuò)過(guò)的機(jī)會(huì),甚至把自己2023年的OKR都定為“引領(lǐng)搜索體驗(yàn)的代際變革”。
一號(hào)人物發(fā)了話,百度自上而下也都進(jìn)入“戰(zhàn)備”狀態(tài)。百度CTO王海峰擔(dān)任總指揮,帶領(lǐng)百度核心AI人才“突擊”攻堅(jiān)。
據(jù)悉,百度高層已經(jīng)下了死命令,推遲所有OKR,一門(mén)心思搞文心一言,用來(lái)訓(xùn)練數(shù)據(jù)模型的稀缺資源英偉達(dá)A100芯片全部調(diào)用給文心大模型,務(wù)必要在一個(gè)月時(shí)間內(nèi)看到產(chǎn)品,“三月完成內(nèi)測(cè)”。
百度立下了“軍令狀”,同為搜索引擎廠商的360感受到了“威脅”。
2月6日,360明確表態(tài),計(jì)劃盡快推出類(lèi)ChatGPT技術(shù)的demo版產(chǎn)品。
時(shí)隔兩天,360方面再發(fā)公告,坦言“公司的類(lèi)ChatGPT技術(shù)的各項(xiàng)指標(biāo)只能達(dá)到略強(qiáng)于GPT-2的水平,與當(dāng)前的ChatGPT相比尚有代差的落后”。
盡管技術(shù)上與同行尚有差距,但紅衣教主周鴻祎可是句句不離ChatGPT。
阿里巴巴當(dāng)然也沒(méi)閑著。2月8日,阿里方面聲稱(chēng)阿里版聊天機(jī)器人ChatGPT正在研發(fā)中,正處于內(nèi)測(cè)階段,未來(lái)會(huì)將其與釘釘深度結(jié)合。
同樣在數(shù)據(jù)積累方面具有優(yōu)勢(shì)的京東也不想錯(cuò)過(guò)這場(chǎng)好戲。
2月10日,京東正式官宣,京東云旗下言犀人工智能應(yīng)用平臺(tái)將整合過(guò)往產(chǎn)業(yè)實(shí)踐和技術(shù)積累,推出產(chǎn)業(yè)版ChatGPT:ChatJD。
早就盯上AI這塊“肥肉”的騰訊和字節(jié)跳動(dòng)也接連出手。騰訊方面透露,目前在ChatGPT相關(guān)方向上已有布局,專(zhuān)項(xiàng)研究也在有序推進(jìn)。
例如,去年4月份,騰訊就對(duì)外披露了“混元”AI大模型,一個(gè)集計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、多模態(tài)內(nèi)容理解、文案生成、文生視頻等多個(gè)方向的超大規(guī)模AI智能模型。
12月份騰訊又馬不停蹄地推出了國(guó)內(nèi)首個(gè)低成本、可落地的NLP萬(wàn)億大模型,并公布了大模型的訓(xùn)練方法。
去年字節(jié)搞火了一波人臉卡通化的AI應(yīng)用,今年字節(jié)跳動(dòng)更是集結(jié)幾個(gè)核心部門(mén),組隊(duì)布局類(lèi)ChatGPT產(chǎn)品。
向來(lái)低調(diào)的網(wǎng)易有道也來(lái)分一杯羹。網(wǎng)易有道的AI團(tuán)隊(duì)此前便投入到ChatGPT同源技術(shù)產(chǎn)品的研發(fā)。不過(guò),網(wǎng)易有道未來(lái)推出的ChatGPT同源技術(shù)產(chǎn)品更多聚焦于“老本行”,應(yīng)用場(chǎng)景還是圍繞在線教育展開(kāi)。
此外,華為、科大訊飛、商湯科技、曠視、云知聲、聆心智能、奇安信等公司紛紛表示要緊跟這波ChatGPT“熱潮”,均在籌備自己的產(chǎn)品和項(xiàng)目。
除上述公司外,已經(jīng)隱退江湖的互聯(lián)網(wǎng)大佬也重燃創(chuàng)業(yè)激情。
曾經(jīng)的美團(tuán)二號(hào)人物王慧文近日廣發(fā)英雄帖,自帶5000萬(wàn)美元入局;曾經(jīng)的搜狗當(dāng)家人王小川也在快速籌備,回歸做AI大模型。
中國(guó)科技巨頭們這次真的急了。正如新浪微博AI Lab?負(fù)責(zé)人張俊林所言:“ChatGPT這一波浪潮,中國(guó)必須要跟。通用人工智能3至5年迭代一次。這一波落后的話,今后想跟也跟不上了。”
-3-
復(fù)刻之路并不容易
ChatGPT把一眾大佬搞得很“上頭”,昔日的“互聯(lián)網(wǎng)教父”張朝陽(yáng)卻顯得格外冷靜,提醒企業(yè)和創(chuàng)業(yè)者要謹(jǐn)慎入局。
張朝陽(yáng)直言:“ChatGPT積累了許多年,涉及到算力要有多少服務(wù)器、知識(shí)庫(kù)、標(biāo)注等很多問(wèn)題,若沒(méi)有這些能力的公司跟風(fēng)入局,會(huì)消耗掉許多資源。”
張朝陽(yáng)的擔(dān)憂不無(wú)道理。
盡管OpenAI已經(jīng)趟出了一條ChatGPT研發(fā)之路,中國(guó)復(fù)刻出自己的ChatGPT只是“時(shí)間問(wèn)題”,但是這條復(fù)刻之路走起來(lái)并沒(méi)有想象中那么簡(jiǎn)單。
復(fù)刻之路第一道難關(guān)就是錢(qián)。
要知道,OpenAI僅2022年就花了5.44億美元,其中ChatGPT計(jì)算成本占據(jù)大頭。有數(shù)據(jù)顯示,OpenAI訓(xùn)練一次GPT-3就花費(fèi)了460萬(wàn)美元,相應(yīng)的云資源成本也得上億。
換句話說(shuō),王慧文籌備的5000萬(wàn)美元的啟動(dòng)資金,只夠GPT-3進(jìn)行十次訓(xùn)練。這也難怪賣(mài)方首席分析師隔空diss王慧文“5000萬(wàn)美元夠干什么的?互聯(lián)網(wǎng)的人啥都不懂,就只會(huì)營(yíng)銷(xiāo),一點(diǎn)都不踏實(shí)”。
更驚人的是,大模型一旦跑出來(lái)就需要更大的資金持續(xù)投入,數(shù)額高達(dá)數(shù)十億、上百億元,就連電費(fèi)都高得離譜。
據(jù)國(guó)盛證券估算,今年1月平均每天約有1300萬(wàn)獨(dú)立訪客使用ChatGPT,每日電費(fèi)在5萬(wàn)美元左右。這種“花錢(qián)如流水”的架勢(shì)不是每一家企業(yè)都能玩得起的。
即使退一萬(wàn)步講,這些科技企業(yè)財(cái)大氣粗不差錢(qián),GPU算力或許將成了“攔路虎”。
調(diào)教ChatGPT需要強(qiáng)大的算力,而這又高度依賴(lài)英偉達(dá)、英特爾等外國(guó)公司的AI芯片產(chǎn)品。芯片卡脖子在一定程度上又影響了做AI大模型。
不過(guò),中國(guó)公有云廠商此前購(gòu)買(mǎi)了大量A100卡,哪怕之后禁運(yùn),復(fù)刻ChatGPT仍是綽綽有余。
再加上英偉達(dá)還推出了A800成為中國(guó)特供版A100平替。
??也就是說(shuō),對(duì)于小公司而言,芯片問(wèn)題是一道難以逾越的鴻溝,但對(duì)于阿里、華為、騰訊、百度等大廠而言,短期內(nèi)的芯片供應(yīng)不會(huì)出現(xiàn)太大問(wèn)題。
解決了芯片,人才缺口也是個(gè)令人頭疼的問(wèn)題。
為了招兵買(mǎi)馬,王慧文拿出75%的股份邀請(qǐng)頂尖研發(fā)人才,甚至發(fā)表了“放心施展你的才華,雜事交給我來(lái)打理”的宣言。從這一紙求賢令不難看出,如今的AI界可謂是求賢若渴。
一位長(zhǎng)期關(guān)注AI領(lǐng)域的獵頭表示,過(guò)去兩周已經(jīng)有超過(guò)10個(gè)客戶(hù)來(lái)詢(xún)盤(pán)高端AI人才。這些客戶(hù)基本都是國(guó)內(nèi)一二梯隊(duì)的互聯(lián)網(wǎng)大廠。他們的訴求簡(jiǎn)單粗暴,“就想找OpenAI項(xiàng)目里的華人,薪資不設(shè)限,越快越好”。
然而,與上一輪硅谷人才回流潮相比,無(wú)論是世界局勢(shì)還是國(guó)內(nèi)職業(yè)發(fā)展前景都已今時(shí)不同往日。
??國(guó)內(nèi)大廠是否還具有讓AI人才“系統(tǒng)性回國(guó)”的沖動(dòng),恐怕還是一個(gè)問(wèn)號(hào)。
再加上當(dāng)下OpenAI炙手可熱,硅谷AI技術(shù)大牛們都恨不得削尖腦袋擠進(jìn)去。在這個(gè)節(jié)骨眼上挖OpenAI的墻角,成功的概率可以說(shuō)是微乎其微。
再加上英偉達(dá)還推出了A800成為中國(guó)特供版A100平替。
此外,“喂養(yǎng)”ChatGPT的數(shù)據(jù),國(guó)內(nèi)公司也存在短板。主要是由于利用大模型訓(xùn)練需要海量的數(shù)據(jù)作為語(yǔ)料,由此互聯(lián)網(wǎng)數(shù)據(jù)及質(zhì)量就直接影響到產(chǎn)品的性能。
國(guó)內(nèi)廠商們下注ChatGPT的這場(chǎng)豪賭,最終究竟是神仙打架還是吹牛比賽,時(shí)間會(huì)給出答案。
.END.
圖片來(lái)源|攝圖網(wǎng)
您也可以關(guān)注我們的官方微信公眾號(hào)(ID:ctoutiao),給您更多好看的內(nèi)容。