當(dāng)前位置:首頁 >  科技 >  互聯(lián)網(wǎng) >  正文

互聯(lián)網(wǎng)公司投入大模型的原動力:反哺自己的「根據(jù)地」

 2023-04-26 09:46  來源: A5專欄   我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

文 / 六金

出品 / 節(jié)點(diǎn)商業(yè)組

大模型熱度遲遲不退,有能力的企業(yè)紛紛搶占生態(tài)位。百度、阿里、華為、商湯、科大訊飛、360等大型互聯(lián)網(wǎng)公司,都已經(jīng)在國內(nèi)展開了“諸神之戰(zhàn)”。

在媒體報道中,參與了大模型競技的公司幾乎都是大公司。這是因?yàn)橥度氪竽P?,最直觀的需求就是“錢”。大廠能成為“開卷”的主力軍,主要是因?yàn)榇竽P偷拈_發(fā)訓(xùn)練,資金、技術(shù)門檻都很高,并非創(chuàng)業(yè)者以及小公司可以輕松吃下的蛋糕。

例如國盛證券的一份研報顯示,GPT-3訓(xùn)練一次的成本約為140萬美元,對于一些更大的LLM模型,訓(xùn)練成本介于200萬美元至1200萬美元之間。這一成本于全球科技大企業(yè)而言并不便宜,但也在可接受范圍內(nèi)。

將大模型的投入“坦誠相告”

由于“貴”,投身大模型的很多企業(yè)其實(shí)都沒告訴投資者們,自己花了多少錢,估計也是怕投資者看到后會產(chǎn)生認(rèn)知偏差。

最近科大訊飛發(fā)了財報,倒是對這一點(diǎn)很坦誠,2023年一季度科大訊飛的利潤轉(zhuǎn)虧,其管理層明確表示,除了一些去年遺留的特殊問題外,是因?yàn)楣驹?022年12月15日啟動了“1+N認(rèn)知智能大模型”的專項(xiàng)攻關(guān),將于2023年5月6日正式發(fā)布訊飛星火大模型,攻關(guān)項(xiàng)目的新增投入一定程度上影響了當(dāng)期利潤。

科大訊飛的掌門人劉慶峰說得很明白:“針對大模型的技術(shù)投入,我們該投的投、絕不手軟。”所以在行業(yè)內(nèi),大家不妨都坦誠點(diǎn),畢竟大模型已經(jīng)成為了“陽謀”,花錢投入也是為收獲果實(shí)打基礎(chǔ)。當(dāng)年馬斯克不就是嫌再次投資OpenAI太貴,后來又想去“摘桃子”被拒之門外了嗎?

除了“投錢”以外,大模型還需要“投人”,在這一點(diǎn)上,國內(nèi)外廠商的爭搶都很激烈。“谷歌大腦”的大模型人才,從去年底到今年被OpenAI挖走了好幾個;節(jié)點(diǎn)財經(jīng)也聽說,某一線大廠開價140萬美元年薪,挖腳OpenAI的員工。在國內(nèi),有公司廣發(fā)英雄帖,把公司的大部分股權(quán)拿出來獎勵研發(fā)人才。

但是有NLP領(lǐng)域的專家對節(jié)點(diǎn)財經(jīng)表示,做大模型這樣的前沿核心技術(shù)研發(fā)還不能只靠高薪挖人才,更要考慮團(tuán)隊(duì)適配程度。

該人士舉例,研發(fā)大模型是為了落地在業(yè)務(wù)上,技術(shù)團(tuán)隊(duì)?wèi)?yīng)該充分了解業(yè)務(wù)特性。具體到業(yè)務(wù)場景,訴求存在著不小的差異,大模型的作用是實(shí)時掌握這些需求,并對此作出快速響應(yīng)。

聽起來理論很簡單,落地可一點(diǎn)都不容易,如果技術(shù)團(tuán)隊(duì)沒有磨合、不適配業(yè)務(wù),很可能會導(dǎo)致迭代落后于業(yè)務(wù)變化。

不過科大訊飛卻表示,未來一段時間公司不需要太多額外的人力投入,現(xiàn)在訊飛的團(tuán)隊(duì)和資金完全靠得住。有業(yè)內(nèi)人士分析,科大訊飛敢于這樣說,大概率是因?yàn)橛嶏w研究院作為人工智能創(chuàng)新研究院的“元老級”機(jī)構(gòu),建制完整、團(tuán)結(jié)且沒有技術(shù)上的內(nèi)耗。

公開資料顯示,目前訊飛研究院最核心的研究團(tuán)隊(duì)有200余人,其中有兩位是《麻省理工科技評論》“35歲以下科技創(chuàng)新35人”榜單中頂尖的年輕科學(xué)家,其他團(tuán)隊(duì)成員不少是和訊飛一起成長的博士,憑這一點(diǎn)可以能推測出,這群科學(xué)家的特點(diǎn)是“懂訊飛的業(yè)務(wù)訴求”。

此外在算力算法方面,訊飛也是業(yè)界公認(rèn)的AI領(lǐng)域長期堅守者。公開資料顯示,科大訊飛在Transformer深度神經(jīng)網(wǎng)絡(luò)算法方面擁有豐富經(jīng)驗(yàn),已經(jīng)應(yīng)用于訊飛的語音識別、圖文識別、機(jī)器翻譯等任務(wù)中,并達(dá)到國際領(lǐng)先水平;而且訊飛創(chuàng)新提出了知識與大模型融合統(tǒng)一的理解框架X-Reasoner,有望彌補(bǔ)大模型的模糊記憶技術(shù)短板。

而在算力投入上,訊飛過去幾年就一直牽頭承擔(dān)著國家自主可控人工智能平臺的諸多項(xiàng)目、在總部自建有業(yè)界一流的數(shù)據(jù)中心,為大模型訓(xùn)練平臺建設(shè)奠定了基礎(chǔ)條件,另外它之前與華為、寒武紀(jì)、曙光等企業(yè),也都建立了深度算力合作。

所以推出大模型,并且讓它具備商業(yè)化條件,對于互聯(lián)網(wǎng)大廠來說并不是一蹴而就的,以科大訊飛為例,它能在認(rèn)知大模型能實(shí)現(xiàn)快速突破、并且敢于披露和預(yù)測自己的投入,與長期在人才、算法、算力上的積累密不可分。

大模型賽道,國家隊(duì)下場

在這場大模型帶來的AI熱中,還有很多“吃瓜群眾”很難理解科技圈對大模型的擁躉,畢竟類似的場景在元宇宙、AR/VR等領(lǐng)域都出現(xiàn)過。但如果深入回顧人工智能的發(fā)展歷史與傳統(tǒng)AI時代的困境,就能理解大模型之于科技時代的含義。

我們可以將大模型的開發(fā),理解為打造AI時代的“操作系統(tǒng)”,就像我們使用windows系統(tǒng)在電腦中完成工作一樣,經(jīng)由AI時代的“操作系統(tǒng)”大模型,人人都可以是開發(fā)者,生產(chǎn)出新產(chǎn)品和新的應(yīng)用場景。

如果上升到這個層面,各個有能力的國家對大模型的基本要求就是“自主可控”。在360宣布進(jìn)軍大模型領(lǐng)域時,周鴻祎也在采訪中提到,GPT是個生產(chǎn)力工具,這將決定未來國際競爭當(dāng)中的國運(yùn)。所以,國家隊(duì)也在大模型的開發(fā)和訓(xùn)練上陸續(xù)下場。

不久前,中國電信布局了企業(yè)版的ChatGPT;復(fù)旦大學(xué)自然語言處理實(shí)驗(yàn)室開發(fā)的MOSS 模型已經(jīng)上線開源;中科院自動化所早在2021年就發(fā)布業(yè)界首個圖文音三模態(tài)大模型“紫東·太初”,清華大學(xué)、北京大學(xué)等院校雖然沒有推出大模型,但是也在人工智能領(lǐng)域國際頂級期刊發(fā)表了多篇大模型相關(guān)的重要文章。

某知名互聯(lián)網(wǎng)公司的NLP團(tuán)隊(duì)負(fù)責(zé)人對節(jié)點(diǎn)財經(jīng)表示,國家隊(duì)下場更容易在一些核心數(shù)據(jù)、參數(shù)上占有優(yōu)勢。大模型的訓(xùn)練的本質(zhì),就是把語料、數(shù)據(jù)、參數(shù)等當(dāng)作“食物”喂給大模型,當(dāng)食物品質(zhì)越高,大模型就會越智能,還能節(jié)省算力。

例如作為“人工智能國家隊(duì)”,科大訊飛在中文語料上有著明顯優(yōu)勢。據(jù)了解,在多年認(rèn)知智能系統(tǒng)研發(fā)推廣中,科大訊飛積累了超過50TB的行業(yè)語料和每天超10億人次用戶交互的活躍應(yīng)用,擁有大量的機(jī)器翻譯、語音識別、語音合成等方面的數(shù)據(jù),這些數(shù)據(jù)均是用于大模型訓(xùn)練和優(yōu)化自然語言處理模型的重要來源之一。

另外,科大訊飛要搭建的“認(rèn)知大模型”特別注重多輪對話和邏輯推理,才能在行業(yè)中深度應(yīng)用,這就意味著需要更高質(zhì)量的數(shù)據(jù)和參數(shù)。以醫(yī)療領(lǐng)域?yàn)槔拼笥嶏w是全國唯一通過國家執(zhí)業(yè)醫(yī)師資格考試的“人工智能系統(tǒng)”,超過了96.3%的醫(yī)學(xué)考生,現(xiàn)在科大訊飛已累計為基層醫(yī)生提供了超過5.8億次、日均超過70多萬人次的人工智能輔診。這就意味著在專業(yè)領(lǐng)域,科大訊飛可以避免一本正經(jīng)地回復(fù)錯誤消息,使得專業(yè)保障性更強(qiáng),大模型的落地也“更有專長”。

科大訊飛,將人工智能與智慧醫(yī)療深度融合

還有不少機(jī)構(gòu)在研報中提到,科大訊飛在教育領(lǐng)域的應(yīng)用規(guī)模比醫(yī)療更大、數(shù)據(jù)更翔實(shí),未來的增長更強(qiáng)勁。機(jī)構(gòu)們的肯定也印證了,在真正有剛需、適合認(rèn)知智能大模型的地方,國家隊(duì)下場后可以推動大模型在具體行業(yè)上做得更透。

投入大模型,反哺根據(jù)地

在大模型的“諸神之戰(zhàn)”中還有個特點(diǎn),即面對著市場上成百上千個大模型投資標(biāo)的,一級市場和二級市場在投資上都有些不知所措。

有VC合伙人評價,大家都看好大模型的發(fā)展趨勢,也更愿意做跟投,但是一級市場的投資人不一定都能看懂大模型的落地前景,沒有領(lǐng)投人就不知道如何開始。二級市場的投資者則提出了靈魂疑問,現(xiàn)在宣布投身大模型的公司這么多,如何判斷他們是蹭熱點(diǎn)還是真做大模型?我不想買到只會炒作概念的“妖股”。

上海一券商的計算機(jī)行業(yè)賣方分析師提出了一個解決方案,對于上市公司,可以仔細(xì)觀察企業(yè)有沒有讓大模型反哺主要業(yè)務(wù)的發(fā)展。

例如百度的文心一言全面嵌入百度內(nèi)部工作平臺如流、對外也上車了百度apollo等業(yè)務(wù);釘釘也表示全面接入阿里的 "通義千問 "大模型,增加了 10余種 AI能力、對外也表示要開放;WPS AI表示將嵌入金山辦公全線產(chǎn)品,科大訊飛的投資者交流會中也表示,大模型對于其根據(jù)地業(yè)務(wù),有著很大推動意義。

據(jù)了解,科大訊飛即將發(fā)布的星火大模型是“1+N認(rèn)知智能大模型”,其中“1”是代表的是大模型訓(xùn)練平臺,“N”是應(yīng)用于教育、醫(yī)療、人機(jī)交互、辦公、翻譯、工業(yè)、汽車等多個根據(jù)地領(lǐng)域的專用大模型版本。

能提出這樣的模型架構(gòu),是因?yàn)榭拼笥嶏w在行業(yè)內(nèi)是少數(shù)既懂B端又懂C端的AI公司。劉慶峰預(yù)測道,超大規(guī)模的大模型已經(jīng)到了一個臨界點(diǎn),下一個階段應(yīng)該用更多專業(yè)的子模型來協(xié)同訓(xùn)練,獲得更可靠的成效。

這個專業(yè)階段的子模型,關(guān)聯(lián)的就是科大訊飛的“根據(jù)地業(yè)務(wù)”,之前我們看科大訊飛的財報時,其根據(jù)地業(yè)務(wù)的基本盤一直非常穩(wěn)健,例如去年即使在宏觀因素的擠壓和疫情影響時,科大訊飛根據(jù)地業(yè)務(wù)仍能實(shí)現(xiàn)23%的增長。而基于上文提到語料、數(shù)據(jù)、參數(shù)的優(yōu)勢,專業(yè)模型通過協(xié)調(diào)聯(lián)動,根據(jù)地業(yè)務(wù)還能形成效益的提升。

劉慶峰同樣預(yù)測道,訊飛在教育、醫(yī)療等根據(jù)地業(yè)務(wù)上的大模型成效不比千億級模型差。特別是想要形成通用領(lǐng)域的智慧涌現(xiàn),需要把這些模型的知識相互銜接,在整體的大模型中去統(tǒng)一訓(xùn)練,未來就有希望在教育、辦公、醫(yī)療等應(yīng)用領(lǐng)域搶占先機(jī)。有不少機(jī)構(gòu)同樣預(yù)測道,星火認(rèn)知大模型反哺業(yè)務(wù),會讓科大訊飛的根據(jù)地業(yè)務(wù)壁壘更加深厚。

幾天前,被譽(yù)為“AI界傳奇”的陸奇在《我的大模型世界觀》演講中提到了對于大模型的展望,即大模型是平臺型機(jī)會,以模型為先的平臺需要以下幾個特征:1.開箱即用;2.要有一個足夠簡單和好的商業(yè)模式;3.有自己殺手級應(yīng)用。

所以星火大模型的發(fā)布落地,不僅是簡單易用的專業(yè)化模型;還可以在科大訊飛自己的教育、醫(yī)療、辦公等場景打造經(jīng)典應(yīng)用;再經(jīng)由訊飛的開放平臺開放出去,讓AI認(rèn)知大模型從“可用”階段邁入“常用”階段,帶動AI時代的“操作系統(tǒng)”更加普惠化;最后為大模型的使用者創(chuàng)造現(xiàn)金流、創(chuàng)造真金白銀的產(chǎn)業(yè)附加值,這才是大模型的發(fā)展“偉力”。

節(jié)點(diǎn)財經(jīng)聲明:文章內(nèi)容僅供參考,文章中的信息或所表述的意見不構(gòu)成任何投資建議,節(jié)點(diǎn)財經(jīng)不對因使用本文章所采取的任何行動承擔(dān)任何責(zé)任。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
互聯(lián)網(wǎng)公司

相關(guān)文章

熱門排行

信息推薦