①國內(nèi)大模型的使用量確實(shí)在顯著地增長,并且中國的模型在海外確實(shí)越來越具有競(jìng)爭(zhēng)力,這是兩個(gè)積極的變化。 ②當(dāng)產(chǎn)品沒人用或者不賺錢的時(shí)候,肯定不能怪用戶,大部分只能怪自己技術(shù)、產(chǎn)品做得不夠好?!爸辽傥覀円恢笔窃谂Φ?。希望自己能變得更好,這是我們唯一可以做的事?!遍Z俊杰說。
編者按:
財(cái)聯(lián)社、科創(chuàng)板日?qǐng)?bào)旗下《AI daily》今日正式推出“Insight?AI 鋒線”訪談。訪談聚焦國內(nèi)外人工智能及大模型領(lǐng)域優(yōu)秀企業(yè)、創(chuàng)業(yè)者、領(lǐng)軍學(xué)者、投資人等,帶來AI賦能千行百業(yè)的最新探索、實(shí)踐與思考。Insight?AI 鋒線,洞見,先鋒,一線!
《科創(chuàng)板日?qǐng)?bào)》9月20日訊(記者 黃心怡)作為AI六小虎之一,MiniMax已完成了A+輪融資,最新一輪由阿里領(lǐng)投,金額為6億美元。公司估值已突破25億美元,背后投資方包括騰訊、紅杉中國、高瓴、IDG、米哈游等。
在MiniMax的公司內(nèi)部,同事彼此之間只稱呼花名。而對(duì)于創(chuàng)始人閆俊杰,員工稱呼他為為IO(花名)。閆俊杰曾擔(dān)任過商湯副總裁、研究院副院長和智慧城市事業(yè)群CTO。2021年12月,在商湯上市前夕,閆俊杰離開商湯,創(chuàng)立了MiniMax。
近日,MiniMax發(fā)布首款A(yù)I高清視頻生成模型abab-video-1。閆俊杰在發(fā)布會(huì)后接受《科創(chuàng)板日?qǐng)?bào)》等媒體在采訪中透露,采用新一代技術(shù)的abab7系列模型將于未來數(shù)周內(nèi)正式發(fā)布,效果對(duì)標(biāo)GPT-4o的模型。談及大模型商業(yè)化的難點(diǎn),閆俊杰回應(yīng)稱,這確實(shí)是行業(yè)考驗(yàn),只有通過這一考驗(yàn)的企業(yè)才能成功。
“當(dāng)產(chǎn)品沒人用的時(shí)候,或者當(dāng)產(chǎn)品不賺錢的時(shí)候,肯定是不能怪用戶,大部分只能怪自己的技術(shù)做得不夠好,或者產(chǎn)品做得不夠好。這可以當(dāng)成對(duì)一個(gè)行業(yè)的考驗(yàn)。如果能夠通過考驗(yàn),就能夠跑出來。如果通不過確實(shí)(公司)應(yīng)該關(guān)掉?!?/strong>
閆俊杰在發(fā)布會(huì)現(xiàn)場(chǎng)
▌競(jìng)爭(zhēng)在所難免 要把自己可能做強(qiáng)的地方無限放大
隨著以GPT為代表的新一輪人工智能浪潮的興起,為通用人工智能(AGI)的實(shí)現(xiàn)創(chuàng)造了更多的想象空間。
閆俊杰認(rèn)為,AGI并非高大上的東西,而是要能夠變成大家每個(gè)人生活中的一部分。
“比如大家看抖音或者看視頻號(hào)的時(shí)候,不會(huì)意識(shí)到這是基于推薦算法短視頻的內(nèi)容分發(fā)平臺(tái),大家就覺得抖音、微信已經(jīng)變成大家生活中的一部分。AGI也是一樣,當(dāng)AI變成如同手機(jī)這般,成為大家每天都在用的一部分的時(shí)候,AGI就實(shí)現(xiàn)了。當(dāng)然這需要很長的時(shí)間,但我覺得可以一步一步地努力。”
對(duì)于短期五年內(nèi)AI能帶來的改變,閆俊杰認(rèn)為,5年后,在有AI幫助的情況下,每個(gè)人會(huì)大大提高智商的上限,做到比數(shù)百人會(huì)場(chǎng)里智商最高的人更高?!爱?dāng)然,在有AI的幫助下,人的智商上限能提升多少,這個(gè)事情是不太確定的?!?/p>
進(jìn)入2024年,大模型競(jìng)爭(zhēng)愈發(fā)激烈。面對(duì)大廠的迅猛夾擊,初創(chuàng)公司的生存空間被壓縮。
“競(jìng)爭(zhēng)是難免的?!伴Z俊杰感嘆,“中國有些發(fā)展很好的行業(yè),像電動(dòng)車、手機(jī)、移動(dòng)互聯(lián)網(wǎng),都有好幾家公司進(jìn)行了長期非常激烈的競(jìng)爭(zhēng),最終使得中國產(chǎn)品在全球領(lǐng)先。既然其他新興行業(yè)發(fā)展歷史是這樣的,大模型又有可能產(chǎn)生很大的社會(huì)價(jià)值,確實(shí)也就應(yīng)該有很多的競(jìng)爭(zhēng)。這是發(fā)展的客觀規(guī)律?!?/p>
閆俊杰認(rèn)為,假如一家創(chuàng)業(yè)公司在激烈的競(jìng)爭(zhēng)中打不贏,那么就應(yīng)該被淘汰。
“當(dāng)那些比你大好多倍的公司,都開始跟你競(jìng)爭(zhēng)的時(shí)候,就會(huì)意識(shí)到有些東西是沒用的。因?yàn)槟切〇|西大廠比你強(qiáng)百倍千倍。我們能做的就是,把有可能變強(qiáng)的事無限地放大(做強(qiáng))。歸結(jié)起來有兩點(diǎn),一是技術(shù)如何提升,二是如何跟用戶做更好的共創(chuàng)。這兩點(diǎn)都需要一些非常關(guān)鍵的判斷,需要靠非常長期的積累。”
▌多模態(tài)大模型 意味著底層基礎(chǔ)設(shè)施也需要升級(jí)
在過去幾個(gè)月,視頻生成大模型的賽場(chǎng)非常熱鬧。生數(shù)科技打造的視頻大模型Vidu上線;智譜AI正式發(fā)布視頻生成大模型“清影”;商湯發(fā)布首個(gè)面向C端用戶的可控人物視頻生成大模型Vimi;阿里達(dá)摩院推出一站式AI視頻創(chuàng)作平臺(tái)“尋光”;快手可靈AI正式上線網(wǎng)頁端,并開源名為LivePortrait的可控人像視頻生成框架……
近日MiniMax也發(fā)布了首款A(yù)I高清視頻生成模型。閆俊杰認(rèn)為,多模態(tài)大模型是必由之路,因?yàn)槎嗄B(tài)內(nèi)容是人類交流溝通中的主要部分。
“現(xiàn)在我們每天看的大部分內(nèi)容,都不是文字,而是一些動(dòng)態(tài)的內(nèi)容。打開小紅書是圖文,打開抖音都是視頻,甚至打開拼多多買東西,大部分時(shí)候也是圖片。對(duì)于人類社會(huì),大模型的核心意義做更好的信息處理,大部分的信息體現(xiàn)在多模態(tài)的內(nèi)容里,而不是在文字上,文字很多時(shí)候是其中最精華的那么一小部分。為了能有非常高的用戶覆蓋度,有非常高的使用深度,唯一的辦法輸出(多模態(tài))的動(dòng)態(tài)內(nèi)容,而不只是輸出單純的基于文字的內(nèi)容,這是一個(gè)非常核心的判斷。”
盡管多模態(tài)被普遍看好,但業(yè)界在探索中也感受到,相比文本模型,視頻生成模型的研發(fā)難度顯然更高。
對(duì)此,閆俊杰認(rèn)為,視頻大部分的時(shí)候工作復(fù)雜度確實(shí)比做文本更難,因?yàn)橐曨l的文本天然很長。比如一個(gè)視頻涉及千萬的輸入和輸出,天然會(huì)很難處理。其次,視頻量很大。又比如5秒的視頻有幾兆,但是5秒看完的文字可能都不到1K,這是幾千倍的存儲(chǔ)差距。這其中的挑戰(zhàn)在于,之前基于文本建的底層基礎(chǔ)設(shè)施怎么來處理數(shù)據(jù),怎么來清洗數(shù)據(jù),怎么來標(biāo)注,這意味著基礎(chǔ)設(shè)施也需要升級(jí)。
“此外,還需要更多的耐心。做文字有很多開源的東西,如果基于開源來做研發(fā)會(huì)更快,但視頻開源的東西沒那么多,需要重新來做,付出的耐心也更大?!?/strong>
▌客觀來看,價(jià)格戰(zhàn)提高了模型的調(diào)用量
今年以來,不少大模型企業(yè)紛紛開啟價(jià)格戰(zhàn),以換取AI大模型普及度。閆俊杰認(rèn)為,客觀來看,價(jià)格戰(zhàn)確實(shí)提高了模型的調(diào)用量。
“當(dāng)國內(nèi)的模型搞起價(jià)格戰(zhàn)后,本來認(rèn)為大模型很貴的大部分公司,開始發(fā)現(xiàn)大模型很便宜,可以放心地使用。最終驚人地發(fā)現(xiàn)有了大模型的價(jià)格戰(zhàn)之后,很多非常傳統(tǒng)的企業(yè)開始非常愿意使用大模型。他們覺得反正成本低,出錯(cuò)了之后也不要緊,出錯(cuò)了多調(diào)用一次就好了。客觀地來說,這非常大地提高了模型的調(diào)用量。”
在國內(nèi)的模型激烈競(jìng)爭(zhēng)的局面下,MiniMax正在向海外市場(chǎng)拓展。閆俊杰表示,“正是由于國內(nèi)的模型這么激烈的競(jìng)爭(zhēng),推著大家必須往前趕,至少目前已可以達(dá)到在非英語國家的語種上,也能夠跟GPT不相上下的水平。競(jìng)爭(zhēng)以及各種各樣的事既然不能避免,那就努力做到最好。我們看到樂觀的一面,國內(nèi)大模型的使用量確實(shí)在顯著地增長,并且中國的模型在海外確實(shí)越來越具有競(jìng)爭(zhēng)力,我覺得是兩個(gè)積極的變化?!?/strong>
在具體的商業(yè)化模式,閆俊杰介紹,整個(gè)公司的商業(yè)化可分成兩個(gè)形式,一是面向B端的MiniMax開放平臺(tái),二是產(chǎn)品內(nèi)的廣告機(jī)制。
“MiniMax開放平臺(tái)現(xiàn)在已經(jīng)有超過三萬家企業(yè)客戶和開發(fā)者,包括知名的互聯(lián)網(wǎng)公司、傳統(tǒng)的企業(yè)等等。用戶會(huì)使用我們的聲音跟視覺的能力,因?yàn)椴皇撬械墓径伎梢宰约鹤觯覀兪呛芎玫暮献骰锇?。二是MiniMax的產(chǎn)品里也有廣告機(jī)制,可以做商業(yè)化的變現(xiàn)。不過,在現(xiàn)階段,最重要的事還不是商業(yè)化,是真正地讓技術(shù)到達(dá)廣泛可用的程度?!?/p>
目前,國內(nèi)已有智譜AI、百川智能、零一萬物、月之暗面、MiniMax、階躍星辰六家獨(dú)立大模型創(chuàng)業(yè)公司,被稱之為“AI六小虎”。金沙江創(chuàng)投主管合伙人朱嘯虎在接受媒體采訪時(shí)直言,大模型太貴了,靠商業(yè)化根本養(yǎng)不活自己。這幾家創(chuàng)業(yè)公司最好的結(jié)果就是賣給大廠。
談及投資人朱嘯虎的言論和大模型商業(yè)化的難點(diǎn),閆俊杰回應(yīng)稱,這確實(shí)是行業(yè)考驗(yàn),只有通過這一考驗(yàn)的企業(yè)才能成功。
“當(dāng)產(chǎn)品沒人用的時(shí)候,或者當(dāng)產(chǎn)品不賺錢的時(shí)候,這時(shí)候肯定是不能怪用戶的。大部分時(shí)候只能怪自己的技術(shù)做得不夠好,或產(chǎn)品做得不夠好,反正我們是這么來看待這件事的?!?
在閆俊杰看來,QQ在2000年也不知道該怎么賺錢,嘗試無數(shù)商業(yè)化變現(xiàn)的方案都失敗了,但是最終找到了移動(dòng)增值業(yè)務(wù)、找到了游戲,都會(huì)經(jīng)歷這樣的過程?!斑@可以當(dāng)成對(duì)一個(gè)行業(yè)的考驗(yàn),如果能夠通過考驗(yàn),就能夠跑出來。如果通不過確實(shí)(公司)應(yīng)該關(guān)掉?!?/p>
在整個(gè)訪談中,對(duì)于行業(yè)競(jìng)爭(zhēng)與企業(yè)前景,閆俊杰始終顯得比較坦然。“肯定不能怪用戶,也不能怪生態(tài),(許多事)只能怪自己做得不夠好,至少我們一直是在努力的。希望自己能變得更好,這是我們唯一可以做的事?!?/strong>