“在一些基礎(chǔ)工作被AI替代的同時,也會衍生諸如人工智能培訓(xùn)師等新興行業(yè)。當(dāng)前中國版ChatGPT要實現(xiàn)追趕,最大的挑戰(zhàn)在于追趕時間差?!?/pre>《安安訪談錄》是界面財聯(lián)社執(zhí)行總裁徐安安出品的一檔深度訪談類欄目。從投資角度對話1000位行業(yè)領(lǐng)軍人物,覆蓋傳媒創(chuàng)新、VC/PE、信息服務(wù)、金融科技、交易體系、戰(zhàn)略新興等方向。
科創(chuàng)板日報《連線創(chuàng)始人/CEO》是由《安安訪談錄》出品的針對創(chuàng)新創(chuàng)業(yè)型未上市企業(yè)創(chuàng)始人的訪談欄目,以企業(yè)創(chuàng)始人/CEO的訪談為一手信源,讓成長中的創(chuàng)業(yè)公司走入公眾和市場視野,并發(fā)掘最新技術(shù)和產(chǎn)業(yè)趨勢。
本期訪談人物:
天壤創(chuàng)始人兼首席執(zhí)行官 薛貴榮
“在一些基礎(chǔ)工作被AI替代的同時,也會衍生諸如人工智能培訓(xùn)師等新興行業(yè)。當(dāng)前中國版ChatGPT要實現(xiàn)追趕,最大的挑戰(zhàn)在于追趕時間差?!?/p>
▍個人介紹
天壤創(chuàng)始人兼首席執(zhí)行官,人工智能與大數(shù)據(jù)領(lǐng)域科學(xué)家,國家科技部云計算專家組成員,原阿里媽媽首席數(shù)據(jù)科學(xué)家。首批全國優(yōu)秀博士論文獎獲得者,國內(nèi)第一位在全球搜索領(lǐng)域頂級會議ACM SIGIR上發(fā)表論文的科學(xué)家,全球遷移學(xué)習(xí)領(lǐng)域開創(chuàng)者和深度強化學(xué)習(xí)頂尖專家。薛貴榮博士曾在世界頂級會議NIPS、ICML、SIGKDD、SIGIR、WWW與世界頂級刊物ACM TOIS、ACM TIST等發(fā)表論文70余篇,擁有專利十余項,論文引用達9000+。
▍第一標(biāo)簽
國內(nèi)深度強化學(xué)習(xí)領(lǐng)域開拓者
▍公司簡介
天壤成立于2016年,是專注于通用智能研究(AGI)的創(chuàng)新企業(yè),致力于解決人工智能的可用性和易用性問題,實現(xiàn)以最小成本、最快速度賦能業(yè)務(wù)場景,讓智能像水電煤一樣便捷。
目前,已經(jīng)廣泛地服務(wù)于城市運行、交通治理、金融保險、商業(yè)零售、生物科技等場景。希望為人類社會的可持續(xù)發(fā)展帶來突破性進展,讓社會更便捷、更聰明、更智慧。
大模型近幾年持續(xù)火熱,薛貴榮認為,ChatGPT能夠脫穎而出的根本原因是強化學(xué)習(xí)技術(shù)的創(chuàng)新和高質(zhì)量數(shù)據(jù)積累的疊加效應(yīng)。
“先預(yù)訓(xùn)練一個大模型,然后用強化學(xué)習(xí)去‘教導(dǎo)’模型,讓模型生產(chǎn)出足夠多的新數(shù)據(jù),進行‘自學(xué)習(xí)’。就像一個小孩對應(yīng)一個教導(dǎo)老師,不僅學(xué)習(xí)知識,還學(xué)習(xí)方法,解決問題的能力就可以持續(xù)提升。這才能代表真正的人工智能。”
薛貴榮指出,現(xiàn)如今的所有界面可能都會被重構(gòu),最終將變成人類通過AI和數(shù)字世界進行自然語言交流,可以直接向機器發(fā)送指令,解決問題。
在2016年創(chuàng)立天壤之前,薛貴榮曾就職于阿里巴巴,先后任職阿里媽媽大數(shù)據(jù)中心負責(zé)人、阿里媽媽首席數(shù)據(jù)科學(xué)家等職務(wù),負責(zé)研發(fā)了阿里搜索引擎等平臺。
作為上海交通大學(xué)計算機系副教授,薛貴榮的研究方向主要為機器學(xué)習(xí)、信息檢索、互聯(lián)網(wǎng)營銷、大規(guī)模數(shù)據(jù)分析和分布式計算,在世界頂級會議NIPS等發(fā)表論文70余篇,擁有專利十余項。
談及當(dāng)下ChatGPT所引領(lǐng)的人工智能熱潮,薛貴榮認為未來兩年,會看到AI應(yīng)用的極度爆發(fā),人工智能技術(shù)將廣泛、深刻地改變各行各業(yè),并將帶來人機交互方式的巨大變革,所有的應(yīng)用和平臺要基于ChatGPT框架重新開發(fā)。
“在一些基礎(chǔ)工作被AI替代的同時,也會衍生諸如人工智能培訓(xùn)師等新興行業(yè)。當(dāng)前中國版ChatGPT要實現(xiàn)追趕,最大的挑戰(zhàn)在于追趕時間差。”薛貴榮說。
01
——————————
做中國版ChatGPT 算法創(chuàng)新和高質(zhì)量的數(shù)據(jù)缺一不可
對于ChatGPT熱潮背后的推動力,薛貴榮認為,首先是算力的提升,其次是算法的躍遷。Transformer把自然語言模型的上下文之間關(guān)系的學(xué)習(xí)能力,提升了新的臺階。
“過去基于卷積的神經(jīng)網(wǎng)絡(luò)依賴大量數(shù)據(jù),通過一層一層網(wǎng)絡(luò)的學(xué)習(xí),掌握如何把一個概念與另一個概念相關(guān)聯(lián)。但這種方式傳遞過程中往往容易產(chǎn)生信息的丟失。Transformer模型出現(xiàn)后,針對某兩個概念,機器可以更迅速、準(zhǔn)確地建立關(guān)系的連接。這種方式更接近于我們?nèi)祟惤鉀Q問題的方式,可以考慮更復(fù)雜的事情。
同時,ChatGPT引入了強化學(xué)習(xí)機制,加速推動了通用人工智能的發(fā)展。
“在過去,標(biāo)數(shù)據(jù)是一個很困難的事兒,特別是標(biāo)這么大的規(guī)模。如今的ChatGPT基于大模型學(xué)到的知識,并通過人類的反饋進行訓(xùn)練優(yōu)化。通過人的指導(dǎo),不斷告訴AI,這么回答是錯的、這么回答是很有條理的。讓AI盡可能地掌握與人類進行溝通的‘技能’,以保證AI能夠像人類一樣思考和回答問題,并和人類保持相似的價值觀?!?/p>
隨著ChatGPT帶動人工智能產(chǎn)業(yè)成長,引起新一輪全球科技競賽。中國的ChatGPT究竟該如何追趕?薛貴榮表示,國內(nèi)廠商要不惜代價地迎頭追趕,現(xiàn)在最重要的是追趕時間差。ChatGPT的智能化程度指數(shù)級增長且與日俱增。其最終的迭代信息差和發(fā)展高度決定了我國與國外的平均智商差。
“大模型近幾年持續(xù)火熱,ChatGPT能夠脫穎而出的根本原因是強化學(xué)習(xí)技術(shù)的創(chuàng)新和高質(zhì)量數(shù)據(jù)積累的疊加效應(yīng)。第一,只有基于深度強化學(xué)習(xí)體系,模型才會有更好的反饋機制和價值判斷標(biāo)準(zhǔn),才能掌握更多優(yōu)質(zhì)數(shù)據(jù)和答案,才更逼近人類智能。第二,只有對語料數(shù)據(jù)的抓取足夠充分,實現(xiàn)規(guī)模、深度、廣度的全覆蓋,才能提升高質(zhì)量數(shù)據(jù)密度,訓(xùn)練出好的大模型。要實現(xiàn)中國的ChatGPT大模型,這兩點缺一不可,而國內(nèi)廠商目前在這兩方面的探索還有較大提升空間。”
在模型方面,自然語言處理的兩大路線分別為谷歌BERT和OpenAI的GPT系列,兩者一直處于競爭狀態(tài)。此前,BERT模型的表現(xiàn)更好,也導(dǎo)致國內(nèi)企業(yè)大多追隨的是谷歌BERT路線,國內(nèi)的模型面臨技術(shù)路線的調(diào)整。
02
——————————
每個人都將擁有AI大腦
作為國家科技部云計算專家組成員,薛貴榮是國內(nèi)第一位在全球搜索領(lǐng)域頂級會議ACM SIGIR上發(fā)表論文的科學(xué)家。之后,也曾加入阿里巴巴,負責(zé)研發(fā)阿里全網(wǎng)搜索引擎。
2016年離開阿里創(chuàng)立天壤后,薛貴榮堅定了通用人工智能的探索道路?!白屆總€人都有一個AI大腦,是我們一直以來所堅持的方向,也是我們最大的目標(biāo)。”
迄今,薛貴榮帶領(lǐng)團隊先后在AI圍棋、交通、生物科技等領(lǐng)域開展探索,研發(fā)了AI圍棋TRGo、蛋白質(zhì)結(jié)構(gòu)預(yù)測系統(tǒng)TRFold,以及國內(nèi)首個城市級交通調(diào)度系統(tǒng)TRTraffic、蛋白質(zhì)設(shè)計TRDesign等多個大模型。
薛貴榮向《科創(chuàng)板日報》記者坦言,在創(chuàng)業(yè)過程中曾面臨中文版ChatGPT一樣的難題,即有標(biāo)注的數(shù)據(jù)量不夠。如果沒有高質(zhì)量的數(shù)據(jù),很難把技術(shù)做深。為此,天壤很早地就在實踐中引入了基于強化學(xué)習(xí)的數(shù)據(jù)增強機制。
“我們做強化學(xué)習(xí)在國內(nèi)是非常早的。2016年我們做AI圍棋的時候,用兩個機器人對抗的方法來生成大量的棋譜數(shù)據(jù),并通過優(yōu)勝劣汰的方式迭代優(yōu)化模型。那時候我們就發(fā)現(xiàn)用強化學(xué)習(xí)對模型的效果提升作用非常巨大,這個發(fā)現(xiàn)對當(dāng)時的我們來說非常震撼,也證明我們找對了路子?!?/p>
薛貴榮認為,生成高質(zhì)量數(shù)據(jù)的能力是天壤的優(yōu)勢。
“后來這套方法論我們在智能交通領(lǐng)域進行應(yīng)用。路上的信號燈基本上都是靠人力調(diào)控,調(diào)地好壞沒有很客觀的評價標(biāo)準(zhǔn)。同時信號燈又涉及上下游路口聯(lián)調(diào),流量24小時都在動態(tài)變化,要獲取訓(xùn)練數(shù)據(jù)非常復(fù)雜。我們搭建交通模擬器來生成數(shù)據(jù),通過強化學(xué)習(xí)不斷的進行模型的學(xué)習(xí)和數(shù)據(jù)生成,從而獲得高質(zhì)量的交通信號燈調(diào)控模型。
薛貴榮透露,在做蛋白質(zhì)研究時,同樣采用了強化學(xué)習(xí)來進行數(shù)據(jù)增強?!跋扔媚P皖A(yù)測結(jié)果,然后再把預(yù)測好的數(shù)據(jù)投喂給模型訓(xùn)練,用數(shù)據(jù)增強的方式讓模型質(zhì)量有了大幅度的提升。經(jīng)過幾個大的復(fù)雜場景的實踐,我們研究大模型訓(xùn)練的路線越來越通用,也形成了統(tǒng)一的思路?!?/p>
“先預(yù)訓(xùn)練一個大模型,然后用強化學(xué)習(xí)去‘教導(dǎo)’模型,讓模型生產(chǎn)出足夠多的新數(shù)據(jù),進行‘自學(xué)習(xí)’。就像一個小孩對應(yīng)一個教導(dǎo)老師,不僅學(xué)習(xí)知識,還學(xué)習(xí)方法,解決問題的能力就可以持續(xù)提升。這才能代表真正的人工智能?!毖F榮總結(jié)。
從科學(xué)家變成創(chuàng)業(yè)者,薛貴榮直言這條路上確實荊棘重重。
“創(chuàng)業(yè)的關(guān)鍵,還是要有核心技術(shù),并且靠核心技術(shù)能夠帶動商業(yè)。我覺得在國內(nèi),創(chuàng)業(yè)的門檻要足夠高,才能有機會?!?/p>
03
——————————
“這兩年AI應(yīng)用會極度爆發(fā),沖擊所有行業(yè)”
對未來人工智能的發(fā)展,薛貴榮表達了樂觀的態(tài)度。
“這兩年AI應(yīng)用會爆發(fā),而且會極度爆發(fā)。我覺得對所有的行業(yè)都會有沖擊。首當(dāng)其沖是客服會被顛覆,普通的律師、財務(wù)、人力等工作可能也會被替代。以后,人類要學(xué)會和機器一起工作,這是競爭力所在。機器將承擔(dān)絕大部分基礎(chǔ)性的工作,人類主要做好‘指導(dǎo)’的角色,并把精力投入到更有創(chuàng)造性的事情上。”
在替代一些基礎(chǔ)工作的同時,AI也將催生新的行業(yè),比如人工智能培訓(xùn)師。
“AI生產(chǎn)內(nèi)容的組織方式很重要。比如,讓AI提取財報的核心數(shù)據(jù),需要依賴人類給他指令,告訴它重點是什么。將來會'提問題'是一項很重要的能力。你問的問題越有挑戰(zhàn),越能持續(xù)幫助AI訓(xùn)練,升級AI應(yīng)用,AI回答問題也將更加準(zhǔn)確、全面。這在未來幾年會是一個很大的行業(yè)。”
ChatGPT所引領(lǐng)的這波人工智能熱潮,也會帶來人機交互方式的巨大變革,所有的應(yīng)用和平臺要基于ChatGPT框架重新開發(fā)。
“ChatGPT的成功不僅僅是新一代聊天機器人的突破,更是人工智能對整個信息產(chǎn)業(yè)帶來的革命,將帶來全要素生產(chǎn)率的極速提升。基于ChatGPT的全新的交互接口,所有的應(yīng)用、平臺、軟件將全部重新開發(fā),代替以往Windows視窗作業(yè)系統(tǒng)?!?/p>
薛貴榮進一步解釋,“現(xiàn)如今的所有界面可能都會被重構(gòu),最終將變成人類通過AI和數(shù)字世界進行自然語言交流??梢灾苯酉驒C器發(fā)送指令,解決問題。人和數(shù)字世界的通道徹底被打通,AI將變得更加實用。你可以直接跟AI交流,來完成一個客戶email的回復(fù),完成一個廣告策劃的文案,也可以完成會議的關(guān)鍵內(nèi)容整理,獲取財報的關(guān)鍵數(shù)據(jù)。他會變成你個人的一個AI助手。越多的交流,他就會越能明白你的意圖,幫你解決各類問題?!?/p>
除了工作場景,行業(yè)和企業(yè)級的應(yīng)用,也將被完全顛覆?!安辉偈莻鹘y(tǒng)的交互方式,而是直接給AI下指令:把招聘需求、大量文稿翻譯,面試和財務(wù)報告的整理等等?!?/p>
當(dāng)然,這背后都需要大模型的支撐。薛貴榮認為,未來模型會進一步細分,除了通用模型外,還會衍生針對不同細分領(lǐng)域的行業(yè)模型,以及企業(yè)內(nèi)部模型、個人模型等等。
“總之ChatGPT讓我們看到大模型有希望實現(xiàn)通用人工智能。未來針對某個場景有Best Model(最佳模型),每個行業(yè)、每個企業(yè)都需要有一個ChatGPT,再結(jié)合個人模型。其中,個人模型里會包括你的基礎(chǔ)信息、喜好偏向等,便于AI更準(zhǔn)確地為你提供個性化服務(wù)。”
我要評論反饋意見歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。發(fā)表評論
前阿里大數(shù)據(jù)中心高管、天壤CEO薛貴榮: AI將沖擊所有行業(yè) 人類要學(xué)會和機器一起工作|連線創(chuàng)始人
要聞
股市
關(guān)聯(lián)話題