文|張嘉琦
編輯|張友發
來源:毒眸(ID:DomoreDumou)
AI的風潮,不僅促使很多新公司的加入,也讓正在發展中的科技公司找到了新的方向。對于這些公司來說,擁抱新技術的速度越快,就越有可能抓住新的機遇,從而避免被其他公司實現彎道超車。
2015年成立的世優科技,是一家聚焦于數字人和虛擬內容的數字技術公司。在過去幾年,其核心產品和競爭力一直擁有著嫁接不同技術的可能性。
在被稱為“元宇宙元年”的2021年,數字人領域迎來了新的機會,相關公司也因此獲得了資本的高度關注。作為國內最早一批研發實時數字人的技術團隊,世優科技在去年連續完成了兩輪過億元融資,又在如今AI浪潮來臨時推出了新的產品。
自2004年起就開始參與數字人相關技術研發,世優科技的創始人兼CEO紀智輝在這近二十年間見過太多次新技術來臨的時刻?;蛟S也是因為這樣,他對這波AI浪潮的興奮感并沒有其他年輕創業者那么強烈,用一個詞來總結,可能是“謹慎樂觀”。
對于AIGC的嘗試,也仍然是以原本業務為圓心進行的外環拓展,他告訴毒毒眸(ID:Domoredumou):“確切地說,世優不太算是AI公司,我們本質還是一個數字人公司?!?/p>
更大的不同點,在于對機會的判斷?;蛟S更加原生的AI創業者在這波浪潮中,對機會的潛能判斷上不封頂,但紀智輝仍然在行業既有格局中思考著AI的機會:大廠還是占據著絕對的優勢地位,創業公司可能在細分垂直、項目服務市場上會有更多的機會,而TO C平臺型的機會在原本的主導者將更有優勢。
我們與紀智輝聊了聊AI浪潮來臨后,世優科技所進行的轉向,包括他們新推出的AI數字人產品世優BOTA,他對這波創業風潮的看法,和他所認為的、創業者們的機會。
以下是對談實錄:
數字人能代替人工嗎?
毒眸:作為一家數字人公司,我們和AI的結合點在哪里?
紀智輝:數字人和元宇宙底層還是需要有AI去加持和助力,數字人也不能只是靠人來驅動,未來AI驅動會是大趨勢,所以AI的發展跟我們的關系也比較密切。本質上我們公司的核心邏輯是圍繞數字人的應用場景來展開,AI+數字人屬于數字人的應用場景之一。
毒眸:可以介紹一下前幾天發布的新產品“世優BOTA”的研發過程嗎?
紀智輝:因為AI范圍很大,我們更關注的是讓數字人用AI來驅動,以前像這種AI更多的是傳統的NLP(自然語言處理,Natural Language Processing),就像小愛音箱,底層邏輯是輸入文本—輸出文本。
傳統NLP比較傻,比較機械,大部分問題它是回答不上來的,也沒有邏輯和條理,更多是通過類關鍵詞的方式做解答,當然它有一定的語義理解能力,但很輕度。
基本上原來傳統NLP的廠商會比較難受,需要自我革命升級,而且這種優勢是碾壓式的,所有以前做的代碼和訓練工作都廢掉了。
ChatGPT出來之后,我們都覺得這是讓數字人“變聰明”的機會,于是大概在半年前就接入了,然后發現一個問題,它雖然很聰明,但不可控,比如會胡編亂造,還說得很正式,我們公司實際控制人是馬斯克都敢說,不能適配我們想做的商業化落地場景。
后來我們就研究了Open AI的開源框架和機制,在上面做了一些二次開發修改,加了一些邏輯,形成了現在的世優BOTA。我們給它的定位是AI數字員工,分兩部分,一部分是AI專有GPT能力,另一部分是數字人的形象表現和交互能力。
毒眸:在研發過程中,有遇到哪些挑戰?
紀智輝:太聰明了,不好控制。ChatGPT的智商肯定是夠的,如果你要喂給它特定的數據,比如公司介紹,理論上它學了就會,但實際上不是這樣,因為它聰明的基礎是來自于過去在全球范圍內學到的數據,它已經認識很多東西,再喂它新的,它就會自動聯想和泛化。邊界拆分很困難,要么就會特別保守,要么就開始亂說。
數據在喂進去的時候,也需要做一些梳理。因為人在閱讀的時候,不會太講究主謂賓關系,就像中國人寫詩一樣,講究的是對稱。這個時候就得人工做一些標注,讓AI能夠像理解英語一樣理解中文的意思。我們也在借助ChatCPT來幫我們訓練一部分數據,再加一些人工干預。
毒眸:在訓練數據的過程中,人工干預的比例大概是多少?
紀智輝:要看原始的資料跟素材是什么狀態,因為客戶提供的素材,什么類型都有,像網頁、表格這些,只能人工去理解,再變成文本輸入。
毒眸:訓練一個企業專屬的AI模型,大概需要多長時間?
紀智輝:一般公司都比較快,基本上就是找一個人梳理,客戶也會協助,可能半天、一天基本上就可以搞定。
毒眸:目前看來“世優BOTA”承擔的還是人工客服的工作,但理論上講,如果真的有數字員工,應用的場景應該會更多吧?
紀智輝:理論上是這樣??头谴蠹夷壳霸谟?、最容易使用的一個場景。另外像是前臺、展廳展會的講解和接待,還有一些依托短視頻和直播的銷售場景、品牌宣傳等等,這些場景是目前可以落地的。BOTA主要是解決文本輸入輸出精準可控、以及在特定領域精確回答的問題。
毒眸:相當于BOTA是我們正在探索的“AI+數字人”的一個方向,其他方向我們有考慮過嗎?
紀智輝:也有,比如針對TO C方向的個人數字助理。其實BOTA的未來就是數字永生,我們會先從B端(也就是行業客戶)去切入,再向個人做延展。因為能夠訓練企業數據的話,也能夠訓練個人數據,先復刻個人的形象和聲音,再進行情緒、情感、人格和個人經歷知識能力方面的訓練,最終實現個人的數字分身。
毒眸:目前從產品端的角度來說,BOTA跟真人相比有哪些還需要繼續改進的部分?
紀智輝:現在反應速度比較慢。像我們現在聊天,可能我說一半你可以打斷我,我也可以打斷你,因為我聽懂了,但是AI不會,你必須得讓他完整表達,很難去打斷。而且它的思考和運算還有延遲的,它也看不到我們的表情、情緒和身體動作。
毒眸:所以BOTA現在投入使用后,也還是需要一定的人力輔助?
紀智輝:還是要看應用場景。線上主播、展廳展館的介紹員、線上客服這些工作,AI基本都能獨立完成。但是很多時候還是需要人工介入,很激動著急的投訴行為,就不能再用AI和他溝通了。
毒眸:未來產品迭代的方向是什么?
紀智輝:第一肯定是從文本向多模態做延展;第二,我們也在試圖對底層能力做一些研究,比如性格、情感和情緒控制,但這個方向風險很大,因為大廠也在做類似的事情,未來可能會被碾壓。所以我們還是基于自身優勢,把數字人和商業應用場景做結合,讓它能完成更多的工作。
毒眸:流程類的工作會更早地被替代,內容相對不太固定的工作會晚一些被替代,是嗎?
紀智輝:其實還得看不同公司的情況。從每個行業來看,有的公司會慢一點,他不著急,也有公司會激進一點。但是這個趨勢是擋不住的,如果拒絕AI的話,就會逐漸失去競爭力。
毒眸:目前接觸下來,哪種類型的公司會更敏感一點?更愿意接受新的變化?
紀智輝:從接受度來講,整體大家還是都愿意接受的,但是最后愿不愿意買單就不一定了。也有些公司傾向于先觀望。
毒眸:那么就大的趨勢來看,目前AI和數字人結合還有哪些應用的機會和方向?
紀智輝:那想象空間就很大了。從我個人來看,這次的AI有點類似“革命性的進展”,會對很多行業產生很大的沖擊。
用我們自己的工作來舉例,現在我們設計數字人,可以直接用原始照片和描述性的詞匯,用AI生成一些初版,給客戶挑選一個方向后,我們再做細調,這個過程比原來快很多,很多人也就因此被替換掉了。
這個過程和BOTA的邏輯不太一樣,是一種多維度的替換。因為大部分人在做工作的時候,都是去理解需求,再輸出結果,而當AI同時具備理解能力和處理能力時,只要把輸入和輸出的工具對接起來,就完全可以代替人類。而且隨著社會的發展,這種替換會越來越容易和普遍。
混亂、危險但迷人的創業機會
毒眸:我們最近跟一些創作者聊天,感覺AI的方向有很多創業機會,很多人都在嘗試,你有在關注新的工作或者新產品嗎?
紀智輝:有,最近市場比較混亂,大家都蠢蠢欲動又不敢動,因為風險很大,但是其他的地方都沒有出口了,所以大家都想做。綜合來講,創業還是挺難的,但是機會又很多,到底該做什么不該做什么,還不好說,而且很多公司不一定能搭上邊兒。
毒眸:因為世優很早就在研究技術相關的領域,包括數字人跟AI的結合其實也是現在很多人的創業方向,會比其他人更有機會和優勢嗎?
紀智輝:這里面也涉及到一些問題。從業務聚焦的角度來講,應該只做一個點,但是我們又跨出來了,又做了一個小模型的能力。小模型的能力也有不同的定位,如果被標準化,就變成了標準能力,另一種就是不能被標準化,必須得配套服務,這個部分大廠就很難拉平,因為除了開源框架之外,還有一部分是私有數據和訓練,這是服務性質比較重的。
用數字人來舉例,如果是拍個照生成的話,就屬于標準化。但我們現在做的是偏定制化的數字人,這個方向大廠不一定愿意做,因為能效很低,每一個數字人都要做半人工的調校。大廠可能更愿意在普適性、通用性的層面做訓練,所以在細分垂直領域我們可能會跑得快一點。
所以創業其實取決于定位選擇。新進來的創業者們怎么給自己定位?是跟大廠競爭,還是在已經有優勢的地方再去創造一個新產品?或者依托于抖音、快手等已有平臺,利用AI做工具輸出一些內容,當然這個是沒有未來的,只是趁著熱點薅一波流量。
毒眸:相當于大廠是比較傾向于做通用模型的,我們這類公司更傾向于做私有模型?
紀智輝:對,因為歷史是相似的。就像電商,最先做起來的肯定是淘寶的模式,誰都不會先做拼多多和京東。因為當市場足夠大的時候,肯定是從最賺錢的、規模最大的、最有普適性的時長開始切,切到最后大家發現太亂了,因為所有人都在里面,你就變得沒有特點。所以就開始出現拼多多、京東、抖音電商這些細分垂類。
毒眸:我們未來也還是沿著小模型、定制化的方向發展是嗎?
紀智輝:對,因為我們更多是做大行業品牌跟大B端的業務,對于定制和服務的要求比較高一點。不過我們也挺焦慮的,因為好多事情看得還不那么清楚,也沒法給出準確的判斷。你知道它會發生,但是不知道什么時候會發生,也不知道什么時候介入合適。
毒眸:現在很多創業者更傾向于TO B的商業模式,也是這個原因嗎?
紀智輝:對,因為TO C的領域就像其他傳統行業一樣,大廠已經形成了自己的格局,人才、資源這些東西都已經分完了。產品又好,人又多,流量也有,而且你收1塊錢,它可以不要錢,你不要錢,它可以補貼你10塊錢,打不過。
毒眸:即便現在有AI這個風口,做C端產品還是跟大廠競爭。
紀智輝:對,這種可以被標準化、市場規模足夠大的產品,對小的創業公司來講,不是說完全沒有機會,也有,但是特別特別渺茫,C的事情就是千軍萬馬過獨木橋,基本上只能給大平臺打工,這是事實。
毒眸:你現在的心情跟當時元宇宙特別火的時候心情有所不同嗎?
紀智輝:元宇宙是一個大的方向和概念,那個東西出現的時候,大家是不焦慮的,甚至很興奮,因為感覺發現了一個新的藍海,新的世界,我們可以去建設它?,F在是發現好像不太需要我們建設了,當然這里又出現了很多機會,所以會比較糾結。
毒眸:世優之前也有一些游戲客戶,在你看來,AI會給游戲行業帶來多大的影響?
紀智輝:他們應該已經開始用AIGC去輔助游戲的設計和腳本的創意策劃了,還有一些模型資產的制作生成,以及游戲里面一部分的NPC跟玩家之間的對話也比原來更豐富了。
毒眸:目前還不足以成為普遍現象對吧?
紀智輝:可能再過幾年,大家會更習慣于沉浸在另一個虛擬世界里,會對交互性、沉浸式的體驗有更多需求,但現在跟AI聊天還屬于小眾文化,很難對某個行業有顛覆性的影響。
毒眸:之前騰訊的副總裁孫忠懷說,他在2017年的一次演講提到,如果人工智能要達到人的智力水平至少還需要100年,結果現在6年就完成了。
紀智輝:智力水平是一方面,但好多問題并不是智商能解決的,要真正做商業化落地,讓AI產生應用價值,需要一系列的流程才能夠完成的,AI自己只是解決了一小部分的問題,很多時候還需要情商、資源和過程銜接,這些都得靠人來完成。
所以目前AI只能是一個工具,等未來它迭代到能夠連接自主意識,能夠思考,并且連上了生產制造設備,這個時候可能會影響比較大。
毒眸:之前每次有新的技術出現時,有的公司會迅速all in,但是有一些風口是過得很快的,所以他們會因此而陷入很被動的局面,你判斷AI會是一個可持續的、有前景的創業方向嗎?
紀智輝:說實在我還沒有想得特別明白,今年市場比較亂,到底是2B還是2C,借助這個工具能夠達到什么樣的水平,都不好說。但是綜合來講,是屬于比較容易能夠落地的。像是之前的元宇宙,那種沉浸式和體驗感,目前的移動端還實現不了,有一部分營銷在里面。
但AI的確是實實在在地把人力減下來了,還可以提升生產力。作為創業風口,好像也不會過得那么快,至少TO B的市場也足夠大,所以還是有得做的。
毒眸:感覺你對AI的看法還比較冷靜,因為AI迭代的速度好像比大家想得要快,很多人對此抱有很大的期待。
紀智輝:是的,但是它再快也得有人幫它去做落地嘛,人跟不上也不行。
本文轉載自微信公眾號毒眸(ID:DomoreDumou),已獲授權,版權歸毒眸所有,未經許可不得轉載或翻譯。
【免責聲明】
關鍵詞:AI
一只靴子終于落地了:網傳了大半年后,楊冪終于官宣與嘉行傳媒解約。楊冪更換了多年以來的微博頭像,發文:“共有從前,各有未來。”嘉行傳媒發布微博祝楊冪“未來一切順利”,并迅速地刪除了公司發布的藝人年終總結里楊冪的圖片。