一级毛片在线视频,久久超碰激情网,欧美日韩性爱一区二区,精品国产av

獨家對話(huà)騰訊混元劉煜宏:做大模型可以有「深圳速度」,但不能跳步

摘要

「越有決心情緒越穩,已悄然接入騰訊 700 個(gè)產(chǎn)品」。

加速,狂奔,硝煙四起,是過(guò)去一年大模型創(chuàng )業(yè)浪潮展現出的一番景象。有資源、有能力的騰訊,卻顯得「過(guò)于冷靜」了。

2024 年 5 月 30 日,騰訊推出基于混元大模型的 App——元寶,它的產(chǎn)品設計很簡(jiǎn)潔,打開(kāi)的第一屏,是一個(gè)搜索框,核心是先瞄準生產(chǎn)力場(chǎng)景,重塑信息的組織、交付。

這樣的產(chǎn)品理念從何而來(lái)?一個(gè)做底層技術(shù)出身的團隊,做大模型是首先是為了改造內部業(yè)務(wù)的工作流和產(chǎn)品。所以對于做什么,不做什么,騰訊混元大模型團隊有清晰的認知。生產(chǎn)率工具容錯率低,更考驗技術(shù)能力,進(jìn)一步迭代模型能力。

對外鮮有高調發(fā)聲,「水下」內部卻將大模型擺在戰略位置。推出元寶 App 之前,騰訊混元大模型作為技術(shù)底座的角色,已經(jīng)支持了騰訊內部接近 700 個(gè)「客戶(hù)」,并沉淀出一套平臺工具和合作模式。這讓騰訊對后來(lái)將模型算法、數據、工程能力等技術(shù)能力「外化」有了信心,一切也順其自然。

騰訊元寶發(fā)布之后,騰訊混元大模型負責人劉煜宏收到一些反饋,讓他感到驚喜,「一些好的公眾號內容已經(jīng)被『遺忘』,但元寶挖掘出來(lái),重新做了信息組織」?!笡](méi)有上帝視角」,用戶(hù)需求越滾越大是產(chǎn)品最好的驗證。

「一年后國內的模型能力將拉齊」的預判在今天被驗證,再次證明了圖快走捷徑做大模型沒(méi)有意義。對于 OpenAI 的示范效應,劉煜宏說(shuō),即便后來(lái)者看到一條確定性高的路徑,也得走一遍。試過(guò),才能跑得越來(lái)越快,縮短每一次追趕的時(shí)間。被問(wèn)到之后的計劃,劉煜宏說(shuō),多模態(tài)甚至全模態(tài)的理解和生成都是「必答題」,當下也會(huì )讓模型在「多一些思考」、增強推理能力上下功夫。

大模型注定是一場(chǎng)長(cháng)跑,「AGI 目前更像信仰」,但將騰訊混元大模型能力在內部 700 個(gè)業(yè)務(wù)上用得好,是劉煜宏認為對于 AGI 的務(wù)實(shí)追求。有遠見(jiàn)但務(wù)實(shí),也是混元團隊在大模型上的世界觀(guān)對齊。

在近兩個(gè)小時(shí)的直播里,關(guān)于騰訊的大模型思考,混元的做與不做,元寶將與騰訊生態(tài)如何產(chǎn)生聯(lián)動(dòng)等話(huà)題,劉煜宏為我們做了坦誠的梳理和解答。

以下是這次直播對話(huà)的實(shí)錄,經(jīng)極客公園整理后發(fā)布:

01 做大模型可以有「深圳速度」,但不能跳步

張鵬:去年 9 月騰訊混元大模型正式對外亮相,前段時(shí)間也發(fā)布了元寶這樣一個(gè)比較AI Native 的產(chǎn)品。但外界總體感覺(jué),騰訊比較沉穩,沒(méi)有瘋狂搶先手、也沒(méi)有一下放出很多產(chǎn)品,情緒一直比較穩定?

沉穩的背后,騰訊在大模型上是怎樣的策略?

劉煜宏:其實(shí)是「外松內緊」。外界看到不著(zhù)急,感知混元推出來(lái)比較晚,但坦白來(lái)講,這是一個(gè)非常卷的賽道,我們內部的節奏是非常緊張的。

騰訊從戰略上一直將大模型和生成式人工智能,視為百年不遇的、類(lèi)似工業(yè)革命一樣的機遇。

對外產(chǎn)品上,去年 9 月推出了「騰訊混元助手」小程序,今年 5 月 30 日推出了元寶 App,(也推出智能體開(kāi)發(fā)平臺——元器),但這些背后的底層能力其實(shí)我們做了很久,像廣告大模型在 21 年就開(kāi)始做了。元寶 App 發(fā)布一個(gè)月不到的時(shí)間里,更新了五六版,每一個(gè)小的迭代都解決了一部分問(wèn)題。

去年我們沒(méi)怎么對外發(fā)布產(chǎn)品,其實(shí)是內部率先用起來(lái)(大模型),比如騰訊會(huì )議、文檔,微信讀書(shū)的 AI 助手,包括它們在內很多內部產(chǎn)品已經(jīng)在用了,除了 API 的方式接入,還有一些業(yè)務(wù)會(huì )做精調。到目前為止,騰訊內部有接近 700 個(gè)業(yè)務(wù)接入混元,基本上騰訊所有的(業(yè)務(wù))都用。

騰訊內部近 700 個(gè)業(yè)務(wù)接入混元大模型|圖片來(lái)源:騰訊

張鵬:OpenAI一聲炮響讓大家看到這個(gè)新的趨勢,去年騰訊內部對于大模型是如何判定的?當時(shí)做決策的真實(shí)情況是什么樣的?

劉煜宏:GPT-3.5 出來(lái)前后開(kāi)始做混元這個(gè)項目。一些底層相關(guān)技術(shù)做得更早,剛才提到廣告大模型在 21 年就開(kāi)始做了,搜索相關(guān)的「推廣搜」場(chǎng)景也做了很久,運行大模型的底座從一幾年開(kāi)始就在建設。

對外的產(chǎn)品節奏看起來(lái)體感很慢,因為一開(kāi)始便深知這是一個(gè)長(cháng)期的項目。原來(lái)還說(shuō)百年一遇,現在發(fā)現是幾百年一遇的項目。不是短期一窩蜂就能搞定,像做原子彈,只有一步一步積累,把底子打牢。

舉個(gè)例子,做底層涉及到網(wǎng)絡(luò )問(wèn)題,沒(méi)有網(wǎng)絡(luò )、算力,怎么訓練?錢(qián)能跟上嗎?預算怎么投怎么收?等等,都得考慮。我們比較清醒,對底層困難預估得足。

一年半前我們判斷,一年后國內的幾家大廠(chǎng)在大模型能力都差不多。目前也認證了這個(gè)預判。我們雖然壓力大但有比較多的試驗機會(huì )。

張鵬:在大模型上,業(yè)界大家都比較著(zhù)急,也有創(chuàng )業(yè)者認為這個(gè)時(shí)候快速跟上是第一目標,甚至可以基于開(kāi)源模型做 post-train,因為開(kāi)源模型「看」過(guò)的那些數據,沒(méi)必要重新再「看」一遍。

劉煜宏:我們從來(lái)沒(méi)想過(guò)這條路,一開(kāi)始就決定冷啟動(dòng),從 0 到 1 完全自研,是一條非常艱難的路。

騰訊做產(chǎn)品有個(gè)原則,得自己驗證一遍,連顏色、像素、排布的選擇都是試驗出來(lái)的,頁(yè)面設計成瀑布流留存率就有多高?對男性用戶(hù)如何?等等這些都是 ABtest 出來(lái)的。

OpenAI 過(guò)去幾年走過(guò)的路,模型從 1.0 版本到 4.0 版本他是怎么走的?就算過(guò)程中你按他披露出來(lái)的一些技術(shù)路線(xiàn)走,該做的實(shí)驗一定不能少。比如也有很多超參數、數據配比要調,甚至中英文數據比例怎樣才是效果最好都要做大量實(shí)驗,花了很多時(shí)間在這里。

張鵬:打個(gè)比方說(shuō),下決心要給新時(shí)代生個(gè)孩子,不是說(shuō)趕緊抱一個(gè)過(guò)來(lái),是要生一個(gè)親生的感覺(jué)。

劉煜宏:對,我們從一開(kāi)始就堅定了全自研路線(xiàn),追求自研、可控度、安全。從 0 到 1 自主探索,包括訓練、推理的框架平臺,模型預訓練、精調、強化、怎么對齊,數據,投入了大量資源。

坦白來(lái)講,大家都在看OpenAI的路線(xiàn),但不是你按 GPT-4.0 的套路走,就能行得通。

張鵬:要從 0 到 1 走一遍、但要更快速地走一遍,而不是找個(gè)捷徑只為了追上某個(gè)點(diǎn)。那么設定的這個(gè)起點(diǎn)是哪?

劉煜宏:如果說(shuō)大模型,可能從 Transformer 甚至更早。

我們會(huì )設定一些目標,比如一開(kāi)始對標 GPT-3.5,預計什么節點(diǎn)能達到 3.5 的什么水平,什么時(shí)候能在工程上追上。坦誠講,目前很多能力提升還真的是靠數據和工程。

目標是有的,但不能跳步。不能看到 GPT-4o 出來(lái)了,發(fā)現多模態(tài)融合做得好,就不考慮 GPT-3.5 了。我們評測 GPT-4o 確實(shí)比 GPT-4V、GPT-4 Turbo 那些版本的能力都強。但直接按 GPT-4o 路線(xiàn)走,估計大概率會(huì )失敗。

目前來(lái)看大模型怎么選擇路線(xiàn),還是一個(gè)實(shí)驗科學(xué),你得堆資源,人力,數據訓練,當看到就這么一條路,那么選它有很大概率會(huì )成功,把他們探索的加速走一遍,而不是直接到終點(diǎn)等著(zhù)說(shuō)就按這個(gè)路線(xiàn)走。

張鵬:大模型技術(shù)變化非???,一邊挖地基、一邊蓋樓的感覺(jué),這樓現在一下都蓋到比方說(shuō) 5、6 層了,統一多模態(tài)什么的全出來(lái)了。壓力會(huì )不會(huì )更大?還是說(shuō),打地基和不斷蓋樓的過(guò)程中,更有信心了?

劉煜宏:跑了一遍,當然更有信心。你看到蓋到 5、6 樓,不代表前面 1、2、3、4……樓就不需要,只不過(guò)你可以蓋得更快,深圳速度一天一層樓類(lèi)似這樣,所以一定是要把從零到一的過(guò)程重新走一遍。

張鵬:你們的做法還是很?chē)乐數?。煜宏你在騰訊多少年了?

劉煜宏:我 05 年加入的。

張鵬:20 年了,那你一定對騰訊的風(fēng)格非常了解。去年很多大廠(chǎng)積極地搶身位,騰訊好似不爭不搶?zhuān)趦炔客^勁的。這個(gè)是騰訊骨子里帶的做事風(fēng)格?

劉煜宏:我在騰訊一直做技術(shù)。坦白講,做技術(shù)、產(chǎn)品是可以借鑒的,但也有個(gè)詞叫「空中樓閣」,沒(méi)有地基你就上不去。這可能也是騰訊的風(fēng)格。

別人用三年從版本 1.0 迭代到 5.0,你用半年走一遍,如果說(shuō)產(chǎn)品和技術(shù)有參考,那么最大的參考意義在這過(guò)程中。走一遍你會(huì )遇到同樣的東西,這時(shí)候會(huì )理解,「哦,為什么是這樣」,走一遍后也才知道,也許因為用戶(hù)群、生態(tài)等不同,另外一條路可能是更好的選擇。

02 從需求中長(cháng)出來(lái)的元寶 App

張鵬:你剛講很多騰訊內部的產(chǎn)品在用混元大模型了,能不能舉幾個(gè)混元給原有產(chǎn)品帶來(lái)新的 Feature(功能/特性)的例子?

劉煜宏:最新的例子,微信讀書(shū)里的 AI 讀書(shū);微信輸入法 AI 幫助擴寫(xiě);騰訊會(huì )議里的 AI 助手,能給晚加入會(huì )議的觀(guān)眾總結之前別人講了什么,把一次很長(cháng)會(huì )議的會(huì )議紀要給摘出來(lái)。還有騰訊文檔里的續寫(xiě);企業(yè)微信里的翻譯幫助與海外同事交流?,F在騰訊旗下的協(xié)作 SaaS 全都接入了騰訊混元大模型。

再早一點(diǎn)的例子,智能客服在內部最為普遍。其實(shí)在用大模型之前,智能客服就做得挺成熟的,但大模型還能再提升 20%,這種程度的效率提升。

其實(shí)做了(大模型)產(chǎn)品之后,也幫助了自己很多,比如用 code copilot 寫(xiě)代碼(涵蓋前后端開(kāi)發(fā),C,C++,Java,Go,Python 多開(kāi)發(fā)語(yǔ)言)的采納率有 30%,相當于 100 行代碼有 30 行是AI寫(xiě)的,而且被采納。設計師設計 logo 時(shí)也用 AI 文生圖來(lái)幫忙,每天千萬(wàn)級收入的廣告業(yè)務(wù)的一些素材,就 是用 AI 助手來(lái)做的。大模型對于降本增效起到很大助力。

張鵬:你剛提到,騰訊內部接近 700多個(gè)產(chǎn)品在用混元大模型,算是混元的「內部客戶(hù)」已經(jīng)有 700 家了,那你怎么服務(wù)得過(guò)來(lái)?同時(shí)還得兼顧不斷前進(jìn)的技術(shù)。

劉煜宏:內部調用量大概將近 3 億次了。去年我們發(fā)布(節奏)慢,一部分原因也是我們投了很多資源先服務(wù)好內部的「客戶(hù)」。騰訊做事情,對外開(kāi)放前一定要先在內部打磨好,自己的狗糧自己先消化。

同時(shí),騰訊確實(shí)有最齊全的業(yè)務(wù)場(chǎng)景,辦公協(xié)作、游戲、社交、推廣搜等等。在這些豐富的場(chǎng)景中,也能練兵,也能練模型。精調、以及其他給產(chǎn)品的反饋,反過(guò)來(lái)又反哺到主模型里。比如,會(huì )議總結、function call 等。

對于內部產(chǎn)品接入混元,我們提供三種模型來(lái)支持。

第一種叫全托管,給沒(méi)有那么強研發(fā)資源的團隊,他們提業(yè)務(wù)需求后,我們想辦法把模型精調好,他拿走直接用;

第二種叫半托管,有些業(yè)務(wù)有自己的研發(fā),也能做算法優(yōu)化,我們一起共建,一人一半,他們搞不定我們再上。最近兩年「開(kāi)源協(xié)同」在騰訊內部很流行。

還有一種,我們把模型開(kāi)放后就不管了,剩下的業(yè)務(wù)如果有需要,自己加數據、自己調。

我們去年也是花了大半年,慢慢把幾個(gè)模式跑通。我們提供一站式精調服務(wù),叫「混元一站式」,允許他們做各種創(chuàng )作、優(yōu)化,內部根據需求調用資源,模型、算法、插件。

張鵬:三種模式占比如何?

劉煜宏:7 成左右拉 API 就可以了,啥都不用管。另外 3 成多少要精調,這其中拿走模型完全自己精調的會(huì )比較少,因為有門(mén)檻,我們一起參與的進(jìn)展會(huì )更快。

張鵬:70% 的業(yè)務(wù)直接調用混元API,30% 要精調,哪些產(chǎn)品、業(yè)務(wù)要重點(diǎn)支持?這個(gè)選擇權到底在誰(shuí),或者看業(yè)務(wù)部門(mén)誰(shuí)更有影響力嗎?

劉煜宏:這時(shí)候我們會(huì )基于兩點(diǎn)考慮,一是復雜度,投入多少資源能幫你解決問(wèn)題;二是同等難度和投入的情況下,先考慮戰略重點(diǎn)。

資源配置上,其實(shí)主要看客觀(guān)需求。目前 70% 是 API 模式就能搞定,用的是大模型的通用能力。那就看什么場(chǎng)景用大模型的通用能力就可以解決,比如像娛樂(lè )場(chǎng)景這樣容錯度高的場(chǎng)景,沒(méi)有強解決問(wèn)題的能力也行。但要做金融、醫療、法律等嚴肅場(chǎng)景,不能有幻覺(jué),通用 API 不一定搞得定,要專(zhuān)門(mén)精調,為嚴肅場(chǎng)景做大量?jì)?yōu)化。

所以,第一是看用戶(hù)選擇。第二,這個(gè)數據在不同階段也會(huì )變。最開(kāi)始我們支持騰訊會(huì )議、騰訊文檔時(shí),擴寫(xiě)、潤色、總結能力都是需要定制的。一旦做好了,這個(gè)能力就能變成通用 API 能力,開(kāi)放出來(lái)給以后接入的業(yè)務(wù)用,這時(shí)候就不再需要定制了。比如給騰訊會(huì )議做好了,騰訊文檔、騰訊郵箱也有類(lèi)似的需求。

張鵬:把模型做好,這幾種模式跑順,服務(wù)好 700 家「內部客戶(hù)」,是挺花時(shí)間的,所以你們去年不著(zhù)急對外說(shuō),是在忙著(zhù)解決服務(wù)內部的問(wèn)題。

劉煜宏:最開(kāi)始做混元,沒(méi)想要做 ToC 產(chǎn)品,是要把基礎模型打磨好,服務(wù)內部需求,這是我們原來(lái)的邏輯。

當我們在內部很多產(chǎn)品、不同場(chǎng)景里驗證后,發(fā)現這個(gè)能力可以拿出來(lái)給大家用,所以去年 9 月份推出了「騰訊混元助手」小程序,因為覺(jué)得在微信生態(tài)里也可以用。但后來(lái)發(fā)現這樣做也有不足,比如使用時(shí)被聊天打斷,沒(méi)法持續地對話(huà),它就沒(méi)法成為一個(gè)好用的 AI 工具。于是推出了 App。

整個(gè)過(guò)程里,我們不斷地思考、調整方向。從做一個(gè)底層模型、一個(gè)基礎功能、平臺服務(wù)內部業(yè)務(wù),到后來(lái)發(fā)現,如果不探索原生AI大模型應用,不知道怎么跟業(yè)務(wù)更好合作,所以又前進(jìn)了一步,從小程序,到 Web 產(chǎn)品,App 產(chǎn)品。

張鵬:市面上也有很多比較熱的大模型產(chǎn)品,主打陪伴類(lèi)等等,你們「元寶」做得比較簡(jiǎn)單,界面就一個(gè)框,當時(shí)是怎么思考的?

元寶 App 第一屏界面|圖片來(lái)源:騰訊

劉煜宏:選擇現在這樣的界面,還是想回歸「用戶(hù)到底需要一個(gè)什么樣的AI產(chǎn)品」?

現在大模型的使用人群,學(xué)歷較高、職場(chǎng)人士占多,所以偏工作和學(xué)習的場(chǎng)景更重要,娛樂(lè )屬性也有,但重要性相對低。相應地,我們的 slogan 也調整成,「輕松工作,多點(diǎn)生活」。不是不做娛樂(lè ),也留了一些智能體在上面。我們也有開(kāi)放的平臺——元器,上面能做很多智能體,角色扮演、陪伴等等。

先選擇把生產(chǎn)力場(chǎng)景的用戶(hù)痛點(diǎn)用 AI 搞定,信息搜索、寫(xiě)文檔、想創(chuàng )意、知識獲取、閱讀等需求。比如搜索場(chǎng)景,我們先做好信息搜索、大模型「閱讀」順暢,又改善了信息源的陳列,提供了又簡(jiǎn)潔又分層次的信息源,提高生成內容的可信度,規避大模型的幻覺(jué)。

后面圍繞著(zhù)搜索、閱讀、寫(xiě)作、畫(huà)畫(huà)和創(chuàng )作等場(chǎng)景做好,這些被視為大模型的基礎能力。

我們做產(chǎn)品經(jīng)常說(shuō),做加法容易,做減法難。這是為什么我們一開(kāi)始就用很少的東西,用一個(gè) AI 搜索做,另外還有一個(gè)發(fā)現頁(yè)面,上面有些智能體,目前并不多。這也代表騰訊一個(gè)做產(chǎn)品的理念,小而精,做減法。先瞄準能提升大家效率的、最有用的場(chǎng)景,把它做透。我們希望提升信息組織、以及信息被找到的效率。

張鵬:為什么不做娛樂(lè )產(chǎn)品?是產(chǎn)品取向選擇,做提升生產(chǎn)力更重要?還是從技術(shù)上來(lái)看,認為做娛樂(lè )對于技術(shù)提升不重要?

劉煜宏:不是說(shuō)娛樂(lè )不重要,大家還是需要情感陪伴的。當下先選擇工作和學(xué)習場(chǎng)景,第一個(gè)有選擇的原因。第二個(gè),當我需要陪伴的時(shí)候,AI 能給到什么樣的幫助?角色扮演的產(chǎn)品有很多,但(模型)能力做不到那么好。打發(fā)時(shí)間,暫時(shí)只能做到這點(diǎn)。

張鵬:人們對「殺時(shí)間」的事包容度高,模型能力沒(méi)那么好也能沒(méi)準讓用戶(hù)愿意掏錢(qián)。

劉煜宏:對。這是選擇問(wèn)題。我覺(jué)得選擇娛樂(lè )場(chǎng)景這個(gè)目標,對目前大模型的這個(gè)階段的發(fā)展不是很好?;趯ψ约旱恼J識和選擇,先把技術(shù)能做的做好。我們先把底層模型、基礎的產(chǎn)品體驗、元寶體系做好了,在此之上開(kāi)放一些東西,就像微信,小程序,公眾號,都是生態(tài)。那娛樂(lè )的事情就交給生態(tài)產(chǎn)品,QQ、游戲、視頻、音樂(lè ),他們做娛樂(lè )場(chǎng)景比我們更擅長(cháng)。

張鵬:騰訊本身就是一個(gè)龐大的產(chǎn)品生態(tài),元寶未來(lái)會(huì )跟騰訊的產(chǎn)品體系打通嗎,比如微信?這方面有什么計劃?

劉煜宏:我們跟微信團隊一直有互動(dòng)。比如元寶里用得好的東西想要分享到微信,或者在微信里傳個(gè)文件,能不能用元寶打開(kāi)?這些互動(dòng),我們有探討怎么做會(huì )更好。但因為微信用戶(hù)非常龐大,任何一點(diǎn)小改動(dòng),都可能影響上億人的體驗,所以也非常謹慎。

5 月 30 號元寶發(fā)布之后,外部解讀元寶和騰訊生態(tài)產(chǎn)品的打通,有點(diǎn)出乎意料。我們確實(shí)會(huì )考慮與騰訊生態(tài)如何互動(dòng),但畢竟元寶還是一個(gè)很小的產(chǎn)品,還在嘗試階段;另外,用戶(hù)需求真的是慢慢發(fā)展起來(lái),才會(huì )變成所謂的戰略,我們并沒(méi)有上帝視角,還是基于用戶(hù)的需求來(lái)考慮。

比如面對用戶(hù)搜索的需求,我們要做一個(gè)什么樣的信息檢索,搜哪里?那我們有搜一搜、新聞、視頻、音樂(lè )、企鵝號,包括公眾號是一個(gè)很好的內容源,這是一個(gè)順理成章、跟著(zhù)用戶(hù)需求慢慢出來(lái)的事情。

我們也看到很多創(chuàng )作者來(lái)說(shuō),元寶 App 里加入公眾號的內容源是一件非常好的事情,一些好的內容都被遺忘了,元寶還能把它挖出來(lái),讓它重新火一把。

但我們有一些更長(cháng)期的目標,我們考慮的是,混元怎么支撐內部業(yè)務(wù)、做到何種程度。

張鵬:看來(lái)騰訊對自己要求很高,就像你說(shuō)的,如果沒(méi)有吃過(guò)自己的狗糧,沒(méi)有真正用起來(lái),不太愿意讓別人為我付代價(jià)。但同時(shí),這會(huì )不會(huì )降低了對外開(kāi)放、快速迭代探索的可能性,讓更多力量一起「共創(chuàng )」本身不就是一種「技術(shù)紅利」嗎?

劉煜宏:確實(shí),讓更多人進(jìn)來(lái),用戶(hù)、開(kāi)發(fā)者、企業(yè)進(jìn)來(lái),一定會(huì )產(chǎn)生更多可能?;煸环矫媸峭ㄟ^(guò)內部比較全面的生態(tài)體系來(lái)打磨、創(chuàng )新。經(jīng)歷了內部的一輪洗禮,外部的需求會(huì )更游刃有余。而且,任何一個(gè)東西,你拉長(cháng)看,現在的進(jìn)展可能會(huì )顯得微不足道的,假如外面是個(gè)大海洋,先在湖里面練好游泳再出去會(huì )做得更好。

同時(shí)我們也有混元 API 供外界用,其中混元 lite 的模型是直接可以免費使用,還有元器開(kāi)發(fā)平臺,上面已經(jīng)有很多開(kāi)發(fā)者做智能體,然后分發(fā)到元寶、QQ、小程序等渠道上面去用。

比如騰訊云的同事會(huì )基于做好的底層基礎模型,做行業(yè)大模型,針對企業(yè)做服務(wù)。這部分增長(cháng)非常迅猛,免費模型的調用量、付費版都增長(cháng)了很多,我們也要投很多資源來(lái)支持、優(yōu)化。

03 AGI 是信仰,眼下的目標是:讓模型多一些思考

張鵬:你怎么看 Character.ai,一個(gè)以前不存在的產(chǎn)品形態(tài)在未來(lái)的發(fā)展空間,以及對于技術(shù)的要求會(huì )是怎樣的?

劉煜宏:類(lèi)似角色扮演的需求,我們在 ToB 的場(chǎng)景里也遇到了,比如類(lèi)似智能客服的接待助手。會(huì )告訴它「你是誰(shuí)」,但發(fā)現聊了幾十輪之后,它可能就忘了自己是誰(shuí)。

Character.ai 很火,我們做了很多用研,但最后選擇沒(méi)做類(lèi)似產(chǎn)品,因為混元還是希望做一個(gè)(技術(shù))平臺,我們會(huì )往它所需要的底層能力去做,長(cháng)文本、長(cháng)窗口的能力、記憶能力等。

這些角色產(chǎn)品的探索可能更適合騰訊的產(chǎn)品團隊,他們來(lái)做會(huì )有更多想象空間。另外,從騰訊的角度看,也還是希望做底座能力和產(chǎn)品,把空間開(kāi)放給市場(chǎng)上更多創(chuàng )業(yè)公司。

張鵬:所以你目前看得不是產(chǎn)品,而是產(chǎn)品背后需要的能力和長(cháng)期有沒(méi)有意義。我可以理解為,混元的目標是做好技術(shù)底座,為騰訊豐富的產(chǎn)品條件和用戶(hù)場(chǎng)景,做好AI Native 的準備?

劉煜宏:一定程度說(shuō)可以這樣說(shuō)。但混元團隊也沒(méi)走過(guò)大模型這條路,也要探索原生的應用和創(chuàng )新。

就像剛提到的元器,我們做好底座,創(chuàng )作、工作流平臺,業(yè)務(wù)部門(mén)和用戶(hù)拿來(lái)做智能體,實(shí)現各種各樣的想法,這是我們的定位。

我們做探索的同時(shí),把底座的技術(shù)能力打造好,這是有門(mén)檻和難度的。

張鵬:有人說(shuō)對國內的大模型來(lái)說(shuō),GPT-4o 是「必答題」,Sora 是「選答題」,哪些在你們看來(lái)是技術(shù)趨勢上的必答題和選答題?

劉煜宏:GPT-4o 和 Sora 背后代表的多模態(tài)甚至全模態(tài),對我們來(lái)說(shuō)都是必答題,但一般沒(méi)做出來(lái)之前,也不會(huì )對外說(shuō)。

做與不做,可能只是一個(gè)特定資源條件下的選擇問(wèn)題。

騰訊為什么必做?因為騰訊業(yè)務(wù)場(chǎng)景齊全,社交、游戲、內容,每個(gè)模態(tài)跟我們場(chǎng)景都有契合點(diǎn),不做的話(huà),可能某個(gè)方面未來(lái)會(huì )缺。

一個(gè)東西將語(yǔ)音、文本、圖像、視頻都能搞定,全模態(tài)進(jìn),全模態(tài)出,需要一些時(shí)間和資源。也許每個(gè)階段會(huì )有不同重點(diǎn)。

張鵬:從混元的角度,你會(huì )怎么定義 AGI?

劉煜宏:目前 AGI 作為信仰比較合適。業(yè)界沒(méi)有一個(gè)對 AGI 量化的定義,連定性都未必定的出來(lái)??赡軓臉I(yè)務(wù)的角度,可以定義一個(gè)可以操作執行的 AGI 目標。

但我最近在思考,讓模型稍微多一些思考,這件事挺重要的,因為可能生成的質(zhì)量會(huì )比過(guò)去高很多,我們接下來(lái)可能會(huì )花更多時(shí)間在這里。

ChatGPT 最早你問(wèn)他一個(gè)問(wèn)題,他馬上吐字回答問(wèn)題,有點(diǎn)像「快思考」或者說(shuō)沒(méi)有思考的直覺(jué)反應,但它可能怎么也想不出來(lái)一個(gè)空城計。

讓模型做AI搜索,或者其他讓它多加幾層思考、強迫他多做思考的動(dòng)作,有助于進(jìn)一步提高模型的推理能力。

7 月 1 日,「騰訊元寶」AI 搜索能力升級,上線(xiàn)深度搜索模式,可從深度和廣度兩方面,提供更結構化、更豐富的回答,并可同步生成內容大綱、思維導圖及相關(guān)人物事件梳理。|來(lái)源:騰訊

張鵬:有沒(méi)有對需要達到的能力范疇的定義?

劉煜宏:過(guò)去幾年里有句話(huà)比較流行,有多少人工就有多少智能。以前智能是靠人堆起來(lái)的,人類(lèi)對齊有很多數據要標注,甚至 OpenAI 也靠高質(zhì)量的標注。坦白來(lái)講,目前要做到(絕對的)AGI 沒(méi)有那么樂(lè )觀(guān)。

務(wù)實(shí)一點(diǎn)看,針對騰訊內部那么多的業(yè)務(wù),如果大模型能把他們的需求都搞定,那可以說(shuō)它具備了比較好的智能,這可能是通向 AGI 的最佳實(shí)踐,工具或技術(shù)從來(lái)都是滿(mǎn)足人的需求。

目前面對騰訊內部接近 700 個(gè)業(yè)務(wù)的需求滿(mǎn)足情況,如果讓我打分,一部分場(chǎng)景合格,但是大部分坦率來(lái)講只是暫時(shí)夠用,要用得好,還有很多努力要做。在這個(gè)過(guò)程中探索 AGI,也可以算我們的一個(gè)實(shí)踐路徑。

當然我們也有比較前沿的科學(xué)探索,騰訊 AI Lab 在做等等,要花點(diǎn)耐心,把應用和研究結合起來(lái),一起做。

張鵬:想象一下混元在三年以后會(huì )什么樣?

劉煜宏:這個(gè)年代哪能定三年目標,因為技術(shù)曲線(xiàn)仍然陡峭,邊走邊看。

要說(shuō)做產(chǎn)品,很像寫(xiě)小說(shuō),有的時(shí)候不是一開(kāi)始就想好結局。比如 Sora 出來(lái)之前,做文生視頻的肯定不會(huì )走那條路。GPT-4o 之前,大家覺(jué)得 4V 很牛了,變化太快了。

我們投了很多資源,做好長(cháng)期戰斗的準備。讓我想,三年如何講做成功了,可能無(wú)非是 AI in all。

張鵬:不是一下投進(jìn)去,而是所有的東西都被AI逐漸滲透進(jìn)去。

劉煜宏:大模型要改造流程和產(chǎn)品。我希望不用到三年,騰訊產(chǎn)品和技術(shù)平臺都用大模型做了改造,讓大模型幫大家做降本增效的事情,這是我對未來(lái)的所想。

 

*頭圖來(lái)源:極客公園

本文為極客公園原創(chuàng )文章,轉載請聯(lián)系極客君微信 geekparkGO

最新文章

極客公園

用極客視角,追蹤你不可錯過(guò)的科技圈.

極客之選

新鮮、有趣的硬件產(chǎn)品,第一時(shí)間為你呈現。

張鵬科技商業(yè)觀(guān)察

聊科技,談商業(yè)。

志丹县| 信丰县| 定南县| 松潘县| 屯留县| 长子县| 白朗县| 牡丹江市| 凭祥市| 旌德县| 耿马| 浮山县| 台前县| 扶风县| 花莲县| 宣恩县| 金川县| 灵台县| 鸡东县| 双江| 和田县| 衡阳县| 泽普县| 永川市| 德昌县| 民和| 长宁县| 温宿县| 苏尼特右旗| 开江县| 唐海县| 宝兴县| 钟祥市| 班玛县| 高尔夫| 广宁县| 沙田区| 从江县| 玛纳斯县| 隆尧县| 高州市|