一级毛片在线视频,久久超碰激情网,欧美日韩性爱一区二区,精品国产av

「橙篇」背后的百度文庫,如何做好「AI 原生化」?

摘要

百度大模型的「先鋒」,是怎么做產(chǎn)品的?

「底稿」對話(huà)欄目

誰(shuí)在影響、定義我們的時(shí)代?他們做了什么,如何思考?對話(huà)關(guān)鍵人物,記錄歷史底稿。

本欄目將持續推出。

對話(huà) | 張鵬
編輯 | 連冉、靖宇
累計 AI 用戶(hù)數已經(jīng)突破 1.4 億,使用次數突破 15 億——AI 重構之下,百度文庫煥發(fā)了全新活力。在「AI 產(chǎn)品榜」的 5 月份榜單中,百度文庫 AI 功能更是以單月 6536 萬(wàn)訪(fǎng)問(wèn)量位列國內總榜首位,甩開(kāi)第二名將近 1500 萬(wàn)的身位。
成立十余年的百度文庫,是如何在 AI 時(shí)代迸發(fā)出強大的吸引力的?
當 AI 作為一項創(chuàng )新的底層技術(shù)被整合進(jìn)產(chǎn)品系統中,如何理解百度文庫的演進(jìn)軌跡,及其在產(chǎn)品使用和目標上的轉變?作為行業(yè)最火的 AI 原生應用之一,它是如何實(shí)現進(jìn)化的?
近日,在與極客公園創(chuàng )始人、總裁張鵬的對談中,百度副總裁、文庫事業(yè)部負責人王穎給出了解答。
去年 8 月至今,百度文庫經(jīng)過(guò)大模型的重構,已經(jīng)實(shí)現了從內容理解、規劃到生成的全流程智能化。目前,百度文庫背后的團隊僅有兩百余人,而在交付上實(shí)現正反饋之外,他們甚至還做到了商業(yè)上的正循環(huán)。
在 5 月底,百度文庫推出了新產(chǎn)品「橙篇」,是行業(yè)首個(gè)集「專(zhuān)業(yè)知識檢索和問(wèn)答、超長(cháng)圖文理解和生成、深度編輯和整理、跨模態(tài)自由創(chuàng )作」的「查閱創(chuàng )編」一站式 AI 自由創(chuàng )作平臺,未來(lái),文庫和橙篇也會(huì )建立自己的內容分發(fā)體系。
在這一波大模型的浪潮中,百度文庫的轉型既借助了技術(shù)的躍進(jìn),也是對用戶(hù)需求深刻理解的體現。如今,百度文庫已進(jìn)入與過(guò)去截然不同的發(fā)展階段,產(chǎn)品正在并將繼續經(jīng)歷一系列變革,而這些變革或許將徹底改變人們對文庫的常規認知和使用習慣。
「理想的 AI,應該端到端解決問(wèn)題,讓機器像人一樣思考,讓產(chǎn)品像人一樣工作?!?/strong>AI 重構后的百度文庫,已經(jīng)做到了這一點(diǎn)。去年的極客公園創(chuàng )新大會(huì ) 2024 上,百度創(chuàng )始人、董事長(cháng)兼首席執行官李彥宏曾強調過(guò),AI 的真正價(jià)值在于原生應用的開(kāi)發(fā),而橙篇作為新近推出的 AI Native 產(chǎn)品,正在為用戶(hù)創(chuàng )作展開(kāi)更廣闊的可能。
從將所有旗下應用全部用大模型進(jìn)行重塑,到文庫成為跑在最前面的那個(gè)隊伍,可以看得到,百度做 AI 的決心并非紙上談兵,而是正在不斷突破創(chuàng )新應用場(chǎng)景,用 AI 深度重構產(chǎn)品,為用戶(hù)持續提供屬于這個(gè)大模型時(shí)代的智能增益。
在對談中,百度副總裁、文庫事業(yè)部負責人王穎輸出了一些精彩觀(guān)點(diǎn):
「文庫會(huì )是一站式 AI 內容獲取和創(chuàng )作平臺,創(chuàng )作從文庫開(kāi)始就好了?!?/strong>
「目標對不齊,來(lái)自于標準對不齊?!?/strong>
「一開(kāi)始做產(chǎn)品,心里就有一張損益表?!?/strong>

以下是對話(huà)全文,由極客公園編輯整理。

 

01

AI 重塑下的百度文庫

張鵬:文庫在引入智能技術(shù)初期的決策過(guò)程是怎么樣的?是如何設定第一個(gè)目標并逐步發(fā)展的?
王穎: 我們首先考慮了兩個(gè)關(guān)鍵點(diǎn)。第一,我們引入了大模型技術(shù),評估它在哪些領(lǐng)域有顯著(zhù)的能力提升,以及還有什么缺陷,AI 技術(shù)自 20 世紀 50 年代以來(lái)一直在發(fā)展,但大模型的出現標志著(zhù)創(chuàng )作的能力飛躍,這個(gè)技術(shù)飛躍是不是能解決目前用戶(hù)的問(wèn)題。
第二,我們深入挖掘了用戶(hù)在文庫的需求。傳統上,人們認為文庫只是一個(gè)文檔檢索平臺,但通過(guò)深入分析,我們發(fā)現用戶(hù)找內容不僅僅是為了閱讀,而是為了寫(xiě)作。我們進(jìn)一步探究了用戶(hù)為何尋找內容,以及找到內容后他們要做什么。我們意識到,用戶(hù)的核心目的不是為了找內容本身,而是為了支持他們的寫(xiě)作需求。
寫(xiě)作有兩條路徑,第一條路徑,擅長(cháng)寫(xiě)的用戶(hù)上手打開(kāi)編輯器就寫(xiě)了,還有一種不會(huì )寫(xiě)的用戶(hù),他們第一步需要找素材。
50% 的用戶(hù)屬于第二類(lèi),他們需要找素材并進(jìn)行組合和編輯。即使是擅長(cháng)寫(xiě)作的用戶(hù),在寫(xiě)作過(guò)程中也常常需要尋找專(zhuān)業(yè)素材和靈感。這些都是文庫用戶(hù)的需求,也顯示出找和寫(xiě)的需求實(shí)際上是一個(gè)統一的需求,只是由于過(guò)去的技術(shù)水平限制,這個(gè)過(guò)程不得不被分割在不同的工具和平臺上進(jìn)行。
張鵬:所以在技術(shù)進(jìn)步的推動(dòng)下,文庫有機會(huì )更深入地滿(mǎn)足用戶(hù)需求了。
王穎:我們一開(kāi)始就知道用戶(hù)有一個(gè)完整的需求,但原來(lái)的技術(shù)和產(chǎn)品限制只能解決其中的一部分,只能提高一部分效率。其實(shí),人工智能的本質(zhì)是讓機器像人一樣思考。
做人工智能產(chǎn)品,就要讓產(chǎn)品像人一樣工作,幫用戶(hù)完成所有工作。我們最初的重構思路是:既然有了這種技術(shù),我們要讓產(chǎn)品像人一樣工作,端到端地解決問(wèn)題,而不是只解決一個(gè)環(huán)節的問(wèn)題。
很多人認為文庫是用來(lái)搜資料的,質(zhì)疑我們?yōu)槭裁匆么竽P???梢曰叵胍幌氯ツ?3 月份,很多平臺是這么做的:用戶(hù)搜索不到內容時(shí),他們用大模型生成一篇給用戶(hù)??墒沁@種做法并沒(méi)有解決用戶(hù)的本質(zhì)需求。就像我們買(mǎi)米是為了做飯吃飽,而不是為了單純擁有米。
我們最開(kāi)始的目標是讓產(chǎn)品像人一樣思考,端到端地解決問(wèn)題,在實(shí)現這個(gè)目標的過(guò)程中,確實(shí)遇到過(guò)很多問(wèn)題。
用戶(hù)對文庫的認知是一個(gè)資料庫,用來(lái)存儲和查找資料,這個(gè)認知非常強烈。
我們要做的第一件事是讓用戶(hù)過(guò)來(lái)查找資料,并讓用戶(hù)繼續留在這里,讓他們知道文庫也能幫助寫(xiě)作。
所以,我們在理解到用戶(hù)在查找資料后可能需要編輯和創(chuàng )作時(shí),就提供相應的能力,當技術(shù)進(jìn)一步成熟時(shí),我們就直接搭建新功能支持寫(xiě)作,比如后續文庫就推出了各種格式的寫(xiě)作功能,到現在文庫又推出的全新 App——橙篇,用戶(hù)不僅可以查找資料,還可以直接進(jìn)行寫(xiě)作。
張鵬:在找到文檔和內容后,用戶(hù)還需要對它們進(jìn)行進(jìn)一步加工、轉化和存儲,使其未來(lái)可以結構化使用。所以第一步是將這個(gè)過(guò)程延長(cháng),而不是直接到寫(xiě)作階段,這些工作是什么時(shí)候進(jìn)行的?
王穎:用戶(hù)進(jìn)入文庫后,我們不僅提供文檔搜索能力,還提供寫(xiě)作相關(guān)的能力。當你找到一篇文檔后,可以進(jìn)行擴寫(xiě)、改寫(xiě),甚至基于文檔內容制作 PPT。
這些工作是在去年 5 月份之前進(jìn)行的。當時(shí)我們還沒(méi)有編輯器,因此只能先做這些基礎工作。然后我們一邊開(kāi)發(fā)編輯器,一邊進(jìn)行 AI 滲透,讓用戶(hù)知道文庫有 AI 功能,AI 對寫(xiě)作有幫助,這是一個(gè)并行的過(guò)程。編輯器做完以后,我們直接推出了完整寫(xiě)作功能,用戶(hù)就可以直接進(jìn)入寫(xiě)作階段。
張鵬:文庫有畫(huà)本的功能,這個(gè)功能用戶(hù)的反饋怎么樣?
王穎:畫(huà)本功能分享率很高,有 30%。這個(gè)功能成本有點(diǎn)高,不過(guò)推出一個(gè)半月我們已經(jīng)把成本下降了一個(gè)量級,到今年年底成本應該都算不上負擔了。
現在文庫所有的 AI 功能沒(méi)有優(yōu)化到位就不推,現在是因為到位了,所以就開(kāi)始推了,轉化率也特別好。
張鵬:所以文庫不光交付實(shí)現了正反饋,商業(yè)上也做到了正循環(huán)。
王穎:我們從一開(kāi)始做項目,就是從一張損益表開(kāi)始的。

02

「模型接入」的挑戰

張鵬:那么后來(lái)真正把模型接入,是很簡(jiǎn)單的事嗎?還是說(shuō)需要和模型團隊磨合很久?
王穎: 我們沒(méi)有覺(jué)得很簡(jiǎn)單。大家對使用模型的理解不同。以前的模型是解決專(zhuān)用問(wèn)題,現在的通用模型解決很多問(wèn)題。
通用模型有它的限制,所以我們用 MoE 來(lái)解決問(wèn)題。首先,通用模型能力有限,我也不能全都用大模型,那樣成本太高,現在 AI 應用賠錢(qián)就是因為成本問(wèn)題。
我們把大模型看作大腦,它負責理解和分工,復雜的問(wèn)題用大模型解決,其他的功能用不同的模型來(lái)做。
事實(shí)上,文庫做到今天,我們有對模型進(jìn)行精調,但并沒(méi)有用想象的那么多的精調數據,因為要求的不是數據數量,而是數據質(zhì)量夠不夠好,夠不夠均衡。并且,文庫有自己的算法工程來(lái)做 Prompt(提示詞)優(yōu)化,包括使用不同尺寸的模型來(lái)執行不同的任務(wù),最終將它們整合起來(lái),形成一個(gè)協(xié)調一致的系統。
文庫從第一天開(kāi)始,就讓產(chǎn)品像人一樣思考,像人一樣工作。這種思考和分工是持續進(jìn)行的,我們從來(lái)沒(méi)有在大模型上糾結過(guò)。
到目前為止,我們和大模型團隊一起真正合作開(kāi)發(fā)的定制能力只有兩個(gè):
一個(gè)是字數控制,大模型的多樣性決定了依從性問(wèn)題的存在:模型團隊一開(kāi)始不能完全理解這個(gè)需求,因為在搜索場(chǎng)景中,字數長(cháng)短內容無(wú)所謂,但對文庫用戶(hù)來(lái)說(shuō)不一樣,如果用戶(hù)要求寫(xiě) 500 字,它卻寫(xiě)了 1500 字,就給用戶(hù)增加了刪減的負擔?,F在,文心一言在字數依從性上可以做到上下浮動(dòng) 5%。
另一個(gè)是理解和生成:我們提供很多文檔解析能力,以及專(zhuān)業(yè)文檔的標準和專(zhuān)家標準,然后模型去訓練這些內容。這兩件事是我們與模型團隊真正共建的。

03

AI 重構,

核心在于「價(jià)值」

張鵬:你要求產(chǎn)品團隊首先對于模型有根本性的理解,且對自己如何運用模型,一上來(lái)就要清晰的認識。
王穎: 對,現在的組織結構中,產(chǎn)品和策略是要融合的。過(guò)去的工作流程里,是算法團隊來(lái)負責策略算法,產(chǎn)品負責提需求,產(chǎn)品團隊提供產(chǎn)品原型可以了?,F在這種模式行不通了,每個(gè)人都要滲透到對方的領(lǐng)域。原來(lái)是陣地型打法,現在得全攻全守往前推進(jìn)。
張鵬:是什么讓你下定決心必須這樣?
王穎:標準不一致就會(huì )導致目標不一致。另外,交付不等于用戶(hù)滿(mǎn)意。成熟的業(yè)務(wù)有明確的標準。但對于全新重構的項目而言,如果沒(méi)有建立明確的標準,光是以物理上線(xiàn)為目標,而不是以用戶(hù)的實(shí)際滿(mǎn)意度為目標,是行不通的。
張鵬:上一個(gè)時(shí)代的產(chǎn)品經(jīng)理需要懂人性,但今天光懂人性不夠,還需要懂模型。
王穎: 對,因為我們建立的是人和機器溝通的橋梁。
張鵬:你是怎么管理產(chǎn)品需求、定義和實(shí)現效果的?
王穎: 我會(huì )把各方面都搞得清晰。從最開(kāi)始的需求判斷是不是應該這么做,產(chǎn)品怎么定義,哪些是突出的賣(mài)點(diǎn),應該實(shí)現什么樣的效果。也畫(huà)產(chǎn)品圖,包括交互設計和一些 UI 設計,會(huì )帶著(zhù)團隊一起來(lái)做。不同的生成路徑也會(huì )關(guān)注,比如做 PPT 的生成路徑和做漫畫(huà)的生成路徑是不一樣的。但是在同一個(gè)產(chǎn)品中又不能讓用戶(hù)在生成不同內容或不同品類(lèi)時(shí),都感覺(jué)像在使用一個(gè)不同的東西一樣。這些流程需要重新設計。
張鵬:做完第一步,把第一個(gè)延長(cháng)線(xiàn)畫(huà)了,看到什么樣的數據變化?
王穎:用戶(hù)使用時(shí)長(cháng)有變化了,翻倍了。
張鵬:上線(xiàn)多長(cháng)時(shí)間看到的?
王穎:大概是一個(gè)月。不光使用時(shí)長(cháng)翻倍了,留存也提升了。
張鵬:怎么從時(shí)長(cháng)的翻倍,去解讀用戶(hù)的收獲?
王穎:看結果。以前的用戶(hù)基本上是找到就下載,時(shí)間很短?,F在會(huì )發(fā)現用戶(hù)有了更多的互動(dòng),會(huì )調用各種功能,自然時(shí)間就變長(cháng)了。
還有一個(gè)關(guān)鍵指標是下載完成后本地使用。畢竟下載可用了,才會(huì )下載。
張鵬:下載下來(lái)意味著(zhù)有效交付完成了。
王穎:對,要么下載,要么分享轉發(fā)。還要關(guān)注留存和活躍留存率,也就是用了某項功能的用戶(hù),第二天再次使用的比例是否超過(guò)以往。只有用戶(hù)覺(jué)得功能有用,才會(huì )再次回來(lái)使用。就像去飯館吃飯一樣,如果今天不好吃,明天還會(huì )再來(lái)的人肯定不多。
張鵬:做到這一步有沒(méi)有很復雜的技術(shù)挑戰?
王穎:有很多,舉個(gè)例子,在初期的文檔寫(xiě)作中,除了大家熟知的幻覺(jué)問(wèn)題,還有字數依從方面。其實(shí)很多時(shí)候擴寫(xiě) 1.5 倍就夠了,但之前有一些大模型的擴寫(xiě)長(cháng)度趕上重寫(xiě)一篇了,這就不太好。文庫推動(dòng)解決的就是這一點(diǎn)。
張鵬:怎么去定義字數依從性的合理指標?擴寫(xiě)要做好是怎么做到的?
王穎:我們做了大量調研去了解用戶(hù)對擴寫(xiě)的期待是什么樣的。用大模型重構產(chǎn)品的時(shí)候,很多人不知道標準怎么建立,但其實(shí)標準不是存在于行業(yè),而是藏在用戶(hù)心里。
用戶(hù)對新事物總是有所期待,我們得去滿(mǎn)足這些期待,高太多,用戶(hù)可能不理解,低于期待值更不行。找到用戶(hù)的期待值,比它高一格就是標準。
產(chǎn)品剛上線(xiàn)的時(shí)候,我們邀請測試、維護了四個(gè)用戶(hù)群,每個(gè)群里有兩百人,版本出來(lái)就給這些群里的用戶(hù)使用,他們會(huì )給到一些反饋。
張鵬:所以擴寫(xiě)也是在這一波前期測試過(guò)程當中,用戶(hù)提出問(wèn)題,然后你們反過(guò)來(lái)進(jìn)行調研,到底應該怎么擴寫(xiě)。
王穎:對,因為 Prompt 解決不了這個(gè)問(wèn)題。有些大模型問(wèn)題是 Prompt 無(wú)法解決的。大模型的特性就是多樣性,而多樣性會(huì )導致依從性差,這是必須要解決的問(wèn)題?,F在一般的擴寫(xiě)比例是 1.5~2。
張鵬:所以這是一個(gè)擴寫(xiě)的黃金比例。在做這個(gè)的同時(shí)你們還在搭編輯器,這個(gè)事情復雜嗎?
王穎:很復雜。復雜之處在于幾個(gè)方面。
首先,不同的文件類(lèi)型需要不同的編輯器,比如 Word、PPT、Excel 需要的編輯器都不一樣。這導致用戶(hù)在處理文件時(shí)需要頻繁地切換。
其次,進(jìn)入編輯器之前,文件可能存在多種格式,增加了處理的復雜性。
最后,編輯器本身的工具非常繁多,使用指令復雜,每個(gè)編輯器可能有數百個(gè)指令,如果每個(gè)都要實(shí)現,工作量非常巨大。
此外,這是一個(gè)強工程項目,像 Word 或 Office 這樣的產(chǎn)品本身也是編輯器,我們做編輯器不是要跟它們做一樣的產(chǎn)品,我們要做的是融合編輯器,這個(gè)編輯器要兼容所有的文件格式,用戶(hù)不需要關(guān)心格式問(wèn)題,只需要告訴我們需要完成什么任務(wù)即可。
百度原來(lái)沒(méi)有這方面對應的積累,我們是從頭開(kāi)始做的。
張鵬:上線(xiàn)之后用戶(hù)的反應怎么樣?
王穎:擴寫(xiě)和續寫(xiě)對編輯器的要求并不高。真正對編輯器要求高的是 PPT。PPT 功能推出之前,擴寫(xiě)僅限于文本,我們對編輯器的理解和難度的把握都相對有限。
PPT 功能的出現,使得操作空間擴展了。首先,PPT 本身的制作難度就比文本要大;其次,現在能夠在同一個(gè)平臺上進(jìn)行格式轉換,融合編輯器的優(yōu)勢也就體現出來(lái)了。如果只限于 Word,能做的就只是文字處理,但有了融合編輯器,不僅可以處理 PPT,還能實(shí)現 PPT 與 Word 之間的格式轉換,甚至還能制作圖表。
張鵬:PPT 能力上線(xiàn)之后,用戶(hù)能明顯感覺(jué)到文庫編輯器的意義所在了。接下來(lái)用戶(hù)數據變化怎么樣?
王穎:非常明顯。各種用戶(hù)數據曲線(xiàn)陡峭上升。去年 9 月到 10 月,DAU 從 30 萬(wàn)爬升到 140 萬(wàn)。
張鵬:所以文庫接下來(lái)會(huì )是什么樣的產(chǎn)品定義?
王穎:一站式 AI 內容獲取和創(chuàng )作平臺,所有創(chuàng )作從文庫這里開(kāi)始就好了。
張鵬:分發(fā)怎么做,有一鍵轉發(fā)功能嗎?
王穎:有。用戶(hù)不需要考慮素材的來(lái)源、格式或者具體細節,他們只需將內容提供給文庫,輸出支持包括存儲、轉發(fā)、分享等。
張鵬:這樣聽(tīng)下來(lái),文庫像是個(gè)人寫(xiě)作的操作系統。
王穎:對,除此之外,還希望文庫有自己的生態(tài),可以分發(fā)內容。
張鵬:Robin 說(shuō)文庫是被 AI 重構最好的產(chǎn)品,你有沒(méi)有聽(tīng)他定義過(guò)他認為的好是在于什么?
王穎:核心就是價(jià)值,為用戶(hù)、行業(yè)帶來(lái)什么價(jià)值,有沒(méi)有價(jià)值重構,提供價(jià)值增量。
給用戶(hù)提供了價(jià)值,用戶(hù)就會(huì )用腳投票,同時(shí)價(jià)值會(huì )反哺大模型,利用人類(lèi)行為反饋提升自身性能。
 

04

橙篇——

「長(cháng)文創(chuàng )作、批量賦能」

張鵬:文庫最近推出了橙篇這個(gè)產(chǎn)品,對它的定位是什么?
王穎:我們希望橙篇能夠成就人生新篇章。除了專(zhuān)業(yè)寫(xiě)作以外,橙篇未來(lái)還將注重休閑娛樂(lè )性質(zhì)的寫(xiě)作,以及分享互動(dòng)的功能。

 

張鵬:文庫這樣的平臺本身也支持創(chuàng )作,橙篇的推出是出于什么考慮?

王穎:用戶(hù)在創(chuàng )作過(guò)程中存在兩種情況:一半的用戶(hù)因為不知道如何著(zhù)手開(kāi)始,需要找資料參考,另一半則能夠直接開(kāi)始寫(xiě)作。盡管文庫已經(jīng)積累了 15 年的經(jīng)驗,擁有廣大用戶(hù),但大多數人仍然將其視為一個(gè)資料搜索平臺,而非創(chuàng )作起點(diǎn)。
在短期內,文庫是一個(gè)內容獲取和創(chuàng )作的一站式平臺的認知還需要逐步建立,但我們需要一個(gè)平臺來(lái)盡快滿(mǎn)足用戶(hù)直接創(chuàng )作的需要,這就是橙篇的定位。
我們希望通過(guò)橙篇從創(chuàng )作的最初階段就為用戶(hù)提供支持,同時(shí)通過(guò)專(zhuān)業(yè)知識內容的輔助來(lái)提升創(chuàng )作質(zhì)量、拓寬創(chuàng )作服務(wù)范圍。
張鵬:可以有一小股部隊像創(chuàng )業(yè)公司做新銳產(chǎn)品一樣,更有活力。
王穎:對,沒(méi)有包袱,可以做很多嘗試。
張鵬:用戶(hù)有給到一些什么反饋,對后續做產(chǎn)品有指導作用的?
王穎:呼喚趕緊出一個(gè) App,需要更多的體裁和品類(lèi),希望有更多表格處理能力。
張鵬:用戶(hù)在橙篇寫(xiě)作的話(huà),主要寫(xiě)些什么類(lèi)型?
王穎:長(cháng)文很多,大多在 5000 字以上。
張鵬:寫(xiě)作通用性還可以。
王穎:對,我們也強調專(zhuān)業(yè)性。我們一直有在長(cháng)文和專(zhuān)業(yè)內容上發(fā)力,為什么要這樣做?因為大學(xué)生用戶(hù)是傳播力最強的用戶(hù)群體,所以我們首先要滿(mǎn)足他們的需求,在長(cháng)文理解和寫(xiě)作方面,進(jìn)行了專(zhuān)門(mén)的調整。
此外,為了應對大模型不夠專(zhuān)業(yè)的問(wèn)題,從去年 7 月份開(kāi)始,我們就開(kāi)始建設專(zhuān)業(yè)內容,大量引入專(zhuān)業(yè)資源,全覆蓋 Nature 這樣的頭部期刊以及大量專(zhuān)業(yè)數據和出版社資源,這些其他大模型尚未涉足。這些工作是在去年 5、6 月份開(kāi)始的。畢竟大模型有幻覺(jué),有專(zhuān)業(yè)性不夠的問(wèn)題,所以比較早就開(kāi)始準備這些。
張鵬:所以你們是希望寫(xiě)作這件事情,更多人當成更日常的東西,怎么做到這一點(diǎn)呢?
王穎:對,本質(zhì)就是兩件事,要么因此獲得尊重,要么因此掙到錢(qián)。那我們就做好兩件事,一個(gè)是分享,一個(gè)是激勵。
我們現在和很多 IP 合作,用戶(hù)可以自由創(chuàng )作并分享作品。通過(guò)分享,讓更多人看到成果,滿(mǎn)足了分享展示的需求。畫(huà)本功能就是出于這個(gè)原因開(kāi)發(fā)的。
激勵方面,用戶(hù)創(chuàng )作小說(shuō)后,我們會(huì )通過(guò)多個(gè)內容分發(fā)平臺進(jìn)行分發(fā),產(chǎn)生的收入會(huì )與創(chuàng )作者分成,這樣用戶(hù)就有了動(dòng)力。
畫(huà)本也一樣,只要用戶(hù)的創(chuàng )作在平臺產(chǎn)生的利潤,都會(huì )分給用戶(hù)。即使用戶(hù)沒(méi)有直接在平臺創(chuàng )作或分享內容,只要他們有所貢獻,也會(huì )有代幣獎勵,這些代幣可以用于完成任務(wù),比如制作 ppt。如果代幣不足,用戶(hù)可以通過(guò)繼續創(chuàng )作或購買(mǎi)來(lái)獲取更多代幣。這是我們在做的一些嘗試。
張鵬:以小說(shuō)為例,現在是供給不足、需求不足還是連接不足?
王穎:現在是供給不足,而不是需求不足。首先,小說(shuō)用戶(hù)占了整個(gè)中國用戶(hù)的 50%,這個(gè)比例遠遠超出想象。我們原本認為小說(shuō)用戶(hù)是十八九歲到三十幾歲的年輕人,但實(shí)際上,小說(shuō)用戶(hù)的年齡范圍非常廣泛,從十幾歲到六七十歲都有。
需求已經(jīng)非常明顯,但供給卻跟不上。供給可以分成幾個(gè)層次,頭部作家一直被催更,顯然是供給出現了問(wèn)題。比如,烽火戲諸侯一章要寫(xiě)十萬(wàn)字,創(chuàng )作時(shí)間很長(cháng),一直被催更。爽文、腦洞文也同樣如此。
優(yōu)質(zhì)供給不足,不是說(shuō)書(shū)放在那兒沒(méi)人看,而是能讓大家持續看下去的好書(shū)不多。我們發(fā)現,老白文人均閱讀本書(shū)是 1.3 本,而腦洞文是 3 本多,讀者閱讀速度很快,而供給足夠的話(huà),讀者還會(huì )繼續閱讀下去。問(wèn)題在于,好的供給還是不夠,這是非常明顯的問(wèn)題。
張鵬:所以可以理解為橙篇的目標是通過(guò)這個(gè)操作系統,幫助更多有效的供給批量產(chǎn)生。
王穎:對,有效的供給可以分為幾類(lèi),每種都有其標準。首先是情節感人、文字優(yōu)美、文筆也不錯的優(yōu)質(zhì)供給;其次是雖然有好的情節但很多人卡在表達環(huán)節,這個(gè)問(wèn)題大模型可以解決。
小說(shuō)后續可以衍生到漫畫(huà)領(lǐng)域,漫畫(huà)供給問(wèn)題尤為突出。我們和創(chuàng )作者合作進(jìn)行了實(shí)驗,有家公司嘗試對兩到三部漫畫(huà)實(shí)施日更策略,以此來(lái)測試是否能夠吸引更多的關(guān)注。結果顯示,盡管付費率保持不變,但閱讀量確實(shí)有所增加。
張鵬:有效供給最后很有可能也變成多模態(tài)。
王穎:我們本身也具備多模態(tài)能力,現在沒(méi)上橙篇是因為人力不夠,還沒(méi)來(lái)得及開(kāi)發(fā)出來(lái),之后會(huì )上線(xiàn)的。
 

05

文庫和橙篇的未來(lái)

張鵬:百度文庫和橙篇是怎么通過(guò)用戶(hù)行為數據實(shí)現數據飛輪效應的?
王穎:比如說(shuō)在文檔平臺上,我們會(huì )根據文檔的下載次數來(lái)篩選出比較優(yōu)質(zhì)的文檔,然后讓大模型重點(diǎn)學(xué)習這些文檔。
PPT 工具中也是類(lèi)似,系統會(huì )自動(dòng)提供已經(jīng)整理過(guò)的圖片,并生成提示,用戶(hù)可以根據這些數據進(jìn)行修改。
漫畫(huà)的話(huà),通常會(huì )同時(shí)生成兩張圖片供用戶(hù)選擇,成本比較高,但效果并不是太好,因為有時(shí)候用戶(hù)對哪張都不太滿(mǎn)意。
張鵬:這種情況可以做局部修改?
王穎:漫畫(huà)功能支持局部修改。
張鵬:這樣就解決了一致性的問(wèn)題。
王穎:一個(gè)是一致性問(wèn)題的解決,另一個(gè)是滿(mǎn)意度的提高。例如用戶(hù)只對圖像的臉部滿(mǎn)意,而對身體部分不滿(mǎn)意,那么評分可能只有 60 分;而如果整體都滿(mǎn)意了,評分可能會(huì )達到 80 分。
張鵬:這種方式在交付、交互和數據循環(huán)上都是有效的。
王穎:對,我們會(huì )在模型上進(jìn)行局部控制。比如,我們將分享和轉發(fā)按鈕放在顯眼位置,方便用戶(hù)操作后進(jìn)行分享和轉發(fā)。這樣的設計不僅能夠提升用戶(hù)體驗,也能更有效地引導用戶(hù)參與,為后續進(jìn)一步優(yōu)化提供參考。
張鵬:橙篇算是文庫下面一個(gè)「特種部隊」?
王穎:它跟文庫是平行的兩個(gè)產(chǎn)品,但是底座的基座能力、基座算法、編輯器都是一套,不同主要在于前端的交互方式,除此之外,就是不同的產(chǎn)品團隊在與模型對接。
張鵬:橙篇與文庫為用戶(hù)提供了兩種典型的創(chuàng )作方式:一種是原生創(chuàng )作加資料參考,另一種是資料參考加創(chuàng )作,最終的目標都是打造創(chuàng )作的操作系統,兩者的價(jià)值在于解鎖更多高質(zhì)量的內容供給,從而激發(fā)需求,并通過(guò)內容分發(fā)建立連接,最終形成完整的閉環(huán)。
王穎:對,先從激發(fā)需求開(kāi)始。
張鵬:過(guò)去發(fā)現,互聯(lián)網(wǎng)領(lǐng)域里只要能夠指數級提升創(chuàng )作者的數量,就有機會(huì )誕生新的分發(fā)平臺。你們相信現在又有這樣的機會(huì )了。
王穎:文庫的目標是平衡消費者和創(chuàng )作者之間的關(guān)系。過(guò)去,消費者遠遠多于創(chuàng )作者,因為很多人覺(jué)得創(chuàng )作是一件很難的事。
文庫的核心是讓每個(gè)消費者都能成為創(chuàng )作者,通過(guò)進(jìn)一步降低創(chuàng )作門(mén)檻,擴大創(chuàng )作者群體,促進(jìn)更多內容的涌現,從而吸引更多人來(lái)消費。
張鵬:文庫怎么定義 24 年的目標?這里面的優(yōu)先級是什么樣的?
王穎:最重要的是有多少用戶(hù)使用,也就是 DAU 或者 MAU。這可能不是唯一的標準,但是是很客觀(guān)的標準。用戶(hù)愿意使用甚至持續使用某個(gè)產(chǎn)品,說(shuō)明這個(gè)產(chǎn)品真的給他們帶去了價(jià)值。對于文庫這種依賴(lài)用戶(hù)主動(dòng)參與的線(xiàn)上業(yè)務(wù),這是很重要的。
張鵬:未來(lái)文庫里的交互會(huì )出現根本性的變化嗎?
王穎:會(huì )?,F在有一個(gè)改版在醞釀了,后面還會(huì )有一個(gè)版本。
張鵬:交互變化的思路原則是什么?
王穎:更傾向于自然交互。7 月底,橙篇 APP 出來(lái)之后,應該會(huì )跟完全大家想的不一樣。
 
*頭圖來(lái)源:百度文庫
本文為極客公園原創(chuàng )文章,轉載請聯(lián)系極客君微信 geekparkGO

最新文章

極客公園

用極客視角,追蹤你不可錯過(guò)的科技圈.

極客之選

新鮮、有趣的硬件產(chǎn)品,第一時(shí)間為你呈現。

張鵬科技商業(yè)觀(guān)察

聊科技,談商業(yè)。

栾城县| 彰化市| 红原县| 宁明县| 革吉县| 平利县| 新疆| 遵化市| 凤山市| 荣成市| 收藏| 灯塔市| 漯河市| 饶阳县| 邹平县| 和静县| 麻阳| 镇雄县| 大足县| 昌都县| 满洲里市| 嘉义县| 上饶县| 阳山县| 涿州市| 上犹县| 唐河县| 泌阳县| 金坛市| 龙山县| 汉沽区| 临西县| 嵊泗县| 凤山市| 邓州市| 榆社县| 镇江市| 临安市| 永顺县| 马关县| 崇义县|