SACC2019:愛奇藝的大數據中臺戰略(附演講實錄) – ITPUB

孫斌 愛奇藝高級總監

主要負責愛奇藝的大數據中臺、商業智能、內容智能制作等業務。在互聯網產品設計和研發方面有十多年經驗,曾就職于微軟、hulu、雅虎等公司。

摘要:愛奇藝的業務已經從單一的視頻業務發展為“大蘋果園”的泛娛樂生態,伴隨著業務的高速發展,從成立至今的9年多時間內,愛奇藝累積了全行業最豐富的娛樂大數據。

隨著AI和大數據的發展,以及云計算能量的釋放,愛奇藝的娛樂大數據的規模化效應呈爆炸式增長,高速發展的業務需要一個健壯穩定的中臺去支撐,愛奇藝大數據中臺應運而生。

本次交流著重介紹愛奇藝大數據中臺戰略的由來、發展以及對公司和行業的影響,將會覆蓋大數據中臺的歷史,基礎架構,落地賦能應用以及未來的發展方向,也涵蓋愛奇藝對整個泛娛樂行業數據驅動業務的理解。

愛奇藝,一家以科技創新為驅動的偉大娛樂公司

眾所周知,愛奇藝本身是一家以科技創新為驅動的偉大娛樂公司。現在大家看到的大量影視綜藝內容,很多都是愛奇藝的主要品牌。

愛奇藝一路走過來,在商業模式上也做了相關的創新,旨在打造多樣化的貨幣化IP合作模式。愛奇藝的創始人是工科博士,非常注重技術和數據。愛奇藝內部有個不成文的規定,旗下產品技術的人數比例需要占到公司一半,因此,愛奇藝全站做了很多獨立的技術體系。

上圖大家看到中間有個金字塔,這里面涉及幾個專業名詞:PPC、PGC和UGC。頂層PPC是指最專業的內容,來自影視綜藝,所有大劇、大片通過正版版權進行售賣、交換的商業模式;中間的PGC是專業的中轉視頻,相對比較短的視頻,但在各方面都做得比較好;最底層UGC,可以是在座各位手機錄的視頻。

最頂端的商業模式,基本上是以正版視頻內容通過會員付費模式為主,通過廣告收入以及其他發行之類的東西為輔。最底層商業模式,目前比較火的頭條系產品(比如快手),以更加靈活、豐富的變現商業模式,包括打賞、電商代貨等等。對比看來,中間一層相對比較靈活。

除了大家熟悉的愛奇藝APP,我們產品形態的腰部和最底部,同樣也做了大量地嘗試。從我們主營業務(在線廣告+視頻內容)的基礎上衍生出來整個泛娛樂生態,包含:網絡文學、網絡游戲、在線直播、網絡漫畫、輕小說、票務以及網上商城等,會探索到不同的領域。

企業文化是一個公司里非常獨特的基因,愛奇藝通過獨特的企業文化來解讀娛樂,我們對標各種各樣的國內外領先科技公司。視頻網站最大的兩大成本分別是帶寬和版權。所以大家可以看到,國內外所有大的視頻網站,從美國的奈菲、亞馬遜hulu到中國前三家,大家都有別于傳統公司,在做自制內容。

提及愛奇藝的行業規模,這里有幾個比較直觀的數字。我們的用戶量月活有6億,這個數字基本持續了一到兩年時間。而且,我們穩定1.8億日均獨立設備數。全平臺日均總使用時長3.5億小時。種種數據顯示,愛奇藝是不同尋常的大數據典型的應用。

愛奇藝大數據中臺戰略

大數據中臺這個概念,在行業里被提出差不多四五年時間。與此同時,愛奇藝內部已經做了很久關于中臺的事情。大家可能第一反應就是,一個視頻播放平臺雖然體量比較大,但是場景單一,為什么會需要大數據中臺或者更強大的中后臺來支撐?

大家會通過各種各樣的APP看到不少講“大中臺小業務”,這就允許我們前面做各種各樣的業務迭代、業務嘗試。坦白來講,所有公司都在做中臺,但重要的是能不能很好的把相關數據資產沉淀下來。

愛奇藝曾提出過一個概念:蘋果園。最早愛奇藝是視頻業務,后來從周邊衍生出來一些新的業務,這便是我們的蘋果樹模型。從蘋果樹的模型往下延伸,遠遠不是跟視頻場景周邊相關的,而我們不僅可以在場景上做各種各樣的關聯,還可以在人群中做各種各樣的關聯。

我們提出從蘋果樹,到蘋果園泛娛樂生態矩陣。簡單地說,我們有長視頻、短視頻、小視頻、奇巴布、愛奇藝閱讀、叭噠、泡泡、奇秀直播、愛奇藝知識、體育、電商等等。以下是愛奇藝整個硬件產品的矩陣。

針對中臺戰略“金字塔”,從底部往上,分別是數字資產沉淀、統一數據平臺|技術內核工具、業務互動三個層面。拋開商業模式,純粹從用戶角度看愛奇藝,愛奇藝最主要兩個東西是:用戶(人)和內容(IP)。

講到數字資產,重點核心關鍵詞是“統一”。所有不同的東西,我們如何把它能夠關聯起來。大數據中臺在這里面體現的是OneID,如果真正把OneID人、物串起來,最終實現在這基礎上各種各樣的廣告投放、內容變現都有可能。

再講數字資產沉淀,當你把用戶和內容進行實景兌現化,一定要把它在邏輯上放到一個統一的大數倉,才有可能在此基礎上進行各種各樣的計算。并不是說,非物理存儲上在同一個地方。數據中臺概念是我在邏輯上對所有數據進行管控,所有血緣、上下游關系清晰記在冊的,基于這上的數字資產管理才變得有序。

左側最上層基礎上,對各種各樣的復雜業務場景,智能硬件場景、愛奇藝閱讀、愛奇藝視頻場景,如何讓所有行為讓機器認識而且明白中間的關聯,除了OneID之外的行為,在此行為上用戶分析才能真正有意義。

這里有個關鍵是“主題”,比如所有付費的會員業務這是一個主題,電商業務也是主題,奇秀直播業務也是主題。如何能夠讓數據結構后面去利用好大數據中臺,更好地去實現業務上的訴求,這里面有一個業務主題的概念,這也是我想突出的。

中間統一管控加上規范化,再到這一端開始發揮價值。

比如投資資產,在一些IP我們要做全生命周期的管控,也許有可能它只是一個概念或者僅僅有一本比較古老的小說的時候,怎么能夠發現它潛在的價值?第二塊是用戶增長,這個是最近比較火熱。最后一塊講數據賦能,比如大家知道的數據賦能廣告、數據賦能風控等。

講了這么多資產沉淀,到底大數據平臺是什么樣的,中間層統一大數據平臺和技術內核工具。我重新再強調一個關鍵詞 “統一”,在此基礎上再加一個關鍵詞“透明”。

大概在三個月前,我們團隊剛剛做了大數據沙龍,專門分享了數據治理。數據治理這一塊就是讓所有的數據有序且對上對所有的上層業務透明,而是指所有業務關系、血緣關系,所有地圖都可查而且非常有利于理解。在此基礎上突出非常重要的關鍵詞“透明”。

還有一個關鍵詞是“兼容”,大家看愛奇藝有那么多業務,有些是愛奇藝自制的,有些是合作的,如何實現所有這些東西兼容?比如存儲上的兼容、通訊引擎上的兼容、地域上的兼容等。再往上是大家非常熟悉的關鍵詞,比如畫像標簽、行為標簽。最底層是所有數據的接入,用戶全域數據、IP數據以及外部交換數據。

上圖大數據平臺的架構,其實各家所用的技術站各個方面差別不大,主要有兩點。第一點如何能夠很好的服務于不一樣的獨立業務場景,如何能夠應對海量的大應用。第二點,系統整體的健壯性。在此基礎上整體這套東西非常簡單就是為了實現敏捷開發,以此降低各種各樣的成本。

金字塔最上層的業務互動,大家對數據最基本的認識就是看、讀、用、懂。看數據處在工作的剛需層面,在此基礎上,真正通過數據得到啟發,來指導業務的話,可以進入第二階段的讀數據,再往上一層是用數據,在數據中找到洞察,從而指導我們的工作。最上層是比較經典的業務模型,在此基礎上去設計業務和系統。

在愛奇藝內部,目前在我們實現半自動埋點,并不是說我們不能實現全自動(全埋點),我個人認為這對于一個有很多訴求的大場景來說,是會有很多冗余數據,所以我們是半自動。在此基礎上,整體的BI應用、AI應用,各種各樣的留存分析、報表,即是我們整個業務增長體系的所有東西。

從懂到用:降低時間、操作門檻。在愛奇藝內部我們有一個文化,我們所有數據相關的業務部門和大數據部門定期都有業務數據分析的分享會。

最后總結一下, “大中臺、小前端”,而且我們是在娛樂大數據領域擁有非常專、非常深的應用。

愛奇藝的大數據中臺戰略使以用戶為核心的持續的規模化業務創新成為可能,業務響應能?和規模化創新能力,是互聯?時代企業綜合競爭?的核?體現。正是因為擁有這種核心競爭力,愛奇藝才能利用好自己的娛樂大數據,在泛娛樂領域遍地開花,以一系列創新業務來領跑行業!

免責聲明:本文僅代表文章作者的個人觀點,與本站無關。其原創性、真實性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容文字的真實性、完整性和原創性本站不作任何保證或承諾,請讀者僅作參考,并自行核實相關內容。

http://www.uswqb.club/style/images/nopic.gif
分享
評論
首頁
高速公路之王电子游艺
多乐彩下载安装 排列五走势图100期 微乐广西麻将技巧 精准一尾中特怎么区别 熟客温州麻将app 美股模拟炒股软件 北京麻将打法和规则 老11选5开奖结果 广西快乐双彩 贵州快3基本走势图 快乐扑克时时彩 浙江快乐十二选5走势 花花公子 微信红包麻将app下载v1.0 注册送分的电玩城捕鱼 皇家炸金花aaa最新版下载