嘉賓 | 白曉航、晁楊、謝淼
(資料圖)
編輯 | 薛梁
伴隨短視頻行業(yè)的飛速發(fā)展和快手商業(yè)化的加速繁榮,2022 年快手聯(lián)盟增長(zhǎng)迅猛,作為移動(dòng)開發(fā)者短視頻商業(yè)生態(tài)聯(lián)盟,快手聯(lián)盟正在成為各行業(yè)撬動(dòng)短視頻商業(yè)紅利的新杠桿。InfoQ 技術(shù)大會(huì)旗下《大會(huì)早班車》直播欄目邀請(qǐng)到了快手聯(lián)盟運(yùn)營(yíng)負(fù)責(zé)人白曉航,產(chǎn)品負(fù)責(zé)人晁楊和高級(jí)算法專家謝淼博士,來從業(yè)務(wù),產(chǎn)品和算法技術(shù)角度聊聊快手聯(lián)盟近年來在產(chǎn)研合作上的探索與創(chuàng)新。
InfoQ:隨著短視頻和直播近年來已成為我們?nèi)粘I钪斜夭豢缮俚牟糠郑ヂ?lián)網(wǎng)的這種新形態(tài)下,快手在廣告業(yè)務(wù)上,有什么新的探索,對(duì)于聯(lián)盟的業(yè)務(wù),有什么特殊的期待嗎?
白曉航:廣告聯(lián)盟本質(zhì)上是一個(gè)撮合平臺(tái),一端是廣大的開發(fā)者(背后是各種各樣的 App),另一端是廣大的廣告主;聯(lián)盟平臺(tái)居中連接兩端,提供統(tǒng)一的投放能力和變現(xiàn)能力。
快手做聯(lián)盟的初衷,是期望將快手在短視頻和直播上積累的產(chǎn)品算法能力釋放出來,在快手系 App 之外獲得聯(lián)盟流量的增量,給廣告主提供更大的投放空間。
具體說來,快手聯(lián)盟可以給廣告主這些獨(dú)特的價(jià)值:一是流量和可觸達(dá)用戶數(shù)量巨大,快手聯(lián)盟 DAU 超過 8.5 億,這個(gè)量級(jí)遠(yuǎn)超大多數(shù)互聯(lián)網(wǎng) App;二是流量類型豐富、用戶群體多樣,涵蓋游戲、工具、閱讀、生活、運(yùn)動(dòng)健康、視頻、資訊等等各種類型 App。
晁楊:從產(chǎn)品角度,簡(jiǎn)單來說聯(lián)盟廣告有激勵(lì)視頻、信息流、開屏、插屏及視頻流幾大類,整體來說我們要根據(jù)媒體 App 的特點(diǎn)及用戶的特性設(shè)計(jì)不同的廣告形態(tài)。
邏輯上廣告也是一種信息,廣告的呈現(xiàn)跟大家日??吹降男侣劇⒁曨l沒什么兩樣,只不過廣告是為用戶提供了感興趣的商品、游戲等有別于傳統(tǒng)內(nèi)容的信息,我們?cè)趶V告設(shè)計(jì)上用戶體驗(yàn)是第一位的,希望給用戶帶來更有價(jià)值的信息。
在短視頻和直播的賦能下,廣告形態(tài)在廣告呈現(xiàn)、用戶交互上有了更大的空間,比如直播給廣告帶來了跟用戶互動(dòng)的全新方式,用戶可以在快手聯(lián)盟覆蓋的 App 上實(shí)時(shí)觀看豐富多樣的直播,可以無縫銜接到快手 App 上,給用戶帶來全新體驗(yàn)的同時(shí)也給廣告主提供了觸達(dá)用戶的新途徑。短視頻和直播給廣告注入全新的想象空間,聯(lián)盟會(huì)持續(xù)探索用戶體驗(yàn)和新的廣告形態(tài)如何更好結(jié)合。
謝淼:優(yōu)化聯(lián)盟廣告投放,我們較其他頭部廣告聯(lián)盟起步較晚,只有廣告產(chǎn)品形態(tài)設(shè)計(jì)完成并打通投放鏈路后,我們算法才能發(fā)揮出價(jià)值,持續(xù)的優(yōu)化 AB 和大盤使得廣告的匹配效率更高。
可以說前期靠運(yùn)營(yíng)和銷售獲客,后期靠算法迭代拓客。從算法難度上,與在站內(nèi)投放快手原生廣告相對(duì)比,對(duì)我們提出了更高的要求和更多的挑戰(zhàn)。
首先,聯(lián)盟的環(huán)境更不穩(wěn)定,外部 App 從流量和質(zhì)量上變化程度都非常大,今天有 100w 的請(qǐng)求,可能明天就 10w 了。
第二點(diǎn),是對(duì)用戶行為理解的難度,相比主站,主站的用戶粘性高,原生廣告的轉(zhuǎn)化率自然就高,而且隨著時(shí)間的推移,我們還能積累大量豐富的用戶行為數(shù)據(jù),對(duì)用戶偏好有非常強(qiáng)的挖掘能力。相比較而言,聯(lián)盟上的流量是由眾多互聯(lián)網(wǎng) App 所組成的異構(gòu)型動(dòng)態(tài)流量池,即使是快手用戶,他們?cè)谶@些外部 App 上的行為與對(duì)快手廣告的興趣,與站內(nèi)瀏覽時(shí)也存在巨大差異,而且把用戶吸引到快手 App 中達(dá)成轉(zhuǎn)化所需的鏈路更長(zhǎng)。
第三點(diǎn),優(yōu)化的元素增多了,從站內(nèi)的用戶到廣告的二元構(gòu)成,變成了外部 App,用戶再到廣告的三元匹配,因此對(duì)算法的要求更高。所以從算法角度,我們期待能夠找到針對(duì)聯(lián)盟復(fù)雜環(huán)境的算法建模方式,沉淀有深度的解決方案。
InfoQ:那么為了達(dá)成聯(lián)盟廣告的業(yè)務(wù)目標(biāo),從業(yè)務(wù)運(yùn)營(yíng)角度覺得有什么挑戰(zhàn)嗎?
白曉航:介紹聯(lián)盟的核心痛點(diǎn),內(nèi)外循環(huán)可以一起說,然后突出給出冷啟問題和業(yè)務(wù)上疼的程度。比如可以拆成預(yù)算側(cè)和流量側(cè)冷啟兩個(gè)問題來講,深度轉(zhuǎn)化類型的廣告在量和質(zhì)上的要求,流量側(cè)冷啟問題等。
1. 流量大且雜,如何挑準(zhǔn)適配流量;
2. 冷啟:流量大、異構(gòu)、變動(dòng)多;
3. 直播廣告時(shí)間短、要求快速起量。
InfoQ:冷啟這個(gè)問題是行業(yè)內(nèi)聯(lián)盟的共性業(yè)務(wù)難點(diǎn)嗎,還是快手廣告的特殊業(yè)務(wù)問題?
白曉航:存在一定共性,但是快手原生廣告的特殊性是短視頻和直播,廣告主對(duì)廣告的深度目標(biāo)達(dá)成有非常高的期待,但是這種新業(yè)態(tài)的廣告,本身在聯(lián)盟的動(dòng)態(tài)性較高的媒體流量中和廣告做深度匹配時(shí)就存在很大的挑戰(zhàn)。另外,快手原生的內(nèi)循環(huán)廣告在聯(lián)盟是 2021 年才逐漸開始做的,我們對(duì)他有更高的要求,就是起量過程不能嚴(yán)重影響已起量廣告的預(yù)算匹配效率。
InfoQ:那針對(duì)這個(gè)冷啟的業(yè)務(wù)痛點(diǎn),從運(yùn)營(yíng)和產(chǎn)品角度,如何解決呢,有沒有什么現(xiàn)有的工具和手段?
晁楊:針對(duì)冷啟這個(gè)業(yè)務(wù)核心痛點(diǎn),我是這么看的:
(1)需要從這個(gè)產(chǎn)品的設(shè)計(jì)角度看這個(gè)事情,是系統(tǒng)性冷啟問題還是少數(shù)個(gè)例,產(chǎn)研系統(tǒng)在冷啟設(shè)計(jì)上是全局的,很多時(shí)候冷啟問題可能是比較小的點(diǎn)造成的,比如是否因?yàn)樗夭脑驅(qū)е掠诹髁坎黄ヅ洌虼肆砍霾蝗ィ?/p>
(2)不管是全局問題還是個(gè)例問題,我們都需要從鏈路角度看看在線系統(tǒng)各個(gè)階段的轉(zhuǎn)化情況,定向地發(fā)現(xiàn)潛在問題,各個(gè)擊破,這個(gè)鏈路就是我們常說的投放漏斗,也是產(chǎn)研給運(yùn)營(yíng)同學(xué)提供的工具之一;
(3)冷啟是從無到有的過程,除了系統(tǒng)冷啟的機(jī)制外,我們也會(huì)從人群適配等角度挖掘符合行業(yè)特性的人群,幫助算法快速收斂;
(4)多數(shù)的情況下從上面幾個(gè)方面可以快速定位和解決冷啟問題,但在系統(tǒng)有新能力上線或系統(tǒng)性出現(xiàn)冷啟動(dòng)問題時(shí),我們要逼著算法專家們一起定位問題,共同去挖掘能解決這個(gè)問題的解決方案,哈哈。
謝淼:是,在你們的強(qiáng)壓下,我們其實(shí)也成長(zhǎng)了很多;
(1)在廣告系統(tǒng)中,我理解的冷啟問題的本質(zhì),其實(shí)是由于每次請(qǐng)求下模型對(duì)候選廣告的預(yù)估偏差導(dǎo)致的有效投放量少的問題,當(dāng)然模型的偏差是來自訓(xùn)練數(shù)據(jù)稀疏這個(gè)情況,這里的訓(xùn)練數(shù)據(jù)的稀疏并不是單純指樣本量少,也就是說并不意味著量大了,一定沒有冷啟問題。
通常而言對(duì)于廣告系統(tǒng)來說他是一直伴隨著業(yè)務(wù)成長(zhǎng)的,比如一個(gè)新行業(yè)剛開始投放時(shí),肯定是數(shù)據(jù)量少導(dǎo)致訓(xùn)練數(shù)據(jù)少,模型偏差較大,但是如果后面僅局限在某個(gè)人群上,或者某類廣告上擴(kuò)量,那么即使他的投放量每天達(dá)到億級(jí)別,那么它仍然是稀疏的,因?yàn)槠渌巳夯蚱渌悘V告的樣本幾乎沒有,也會(huì)導(dǎo)致模型預(yù)估偏差。
為何模型的偏差會(huì)導(dǎo)致量起不來呢?因?yàn)閺V告系統(tǒng)中絕大多數(shù)都是 ecpm 競(jìng)價(jià)(千次曝光下的預(yù)期收益),而這里的 ecpm 計(jì)算是離不開模型預(yù)估的,當(dāng)然還有廣告主出價(jià)的影響,模型預(yù)估不準(zhǔn),可以拆解為兩種情況,模型預(yù)估偏低,那么直接導(dǎo)致競(jìng)價(jià)能力變差,廣告自然很難去拿到量,沒有量,也就不可能有太多的正樣本,那么模型會(huì)持續(xù)偏低;
另一種情況,模型預(yù)估值偏高,競(jìng)爭(zhēng)力偏大,量是會(huì)有一些,但是會(huì)出現(xiàn)超成本,即投放了,但是沒有實(shí)際轉(zhuǎn)化,這種情況下,系統(tǒng)的調(diào)價(jià)機(jī)制就會(huì)被觸發(fā),會(huì)導(dǎo)致大力壓價(jià),競(jìng)爭(zhēng)力就會(huì)回歸正常甚至變成偏低,量就變小了,后面當(dāng)模型重訓(xùn)時(shí),就會(huì)導(dǎo)致量持續(xù)變小。
(2)內(nèi)循環(huán)行業(yè)的外投晚于外循環(huán),因此在內(nèi)循環(huán)開搞的時(shí)候,已有很多行業(yè)在聯(lián)盟上有穩(wěn)定的投放,而且量不小,所以針對(duì)內(nèi)循環(huán)的業(yè)務(wù)問題的建模,天然就帶了個(gè)約束,即盡可能不影響已起量行業(yè)的前提條件下,讓內(nèi)循環(huán)廣告在聯(lián)盟起量??梢姡@個(gè)帶約束的冷啟問題比單純的冷啟還要難。
要解決這個(gè)帶約束的冷啟問題,我們首先需要一類算法能夠幫助模型破圈,即防止持續(xù)偏低或偏高的情況,MAB 就是這類算法。直接用 MAB 來解決實(shí)際業(yè)務(wù)問題,必不可少地需要將實(shí)際業(yè)務(wù)問題建模為算法可解的形態(tài),如果建模存在較大偏差,則再優(yōu)秀的 MAB 算法也很難取得收益。
這種面向?qū)嶋H業(yè)務(wù)問題,構(gòu)建算法策略的建模,通常在實(shí)際落地時(shí),需要的可能不止一種建模形態(tài),而是一個(gè)問題建模的組合,而且他們之間是有關(guān)聯(lián)的。
我們圍繞著內(nèi)循環(huán)冷啟的這個(gè)事來分析下,首先當(dāng)鏈路打通后,系統(tǒng)其實(shí)是個(gè)雙側(cè)冷啟狀態(tài),對(duì)于媒體側(cè)而言,聯(lián)盟之前很少投放過具有快手特色的短視頻和直播類型廣告,相似行業(yè)很少,而從廣告?zhèn)瓤?,所有的候選廣告也沒有投放過類似的聯(lián)盟媒體流量,因此它是雙側(cè)冷啟問題。
當(dāng)我們針對(duì)這個(gè)問題進(jìn)行合理地建模后,量起來了一些,這時(shí),我們看到了一些媒體位的量從 0 到 1 進(jìn)行突破了,隨之我們希望在這些媒體上的量能進(jìn)一步擴(kuò)大,那這個(gè)時(shí)候,冷啟問題就從雙側(cè)冷啟問題轉(zhuǎn)化為了單側(cè)冷啟問題,因?yàn)閺拿襟w上看已經(jīng)“熱”了,這時(shí)他的核心問題就變成了幫助某一給定的媒體位,來優(yōu)化候選廣告的位序,使得業(yè)務(wù)指標(biāo)最大化,例如預(yù)期花費(fèi)最大化,于是算法的建模形態(tài)就變成了單側(cè)冷啟的優(yōu)化問題。
然后我們來想一下量進(jìn)一步變大,會(huì)如何呢?我們期待模型越來越好,因?yàn)闃颖玖吭龃罅瞬簧伲啬軌驅(qū)W到背后的規(guī)律,逐漸演化為成熟狀態(tài),模型的預(yù)估值越來越準(zhǔn),且讓人滿意。這樣不就慢慢形成了一套整體解決方案了嘛,在我們的實(shí)際優(yōu)化過程中也看到了這些階段所用的策略,相互繼承和演化的關(guān)系和數(shù)據(jù)。
也潑個(gè)冷水,在聯(lián)盟中,其實(shí)我們期待模型絕對(duì)的準(zhǔn)確,是非常不切實(shí)際的,即使當(dāng)有些行業(yè)投放量大了,也不可避免的是媒體側(cè)流量的動(dòng)態(tài)變化,因此像 Bandit 這種技術(shù)其實(shí)就可以針對(duì)這種動(dòng)態(tài)性持續(xù)地在線上優(yōu)化,是天然的練兵場(chǎng)。
InfoQ:可以用白話幫忙介紹下,為何這種算法能緩解冷啟問題?為何它能比隨機(jī)這種,探索的更好,收益如何度量呢?
謝淼:MAB 這類算法其實(shí)是在線學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的交叉方向,快速學(xué)習(xí)(一條請(qǐng)求學(xué)一次),而且能快速感知環(huán)境給的 reward,即后驗(yàn),以此來改變自己的決策行為,并通過權(quán)衡探索和利用,使得一段時(shí)間整體累計(jì)效果最大化;所以這種算法即可以給候選透出的機(jī)會(huì),又能在透出后的效果中挖掘出實(shí)際質(zhì)量較好的候選集合,持續(xù)地優(yōu)選,在此過程中達(dá)到優(yōu)勝略汰。因此能夠在保證業(yè)務(wù)指標(biāo)盡可能地達(dá)成的前提下,將消耗起量,提升匹配效率。這是一個(gè)動(dòng)態(tài)的尋優(yōu)過程,我們也有指標(biāo)來衡量當(dāng)前算法所達(dá)到的狀態(tài),即算法的可收斂性。
但是隨機(jī)這種策略,其實(shí)是證明不出來收斂性的,因此效果是沒法衡量的。另外,實(shí)際的收斂程度也說明了在什么情況下能產(chǎn)生收益,如果單純依賴模型,就可以做到絕對(duì)準(zhǔn)的話,那么也就是說只要增加一定的探索成分,就一定是次優(yōu)解,就會(huì)產(chǎn)生錯(cuò)誤,導(dǎo)致 Bandit 拿不到收益,這里的錯(cuò)誤其實(shí)就是探索的成本,其實(shí)就是“拋開經(jīng)驗(yàn),不一定每次都是對(duì)的,但是一旦比經(jīng)驗(yàn)好,就帶來了收益”,所以當(dāng)且僅當(dāng)探索的成本小于探索收益的時(shí)候,Bandit 就能產(chǎn)生收益。
晁楊:所以說我們之前采用的在 AB 上進(jìn)行隨機(jī)投放用于探索的做法,其實(shí)是純探索的過程,因?yàn)殡S機(jī)選取這種方法,本身并不能收斂,因此效果無法度量和保證。
InfoQ:嗯,似乎有了這類算法,冷啟問題的確有解了,那上線還存在哪些挑戰(zhàn)嗎?
謝淼:雖然 MAB 算法在業(yè)內(nèi)已有一些成功案例,但是將 MAB 正確且能夠獲得穩(wěn)定業(yè)務(wù)收益地落地,并非易事。實(shí)際上我們躺過很多坑,這些坑歸納起來有如下幾點(diǎn):1. 問題建模;2. 算法假設(shè);3. 超參數(shù);4. 算法鏈路長(zhǎng)。
簡(jiǎn)單介紹下上述幾點(diǎn)。最主要的其實(shí)是如何將對(duì)業(yè)務(wù)的理解注入到算法中,以最大化算法收益,我來講個(gè)故事,首圖優(yōu)化中專業(yè)玩家的故事。這里可能還有個(gè)更深的問題,如果上述坑都避開了,那是不是直接作用到業(yè)務(wù)就能取得足夠的收益了?其實(shí)不然,它可能存在更大的優(yōu)化空間,絕大多數(shù) Bandits 算法的提出,都需要在理論上對(duì)所提出的新問題的建模形式,給出可證明的累計(jì)后悔度的理論上界(Upper Bounds of Cumulative Regret),但是在研究中可能存在為了獲得一個(gè)可證明的“漂亮”算法,而閹割原有算法或者增加嚴(yán)格的限制條件,導(dǎo)致犧牲原有算法在大多數(shù)實(shí)際業(yè)務(wù)中的效果,因此在落地時(shí)存在針對(duì)業(yè)務(wù)場(chǎng)景的優(yōu)化空間,而且這種優(yōu)化沉淀出來,就是業(yè)務(wù)的行業(yè)競(jìng)爭(zhēng)力。
晁楊:業(yè)務(wù)理解非常重要,也是對(duì)合格產(chǎn)品同學(xué)的要求之一,但是如何將對(duì)業(yè)務(wù)的理解注入到算法呢?能具體點(diǎn)不?
謝淼:比如首先我們得解雙側(cè)冷啟問題,對(duì)于我們而言其實(shí)就是盲探,用算法自動(dòng)探索,但是如果能找到一些先驗(yàn)知識(shí)或歷史經(jīng)驗(yàn),幫助我們把范圍有效地縮小,那么可以加速我們算法的收斂 ; 否則范圍越大,我們難度越高,這個(gè)來講,產(chǎn)品對(duì)業(yè)務(wù)理解可能更深,你們得挖掘下,爭(zhēng)取能夠比我們挖的準(zhǔn)。
晁楊:我這里講講電商零售等相似的外循環(huán)行業(yè),用這些行業(yè)挖可能得 POS,另外再講講人群的挖掘方法。
在這方面我們有比較成功的 case 可以給大家分享一下:內(nèi)循環(huán)廣告數(shù)為百萬量級(jí),歷史的聯(lián)盟流量探索中,因廣告?zhèn)扰c要探索的流量側(cè)的匹配數(shù)據(jù)較少,屬于雙側(cè)冷啟,跑量難度大,且容易超成本。針對(duì)該痛點(diǎn)產(chǎn)品上基于好的快手用戶流量,對(duì)所有直播廣告,都能有高于均值的轉(zhuǎn)化,用這些用戶去做增量探索,超成本預(yù)計(jì)會(huì)遠(yuǎn)低于當(dāng)前無人群方向引導(dǎo)的 POS 盲探。將雙側(cè)冷啟問題轉(zhuǎn)變?yōu)閱蝹?cè)冷啟,同時(shí)利用 Bandit 算法,效果穩(wěn)定性更有保障。
人群落地的思路:憑借產(chǎn)品對(duì)業(yè)務(wù)的理解,收集電商、主站、商業(yè)化等多方數(shù)據(jù),組合維度,基于現(xiàn)有投放數(shù)據(jù)進(jìn)行人群評(píng)估,得出后驗(yàn)效果明顯高于聯(lián)盟直播整體值的多個(gè)人群條件組合,再驗(yàn)證圈選的人群仍在聯(lián)盟流量漏斗中存在足夠增量機(jī)會(huì)。使用 Bandit 算法在這些人群條件上進(jìn)行探索,逐步收斂。通過在目標(biāo)人群上拿到較高的消耗增量,來帶動(dòng)整體消耗的提升。
謝淼:有了這些信息,有助于我們縮小探索的范圍,集中炮火,加速算法迭代。還記得之前咱們合作第一個(gè)優(yōu)化點(diǎn)的時(shí)候,就是這樣,效率非常高,各司其職。
經(jīng)過雙側(cè)冷啟的解決方案的落地,我們需要建模一個(gè)從 1 到 2 的冷啟問題,期待廣告投放量能夠在某個(gè)媒體粒度上進(jìn)一步增大,這里的策略建模方式可以是以某個(gè)媒體粒度的實(shí)例為問題單元,即 machine,來通過平衡探索和利用優(yōu)選廣告,打破模型預(yù)估所陷入的局部最優(yōu)解,那么這里在落地時(shí)就會(huì)遇到一個(gè)棘手的問題,就是媒體側(cè)變化太大了,如果選擇的維度變化大,算法就可能存在沒有收斂趨勢(shì)的情況,即無法穩(wěn)定,在這種情況下,探索成本就比利用帶來的效果增長(zhǎng)要大很多,因此獲得不了收益。這個(gè)問題的確頭疼了很久。
白曉航:這個(gè)點(diǎn),我們運(yùn)營(yíng)可能有發(fā)言權(quán),講講對(duì)客戶的理解,推導(dǎo)出媒體行業(yè)和媒體場(chǎng)景的疊加粒度會(huì)較 POS 更為穩(wěn)定。
謝淼:對(duì),融合這個(gè)點(diǎn)后,經(jīng)過實(shí)驗(yàn),咱們做出的首版優(yōu)化就是基于這個(gè)理念。如果我們自己窮舉維度,一個(gè)個(gè)試,估計(jì)得拖幾個(gè)月才能上線。
晁楊:從流量和廣告?zhèn)冉嵌瓤?,每一?cè)都有很多影響因素,比如流量側(cè)有 App、POS、ADStyle、流量行業(yè)、用戶行為等,廣告?zhèn)葧?huì)有定向、創(chuàng)意、出價(jià)及人群等多個(gè)表達(dá),從探索的角度出發(fā)我們有很多可拆解的冷啟子問題,產(chǎn)品可以針對(duì)這些子問題,不斷挖掘新維度,給到算法增強(qiáng)迭代。
謝淼:對(duì),那樣的話,我們得解決這些策略疊加的問題,我們得設(shè)置大的兜底,以防止超成本的發(fā)生;于此同時(shí),我們還要繼續(xù)進(jìn)行更深的算法研究,以應(yīng)對(duì)產(chǎn)品在人群和維度上的迭代,比如隨著產(chǎn)品挖掘人群的程度越大,挖掘出來的人群可能種類就隨著增多,于是我們就需要考慮這些所帶來的迭代問題,如何讓算法自動(dòng)適應(yīng)越來越多的圈圈?這里可介紹下 AutoBandit 的思路。
晁楊:這樣一來,我們就可以并行迭代了,分別開實(shí)驗(yàn)看效果,螺旋上升。從去年的合作效果上看,我們的 AB 提升幅度達(dá)到了翻翻的指標(biāo)收益,AA 上看的確量起來了幾十倍,而且對(duì)已起量的其他行業(yè)廣告,沒有顯著負(fù)向。
白曉航:從我們運(yùn)營(yíng)角度,需要平衡算法風(fēng)險(xiǎn)和廣告主利益,介紹下平臺(tái)保護(hù)廣告主利益的機(jī)制。廣告主不用擔(dān)心算法迭代影響自身利益。
白曉航:我覺得這樣優(yōu)化行業(yè)大盤是沒有問題,但是我這里的問題還有重點(diǎn)廣告主的運(yùn)營(yíng),我們得做運(yùn)營(yíng)活動(dòng),沖擊消耗大盤,得滿足廣告主各自的訴求,這里可能跟大盤的優(yōu)化向矛盾,我們?cè)撛趺唇饽兀?/p>
晁楊: ?提產(chǎn)品理念。在廣告系統(tǒng)的產(chǎn)品設(shè)計(jì)上我們既要全局大盤最優(yōu),也要兼顧重要節(jié)點(diǎn)和重點(diǎn)客戶的訴求,為了解決運(yùn)營(yíng)同學(xué)面臨的這些問題,產(chǎn)研對(duì)運(yùn)營(yíng)工具做了大量的平臺(tái)化工作,主要是讓工具產(chǎn)品能夠更加智能化,比如上提到的多配置、不斷調(diào)參等可以通過約束目標(biāo)的方式,交給系統(tǒng)去探索,提升日常使用的效率和效果。
謝淼:我們之前也按照這種方式做過很多工作,例如針對(duì)綠通,我們可以以 Bandit 算法為基石,做個(gè)指標(biāo)正向且理論上可以配置無窮多個(gè)候選的非擠占綠通,介紹下原理(自創(chuàng)的 non-stationary e-greedy 算法)。另一方面,在運(yùn)營(yíng)干預(yù)廣告主出價(jià)的工具上,我們可以用 Bandit 來進(jìn)行對(duì)出價(jià)干預(yù)力度的自動(dòng)控制,運(yùn)營(yíng)只需設(shè)置上下界即可,而非直接固定一個(gè)干預(yù)力度。
InfoQ:聽上去你們之間的合作還是蠻緊密的,那么在互聯(lián)網(wǎng)公司中,合作都是這樣的嗎?還是你們摸索出來的,我理解產(chǎn)品像是個(gè) PMO 角色,但是在你們的合作中怎么還承擔(dān)了數(shù)據(jù)分析和業(yè)務(wù)理解的工作?
晁楊:這是一個(gè)非常好的問題,在回答產(chǎn)品工作內(nèi)容之前先簡(jiǎn)單說一下我理解的商業(yè)產(chǎn)品有哪幾大類,平臺(tái)產(chǎn)品、用戶產(chǎn)品、策略產(chǎn)品等,產(chǎn)品確實(shí)在工作中承擔(dān)了一部分 pmo 的角色,除此之外產(chǎn)品更多的工作內(nèi)容是如何解決業(yè)務(wù)問題,這個(gè)解決問題包含了深入業(yè)務(wù)、發(fā)現(xiàn)問題、理解問題、抽象邏輯和給出解決思路,對(duì)產(chǎn)品同學(xué)對(duì)不同行業(yè)客戶的商業(yè)模式和投放系統(tǒng)的理解有非常高的要求。
日常跟算法打交道比較的多是策略產(chǎn)品同學(xué),我自己概括策略產(chǎn)品的價(jià)值可以用一個(gè)詞“idea”來概括,idea 包含了上面講的全部,這個(gè) idea 就是解決某一具體業(yè)務(wù)問題的策略思路。產(chǎn)品同學(xué)給算法提需求的時(shí)候需要講清楚業(yè)務(wù)問題、數(shù)據(jù)邏輯和解決思路,我們常說的加強(qiáng)同算法的對(duì)話能力就是指提需求的過程,面對(duì)具體業(yè)務(wù)問題產(chǎn)品需要找到其中的機(jī)會(huì)點(diǎn),數(shù)據(jù)和邏輯上驗(yàn)證可行性后再去與算法聯(lián)動(dòng),同算法同學(xué)一同探討思路實(shí)現(xiàn)并不斷優(yōu)化。
通過上述的項(xiàng)目合作,我們?cè)诙嘈袠I(yè)取得了顯著效果,比如內(nèi)循環(huán),業(yè)務(wù)收益,尤其深度增長(zhǎng)了數(shù)十倍,游戲等外循環(huán)行業(yè)在 AA 上,也取得了較好的冷啟效果。
謝淼:在合作中,我們也沉淀了一些經(jīng)驗(yàn),被動(dòng)的等著產(chǎn)品提需求,往往有逆反心理,似乎是在給算法找 bug,因此得化被動(dòng)為主動(dòng),將這個(gè)需求轉(zhuǎn)化為算法的一部分,并且將算法拿到的收益與產(chǎn)品分享,達(dá)到共贏。
舉個(gè)例子,當(dāng)時(shí)做直播廣告起量的時(shí)候,有個(gè)問題就是不可能一下子對(duì)所有廣告主都起量,因此我們得貼著業(yè)務(wù)特性,挖一批最優(yōu)潛力的大 V 主播出來,挖的方法有很多,產(chǎn)品很擅長(zhǎng),而且可以通過歷史數(shù)據(jù),先粗略驗(yàn)證一下,最后把最佳的幾個(gè)后選,我們拿到線上實(shí)際配合算法策略做 ab 實(shí)驗(yàn),取得了業(yè)務(wù)收益,那么未來隨著時(shí)間的推移,這個(gè)挖掘的方法也應(yīng)該會(huì)與時(shí)俱進(jìn),產(chǎn)品可以自行通過離線分析和在線 ab 來迭代,因此如果沒有運(yùn)營(yíng)給出的行業(yè)建議,沒有產(chǎn)品的業(yè)務(wù)理解作為補(bǔ)充,AB 的收益可能也不會(huì)那么大,或者需要更長(zhǎng)的時(shí)間摸索。
InfoQ:這樣的確看上去,摸索出了一套技術(shù)、業(yè)務(wù)和產(chǎn)品的閉環(huán)合作方法。那么在此過程中三方分別積累了什么能力呢?是否能在不同的專業(yè)上各取所需?
白曉航:分享運(yùn)營(yíng)理念,摸索沉淀了一套運(yùn)營(yíng)問題及其對(duì)應(yīng)的分析和運(yùn)營(yíng)工具抓手,并且將 go to market 市場(chǎng)走深的客戶需求帶給合作團(tuán)隊(duì)。
晁楊:在此過程中,產(chǎn)品對(duì)業(yè)務(wù)的理解更加深刻,并且發(fā)現(xiàn)的機(jī)會(huì)點(diǎn)也越來越準(zhǔn),也在跟算法合作的過程中,了解了算法運(yùn)作機(jī)理,同時(shí)也看到了能通過業(yè)務(wù)理解對(duì)系統(tǒng)產(chǎn)生正向影響的抓手。
對(duì)于新行業(yè)的起量,積累了方法論,對(duì)于新的客戶訴求,也有逼迫算法進(jìn)行針對(duì)性優(yōu)化的抓手。感覺其他類型的業(yè)務(wù)問題,這個(gè)方法論依然奏效,核心是找到雙方優(yōu)勢(shì)互補(bǔ)的地方,而不是干干地做提需求的一方,也應(yīng)該擁抱算法所提出的需求。
謝淼:在探索出有效地合作模式后,我們就可以沉下心做更深入的算法研究且迭代業(yè)務(wù)認(rèn)知,使得算法能力持續(xù)在行業(yè)保持領(lǐng)先,例如隨著算法落地和走深,我們發(fā)現(xiàn)很多有意思的待解問題,比如剛剛提到的 Bandit 算法作為算法策略的一部分,是可以起到對(duì)模型預(yù)估糾偏的功能的,但是模型一定能隨著樣本的增多,預(yù)估就一定能變準(zhǔn)嗎?不一定,或者說在業(yè)務(wù)中需要很長(zhǎng)時(shí)間可能才能體會(huì)到預(yù)估逐漸變準(zhǔn)的過程,那么能不能將深度學(xué)習(xí)模型和 Bandit 算法融合起來?針對(duì)這一點(diǎn),我們是有一些研究成果的,同時(shí)這個(gè)問題也是學(xué)術(shù)界近年來的研究熱點(diǎn)問題。
往深一步,如果能夠從產(chǎn)品的需求中抽身出來,我們還能暢享一下,通過我們的努力,使得 Bandit 的學(xué)術(shù)成果轉(zhuǎn)化為業(yè)內(nèi)生產(chǎn)力更加便捷。
InfoQ:冷啟問題,不光在廣告系統(tǒng)中存在,其實(shí)很多在線系統(tǒng)都存在這個(gè)問題,市場(chǎng)空間是不是也蠻多的?從技術(shù)本身,能打造技術(shù)、產(chǎn)品到業(yè)務(wù)的閉環(huán)嗎?
謝淼:嗯,是的,冷啟問題在互聯(lián)網(wǎng)上的應(yīng)用場(chǎng)景是非常多的,我們每天都能看到成百上千的新 App 在應(yīng)用市場(chǎng)上架,其中每個(gè)新 App 都會(huì)遇到冷啟問題;具體而言呢,小到推薦場(chǎng)景中的一張圖片,一個(gè)視頻的封面圖,都需要優(yōu)選,這個(gè)是很難借助一個(gè)深度模型直接優(yōu)化的,是典型的冷啟問題,再比如一個(gè)場(chǎng)景中的新品推薦問題,大促上的問題,日常和大促用戶行為和興趣均不相同,在線系統(tǒng)中的參數(shù)調(diào)優(yōu)問題等,所以只要能建模為選擇性問題且模型不能給出非常準(zhǔn)的預(yù)估時(shí),都是 Bandit 算法的適用范圍。
因此如果我們能將 Bandit 算法變成算法產(chǎn)品,讓更多的業(yè)務(wù)可以非常低成本的接入,則將是企業(yè)降本增效,顯著提升生產(chǎn)效率的一環(huán)。Bandit 產(chǎn)品化,核心能解決理論工作到實(shí)際落地的鴻溝,將采完的坑,加到產(chǎn)品功能中,幫助客戶避坑。
那么如何構(gòu)建該產(chǎn)品的門檻呢?我們嘗試通過如下三個(gè)方面來進(jìn)行構(gòu)建壁壘:(1)提供基于實(shí)踐經(jīng)驗(yàn)的避坑功能,幫助用戶有效避免典型的應(yīng)用誤區(qū),比如應(yīng)用環(huán)境和算法假設(shè)自動(dòng)審查,在利用 UCB,TS 等不能支持大量 arm 的算法時(shí),自動(dòng)檢測(cè) arm 的數(shù)量是否過多;(2)提供能夠快速收斂,拿到指標(biāo)收益的功能,例如產(chǎn)品支持算法應(yīng)用范圍導(dǎo)入功能,把業(yè)務(wù)中不適合探索的部分過濾掉;(3)不斷地以應(yīng)用中的實(shí)際問題推動(dòng)算法的創(chuàng)新,并將這些創(chuàng)新轉(zhuǎn)化為產(chǎn)品力,例如我們針對(duì)給定業(yè)務(wù)場(chǎng)景,通過 AutoML 思路,自動(dòng)地通過 Bandit 算法尋優(yōu)超參,甚至直接尋優(yōu) Bandit 算法本身的 AutoBandit,降低應(yīng)用時(shí)對(duì)人工經(jīng)驗(yàn)的依賴,真正做到智能尋優(yōu)。
2023 年 4 月 21-22 日,ArchSummit 全球架構(gòu)師峰會(huì)將落地上海·明捷萬麗酒店。來自阿里、順豐、保時(shí)捷、肯德基、蔚來汽車、Shopee 等企業(yè)的技術(shù)專家,將就微服務(wù)架構(gòu)、大數(shù)據(jù)架構(gòu)、開源、國(guó)產(chǎn)軟件、制造業(yè)數(shù)字化轉(zhuǎn)型、金融業(yè)數(shù)字化轉(zhuǎn)型、人工智能、架構(gòu)師進(jìn)階等主題展開分享討論。
關(guān)鍵詞: