這是我的半小時(shí)讀懂系列的一篇新的文章。這篇文章不會(huì)用更難懂的技術(shù)術(shù)語(yǔ)去解釋本來(lái)已經(jīng)很難懂的技術(shù)與概念。事實(shí)上,我們只要知道,隱私計(jì)算技術(shù)在數(shù)字營(yíng)銷(xiāo)領(lǐng)域里的關(guān)鍵應(yīng)用,以及背后的原理即可。
當(dāng)然,這個(gè)話題非常非常龐大,并不是三言?xún)烧Z(yǔ)能說(shuō)清楚的。但相信你讀了我這篇文章,會(huì)清楚很多一直以來(lái)在心里模模糊糊的東西。
1 企業(yè)自己的數(shù)據(jù),在數(shù)字營(yíng)銷(xiāo)中越來(lái)越重要
在介紹隱私計(jì)算在數(shù)字營(yíng)銷(xiāo)中的應(yīng)用之前,先要說(shuō)明一個(gè)非常非常重要的一點(diǎn),那就是企業(yè)(廣告主)自己的數(shù)據(jù),在數(shù)字營(yíng)銷(xiāo)中的作用越來(lái)越重要。
企業(yè)自有的一方數(shù)據(jù)的作用,以及在構(gòu)成全局性營(yíng)銷(xiāo)(例如行業(yè)中所說(shuō)的全域、全鏈路之類(lèi))中的意義。
不過(guò),《中華人民共和國(guó)個(gè)人信息保護(hù)法》的出臺(tái),很大程度上限制了企業(yè)一方數(shù)據(jù)的隨意應(yīng)用。最典型的,幾乎所有在廣告投放上的一方數(shù)據(jù)應(yīng)用,都需要由企業(yè)之外的實(shí)體(一方或多方)參與,這就可能導(dǎo)致數(shù)據(jù)直接的轉(zhuǎn)移和使用與法律規(guī)定的要求相違背。
即便沒(méi)有法律的限制,一方數(shù)據(jù)在應(yīng)用中也涉及到泄露企業(yè)的機(jī)密信息的可能性。如果我是廣告主,在我將自己的一方數(shù)據(jù)拿給媒體用于找人投放的時(shí)候,我確實(shí)會(huì)非常猶豫。
法律限制、保密需求,與讓一方數(shù)據(jù)發(fā)揮真正的價(jià)值產(chǎn)生了嚴(yán)重的矛盾,而這樣的矛盾,目前只有隱私計(jì)算能夠很大程度上地緩解。
2 撞庫(kù)
一方數(shù)據(jù)指導(dǎo)投放的邏輯是這樣的:廣告主將自有的、包含ID的消費(fèi)者數(shù)據(jù)“交給”媒體,然后媒體在自己數(shù)據(jù)庫(kù)中也同時(shí)查找這些ID。如果找得到同樣的ID,那么媒體就開(kāi)始基于媒體自己的數(shù)據(jù),分析這些ID背后的用戶(hù)是什么樣的人,也就是我們說(shuō)的,分析這些人的標(biāo)簽或者特征。然后,媒體在自己的數(shù)據(jù)庫(kù)的海量數(shù)據(jù)中,查找與這些ID具有類(lèi)似標(biāo)簽,或者具有類(lèi)似特征的人。
一旦找到了類(lèi)似特征的用戶(hù),就把這些人的ID記錄下來(lái),作為可以針對(duì)性投放的人群。一旦這些ID背后的用戶(hù)打開(kāi)了媒體的網(wǎng)頁(yè)或者應(yīng)用,廣告就會(huì)出現(xiàn)在這些人打開(kāi)的網(wǎng)頁(yè)或者應(yīng)用上面的廣告位上。
這就是我們常說(shuō)的look-alike的投放的“大白話”的原理。除了這種最為常見(jiàn)的look-alike,一方數(shù)據(jù)與媒體端的二方數(shù)據(jù)或者其他方的三方數(shù)據(jù),如果能夠連接、打通這些數(shù)據(jù),就能夠應(yīng)用在很多數(shù)字營(yíng)銷(xiāo)中此前不能實(shí)現(xiàn)的應(yīng)用場(chǎng)景上。關(guān)于這些場(chǎng)景是什么,我們?cè)谶@篇文章的后半段會(huì)具體講述。
為了實(shí)現(xiàn)連接與打通這些消費(fèi)者數(shù)據(jù),數(shù)據(jù)中的ID至關(guān)重要,這個(gè)ID必須是廣告主和媒體共同利用的ID類(lèi)型。比如,廣告主和媒體雙方都用手機(jī)號(hào)碼識(shí)別用戶(hù),或者都用設(shè)備ID(deviceID)識(shí)別用戶(hù)。
現(xiàn)在,另一個(gè)至關(guān)重要的問(wèn)題需要解決,那就是我打了雙引號(hào)并且加粗了的“交給”二字。
廣告主是如何將自己的一方數(shù)據(jù)連同ID一起“交給”媒體的呢?
過(guò)去,媒體提供給廣告主一個(gè)上傳數(shù)據(jù)的操作界面,廣告主把自己的一方消費(fèi)者數(shù)據(jù),上傳給媒體就可以了。
最開(kāi)始,這些一方消費(fèi)者數(shù)據(jù)的上傳,是明文的。
但這么做,廣告主風(fēng)險(xiǎn)巨大,媒體也漸漸不想接受這些明文數(shù)據(jù)。因?yàn)槊襟w若接受了這些數(shù)據(jù),它也要承擔(dān)法律責(zé)任,而廣告主隨意上傳明文消費(fèi)者數(shù)據(jù)且不說(shuō)會(huì)泄露消費(fèi)者個(gè)人信息,它自己的商業(yè)機(jī)密也被泄露了。
所以,媒體之后,都要求廣告主上傳經(jīng)過(guò)加密的消費(fèi)者數(shù)據(jù)(MD5或者SHA256加密)。
MD5或者SHA256,都是不可逆的加密。也就是說(shuō),不可能通過(guò)加密之后的密文還原為原文。加密了之后如果把原文完全毀掉并且忘掉了,想要找回原文是不可能的。當(dāng)然,不能通過(guò)密文還原為原文,不代表不能用別的方法還原為原文——這一點(diǎn)極為重要,也是我們后面隱私計(jì)算能夠?qū)崿F(xiàn)的基礎(chǔ)之一。
假如,我用SHA256加密了一段文字:“我愛(ài)公眾號(hào)宋星的數(shù)字觀”,變成了密文
“43d24306cf8a96d5b47f33114bdc66ef0c32cd26b639a4f71f5dfe13c65bce43”。然后我忽然得了失憶癥,忘掉了原文是什么,而且我也沒(méi)有任何記錄記下我的原文是什么。現(xiàn)在我手上只有這段完全看不懂什么意思的密文。
按道理講,我永遠(yuǎn)也不可能再知道這段密文對(duì)應(yīng)的明文是什么了。
但天無(wú)絕人之路。正巧我的朋友,他也曾經(jīng)加密了很多文字,其中也包括“我愛(ài)公眾號(hào)宋星的數(shù)字觀”這十一個(gè)字。
并且,他沒(méi)有丟掉他的原文和加密密文的對(duì)應(yīng)記錄。
我于是去找他,希望搞清楚我的密文“43d24306cf8a96d5b47f33114bdc66ef0c32cd26b639a4f71f5dfe13c65bce43”背后到底是什么原文。
他把這個(gè)密文跟他所有的密文做一個(gè)vlookup的匹配,或者干脆來(lái)個(gè)Ctrl+F,直接就找到了他那邊的同樣的密文,然后對(duì)照著他的原文和密文對(duì)照表,他輕松找到了“我愛(ài)公眾號(hào)宋星的數(shù)字觀”。

上圖:撞庫(kù)
我想你一定已經(jīng)理解了背后的原因,就是這種SHA256等不可逆加密的背后,是不需要密鑰的,而且任何人,只要他加密的原文是一樣的,那么得到的密文也就一模一樣。
無(wú)論是用戶(hù)ID,還是一段話,只要是相同的,那么SHA256之后的密文,不會(huì)有區(qū)別。
因此,廣告主把自己的消費(fèi)者的電話號(hào)碼一一用SHA256加密,然后拿著密文上傳給媒體,只要媒體那邊也有這些消費(fèi)者的電話號(hào)碼,那么就能夠同樣把這些電話號(hào)碼用SHA256加密之后,進(jìn)行匹配。
雖然是用加密的密文進(jìn)行匹配,但是用原文密文的對(duì)照表一對(duì)照,也就知道了明文是什么。
這種方法,有一個(gè)學(xué)名,叫“隱私集合求交”,也被俗稱(chēng)為“安全求交”。但,實(shí)際上,“安全”二字很勉強(qiáng),它本質(zhì)上就是行業(yè)中常說(shuō)的“撞庫(kù)”的方法。
你會(huì)說(shuō),這樣加密還有什么意義,只要保留著加密的明文和密文之間的對(duì)應(yīng)關(guān)系,那么什么不可逆加密之類(lèi)的,都照樣會(huì)被破解。廣告主就算把消費(fèi)者的ID都加密了,上傳給媒體,媒體照樣還是很有可能把這些密文對(duì)應(yīng)的ID給找回來(lái)。
并不是沒(méi)有意義。上面這些不可逆加密的方法,確實(shí)不妨礙媒體還原廣告主上傳的消費(fèi)者ID。但數(shù)據(jù)傳輸?shù)闹虚g過(guò)程中,例如需要由第三方經(jīng)手的時(shí)候,數(shù)據(jù)萬(wàn)一發(fā)生泄露,消費(fèi)者ID明文被暴漏的風(fēng)險(xiǎn)大大降低了。
比如,我是廣告主,我找一個(gè)agency幫我上傳相關(guān)的數(shù)據(jù)給媒體。在明文操作的情況下,agency可以拿到這些消費(fèi)者ID,并且agency的員工有可能獲得這些ID,這是很不安全的。但是,如果加密了,就算agency拿到了這些密文,也不會(huì)有大量的手機(jī)號(hào)碼和對(duì)應(yīng)的密文的對(duì)照表,風(fēng)險(xiǎn)也會(huì)更小。
講到這里,跟隱私計(jì)算還沒(méi)有什么關(guān)系。下面,隱私計(jì)算要出場(chǎng)了。
3 隱私計(jì)算為什么是必須的
在上面的場(chǎng)景中,有些廣告主介意自己的消費(fèi)者ID上傳給媒體,哪怕是加密了,這些廣告主仍然覺(jué)得自己的消費(fèi)者ID會(huì)通過(guò)撞庫(kù)被媒體掌握。
比如,奧迪說(shuō),我可不愿意把我的消費(fèi)者ID上傳給媒體,要是上傳給了媒體,媒體就知道這些ID背后,是我的消費(fèi)人群,媒體就可能轉(zhuǎn)手把我的這些ID用于給其他車(chē)廠進(jìn)行營(yíng)銷(xiāo)所用,比如給寶馬或者特斯拉投廣告,就直接投放給這些ID。
隱私計(jì)算可以解決這個(gè)問(wèn)題,即廣告主ID保密情況下的ID匹配與數(shù)據(jù)應(yīng)用。這種基于各方共有ID并在匹配ID(撞庫(kù))之后進(jìn)行的相關(guān)計(jì)算,被稱(chēng)為“縱向聯(lián)邦學(xué)習(xí)”。
另一些廣告主,則有更高的要求,他們說(shuō),我的這些消費(fèi)者,不僅僅只有ID,還有很多ID背后的屬性,這些數(shù)據(jù),能不能跟媒體或者第三方的數(shù)據(jù)結(jié)合起來(lái),用于更好地洞察消費(fèi)者?或者結(jié)合起來(lái)更好地圈選消費(fèi)者?不過(guò),這些屬性不能透露給媒體或者第三方,也就是說(shuō),要在不給媒體或者第三方提供數(shù)據(jù)的情況下實(shí)現(xiàn)基于一方、二方(或三方數(shù)據(jù))相結(jié)合的人群洞察和圈選。
這也是隱私計(jì)算可以解決的問(wèn)題,即在不共享消費(fèi)者屬性數(shù)據(jù)的情況下,實(shí)現(xiàn)對(duì)屬性數(shù)據(jù)的應(yīng)用。
這些應(yīng)用對(duì)于實(shí)現(xiàn)一些重要的數(shù)字營(yíng)銷(xiāo)場(chǎng)景至關(guān)重要,畢竟,數(shù)據(jù)如果不能夠連通起來(lái),數(shù)據(jù)的價(jià)值就大打折扣,數(shù)據(jù)在數(shù)字營(yíng)銷(xiāo)上的作用就得不到充分發(fā)揮??梢赃@么說(shuō),今天的數(shù)字營(yíng)銷(xiāo),如果沒(méi)有隱私計(jì)算的幫助,很多高級(jí)的玩法都無(wú)法實(shí)現(xiàn)。
我們先看看“廣告主ID保密情況下的ID匹配與數(shù)據(jù)應(yīng)用”問(wèn)題如何通過(guò)隱私計(jì)算加以解決。
4 在ID保密情況下的ID求交與數(shù)據(jù)應(yīng)用
前面說(shuō)了,ID保密是廣告主在意的,他們不希望自己消費(fèi)者的ID被媒體知道,以免媒體把自己的ID也用于自己競(jìng)爭(zhēng)對(duì)手的推廣。
但自己的ID總是要跟媒體的ID做匹配的,一旦匹配了,那豈不是自己的這些ID,媒體就完全知道了。

上圖:交集ID可以不泄露嗎?
因此,必須解決這個(gè)問(wèn)題。
利用差分隱私實(shí)現(xiàn)匿蹤安全求交
這個(gè)問(wèn)題的解決,要靠加入一些“混淆ID”。
所謂“混淆ID”,也叫“隨機(jī)噪聲”,就是廣告主在跟媒體匹配的時(shí)候,額外隨機(jī)添加很多其他與廣告主消費(fèi)者不相關(guān)的ID。這樣,媒體就不知道廣告主真正的消費(fèi)者到底是哪些了。
比如,A是廣告主,自己的消費(fèi)者手機(jī)號(hào)碼有5000個(gè),想要跟媒體B進(jìn)行ID匹配。但為了不把這些ID暴露給媒體,于是又摻雜了45000個(gè)其他的手機(jī)號(hào)碼。這樣,湊齊了5萬(wàn)個(gè)手機(jī)號(hào)碼,跟媒體匹配。
媒體,當(dāng)然也就不知道這5萬(wàn)個(gè)手機(jī)號(hào)碼中到底哪些是廣告主的消費(fèi)者了。廣告主的ID就此實(shí)現(xiàn)了保密!
這種利用“摻混淆數(shù)據(jù)”保護(hù)秘密(隱私)的方法,被稱(chēng)為“差分隱私”。差分隱私有很多方法,這里講的只是一種最容易理解的方法。其他各種摻入混淆數(shù)據(jù)的方法,要基于各種各樣的算法,以保證混淆的效果,這里就不多介紹了。
加入了差分隱私的ID匹配,也被稱(chēng)為“匿蹤安全求交”。

上圖:基于“混淆差分”的安全求交
講到這里,你肯定會(huì)一頭霧水了。按照這樣的匹配方法,廣告主的數(shù)據(jù)豈不是也被污染了?比如,廣告主要找跟自己已有的這5千消費(fèi)者相近似的人群,結(jié)果,媒體按照的卻是“摻水”的5萬(wàn)個(gè)人群去尋找近似人群。廣告主雖然保住了秘密,但是營(yíng)銷(xiāo)效果卻南轅北轍了!
你的擔(dān)憂不是多余的,這絕對(duì)是非常重大的問(wèn)題。為了解決這個(gè)問(wèn)題,需要再引入一些新的東西。
這個(gè)新的東西,是媒體和廣告主中間的一個(gè)可信第三方。
可信第三方
還是回到前面這個(gè)例子,A是廣告主,B是媒體,那么這個(gè)可信第三方就是C。
C的職責(zé)很重要。
廣告主(A)要把自己的5000個(gè)手機(jī)號(hào)碼加密發(fā)給第三方(C),然后C幫忙再摻入45000個(gè)起混淆作用的手機(jī)號(hào)碼。
然后C幫助A,跟媒體(B)進(jìn)行數(shù)據(jù)匹配。匹配完成后,B將自己的數(shù)據(jù)結(jié)果(個(gè)體級(jí)別的用戶(hù)屬性數(shù)據(jù)),以加密的形式發(fā)給C。
C針對(duì)B發(fā)回的加密屬性,把混淆ID的加密屬性去掉(剝離),然后計(jì)算廣告主5000個(gè)手機(jī)號(hào)碼中能匹配到的那些人的加密屬性,并且歸納出這些人的共性特征。這些共性特征,不再帶有個(gè)人屬性,而是統(tǒng)計(jì)級(jí)別的數(shù)據(jù),所以不再涉及到廣告主A的消費(fèi)者的ID。并且這些共性特征是由媒體B發(fā)來(lái)的加密屬性計(jì)算出來(lái)的,因此,也是加密狀態(tài)。
第三方C再把這些共性特征返回給媒體B,媒體把這些加密狀態(tài)的共性特征解密,之后尋找與這些共性特征相同或者相近的人群,幫助廣告主進(jìn)行廣告投放。

上圖:加入可信第三方的匿蹤安全求交
同態(tài)加密
你肯定又有問(wèn)題了,為什么C計(jì)算的是媒體B發(fā)來(lái)的加密的個(gè)體屬性。加密之后,還能計(jì)算嗎?
答案是,能。因?yàn)殡[私計(jì)算有另外一個(gè)技術(shù),叫“同態(tài)加密”。所謂同態(tài)加密,就是計(jì)算原文(明文)的結(jié)果,和計(jì)算這些明文加密之后的密文的結(jié)果,是完全一樣的。如果原文用了某個(gè)算法和秘鑰進(jìn)行了加密,那么加密之后,做“加減乘除”以及各種各樣的數(shù)學(xué)計(jì)算之后得到的結(jié)果,再利用該加密算法和秘鑰解密之后,得到的結(jié)果,和直接用明文做同樣的數(shù)學(xué)計(jì)算得到的結(jié)果一樣。
這樣,C在計(jì)算媒體B發(fā)來(lái)的加密個(gè)體屬性,得到的共同屬性特征,雖然也是加密的,但是在B那里做一個(gè)解密就可以直接應(yīng)用于圈選人群了。甚至,今天的技術(shù),連解密都不需要,就可以直接圈選人群了,這樣安全性進(jìn)一步提高。

這樣,廣告主A沒(méi)有暴露自己真正的消費(fèi)者ID;媒體B也沒(méi)有透露自己這些ID背后的屬性;第三方C,幫助A和B完成了數(shù)據(jù)匹配,也計(jì)算出A消費(fèi)者的共性特征,卻也不知道這些特征具體是什么。只要C信守誠(chéng)信,不泄露A交給他的加密的消費(fèi)者ID,那么整個(gè)過(guò)程,就是相當(dāng)安全的。
這就是隱私計(jì)算在數(shù)字營(yíng)銷(xiāo)上的一個(gè)非常典型且重要的應(yīng)用。
5 對(duì)交集ID進(jìn)行保密的進(jìn)一步優(yōu)化
基于可信硬件技術(shù)的安全屋
上面的“匿蹤安全求交”需要加入很多“噪聲”,同時(shí)對(duì)第三方的計(jì)算能力的要求很高。而且,還要確保第三方是誠(chéng)實(shí)可信的。
因此,在實(shí)踐中,采用這種方法并不多。大部分時(shí)候,廣告主和媒體都怕麻煩,媒體會(huì)直接在自己的服務(wù)器內(nèi)辟出一個(gè)所謂的“安全屋”,然后讓這個(gè)安全屋扮演上面第三方C的角色,發(fā)揮安全求交或是逆蹤求交的作用。
這是目前最常見(jiàn)的實(shí)現(xiàn)方式,但談不上小標(biāo)題所說(shuō)的優(yōu)化,只能算是簡(jiǎn)化。這種簡(jiǎn)化,多多少少有點(diǎn)“自欺欺人”的味道。
當(dāng)然,這種方法也不能說(shuō)一無(wú)是處,媒體會(huì)強(qiáng)調(diào),廣告主的數(shù)據(jù)會(huì)在“可信硬件技術(shù)”之下被隔離保護(hù)起來(lái),對(duì)廣告主數(shù)據(jù)的操作,也是在這些硬件內(nèi)進(jìn)行的,并不會(huì)被泄露到這些硬件之外。
可信硬件技術(shù),也在行業(yè)中被俗稱(chēng)為“數(shù)據(jù)安全島”。
可信硬件技術(shù)主要解決下面的問(wèn)題:
1. 數(shù)據(jù)獨(dú)立(data separation):存儲(chǔ)在某個(gè)分區(qū)中的數(shù)據(jù)不能被其他的分區(qū)讀取或篡改。也就是說(shuō),廣告主用于安全求交的ID,是不會(huì)被放到除可信硬件之外的地方的。
2. 時(shí)間隔離(temporal separation):公共資源區(qū)域中的數(shù)據(jù)不會(huì)泄露任意分區(qū)中的數(shù)據(jù)信息。計(jì)算資源,例如CPU,也有專(zhuān)門(mén)隔離的時(shí)間切片,來(lái)處理可信硬件中的數(shù)據(jù)。
3. 信息流控制(Control of information flow):
除非有特殊的授權(quán),否則各個(gè)分區(qū)之間不能進(jìn)行通信。
4. 故障隔離(Fault isolation):一個(gè)分區(qū)中的安全性漏洞不能傳播到其他分區(qū)。
如果媒體嚴(yán)格采用可信硬件技術(shù)及管理,確實(shí)能夠確保廣告主提供的ID不被挪作他用。當(dāng)然了,媒體是不是都能?chē)?yán)格自律,我們可以看他們獲得的執(zhí)行標(biāo)準(zhǔn)的認(rèn)證,比如《信息安全技術(shù) 可信執(zhí)行環(huán)境服務(wù)規(guī)范》認(rèn)證之類(lèi)。不過(guò)認(rèn)證這東西也不能100%全信,具體哪個(gè)媒體合格,哪個(gè)媒體不合格,就不在本文討論的范圍了。
全匿名下的安全求交(尚無(wú)定論)
上面的方法,對(duì)那些“較真”的廣告主而言,可能是不可接受的。
有些廣告主,一定要求自己上傳的ID不能被媒體知曉,那怕是加密后,并且媒體保證只用這些ID做撞庫(kù)也不行。因此,他們迫切需要知道,是否有比“匿蹤安全求交”更優(yōu)化的方法解決這個(gè)問(wèn)題。
目前,隱私計(jì)算的技術(shù)解決方案提供商可能已經(jīng)找到了解法。這個(gè)解法,頗有些“釜底抽薪”的味道。簡(jiǎn)單講,任何求交的過(guò)程,都必然會(huì)導(dǎo)致交集ID被求交的雙方共同掌握(安全求交),或是被第三方掌握(匿蹤安全求交)。那么,如果能夠不做求交,就實(shí)現(xiàn)跟求交一樣的效果,把廣告主ID和媒體ID匹配的用戶(hù)的屬性直接計(jì)算出來(lái),就不存在廣告主的消費(fèi)者ID被媒體知曉的情況了。
在2022年的一個(gè)新聞稿中,某個(gè)數(shù)據(jù)科技公司提到,他們的技術(shù)能夠:“無(wú)需安全求交、不泄露交集ID、在全匿名數(shù)據(jù)集下進(jìn)行聯(lián)邦學(xué)習(xí)的技術(shù)難題,真正符合《數(shù)據(jù)安全法》和《個(gè)人信息保護(hù)法》的要求,進(jìn)一步加強(qiáng)了用戶(hù)數(shù)據(jù)安全和隱私保護(hù)。”
真的可以嗎?我的客戶(hù)和我見(jiàn)過(guò)的媒體都還沒(méi)有采用,所以,我暫時(shí)還不能給出肯定的回答。但看到這個(gè)消息,至少讓我覺(jué)得這個(gè)方向是有可能的。
6 ID求交(撞庫(kù))和可信硬件環(huán)境下的數(shù)字營(yíng)銷(xiāo)應(yīng)用場(chǎng)景
廣告主的消費(fèi)者ID和媒體的用戶(hù)的ID打通,本質(zhì)上就是廣告主私域用戶(hù)的ID,和媒體的公域人群的ID的打通。
一旦打通,很多數(shù)字營(yíng)銷(xiāo)的應(yīng)用就變得可能。
應(yīng)用一:Retargeting
Retargeting:廣告主把那些在自己的私域中留下了各種行為和痕跡,但卻沒(méi)有實(shí)現(xiàn)最終轉(zhuǎn)化的人的ID收集起來(lái),然后把這些ID跟媒體的ID做安全求交,之后在媒體上給這些人投放定向廣告。
比如,某次大促,廣告主A花了一個(gè)億,引流到自己的私域小程序上,并獲得了1000萬(wàn)個(gè)OpenID。然后,這1000萬(wàn)個(gè)OpenID中,有100萬(wàn)個(gè)發(fā)生了購(gòu)買(mǎi)行為,剩下900萬(wàn)個(gè)沒(méi)有購(gòu)買(mǎi)。于是,廣告主A又找騰訊,把這900萬(wàn)OpenID跟騰訊廣告做安全求交,隨之對(duì)這900萬(wàn)人進(jìn)行定向的朋友圈廣告投放。
應(yīng)用二:Look-alike
跟Retargeting其實(shí)本質(zhì)沒(méi)有什么區(qū)別,只是多了一個(gè)步驟,即look-alike的步驟。
還是上面那個(gè)例子,廣告主A覺(jué)得對(duì)900萬(wàn)個(gè)沒(méi)有購(gòu)買(mǎi)的投放一次廣告,人數(shù)有點(diǎn)少。于是就找騰訊廣告說(shuō),我跟你安全求交后,請(qǐng)你幫我找到跟這100萬(wàn)購(gòu)買(mǎi)人群類(lèi)似的更多的人。于是騰訊廣告基于這100萬(wàn)購(gòu)買(mǎi)人群的共性特征,幫助廣告主A找到了3000萬(wàn)個(gè)跟這100萬(wàn)人類(lèi)似的人。隨之對(duì)這3900萬(wàn)(3000萬(wàn)look-alike的人,加上900萬(wàn)retargeting的人)人進(jìn)行廣告投放。
應(yīng)用三:基于一方、二方數(shù)據(jù)的聯(lián)合人群圈選
這個(gè)是一個(gè)非常有意思的應(yīng)用,是目前比較高端的應(yīng)用。媒體可能只對(duì)部分大型廣告主開(kāi)放該功能。
具體實(shí)現(xiàn)如下:
廣告主將自己的消費(fèi)者ID,以及每個(gè)ID對(duì)應(yīng)的屬性標(biāo)簽,在加密后,上傳到媒體提供的可信硬件環(huán)境中。
媒體與這些ID進(jìn)行安全求交。
求交之后,能夠匹配到的ID,媒體也把這些ID對(duì)應(yīng)的媒體端所擁有的屬性數(shù)據(jù),上傳到該硬件環(huán)境中。
此時(shí),這個(gè)硬件環(huán)境中,也就是數(shù)據(jù)安全島中,就集合了交集ID,以及每個(gè)ID所對(duì)應(yīng)的廣告主的一方屬性標(biāo)簽,和媒體的二方屬性標(biāo)簽。
媒體基于這些ID和屬性標(biāo)簽,以及基于這個(gè)可信硬件環(huán)境,為廣告主提供一個(gè)圈選人群的界面。廣告主在這個(gè)界面中,根據(jù)自己的需求,基于一方、二方的屬性標(biāo)簽,進(jìn)行人群圈選。
比如,廣告主A,跟媒體通過(guò)安全求交,匹配了1000萬(wàn)人。這1000萬(wàn)人,廣告主自己的標(biāo)簽是過(guò)去一年內(nèi)的購(gòu)物數(shù)據(jù)和私域內(nèi)的互動(dòng)行為數(shù)據(jù)。而媒體端,則是這1000萬(wàn)人的社會(huì)屬性和興趣愛(ài)好數(shù)據(jù)。
基于聯(lián)合人群圈選的解決方案,廣告主A可以選擇,在過(guò)去3個(gè)月內(nèi)購(gòu)買(mǎi)了某類(lèi)商品,且興趣愛(ài)好是旅游的一線城市的20-30歲的女生。
圈選之后,媒體基于圈選結(jié)果得到的ID,進(jìn)行廣告投放,或是按照廣告主A的要求做其他營(yíng)銷(xiāo)觸達(dá)。
或者,廣告主也可以先基于自己的一方數(shù)據(jù)標(biāo)簽,圈選出人群,然后再看這些人群的二方屬性是什么。從而更好地洞察自有消費(fèi)者。
比如,廣告主A基于自己的一方數(shù)據(jù),圈選出3個(gè)月內(nèi)購(gòu)買(mǎi)某類(lèi)商品的人群,然后再在這個(gè)界面上要求媒體對(duì)這些做畫(huà)像。媒體會(huì)提供這些人的二方屬性的統(tǒng)計(jì)報(bào)告。
應(yīng)用四:數(shù)據(jù)下發(fā)
所謂數(shù)據(jù)下發(fā),是指媒體基于ID求交之后,將個(gè)體級(jí)別的數(shù)據(jù)傳輸給媒體。
最典型的,就是“會(huì)員通”。
廣告主將自己的會(huì)員ID加密后,上傳給電商平臺(tái)提供的“會(huì)員通”服務(wù)指定的可信硬件環(huán)境中(例如,阿里的聚石塔、京東的云鼎),ID在這里進(jìn)行求交。求交之后能匹配上的ID的會(huì)員相關(guān)的數(shù)據(jù),會(huì)傳輸給廣告主。
應(yīng)用五:Leads打分或決策判斷
指在ID求交之后,第二方或者第三方為廣告主提供是否應(yīng)該為該ID進(jìn)行某項(xiàng)營(yíng)銷(xiāo)行為的判斷決策。
比如,汽車(chē)廣告主,將收集到的線索(leads)ID,通過(guò)安全求交的方法與運(yùn)營(yíng)商的數(shù)據(jù)相匹配。匹配后,運(yùn)營(yíng)商提供一個(gè)線索價(jià)值的打分返回給廣告主。
7 安全求交之外的隱私計(jì)算應(yīng)用
安全求交并不是隱私計(jì)算在數(shù)字營(yíng)銷(xiāo)中的唯一應(yīng)用。我們前面講過(guò),安全求交本質(zhì)上是“縱向聯(lián)邦學(xué)習(xí)”。
同樣,“橫向聯(lián)邦學(xué)習(xí)”在數(shù)字營(yíng)銷(xiāo)中也有應(yīng)用。
比如,我們?nèi)绻?000萬(wàn)個(gè)汽車(chē)購(gòu)買(mǎi)者的私域數(shù)據(jù)樣本,就能計(jì)算出,購(gòu)車(chē)人在私域中做出的哪些行為(或行為的組合),就意味著他們要買(mǎi)車(chē)了。這個(gè)計(jì)算的結(jié)果,就是“購(gòu)車(chē)預(yù)測(cè)模型”。
但可惜,每個(gè)汽車(chē)主機(jī)廠最多的樣本也只有200萬(wàn)個(gè)。于是多個(gè)主機(jī)廠聯(lián)合起來(lái),他們不分享任何的ID給彼此(不做安全求交),而是各自基于自己的樣本先計(jì)算一個(gè)“粗糙的”購(gòu)車(chē)預(yù)測(cè)模型。然后各自把自己計(jì)算的模型結(jié)果上傳到一個(gè)第三方,第三方基于這些車(chē)廠的模型,整合出一個(gè)新的模型。并把這個(gè)新的模型下發(fā)給各個(gè)主機(jī)廠,再次做計(jì)算,以?xún)?yōu)化這個(gè)模型的“梯度”。
至于什么是梯度,就不解釋了,太技術(shù)。你可以簡(jiǎn)單理解為,就是對(duì)這個(gè)模型里面的參數(shù)什么的進(jìn)行進(jìn)一步優(yōu)化。
這樣的過(guò)程多來(lái)幾遍,直到這個(gè)模型靠譜了,就能夠給每個(gè)車(chē)企使用了。
你看,每個(gè)車(chē)企沒(méi)有把自己的任何樣本公開(kāi)出去,卻都得到了靠譜的購(gòu)車(chē)預(yù)測(cè)模型。
所謂橫向聯(lián)邦學(xué)習(xí),這里的橫向,就是指,參與計(jì)算的各方,他們擁有的樣本的ID并不相同,但是這些ID的屬性類(lèi)型是相同的,比如購(gòu)買(mǎi)者都有在私域中的各種同樣的行為類(lèi)型(查看車(chē)型、查看購(gòu)車(chē)金融、詢(xún)問(wèn)客服之類(lèi)的,每個(gè)車(chē)企的私域都有這些相同的交互功能)、同樣的社會(huì)屬性類(lèi)型等。而縱向聯(lián)邦學(xué)習(xí),則是樣本的ID相同,而ID背后的屬性不同。
講到這里,終于把我想講的基本上講完了。能讀到這里的朋友,應(yīng)該對(duì)隱私計(jì)算在數(shù)字營(yíng)銷(xiāo)上的原理和應(yīng)用有了更全面的理解。不過(guò),還有一些問(wèn)題我沒(méi)有能在這里進(jìn)一步闡述,比如,這些應(yīng)用場(chǎng)景具體起到什么作用,對(duì)不同行業(yè)的意義是什么,又如,隱私計(jì)算在數(shù)字營(yíng)銷(xiāo)中的合法合規(guī)性問(wèn)題。這些內(nèi)容,就不再寫(xiě)在文章中了,否則文字太多了。

小程序
掃碼打開(kāi)微信小程序
APP下載
掃碼下載市場(chǎng)部網(wǎng) App




