萬(wàn)字長(zhǎng)文：大白話講解隱私計(jì)算在數(shù)字營(yíng)銷(xiāo)中的底層邏輯和應(yīng)用場(chǎng)景

數(shù)字營(yíng)銷(xiāo)

宋星

2023-05-11

這是我的半小時(shí)讀懂系列的一篇新的文章。這篇文章不會(huì)用更難懂的技術(shù)術(shù)語(yǔ)去解釋本來(lái)已經(jīng)很難懂的技術(shù)與概念。事實(shí)上，我們只要知道，隱私計(jì)算技術(shù)在數(shù)字營(yíng)銷(xiāo)領(lǐng)域里的關(guān)鍵應(yīng)用，以及背后的原理即可。

當(dāng)然，這個(gè)話題非常非常龐大，并不是三言?xún)烧Z(yǔ)能說(shuō)清楚的。但相信你讀了我這篇文章，會(huì)清楚很多一直以來(lái)在心里模模糊糊的東西。

1 企業(yè)自己的數(shù)據(jù)，在數(shù)字營(yíng)銷(xiāo)中越來(lái)越重要

在介紹隱私計(jì)算在數(shù)字營(yíng)銷(xiāo)中的應(yīng)用之前，先要說(shuō)明一個(gè)非常非常重要的一點(diǎn)，那就是企業(yè)（廣告主）自己的數(shù)據(jù)，在數(shù)字營(yíng)銷(xiāo)中的作用越來(lái)越重要。

企業(yè)自有的一方數(shù)據(jù)的作用，以及在構(gòu)成全局性營(yíng)銷(xiāo)（例如行業(yè)中所說(shuō)的全域、全鏈路之類(lèi)）中的意義。

不過(guò)，《中華人民共和國(guó)個(gè)人信息保護(hù)法》的出臺(tái)，很大程度上限制了企業(yè)一方數(shù)據(jù)的隨意應(yīng)用。最典型的，幾乎所有在廣告投放上的一方數(shù)據(jù)應(yīng)用，都需要由企業(yè)之外的實(shí)體（一方或多方）參與，這就可能導(dǎo)致數(shù)據(jù)直接的轉(zhuǎn)移和使用與法律規(guī)定的要求相違背。

即便沒(méi)有法律的限制，一方數(shù)據(jù)在應(yīng)用中也涉及到泄露企業(yè)的機(jī)密信息的可能性。如果我是廣告主，在我將自己的一方數(shù)據(jù)拿給媒體用于找人投放的時(shí)候，我確實(shí)會(huì)非常猶豫。

法律限制、保密需求，與讓一方數(shù)據(jù)發(fā)揮真正的價(jià)值產(chǎn)生了嚴(yán)重的矛盾，而這樣的矛盾，目前只有隱私計(jì)算能夠很大程度上地緩解。

2 撞庫(kù)

一方數(shù)據(jù)指導(dǎo)投放的邏輯是這樣的：廣告主將自有的、包含ID的消費(fèi)者數(shù)據(jù)“交給”媒體，然后媒體在自己數(shù)據(jù)庫(kù)中也同時(shí)查找這些ID。如果找得到同樣的ID，那么媒體就開(kāi)始基于媒體自己的數(shù)據(jù)，分析這些ID背后的用戶(hù)是什么樣的人，也就是我們說(shuō)的，分析這些人的標(biāo)簽或者特征。然后，媒體在自己的數(shù)據(jù)庫(kù)的海量數(shù)據(jù)中，查找與這些ID具有類(lèi)似標(biāo)簽，或者具有類(lèi)似特征的人。

一旦找到了類(lèi)似特征的用戶(hù)，就把這些人的ID記錄下來(lái)，作為可以針對(duì)性投放的人群。一旦這些ID背后的用戶(hù)打開(kāi)了媒體的網(wǎng)頁(yè)或者應(yīng)用，廣告就會(huì)出現(xiàn)在這些人打開(kāi)的網(wǎng)頁(yè)或者應(yīng)用上面的廣告位上。

這就是我們常說(shuō)的look-alike的投放的“大白話”的原理。除了這種最為常見(jiàn)的look-alike，一方數(shù)據(jù)與媒體端的二方數(shù)據(jù)或者其他方的三方數(shù)據(jù)，如果能夠連接、打通這些數(shù)據(jù)，就能夠應(yīng)用在很多數(shù)字營(yíng)銷(xiāo)中此前不能實(shí)現(xiàn)的應(yīng)用場(chǎng)景上。關(guān)于這些場(chǎng)景是什么，我們?cè)谶@篇文章的后半段會(huì)具體講述。

為了實(shí)現(xiàn)連接與打通這些消費(fèi)者數(shù)據(jù)，數(shù)據(jù)中的ID至關(guān)重要，這個(gè)ID必須是廣告主和媒體共同利用的ID類(lèi)型。比如，廣告主和媒體雙方都用手機(jī)號(hào)碼識(shí)別用戶(hù)，或者都用設(shè)備ID（deviceID）識(shí)別用戶(hù)。

現(xiàn)在，另一個(gè)至關(guān)重要的問(wèn)題需要解決，那就是我打了雙引號(hào)并且加粗了的“交給”二字。

廣告主是如何將自己的一方數(shù)據(jù)連同ID一起“交給”媒體的呢？

過(guò)去，媒體提供給廣告主一個(gè)上傳數(shù)據(jù)的操作界面，廣告主把自己的一方消費(fèi)者數(shù)據(jù)，上傳給媒體就可以了。

最開(kāi)始，這些一方消費(fèi)者數(shù)據(jù)的上傳，是明文的。

但這么做，廣告主風(fēng)險(xiǎn)巨大，媒體也漸漸不想接受這些明文數(shù)據(jù)。因?yàn)槊襟w若接受了這些數(shù)據(jù)，它也要承擔(dān)法律責(zé)任，而廣告主隨意上傳明文消費(fèi)者數(shù)據(jù)且不說(shuō)會(huì)泄露消費(fèi)者個(gè)人信息，它自己的商業(yè)機(jī)密也被泄露了。

所以，媒體之后，都要求廣告主上傳經(jīng)過(guò)加密的消費(fèi)者數(shù)據(jù)（MD5或者SHA256加密）。

MD5或者SHA256，都是不可逆的加密。也就是說(shuō)，不可能通過(guò)加密之后的密文還原為原文。加密了之后如果把原文完全毀掉并且忘掉了，想要找回原文是不可能的。當(dāng)然，不能通過(guò)密文還原為原文，不代表不能用別的方法還原為原文——這一點(diǎn)極為重要，也是我們后面隱私計(jì)算能夠?qū)崿F(xiàn)的基礎(chǔ)之一。

假如，我用SHA256加密了一段文字：“我愛(ài)公眾號(hào)宋星的數(shù)字觀”，變成了密文

“43d24306cf8a96d5b47f33114bdc66ef0c32cd26b639a4f71f5dfe13c65bce43”。然后我忽然得了失憶癥，忘掉了原文是什么，而且我也沒(méi)有任何記錄記下我的原文是什么。現(xiàn)在我手上只有這段完全看不懂什么意思的密文。

按道理講，我永遠(yuǎn)也不可能再知道這段密文對(duì)應(yīng)的明文是什么了。

但天無(wú)絕人之路。正巧我的朋友，他也曾經(jīng)加密了很多文字，其中也包括“我愛(ài)公眾號(hào)宋星的數(shù)字觀”這十一個(gè)字。

并且，他沒(méi)有丟掉他的原文和加密密文的對(duì)應(yīng)記錄。

我于是去找他，希望搞清楚我的密文“43d24306cf8a96d5b47f33114bdc66ef0c32cd26b639a4f71f5dfe13c65bce43”背后到底是什么原文。

他把這個(gè)密文跟他所有的密文做一個(gè)vlookup的匹配，或者干脆來(lái)個(gè)Ctrl+F，直接就找到了他那邊的同樣的密文，然后對(duì)照著他的原文和密文對(duì)照表，他輕松找到了“我愛(ài)公眾號(hào)宋星的數(shù)字觀”。

微信圖片_20230511163407.png

上圖：撞庫(kù)

我想你一定已經(jīng)理解了背后的原因，就是這種SHA256等不可逆加密的背后，是不需要密鑰的，而且任何人，只要他加密的原文是一樣的，那么得到的密文也就一模一樣。

無(wú)論是用戶(hù)ID，還是一段話，只要是相同的，那么SHA256之后的密文，不會(huì)有區(qū)別。

因此，廣告主把自己的消費(fèi)者的電話號(hào)碼一一用SHA256加密，然后拿著密文上傳給媒體，只要媒體那邊也有這些消費(fèi)者的電話號(hào)碼，那么就能夠同樣把這些電話號(hào)碼用SHA256加密之后，進(jìn)行匹配。

雖然是用加密的密文進(jìn)行匹配，但是用原文密文的對(duì)照表一對(duì)照，也就知道了明文是什么。

這種方法，有一個(gè)學(xué)名，叫“隱私集合求交”，也被俗稱(chēng)為“安全求交”。但，實(shí)際上，“安全”二字很勉強(qiáng)，它本質(zhì)上就是行業(yè)中常說(shuō)的“撞庫(kù)”的方法。

你會(huì)說(shuō)，這樣加密還有什么意義，只要保留著加密的明文和密文之間的對(duì)應(yīng)關(guān)系，那么什么不可逆加密之類(lèi)的，都照樣會(huì)被破解。廣告主就算把消費(fèi)者的ID都加密了，上傳給媒體，媒體照樣還是很有可能把這些密文對(duì)應(yīng)的ID給找回來(lái)。

并不是沒(méi)有意義。上面這些不可逆加密的方法，確實(shí)不妨礙媒體還原廣告主上傳的消費(fèi)者ID。但數(shù)據(jù)傳輸?shù)闹虚g過(guò)程中，例如需要由第三方經(jīng)手的時(shí)候，數(shù)據(jù)萬(wàn)一發(fā)生泄露，消費(fèi)者ID明文被暴漏的風(fēng)險(xiǎn)大大降低了。

比如，我是廣告主，我找一個(gè)agency幫我上傳相關(guān)的數(shù)據(jù)給媒體。在明文操作的情況下，agency可以拿到這些消費(fèi)者ID，并且agency的員工有可能獲得這些ID，這是很不安全的。但是，如果加密了，就算agency拿到了這些密文，也不會(huì)有大量的手機(jī)號(hào)碼和對(duì)應(yīng)的密文的對(duì)照表，風(fēng)險(xiǎn)也會(huì)更小。

講到這里，跟隱私計(jì)算還沒(méi)有什么關(guān)系。下面，隱私計(jì)算要出場(chǎng)了。

3 隱私計(jì)算為什么是必須的

在上面的場(chǎng)景中，有些廣告主介意自己的消費(fèi)者ID上傳給媒體，哪怕是加密了，這些廣告主仍然覺(jué)得自己的消費(fèi)者ID會(huì)通過(guò)撞庫(kù)被媒體掌握。

比如，奧迪說(shuō)，我可不愿意把我的消費(fèi)者ID上傳給媒體，要是上傳給了媒體，媒體就知道這些ID背后，是我的消費(fèi)人群，媒體就可能轉(zhuǎn)手把我的這些ID用于給其他車(chē)廠進(jìn)行營(yíng)銷(xiāo)所用，比如給寶馬或者特斯拉投廣告，就直接投放給這些ID。

隱私計(jì)算可以解決這個(gè)問(wèn)題，即廣告主ID保密情況下的ID匹配與數(shù)據(jù)應(yīng)用。這種基于各方共有ID并在匹配ID（撞庫(kù)）之后進(jìn)行的相關(guān)計(jì)算，被稱(chēng)為“縱向聯(lián)邦學(xué)習(xí)”。

另一些廣告主，則有更高的要求，他們說(shuō)，我的這些消費(fèi)者，不僅僅只有ID，還有很多ID背后的屬性，這些數(shù)據(jù)，能不能跟媒體或者第三方的數(shù)據(jù)結(jié)合起來(lái)，用于更好地洞察消費(fèi)者？或者結(jié)合起來(lái)更好地圈選消費(fèi)者？不過(guò)，這些屬性不能透露給媒體或者第三方，也就是說(shuō)，要在不給媒體或者第三方提供數(shù)據(jù)的情況下實(shí)現(xiàn)基于一方、二方（或三方數(shù)據(jù)）相結(jié)合的人群洞察和圈選。

這也是隱私計(jì)算可以解決的問(wèn)題，即在不共享消費(fèi)者屬性數(shù)據(jù)的情況下，實(shí)現(xiàn)對(duì)屬性數(shù)據(jù)的應(yīng)用。

這些應(yīng)用對(duì)于實(shí)現(xiàn)一些重要的數(shù)字營(yíng)銷(xiāo)場(chǎng)景至關(guān)重要，畢竟，數(shù)據(jù)如果不能夠連通起來(lái)，數(shù)據(jù)的價(jià)值就大打折扣，數(shù)據(jù)在數(shù)字營(yíng)銷(xiāo)上的作用就得不到充分發(fā)揮?？梢赃@么說(shuō)，今天的數(shù)字營(yíng)銷(xiāo)，如果沒(méi)有隱私計(jì)算的幫助，很多高級(jí)的玩法都無(wú)法實(shí)現(xiàn)。

我們先看看“廣告主ID保密情況下的ID匹配與數(shù)據(jù)應(yīng)用”問(wèn)題如何通過(guò)隱私計(jì)算加以解決。

4 在ID保密情況下的ID求交與數(shù)據(jù)應(yīng)用

前面說(shuō)了，ID保密是廣告主在意的，他們不希望自己消費(fèi)者的ID被媒體知道，以免媒體把自己的ID也用于自己競(jìng)爭(zhēng)對(duì)手的推廣。

但自己的ID總是要跟媒體的ID做匹配的，一旦匹配了，那豈不是自己的這些ID，媒體就完全知道了。

微信圖片_20230511163428.png

上圖：交集ID可以不泄露嗎？

因此，必須解決這個(gè)問(wèn)題。

利用差分隱私實(shí)現(xiàn)匿蹤安全求交

這個(gè)問(wèn)題的解決，要靠加入一些“混淆ID”。

所謂“混淆ID”，也叫“隨機(jī)噪聲”，就是廣告主在跟媒體匹配的時(shí)候，額外隨機(jī)添加很多其他與廣告主消費(fèi)者不相關(guān)的ID。這樣，媒體就不知道廣告主真正的消費(fèi)者到底是哪些了。

比如，A是廣告主，自己的消費(fèi)者手機(jī)號(hào)碼有5000個(gè)，想要跟媒體B進(jìn)行ID匹配。但為了不把這些ID暴露給媒體，于是又摻雜了45000個(gè)其他的手機(jī)號(hào)碼。這樣，湊齊了5萬(wàn)個(gè)手機(jī)號(hào)碼，跟媒體匹配。

媒體，當(dāng)然也就不知道這5萬(wàn)個(gè)手機(jī)號(hào)碼中到底哪些是廣告主的消費(fèi)者了。廣告主的ID就此實(shí)現(xiàn)了保密！

這種利用“摻混淆數(shù)據(jù)”保護(hù)秘密（隱私）的方法，被稱(chēng)為“差分隱私”。差分隱私有很多方法，這里講的只是一種最容易理解的方法。其他各種摻入混淆數(shù)據(jù)的方法，要基于各種各樣的算法，以保證混淆的效果，這里就不多介紹了。

加入了差分隱私的ID匹配，也被稱(chēng)為“匿蹤安全求交”。

微信圖片_20230511163445.png

上圖：基于“混淆差分”的安全求交

講到這里，你肯定會(huì)一頭霧水了。按照這樣的匹配方法，廣告主的數(shù)據(jù)豈不是也被污染了？比如，廣告主要找跟自己已有的這5千消費(fèi)者相近似的人群，結(jié)果，媒體按照的卻是“摻水”的5萬(wàn)個(gè)人群去尋找近似人群。廣告主雖然保住了秘密，但是營(yíng)銷(xiāo)效果卻南轅北轍了！

你的擔(dān)憂不是多余的，這絕對(duì)是非常重大的問(wèn)題。為了解決這個(gè)問(wèn)題，需要再引入一些新的東西。

這個(gè)新的東西，是媒體和廣告主中間的一個(gè)可信第三方。

可信第三方

還是回到前面這個(gè)例子，A是廣告主，B是媒體，那么這個(gè)可信第三方就是C。

C的職責(zé)很重要。

廣告主（A）要把自己的5000個(gè)手機(jī)號(hào)碼加密發(fā)給第三方（C），然后C幫忙再摻入45000個(gè)起混淆作用的手機(jī)號(hào)碼。

然后C幫助A，跟媒體（B）進(jìn)行數(shù)據(jù)匹配。匹配完成后，B將自己的數(shù)據(jù)結(jié)果（個(gè)體級(jí)別的用戶(hù)屬性數(shù)據(jù)），以加密的形式發(fā)給C。

C針對(duì)B發(fā)回的加密屬性，把混淆ID的加密屬性去掉（剝離），然后計(jì)算廣告主5000個(gè)手機(jī)號(hào)碼中能匹配到的那些人的加密屬性，并且歸納出這些人的共性特征。這些共性特征，不再帶有個(gè)人屬性，而是統(tǒng)計(jì)級(jí)別的數(shù)據(jù)，所以不再涉及到廣告主A的消費(fèi)者的ID。并且這些共性特征是由媒體B發(fā)來(lái)的加密屬性計(jì)算出來(lái)的，因此，也是加密狀態(tài)。

第三方C再把這些共性特征返回給媒體B，媒體把這些加密狀態(tài)的共性特征解密，之后尋找與這些共性特征相同或者相近的人群，幫助廣告主進(jìn)行廣告投放。

微信圖片_20230511163451.png

上圖：加入可信第三方的匿蹤安全求交

同態(tài)加密

你肯定又有問(wèn)題了，為什么C計(jì)算的是媒體B發(fā)來(lái)的加密的個(gè)體屬性。加密之后，還能計(jì)算嗎？

答案是，能。因?yàn)殡[私計(jì)算有另外一個(gè)技術(shù)，叫“同態(tài)加密”。所謂同態(tài)加密，就是計(jì)算原文（明文）的結(jié)果，和計(jì)算這些明文加密之后的密文的結(jié)果，是完全一樣的。如果原文用了某個(gè)算法和秘鑰進(jìn)行了加密，那么加密之后，做“加減乘除”以及各種各樣的數(shù)學(xué)計(jì)算之后得到的結(jié)果，再利用該加密算法和秘鑰解密之后，得到的結(jié)果，和直接用明文做同樣的數(shù)學(xué)計(jì)算得到的結(jié)果一樣。

這樣，C在計(jì)算媒體B發(fā)來(lái)的加密個(gè)體屬性，得到的共同屬性特征，雖然也是加密的，但是在B那里做一個(gè)解密就可以直接應(yīng)用于圈選人群了。甚至，今天的技術(shù)，連解密都不需要，就可以直接圈選人群了，這樣安全性進(jìn)一步提高。

微信圖片_20230511163457.png

這樣，廣告主A沒(méi)有暴露自己真正的消費(fèi)者ID；媒體B也沒(méi)有透露自己這些ID背后的屬性；第三方C，幫助A和B完成了數(shù)據(jù)匹配，也計(jì)算出A消費(fèi)者的共性特征，卻也不知道這些特征具體是什么。只要C信守誠(chéng)信，不泄露A交給他的加密的消費(fèi)者ID，那么整個(gè)過(guò)程，就是相當(dāng)安全的。

這就是隱私計(jì)算在數(shù)字營(yíng)銷(xiāo)上的一個(gè)非常典型且重要的應(yīng)用。

5 對(duì)交集ID進(jìn)行保密的進(jìn)一步優(yōu)化

基于可信硬件技術(shù)的安全屋

上面的“匿蹤安全求交”需要加入很多“噪聲”，同時(shí)對(duì)第三方的計(jì)算能力的要求很高。而且，還要確保第三方是誠(chéng)實(shí)可信的。

因此，在實(shí)踐中，采用這種方法并不多。大部分時(shí)候，廣告主和媒體都怕麻煩，媒體會(huì)直接在自己的服務(wù)器內(nèi)辟出一個(gè)所謂的“安全屋”，然后讓這個(gè)安全屋扮演上面第三方C的角色，發(fā)揮安全求交或是逆蹤求交的作用。

這是目前最常見(jiàn)的實(shí)現(xiàn)方式，但談不上小標(biāo)題所說(shuō)的優(yōu)化，只能算是簡(jiǎn)化。這種簡(jiǎn)化，多多少少有點(diǎn)“自欺欺人”的味道。

當(dāng)然，這種方法也不能說(shuō)一無(wú)是處，媒體會(huì)強(qiáng)調(diào)，廣告主的數(shù)據(jù)會(huì)在“可信硬件技術(shù)”之下被隔離保護(hù)起來(lái)，對(duì)廣告主數(shù)據(jù)的操作，也是在這些硬件內(nèi)進(jìn)行的，并不會(huì)被泄露到這些硬件之外。

可信硬件技術(shù)，也在行業(yè)中被俗稱(chēng)為“數(shù)據(jù)安全島”。

可信硬件技術(shù)主要解決下面的問(wèn)題：

1. 數(shù)據(jù)獨(dú)立（data separation）：存儲(chǔ)在某個(gè)分區(qū)中的數(shù)據(jù)不能被其他的分區(qū)讀取或篡改。也就是說(shuō)，廣告主用于安全求交的ID，是不會(huì)被放到除可信硬件之外的地方的。

2. 時(shí)間隔離(temporal separation)：公共資源區(qū)域中的數(shù)據(jù)不會(huì)泄露任意分區(qū)中的數(shù)據(jù)信息。計(jì)算資源，例如CPU，也有專(zhuān)門(mén)隔離的時(shí)間切片，來(lái)處理可信硬件中的數(shù)據(jù)。

3. 信息流控制（Control of information flow）：

除非有特殊的授權(quán)，否則各個(gè)分區(qū)之間不能進(jìn)行通信。

4. 故障隔離（Fault isolation）：一個(gè)分區(qū)中的安全性漏洞不能傳播到其他分區(qū)。

如果媒體嚴(yán)格采用可信硬件技術(shù)及管理，確實(shí)能夠確保廣告主提供的ID不被挪作他用。當(dāng)然了，媒體是不是都能?chē)?yán)格自律，我們可以看他們獲得的執(zhí)行標(biāo)準(zhǔn)的認(rèn)證，比如《信息安全技術(shù) 可信執(zhí)行環(huán)境服務(wù)規(guī)范》認(rèn)證之類(lèi)。不過(guò)認(rèn)證這東西也不能100%全信，具體哪個(gè)媒體合格，哪個(gè)媒體不合格，就不在本文討論的范圍了。

全匿名下的安全求交（尚無(wú)定論）

上面的方法，對(duì)那些“較真”的廣告主而言，可能是不可接受的。

有些廣告主，一定要求自己上傳的ID不能被媒體知曉，那怕是加密后，并且媒體保證只用這些ID做撞庫(kù)也不行。因此，他們迫切需要知道，是否有比“匿蹤安全求交”更優(yōu)化的方法解決這個(gè)問(wèn)題。

目前，隱私計(jì)算的技術(shù)解決方案提供商可能已經(jīng)找到了解法。這個(gè)解法，頗有些“釜底抽薪”的味道。簡(jiǎn)單講，任何求交的過(guò)程，都必然會(huì)導(dǎo)致交集ID被求交的雙方共同掌握（安全求交），或是被第三方掌握（匿蹤安全求交）。那么，如果能夠不做求交，就實(shí)現(xiàn)跟求交一樣的效果，把廣告主ID和媒體ID匹配的用戶(hù)的屬性直接計(jì)算出來(lái)，就不存在廣告主的消費(fèi)者ID被媒體知曉的情況了。

在2022年的一個(gè)新聞稿中，某個(gè)數(shù)據(jù)科技公司提到，他們的技術(shù)能夠：“無(wú)需安全求交、不泄露交集ID、在全匿名數(shù)據(jù)集下進(jìn)行聯(lián)邦學(xué)習(xí)的技術(shù)難題，真正符合《數(shù)據(jù)安全法》和《個(gè)人信息保護(hù)法》的要求，進(jìn)一步加強(qiáng)了用戶(hù)數(shù)據(jù)安全和隱私保護(hù)。”

真的可以嗎？我的客戶(hù)和我見(jiàn)過(guò)的媒體都還沒(méi)有采用，所以，我暫時(shí)還不能給出肯定的回答。但看到這個(gè)消息，至少讓我覺(jué)得這個(gè)方向是有可能的。

6 ID求交（撞庫(kù)）和可信硬件環(huán)境下的數(shù)字營(yíng)銷(xiāo)應(yīng)用場(chǎng)景

廣告主的消費(fèi)者ID和媒體的用戶(hù)的ID打通，本質(zhì)上就是廣告主私域用戶(hù)的ID，和媒體的公域人群的ID的打通。

一旦打通，很多數(shù)字營(yíng)銷(xiāo)的應(yīng)用就變得可能。

應(yīng)用一：Retargeting

Retargeting：廣告主把那些在自己的私域中留下了各種行為和痕跡，但卻沒(méi)有實(shí)現(xiàn)最終轉(zhuǎn)化的人的ID收集起來(lái)，然后把這些ID跟媒體的ID做安全求交，之后在媒體上給這些人投放定向廣告。

比如，某次大促，廣告主A花了一個(gè)億，引流到自己的私域小程序上，并獲得了1000萬(wàn)個(gè)OpenID。然后，這1000萬(wàn)個(gè)OpenID中，有100萬(wàn)個(gè)發(fā)生了購(gòu)買(mǎi)行為，剩下900萬(wàn)個(gè)沒(méi)有購(gòu)買(mǎi)。于是，廣告主A又找騰訊，把這900萬(wàn)OpenID跟騰訊廣告做安全求交，隨之對(duì)這900萬(wàn)人進(jìn)行定向的朋友圈廣告投放。

應(yīng)用二：Look-alike

跟Retargeting其實(shí)本質(zhì)沒(méi)有什么區(qū)別，只是多了一個(gè)步驟，即look-alike的步驟。

還是上面那個(gè)例子，廣告主A覺(jué)得對(duì)900萬(wàn)個(gè)沒(méi)有購(gòu)買(mǎi)的投放一次廣告，人數(shù)有點(diǎn)少。于是就找騰訊廣告說(shuō)，我跟你安全求交后，請(qǐng)你幫我找到跟這100萬(wàn)購(gòu)買(mǎi)人群類(lèi)似的更多的人。于是騰訊廣告基于這100萬(wàn)購(gòu)買(mǎi)人群的共性特征，幫助廣告主A找到了3000萬(wàn)個(gè)跟這100萬(wàn)人類(lèi)似的人。隨之對(duì)這3900萬(wàn)（3000萬(wàn)look-alike的人，加上900萬(wàn)retargeting的人）人進(jìn)行廣告投放。

應(yīng)用三：基于一方、二方數(shù)據(jù)的聯(lián)合人群圈選

這個(gè)是一個(gè)非常有意思的應(yīng)用，是目前比較高端的應(yīng)用。媒體可能只對(duì)部分大型廣告主開(kāi)放該功能。

具體實(shí)現(xiàn)如下：

廣告主將自己的消費(fèi)者ID，以及每個(gè)ID對(duì)應(yīng)的屬性標(biāo)簽，在加密后，上傳到媒體提供的可信硬件環(huán)境中。

媒體與這些ID進(jìn)行安全求交。

求交之后，能夠匹配到的ID，媒體也把這些ID對(duì)應(yīng)的媒體端所擁有的屬性數(shù)據(jù)，上傳到該硬件環(huán)境中。

此時(shí)，這個(gè)硬件環(huán)境中，也就是數(shù)據(jù)安全島中，就集合了交集ID，以及每個(gè)ID所對(duì)應(yīng)的廣告主的一方屬性標(biāo)簽，和媒體的二方屬性標(biāo)簽。

媒體基于這些ID和屬性標(biāo)簽，以及基于這個(gè)可信硬件環(huán)境，為廣告主提供一個(gè)圈選人群的界面。廣告主在這個(gè)界面中，根據(jù)自己的需求，基于一方、二方的屬性標(biāo)簽，進(jìn)行人群圈選。

比如，廣告主A，跟媒體通過(guò)安全求交，匹配了1000萬(wàn)人。這1000萬(wàn)人，廣告主自己的標(biāo)簽是過(guò)去一年內(nèi)的購(gòu)物數(shù)據(jù)和私域內(nèi)的互動(dòng)行為數(shù)據(jù)。而媒體端，則是這1000萬(wàn)人的社會(huì)屬性和興趣愛(ài)好數(shù)據(jù)。

基于聯(lián)合人群圈選的解決方案，廣告主A可以選擇，在過(guò)去3個(gè)月內(nèi)購(gòu)買(mǎi)了某類(lèi)商品，且興趣愛(ài)好是旅游的一線城市的20-30歲的女生。

圈選之后，媒體基于圈選結(jié)果得到的ID，進(jìn)行廣告投放，或是按照廣告主A的要求做其他營(yíng)銷(xiāo)觸達(dá)。

或者，廣告主也可以先基于自己的一方數(shù)據(jù)標(biāo)簽，圈選出人群，然后再看這些人群的二方屬性是什么。從而更好地洞察自有消費(fèi)者。

比如，廣告主A基于自己的一方數(shù)據(jù)，圈選出3個(gè)月內(nèi)購(gòu)買(mǎi)某類(lèi)商品的人群，然后再在這個(gè)界面上要求媒體對(duì)這些做畫(huà)像。媒體會(huì)提供這些人的二方屬性的統(tǒng)計(jì)報(bào)告。

應(yīng)用四：數(shù)據(jù)下發(fā)

所謂數(shù)據(jù)下發(fā)，是指媒體基于ID求交之后，將個(gè)體級(jí)別的數(shù)據(jù)傳輸給媒體。

最典型的，就是“會(huì)員通”。

廣告主將自己的會(huì)員ID加密后，上傳給電商平臺(tái)提供的“會(huì)員通”服務(wù)指定的可信硬件環(huán)境中（例如，阿里的聚石塔、京東的云鼎），ID在這里進(jìn)行求交。求交之后能匹配上的ID的會(huì)員相關(guān)的數(shù)據(jù)，會(huì)傳輸給廣告主。

應(yīng)用五：Leads打分或決策判斷

指在ID求交之后，第二方或者第三方為廣告主提供是否應(yīng)該為該ID進(jìn)行某項(xiàng)營(yíng)銷(xiāo)行為的判斷決策。

比如，汽車(chē)廣告主，將收集到的線索（leads）ID，通過(guò)安全求交的方法與運(yùn)營(yíng)商的數(shù)據(jù)相匹配。匹配后，運(yùn)營(yíng)商提供一個(gè)線索價(jià)值的打分返回給廣告主。

7 安全求交之外的隱私計(jì)算應(yīng)用

安全求交并不是隱私計(jì)算在數(shù)字營(yíng)銷(xiāo)中的唯一應(yīng)用。我們前面講過(guò)，安全求交本質(zhì)上是“縱向聯(lián)邦學(xué)習(xí)”。

同樣，“橫向聯(lián)邦學(xué)習(xí)”在數(shù)字營(yíng)銷(xiāo)中也有應(yīng)用。

比如，我們?nèi)绻?000萬(wàn)個(gè)汽車(chē)購(gòu)買(mǎi)者的私域數(shù)據(jù)樣本，就能計(jì)算出，購(gòu)車(chē)人在私域中做出的哪些行為（或行為的組合），就意味著他們要買(mǎi)車(chē)了。這個(gè)計(jì)算的結(jié)果，就是“購(gòu)車(chē)預(yù)測(cè)模型”。

但可惜，每個(gè)汽車(chē)主機(jī)廠最多的樣本也只有200萬(wàn)個(gè)。于是多個(gè)主機(jī)廠聯(lián)合起來(lái)，他們不分享任何的ID給彼此（不做安全求交），而是各自基于自己的樣本先計(jì)算一個(gè)“粗糙的”購(gòu)車(chē)預(yù)測(cè)模型。然后各自把自己計(jì)算的模型結(jié)果上傳到一個(gè)第三方，第三方基于這些車(chē)廠的模型，整合出一個(gè)新的模型。并把這個(gè)新的模型下發(fā)給各個(gè)主機(jī)廠，再次做計(jì)算，以?xún)?yōu)化這個(gè)模型的“梯度”。

至于什么是梯度，就不解釋了，太技術(shù)。你可以簡(jiǎn)單理解為，就是對(duì)這個(gè)模型里面的參數(shù)什么的進(jìn)行進(jìn)一步優(yōu)化。

這樣的過(guò)程多來(lái)幾遍，直到這個(gè)模型靠譜了，就能夠給每個(gè)車(chē)企使用了。

你看，每個(gè)車(chē)企沒(méi)有把自己的任何樣本公開(kāi)出去，卻都得到了靠譜的購(gòu)車(chē)預(yù)測(cè)模型。

所謂橫向聯(lián)邦學(xué)習(xí)，這里的橫向，就是指，參與計(jì)算的各方，他們擁有的樣本的ID并不相同，但是這些ID的屬性類(lèi)型是相同的，比如購(gòu)買(mǎi)者都有在私域中的各種同樣的行為類(lèi)型（查看車(chē)型、查看購(gòu)車(chē)金融、詢(xún)問(wèn)客服之類(lèi)的，每個(gè)車(chē)企的私域都有這些相同的交互功能）、同樣的社會(huì)屬性類(lèi)型等。而縱向聯(lián)邦學(xué)習(xí)，則是樣本的ID相同，而ID背后的屬性不同。

講到這里，終于把我想講的基本上講完了。能讀到這里的朋友，應(yīng)該對(duì)隱私計(jì)算在數(shù)字營(yíng)銷(xiāo)上的原理和應(yīng)用有了更全面的理解。不過(guò)，還有一些問(wèn)題我沒(méi)有能在這里進(jìn)一步闡述，比如，這些應(yīng)用場(chǎng)景具體起到什么作用，對(duì)不同行業(yè)的意義是什么，又如，隱私計(jì)算在數(shù)字營(yíng)銷(xiāo)中的合法合規(guī)性問(wèn)題。這些內(nèi)容，就不再寫(xiě)在文章中了，否則文字太多了。

上一篇：小紅書(shū)運(yùn)營(yíng)需要了解的全流程，即看即會(huì) 下一篇：30歲以后，拼體力的人都輸了

參與討論

評(píng)論

宋星

+ 關(guān)注

瀏覽

438492
文章

148

宋星是紛析數(shù)據(jù)科技的創(chuàng)始人，紛析數(shù)據(jù)為企業(yè)實(shí)現(xiàn)互聯(lián)網(wǎng)營(yíng)銷(xiāo)和運(yùn)營(yíng)優(yōu)化以及互聯(lián)網(wǎng)數(shù)字化轉(zhuǎn)型提供專(zhuān)業(yè)咨詢(xún)服務(wù)。同時(shí)，他也在世界上最大的廣告?zhèn)髅郊瘓F(tuán)之一：陽(yáng)獅媒體集團(tuán)擔(dān)任數(shù)據(jù)與技術(shù)創(chuàng)新部總經(jīng)理。宋星有十一年歷史的個(gè)人博客《網(wǎng)站分析在中國(guó)》是互聯(lián)網(wǎng)從業(yè)者必讀的「圣經(jīng)」。宋星同時(shí)是北京航空航天大學(xué)軟件工程學(xué)院特聘教授、百度特聘專(zhuān)家和鉆石講師、Google mLab特聘顧問(wèn)。

Ta的文章