圖源:Pixabay
口述 | 胡一竑
整理 |李璐 李珊珊
關于大數據殺熟的討論不是第一次了,然而,2024年年末,關于“年輕人反向馴化大數據”的話題又一次成為了熱點。然而,亦有人指出,偽裝、哭窮式的“反向馴化”開始時也許會有點效果,在愈加聰明的算法面前,最終,所有這些終將會被歸入大數據,作為商家用來推測消費者意圖的參數之一。在這個算法的世界,作為普通消費者,究竟該如何自處?我們這個日漸數字化的社會,如何才能避免大數據的濫用?
同濟大學管理科學與工程學院老師胡一竑解釋道:個性化定價本來是市場營銷領域的一個經典題目,對于不同的人給予不同定價以獲取較高利潤本是商業世界中稀松平常的手段,然而,“大數據殺熟”的問題在于這些定價的基礎來自于大量用戶的個人數據,這些數據是否該算作用戶的資產,濫用這些個人數據,甚至將其打包售賣給第三方商家,是否合適?這些都有待法律法規加以明晰。
2024年2月,在管理學頂刊《生產與運營管理學會會刊》(POMS)上,胡一竑和博士研究生渠勝男等發表了共同合著的論文《在線平臺上的信息共享和個性化定價》(Information Sharing and PersonalizedPricing in Online Platforms)。在這篇經歷了三年與審稿人的溝通、修改才得以面世的論文中,胡一竑他們用一個博弈論模型刻畫了在線平臺上的三方:平臺、第三方商家與消費者三方的各種選擇。在他們的模型中,決定商家是否選擇大數據殺熟的一個關鍵因素是:平臺傭金。在傭金適當的時期,存在一個平臺自營與第三方商家都傾向于不適用大數據進行個性化定價的狀態,然而,隨著平臺傭金率的提升和新用戶的減少,基于大數據的個性化定價開始介入,并在最終導致一個“消費者剩余和社會福利最低”的狀態,科技讓生活更糟糕了。要防止這種情況發生,便需要監管者介入,甚至,研究者粗略估算出了第三方商家對大數據從不使用到使用之間的傭金閾值——20%。
這個閾值究竟如何得出?國內平臺目前的大數據定價現狀如何?全球對這種情況又有著怎樣的應對經驗?
帶著這些問題,我們與胡一竑老師進行了如下對話:
01 動態定價還是大數據殺熟,如何區分?
《知識分子》:作為一個管院的老師,您是怎么看大數據殺熟這個問題的?
胡:大數據殺熟的本質其實是個性化定價,這是市場營銷和運營管理領域的一個經典題目,經濟學里也會講這個問題。過去,企業可能做價格歧視,它的的本質就是看人下菜碟。這種歧視,在過去的表現形式比如:把優惠券寄到你家里,也就是給你一個折扣。這種形式有兩種做法——一種是對經常光顧的老客戶就多給一點折扣,不經常來就給少一點;另一種則是反過來,如果你是新客戶,就多給你優惠,老客戶反而無所謂,反正你也經常來了。
(后一種有點對熟客歧視的味道),我知道大家很難接受這一點都是從道德層面,感覺好像(熟客)被辜負了。但實際上,管理學中,從企業的角度來看,這件事情特別合理,是非常理性的決策,因為這群老客戶已經認定我們的產品了,他們是忠誠用戶,所以不需要再給額外的優惠和刺激了。對企業來講,給熟客優惠不是利潤最大化的選擇,所以,從企業來看這種決策很正常,不值得譴責。但我們覺得,比較值得譴責的一點是:在做個性化決策的“大數據殺熟”時,是需要用到用戶信息的,這些信息有可能關系著用戶的隱私,這就涉及到隱私保護問題。商家有沒有權利用這類信息(進行殺熟),甚至是否可以把信息再賣給別人,讓別人再來做大數據殺熟。
在經典經濟學中,傳統的個性化定價,客戶信息比較簡陋,比如:商家會看到某個客戶經常來店里購物,這個人是男是女,是老是少,這些信息都是相對公開的。但是平臺有可能會把購買與用戶的信用卡掛鉤,地址、消費的頻率、網頁瀏覽行為……這些信息平臺都掌握了,只不過看它用不用。此時,如果基于這些信息再對用戶進行數據殺熟,用戶就明顯處于非常不利的地位了。所以,在法律層面這會存在很大問題。從管理學角度來看,信息其實也是一種資產,如果使用用戶的信息再對他進行殺熟,是不是侵犯了用戶的資產?這里也會有爭議。至于(商家)使用優惠券或是其他方式來達到利潤最大化,我們覺得很合理的,不值得譴責,但如果這涉及到用戶的隱私信息,基于這些信息來發放優惠券,情況就變得不一樣了。
我們做那篇論文時也看了很多法律方面的論文,確實,在(大數據殺熟)領域的討論很多,但執行起來特別困難,因為,這種情況通常都特別隱蔽,都是算法做的,自動的,不需要人工控制,歸責的時候也很難說清。
我們能想象,殺熟很多,個性化定價很多,但找證據非常難,不會有企業承認自己在做這類事情的。他們會說:我們只是在做動態定價。但是,個性化定價和動態定價是不同的,前者是不同的人買同樣的東西,會出現不同的價格,而后者,是價格隨庫存或者受歡迎程度而變動,比如電影院還有多少座位物,火車上有多少個座位,甚至變動最大的,機票還有多少席位,這都是隨著時間變化,根據市場的需求變化來制定價格的。如果知識動態定價,不同的人在同樣的情景下看到的價格應該是一樣的。
平臺在進行個性化定價的時候,往往特別喜歡針對一些比較容易做動態定價的商品去進行個性化。對某些東西,比如大米,價格基本是固定的,很難做個性化定價,也比較容易被看出來,但另外一些商品,比如飛機票,因為行業里默認的是可以做動態定價,本來就忽上忽下的,一直在變,如果偷偷地加上個性化定價,可能就不太容易被發現了。甚至當你拿這個證據去跟相關平臺對峙,平臺還可以辯解說我是正常的動態定價,因為動態定價在理論上來講是沒有問題的,過了半小時、1小時,市場上需求又變了,根據供需關系調整價格完全是可以接受的。
《知識分子》:您是怎么想到來研究這個問題的?這個問題是學術界的熱門話題嗎,做起來最大的困難是什么?
胡:個性化定價這個問題過去就是經典的題目,只不過現在有了平臺,個性化定價的方式更加的隱蔽,更加智能化,所以,近兩年很多人都在研究個性化定價在平臺上是怎么做的?但研究起來,很大的問題就是,如何去證明平臺采取了基于大數據的個性化定價?
我們這個文章投稿的時候,評審給我的意見里就有這個問題:有沒有證據表明這件事是真實發生的?這當時就把我難倒了,因為我們只有一些零星的新聞報道,但是企業是不會承認的,這很奇怪,大家都知道(這件事情在發生),但是沒有證據。所以我當時找了很多資料去回復,我們文章寫了一年多,后面陸陸續續補充資料,用了3年的時間才讓評審相信這件事情是真實發生的。
其實除了我這個文章之外,另外也有人在研究這類題目,甚至我們的題目國內和國外也有人同時在做了,但他們可能結果不是很好,所以沒有發表出來。今年10月份有一個歐洲的老師發郵件過來,說他寫了基本上跟我一樣的題目,但因為我這個已經發表出來了,他就被好雜志們拒絕了。所以,其實(管理學)學術界對平臺上的“大數據殺熟”性質的個性化定價還是挺關心的,因為確實現實中這類現象其實很嚴重,理論上也有很多值得研究的地方,因為這種電商平臺是之前沒有的,所以之前的理論都沒有涉及過,這是個新鮮的東西,大家其實都還是很有興趣的。
《知識分子》:審稿人要求您出示證據來說明確實發生過這個情況,您覺得您給出的證據里面特別有力的證據是什么?
胡:我們論文中提到了國內一家電商公司的一個JDM服務市場的平臺,就有一個明碼標價的用戶畫像服務,這個畫像是可以被用來進行個性化定價的,然后我們有很多媒體報道的證據也提交給了審稿人。
另外,美國商務部在2016年有一個關于個性化定價的報告,這個報告里談到了他們目前的現狀,平臺怎樣解決,美國政府該怎么做等等。商務部發布的報告是官方報告,也證明了在美國肯定存在這樣的現象,所以才需要討論。
另外,亞馬遜上有一個化妝品公司,他們在新聞媒體上提到過,使用了大數據算法設計優惠券,設計好之后對方利潤就提高了多少。
因為一般電商平臺有了大數據以后肯定會做一下個性化,其區別只是粗糙還是細致。粗糙一點比如,區分一下老客戶、新客戶。我自己用了兩個賬號登錄一些購物平臺去查,用我爸爸的賬號看衣服跟用我自己的賬號上去確實給了不同的優惠券。我購買的時候,價值會高一點,沒什么券,我爸因為是新客戶,或者是老年人,對價格比較敏感,就給了一個券,額度還不小,大概有幾十塊錢,我當時就截圖直接發給了審稿人。我們使用的很多證據雖然沒有像法律標準上要求的那樣規范,但綜合起來也可以證明情況了,不然我們的論文也沒法發表。
《知識分子》:你們最開始也是深入了解了國內這些平臺在這方面做的情況,包括您在論文中使用了JDM服務市場的圖片,你們是怎么拿到這些東西的?
胡:那是一個公開的平臺,每個人都可以去看的,只不過這個平臺一般消費者不太會去看。
我們當時想調查各大平臺基于大數據個性化定價的情況,然后就搜到了這個服務平臺,里面是這家電商公司提供給它的第三方賣家的各種服務,這些服務都是收費項目,比如推廣告,把商品推上首頁,我們截圖的這個項目是作為增值服務存在的,也就是客戶畫像。如果第三方賣家想把自己的店鋪做好,那就可以買一些數據來做自己的消費者畫像,根據消費者畫像,就可以做一些定制服務,比如:發放一些優惠券。有時候,有些人打開頁面會跳出滿100送多少的券,這很有可能就是個性化定價的,根據你的情況跳出來,它不是大家都有的。我們當時做了很多工作搜出來這種情況,然后發現這應該是證據之一,它收費,它作為一種增值服務存在,不是免費給第三方賣家的,而且,最重要的是,它可以用于個性化定價。
亞馬遜那邊就比較難搜到(這類的服務),因為亞馬遜在2000年時出過一個丑聞,上面賣的 DVD,被發現對老客戶收了很高的價,對新客戶的價格就很低,BBC 當時對此事進行了題為《亞馬遜老顧客被“殺熟”》的報道。出了那個新聞之后,亞馬遜馬上就撤掉(這個公開的服務項目),那之后,他們就不太敢光明正大地做這類事情了,他們現在對外說他們做的是動態定價,不做個性化定價,不做大數據殺熟,但我們還是在某些行業報告里面查到了,他們應該還是在做,只不過沒有過去那么容易被查到了而已。
02 20%的警戒線
《知識分子》:可以分享一下您論文的一些內容嗎?
胡:我們建立了一個模型,底層邏輯是用不用個性化定價是兩方博弈的結果。兩方,指的是平臺和第三方賣家,平臺收入的主要來源是平臺自營的利潤和第三方賣家繳納的傭金。這是現在做電商平臺研究普遍會用到的一個框架,我們在上面又疊加了信息競爭,平臺擁有信息,用這個信息可以對自營產品做個性化定價,它還可以把信息賣給第三方賣家,就像賣廣告一樣,靠賣信息來賺取一部分利潤。當平臺把信息賣給第三方賣家之后,第三方賣家可以基于這些信息進行個性化定價,進而增加自己的利潤,從而覆蓋向平臺購買信息所支付的成本,畢竟,大家都不會做虧本的事情。
我們研究了不同的情況下,平臺到底會怎么做?
我們分了四種情況,第一種是平臺自營和第三方都不用個性化定價;第二種是平臺用信息給自己的自營產品進行個性化定價,但第三方不用;第三種是平臺把信息賣給第三方,讓第三方進行個性化定價,但自己不用;最后一種當然就是平臺和第三方都使用個性化定價。
這里,你要考慮第三方要不要買信息,因為第三方賣家也會考慮,買信息對自己有沒有好處,買信息后去做個性化定價能夠提升多少利潤,如果費用太高那就不劃算了,所以這個模型有點復雜,在產品競爭的基礎上又疊加了一層信息買賣,這個信息又可以用來做大數據殺熟,獲取更多的利潤。但我們最后的結果是比較有趣的,跟大家的直覺有點相反,最后出來的結果是中間有一塊居然是雙方都不用信息的時候,利潤最大化。
我簡單來講講這個結果,跟這個結果相關的幾個因素,一是新客戶的數量,新客戶多,那就說明數據不夠,另一個是傭金,也就是提成比例,這個數值非常重要,我們的計算發現,當傭金的數值較低的時候,不管是自營還是第三方賣家,都傾向于不使用大數據來做個性化定價。
這相當于提成的比例很低的時候,其實政府不用太擔心,他們互相自由競爭、基于自己的利潤最大化決策之后,有很大的可能性是大家都不用信息。在提成比較低的時候,還有兩個可能性,一種可能性是平臺自己用,賣家不用,另一種是賣家用,平臺不用,這個情況對消費者的傷害還比較小,因為有選擇,消費者可以去選不用大數據的那一家,所以危害還比較少。
所以,新舊用戶的比例比較適中,平臺對信息的掌握沒有那么極端,平臺對消費者的了解也比較正常,雙方如果理性思考了,覺得還不如不用(大數據驅動的個性化定價),這種情況是有可能發生的。雖然現實可能不像模型那么理性,因為模型里我們會假設參與方都特別聰明、特別理性,但現實中我相信這種(大家都不用大數據的)情況是有的。主要的原因是個性化定價的成本很高,有算法、服務器、懂得規劃算法的人來做系統,如果只是小業務的賣家,他們其實付不起這個成本的。
但隨著是提成比例(傭金)升高,情況就開始危險了,尤其當傭金上升到一定程度,平臺的最佳選擇可能就變成了自己不用信息,不再賣自營商品,(放棄通過自營商品賺取利潤了),徹底地把信信息賣給第三方賣家,退出市場了。這時,相當于市場被第三方賣家壟斷了,所以整個情況就會從競爭變成了壟斷,然后平臺就可以通過操縱信息得到很大的利潤,提成也很高。而壟斷以后,再使用個性化定價,消費者受到的傷害是非常大的。因為消費者別無選擇,他們的那些剩余價值就都被拿走了,這個情況很危險。
圖說:圖中NN區域,即為平臺和賣家都不使用個性化定價的狀態。
《知識分子》:傭金是獨立于出售信息的價格的,對吧?按照您的模型,傭金達到一個什么樣的閾值之后,大數據殺熟的情況會惡化?
胡:我們的計算中信息費是第三方與平臺談判得到的一個固定的價格,這個數值與傭金有關,但更多地看第三方和平臺博弈的一個結果。我們有個計算的方法,總的來說就是:平臺就會觀察一下,看看在給定傭金率和其他參數的時候,第三方會愿意付多少錢來購買信息,這個值會隨著其他參數發生變化。但是我們發現,最重要的仍然是要看傭金,所以最終,決定平臺和商家決策的主要因素仍然是傭金。
當傭金比較低的時候,比如平臺提成5%-10%,一切都還算合理,但隨著這個數值升高,(按照我們的模型),情況就變得不一樣了,大約傭金升到20%左右的時候,平臺和第三方就有利用大數據達到高利潤的動機了,整個市場就不再是公平競爭了,監管也就該介入了。
目前國內的話,據我們的了解,比如某電商公司,據我們了解,大概傭金率在百分之十幾的樣子,不同品類會不一樣,但還沒有達到20%警戒線。我們需要警惕的是,全球來看,確實也有傭金很高的情況,比如亞馬遜在推的一個項目——Amazon Exclusive program,就是承諾讓商家獨占市場。他們跟商家簽合同時,會承諾亞馬遜平臺本身不賣你的商品品類,也不會再引入其他第三方,但提成非常高,雖然這個傭金很高,但因為獨占市場,對商家還是很有吸引力的。這種情況就非常危險,大數據殺熟,以及其他的一些對消費者非常不利的情況就都來了。我覺得這其實是自由競爭跟壟斷的區別,這是非常明顯的問題。
目前大部分的大數據殺熟,或者叫個性化定價還比較隱蔽,監管很難真正監管到,從技術上來講,很難。所以,我們就建議:要警惕比較高的提成,因為,比較高的提成可能就會有很危險的壟斷情況的出現。整體上,如果市場是自由競爭的,其實不太用擔心,因為,很可能他們雙方都不用(個性化定價)。但一旦傭金超過了20%的警戒線,可能情況就不一樣了。
傭金過高,其實是平臺利用它的壟斷地位來收獲利潤,而第三方商家付出了這些傭金、信息費,他們肯定也需要更高的超額利潤,最后這些成本,都加到了消費者身上。所以,在一個大數據肆意殺熟的市場中,平臺和賣家可能都是受益方,所有的超額利潤都來自消費者。
《知識分子》:那么,如何避免這種情況的發生呢?國外是否有些成熟的方法?
胡:現在有很多文章在討論要限制平臺收集、使用消費者信息的能力,歐盟推出了《通用數據保護條例》(GDPR),在使用消費者的信息之前,要先得到消費者的允許。所有的平臺,歐洲、美國都要遵守,我不知道國內有沒有在做,但國內某一家企業出海時因為這個條例也被罰款了。(注:指的是2021年7月,中國企業字節跳動旗下海外短視頻平臺TikTok,因違反GDPR第12條被荷蘭數據保護局以侵犯兒童隱私為由罰款75萬歐元。荷蘭數據保護局認為,TikTok僅向荷蘭兒童提供了英文版的隱私聲明,沒有提供荷蘭語版的隱私聲明,但英文隱私聲明對荷蘭兒童來說并不屬于易讀懂的內容,因此認定TikTok違反了GDPR的規定。)估計以后中國可能也要走這條路,畢竟,GDPR政策現在國外做得很好。
中國目前的情況相當于消費者的信息被平臺無償的隨意的使用,且消費者未被告知,這是目前所有爭議的來源。GDPR的政策是,平臺要使用用戶的信息就會跳出來一個窗口,問你允不允許把你的數據授權給平臺讓他來用,如果消費者說不允許,就不能用。是否共享數據,應該是一個主動的讓顧客挑選的選項。我們為此特意翻看了好多國內平臺的隱私政策,它們大多默認你是允許的,你如果要不允許,就要打開(這個界面),找很久之后,選中不允許才行。需要用戶自己查找界面這一點是不對的,相當于平臺把那個選項藏起來了。
中國還有一個很麻煩的事情,有些平臺,他們既是社交平臺,同時又在做社交電商,你可以嘗試一下,這種平臺,你關閉它們收集你個人信息的功能,你的社交、娛樂體驗會下降很多。那么是不是我們為了這些體驗就愿意把我們信息給平臺了呢?這相當于平臺要給消費者多少好處,消費者會愿意讓平臺收集自己的信息呢?這個問題的關鍵還是要把權力還給消費者,讓他們自己來做這個決定。
總的來講,對企業來講,它們肯定要追求利潤最大化,不可能讓企業自動去考慮社會公平,所以肯定需要管理者發布相關政策向他們提出要求,起一定的調節作用。但政策何時出,怎么出,能不能起到作用,我們可能就需要通過模型去研究。
目前看來,我們認為,個性化定價本身很難監管,但是有些東西是很容易看到的,比如傭金(提成),這是合同里必須有的,是我們可以很容易監控的東西。還有比如,我們可以控制信息的買賣。要買賣消費者信息,一定要走規定的步驟,比如規定要走數據交易的流程,這樣監管者就可以監測到信息在交易,這同樣可以控制這種信息的濫用。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.