導    讀

  它山之石,可以攻玉。為了幫助各界人士學習國外先進經驗,進一步了解大數據市場的定價、交易與保護,國脈戰略研究院專家楊冰之、林渠,帶來了《大數據市場調查:定價、交易與保護》的翻譯文章,相信會給大家以思想的碰撞、靈感的啟迪,促進大家思考,從而為我國推進數據要素市場化配置改革,貢獻國脈戰略研究院的智慧。本文為《大數據市場調查:定價、交易與保護》連載系列文章第四篇。

  大數據繼續呈指數級增長。隨著大數據的增長和大數據驅動應用的發展,數據本身變得更有價值。如前所述,數據挖掘和機器學習過程可以在充分和全面的數據樣本基礎上從數據集中產生商業價值。因此大數據成為一種新的數據資產,需要有效、公平的評估和定價方法。在本節,我們首先講述現有的數據定價模型。然后,我們對這些定價模型進行分類,并討論每種模型的優缺點。

  A. 數字商品定價原理

  數據可以看作是一種在市場上買賣的數字商品。經濟學中對實物商品交易的早期研究表明,實物商品價格的差異主要取決于產品線的特征差異。該模型由穆薩(Mussa)和羅森(Rosen)于1978年提出,命名為垂直分割或質量分割。在這個模型中,因為價格相同,消費者顯然更喜歡質量較高的商品,而不是質量較低的商品。為了滿足不同的消費者,生產商通常提供不同質量水平的產品。一般來說,生產者必須考慮增量成本和質量成本來決定產品的分化。例如,在信息技術產品公司中,通常對不同級別的產品提供不同價格,所采用的價格涵蓋從高到低的大部分價位。與實物商品交易的研究一樣,人們更加關注數字和信息商品的質量差異。因此,基于不同版本的策略是確定數字商品價格的一種常見方法。

  此外,對于實物商品生產,再生產成本是需要考慮的主要成本之一。而對于數字商品生產,再生產成本幾乎為零(版本控制、完整性檢查、維護等)。因此,衡量數字商品商業價格的因素是開發成本、配置或分析成本以及維護成本。同時,為了滿足不同的消費者,數字商品的價格也需要差異化。例如,原始或預處理的氣候記錄數據集可以通過使用精度的不同、時間頻率等重新打包成不同級別的產品。這些具有不同價格和功能的數據集可以滿足不同的消費者需求。我們在研究當前大數據定價策略的基礎上,將現有的定價策略分為下面不同類別。

  B. 數據市場結構

  正如我們所知,市場結構決定了實物商品交易的價格,數據市場也是如此,在數據市場中,這些結構同樣會影響數據價格。因此,總結數據市場結構是數據定價的第一步。我們將市場結構羅列在表1中。

圖片

  (表一)

  在壟斷結構中,同一數據集將由不同的壟斷者進行分析或生成。換句話說,不同質量和水平的商品是基于相同的原始數據集生產的,我們稱之為數據商品。為此,壟斷者有足夠的權力增加數據商品的利潤。通常,這些壟斷者不是為所有數據商品設定單一價格,而是根據數據商品的質量和細節設定不同的價格點,以滿足消費者對不同層次的需求。這種策略被定義為價格歧視。盡管如此,壟斷者通常會先隱藏這些把戲,并試圖調查消費者的偏好。在數據市場中,壟斷者通常設定參考價格,并監控消費者的反應。根據此參考價格,以及價格的輕微增減,壟斷者能夠細化需求模型和價格函數。而這會將數據商品的利潤最大化。

  在競爭中,大多數壟斷者失去了市場地位,只有少數勝利者幸存下來。這些贏家大多控制著市場資源,這導致了寡頭壟斷結構。特別是在數據市場中,原始數據集只屬于少數所有者。為此,數據所有者有很強的能力控制機器學習和數據挖掘過程、市場價格、競爭和機會,在數據市場中實現最大利潤。盡管如此,這種數據市場結構是病態的,不可能使數據市場繁榮起來,寡頭壟斷嚴重影響消費者的需求和供應商的服務。此外,缺乏競爭會導致數據市場疲軟。

  在強競爭結構的情況下,銷售價格應接近邊際成本,以增加市場透明度。它給消費者帶來了諸多好處,如降低價格和提供更好的服務。盡管如此,從長遠來看,這種結構可能會產生問題,因為所有的競爭都將導致利潤減少。為了在激烈的競爭結構中銷售更多的商品,所有者必須盡可能降低銷售價格,這肯定會減少所有者的利潤,從而減少競爭對手的數量。與數據市場尤其相關的是,強大的競爭結構通常出現在新興市場,這些領域的市場準入門檻較低。因此,許多所有者以同質化和劣質產品參與市場,實際上它們沒有競爭力,因此只有降低銷售價格才能為數據商品提供有效的競爭力,競爭性降價將導致激烈的競爭和市場萎縮。

  C. 數據定價策略

  通常,考慮成本是商品定價的唯一規則,尤其是對于數字商品。事實上,只考慮成本是一種常見的缺陷,它應該只是合理定價的一個因素。成熟的定價策略將是利潤最大化而不是降低成本。因此,選擇合適的定價策略很重要。有多種方法可以用于不同生產商或公司確定其定價策略。例如,馬斯切利特(Muschalleetal)針對數據市場將不同類型的數據定價策略分為以下六大類。

  自由數據策略(Free Data Strategy)是在線發布數據及在公共存儲中共享數據,交易不是免費數據的目標。例如,數據樣本、低精度數據和公共數據庫就是免費數據的例子。免費數據可以吸引一些對購買完整數據集猶豫不決的潛在客戶,刺激消費。同時,免費數據定價模型具有靈活性。根據需求,數據所有者可以將免費數據策略調整為其他定價策略,以實現數據所有者利潤最大化。

  基于使用的定價策略(Usage-Based Pricing Strategy)指統計數據流使用情況和服務時間的策略。該策略涉及一些主要市場行為。例如,移動電話運營商最初根據每個用戶的使用情況銷售數據服務。這些公司每月統計數據使用情況并計算價格。同樣地,網絡供應商向用戶提供互聯網服務,計算服務時間和價格。近年來,服務提供商將數據使用和服務時間合并在一起,從而動態地改變了價格。它們將高峰時間和使用情況結合起來考慮,這對于數據和服務的定價來說更合理。

  套餐定價策略(Package Pricing Strategy)是一種增強版的基于使用情況的定價策略。一些供應商,如T-mobile、Verizon等,提供固定價格的數據包計劃。套餐定價策略是根據大量基于使用的定價策略的研究成果和收集的數據制定的。為了使供應商的利潤最大化,需要進行額外的工作,包括用戶使用分析、高峰時間監控、網絡流量控制等。供應商可以根據研究結果為其數字商品和服務創建合理的定價模型。套餐定價優化是當前一個非常熱門的研究課題。

  單位定價策略(Flat Pricing Strategy)是最簡單的定價策略。在這種策略中,時間是唯一的參數,供應商只需考慮將每個數字商品銷售一次。這種定價策略通常用于軟件許可和托管。此外,使用統一定價策略便于供應商預期利潤,并制定未來計劃和活動。盡管如此,統一定價對消費者來說缺乏靈活性和多樣性。

  二部定價策略(Two-Part Tariff Strategy)是套餐定價和統一定價策略的組合。在這種情況下,消費者需要支付的總價格包含兩部分。第一是軟件許可證的固定費用,第二是固定服務和數據支持。這一策略被網絡服務提供商、移動電話運營商、軟件公司等廣泛使用。這些公司首先以固定價格銷售其數字產品,第二部分包括服務費、更新費或固定套餐以外的數據使用費。

  免費策略(Freemium Strategy)是近年來許多供應商大量采用的新戰略。這種定價策略的主要思想是免費向消費者提供基本產品或有限服務。同時,供應商還以一定的成本向消費者提供增值服務(優質服務)。優質服務的定價策略可以是上面列出的任何策略。這種策略經常被小公司采用,比如蘋果和谷歌Play商店的小型開發商。它們將產品上傳到商店,免費下載。盡管如此,全功能版本需要額外費用才能解鎖。

  鑒于上述策略,為數據商品設計定價模型需要同時考慮數據市場結構和數據定價策略?,F有的一些數據定價模型只考慮市場結構,如拍賣、基于成本的定價等,而另一些則涉及分布式數據存儲結構(云計算、邊緣計算等)和物聯網輔助。我們將在下面進行更詳細的討論。

  D. 數據定價模型

  數據定價的主要考慮因素是數據收集成本、數據分析成本、數據管理成本以及消費者需求。在上述市場結構和定價策略之后,圖2將定價模型分為兩大類:(i)基于經濟的定價模型和(ii)基于博弈論的定價模型。下面,我們首先介紹數據定價的關鍵因素及其挑戰,然后詳細描述數據定價模型。

 圖片

 ?。▓D2.數據定價模型)

  1) 數據定價的主要因素和挑戰

  數據作為一種獨特的商品,具有許多普通實物商品不具有的特征。以下是數字數據集定價面臨的挑戰。

  不同的數據來源:隨著數十億智能個人設備和傳感器的涌現,物聯網驅動的智能系統已成為貢獻數據的主要基礎設施。不同的設備和相關的部署成本可能對評估收集成本構成重大挑戰。同時,收集的數據類型多樣,難以分類和評價。而如何激勵這些設備的所有者貢獻和共享收集的數據也是額外的挑戰。

  數據管理的復雜性:大數據創造了不斷增長的巨大數據量。因此如何管理(分析、存儲、更新等)數據是數據定價的另一個挑戰。事實上,維護大數據的成本很高。從技術角度來看,大多數大數據都存儲在云或邊緣存儲中,維護存儲和數據可用性以及保護數據會帶來高昂的成本。這些過程也很難評估和定價。同時,原始數據在可利用之前需要進行分析,開發分析數據集的高效應用程序也是評估數據定價的因素。

  數據的多樣性:為了銷售數據集,供應商通常處理原始數據以滿足各種需求。這種方法為定價評估提出了許多復雜的問題。例如,需要重新生成原始數據集,并將其按不同體積、精度和類型劃分為不同級別。那么,如何評估不同商品的價格仍然是一個具有挑戰性的問題。

  關于如何應對這些挑戰有許多研究。例如,物聯網為數據收集提供了最重要的網絡基礎設施,數十億臺設備自動運行,在不同領域不斷收集數據。因此,為了量化數據收集的成本并處理不同的數據源,我們需要了解物聯網的工作原理,并鼓勵所有組件在物聯網中提供更好的性能。為了鼓勵傳感器上傳數據并為傳感器所有者實現更好的利潤,適當的定價模型變得更加關鍵。引入定價機制是鼓勵所有者貢獻自己數據的一種可行方法。定價機制調整價格和付款計劃,以保證足夠的參與規模,并提升數據服務、數據準確性和數據覆蓋率。

  根據不同的場景,有幾種不同的定價策略用于評估成本。最常見的策略是基于經濟的定價,它建立了基于經濟原則的價格模型。第二種策略是基于博弈論的定價。在這種策略中,價格模型考慮到價格受競爭的影響,是動態的。

  2) 基于經濟的定價模型

  基于經濟的定價模型基于經濟原則。下面,我們將詳細介紹數據定價的經典經濟概念。

  成本模型:它考慮任何商品的總成本,并將總成本的比率設定為利潤。我們假設 I 為期望收入,C 為總成本,p 為利潤百分比。等式 I = C (1 + p) 表示成本和收入之間的關系。成本通常包括商品的固定成本和可變成本。一般來說,固定成本是資源成本、設備成本、能源消耗等??勺兂杀景▌趧恿Τ杀?、開發成本和其他成本。這種定價模型的優點是簡單,因為它只考慮內部因素來決定售價。另一方面,不考慮外部因素,如競爭和需求,對該定價模型并不利。

  消費者感知模型:由于基于成本的定價模式容易被競爭對手模仿和復制,從長遠來看,供應商需要考慮消費者的反饋。特別是對于數字商品,其再生產成本幾乎為零,因此使用感知定價模型更可靠。消費者感知價格由所有消費者愿意支付的價格決定。哈蒙(Harmon)等人提出了影響數據定價的五個主要因素,以Pv=(Vp,Vc,Vm,Vs,Ve)表示。這里,Vp表示基于消費者反饋數據的性能。關鍵因素是效用,效用是對購買商品或服務的消費者的滿意度測量。因此在數字市場領域,這是供應商滿足消費者的價格準確性的最重要因素。另外,Vc是可能影響消費者行為的市場環境因素,Vm是消費者愿意購買數字商品的動機,Vs是供應商價值,代表供應商的信用和消費者的主要反饋,Ve代表經濟價值,這取決于消費者的需求,以及消費者對價格的感知。

  供求模型:供應商和消費者之間的關系是商業模式的一部分。根據這種關系,市場決定商品的價格。在經濟學領域,供求函數被用來表示這種關系。在市場中,P表示商品的價格,Q表示商品的數量。因此,我們有兩個線性函數來記錄這種關系。方程 P = a ? b · Qs是供給函數;P = c ? d ·Qd是需求函數。這里,a、b、c和d是系數,并且b大于d。根據這兩個方程,我們可以建立供需關系,如圖3所示。

圖片

 ?。▓D3.供求函數)

  如圖所示,橙色線表示供給函數,綠色線表示需求函數。供應商和消費者之間的行為是平衡的。從圖中我們可以看到,橙色線比綠色線有更高的坡度,因此必然有一個交叉點。這個交叉點是供應商和消費者的平衡條件。在這一點,我們從方程中獲得P: (P?a )/b = (P?c)/ d ;和Q: a ? b · Qd = c ? d · Qs。

  該模型有兩個基本特征:(i)這是供應商和消費者之間的一致行為,以及(ii)供應商和消費者不能改變這一過程,決策過程由市場決定。因此,這種模式保證了市場的公平性。

  差別定價模式:為了滿足商品的各種需求,供應商應提供各種具有不同特性的商品。差異定價模型考慮到這些商品之間的差異,提出了不同的價格。例如,高精度數據包的價格應高于低精度數據包,全功能數字應用程序的價格也應高于演示版應用程序。

  動態數據定價(智能數據定價)模型:這是差異定價模型的特例,以避免需求和數據流峰值,它也被稱為智能數據定價模型(SDP)。動態數據定價模型監控市場并評估系統是忙還是閑。通過評估,可以動態調整數字商品的價格,從而節省供應商的資源和消費者的資金。此外,實現這一目標有兩個主要機制。第一種是基于時間的定價,第二種是基于使用情況的定價。對于基于時間的定價機制,價格將隨時間而變化。例如,網絡供應商通常在夜間提供較低的數據價格,以鼓勵消費者在非高峰時間使用網絡服務,并阻止在高峰需求期間使用。同樣,基于使用情況的定價機制將根據數據使用情況改變定價。

  3) 基于博弈論的定價模型

  博弈論是定價和市場領域的一種有用方法,尤其是在數據商品的定價中。在下文,我們首先介紹三種不同的博弈論方案,用于數據定價模型:(i)非合作博弈(Non-cooperative game,),(ii)斯塔克伯格博弈(Stackelberg game),以及(iii)討價還價博弈(Bargaining game)。然后,我們將討論如何使用這些博弈論方案對數字數據商品進行定價。

  a:非合作博弈

  在非合作博弈中,假設所有參與者彼此不合作。為了具體說明非合作博弈,介紹一些術語:(i)參與者(player)是參與博弈并做出決定的個人;(ii)回報(Payoff)是實際利益或效用,代表參與者的預期結果;(iii)合理性(Rationality)描述了所有參與者都希望在博弈過程中保持其個人最大利益的情況;(iv)策略(Strategy)是參與者采取的行為,每個參與者的策略可能不同。支付結果不僅僅只受一種博弈的影響,還會受到其他博弈的影響。

  研究人員設計了一個定價模型來評估物聯網傳感數據。在該模型中,所有供應商都以競爭的方式銷售其數據,并將該模型定義為非合作博弈。供應商扮演參與者的角色,他們決定定價策略。將(V,π)表示為一個n個參與者(賣家)的博弈,其中Vi表示參與者i使用的定價策略。V 是每個策略集的笛卡爾積:V = V1 ·V2 ·V3 ···Vn,而 πi 是代表賣方 i 收益的向量。


圖片

  從這個不平等性中,我們知道納什均衡中的參與者沒有動機改變他們的定價策略,因為這會導致更糟糕的回報。因此,實現納什均衡是解決問題的唯一途徑。注意,在某些條件下不存在納什均衡,有時在相反的條件下存在多個納什均衡。因此,找到納什均衡且博弈只有一個納什均衡是利用非合作博弈對數據集定價的充分必要條件。

  b:斯塔克伯格(Stackelberg)博弈

  在非合作博弈模型中,所有參與者都必須發布一個定價策略,并且定價策略是透明的。盡管如此,這在真實的數字市場中并不總是正確的,因為參與者無法計算納什均衡。因此,他們不能給數字商品定價。相反,參與者需要等其他參與者宣布它們的定價策略。例如,當移動運營商向他們出售數據計劃時,他們顯然需要考慮競爭對手的價格。因此,移動運營商越晚宣布其定價策略,性能就越好。這是一個典型的斯塔克伯格(Stackelberg)博弈模型。

  哈達迪(Haddadi)和加塞米(Ghasemi)提出了Stackelberg博弈模型,以保護宣布其定價策略的參與者。它定義了兩個位置,領導者和追隨者。假設一個市場中有兩個參與者,V1和V2是參與者1和2的定價策略集。如果參與者2首先宣布V2,那么參與者2將是領導者,參與者1將是追隨者。使用Stackelberg博弈,他們證明了領導者可以獲得比使用其他模型更好的回報。請注意,將Stackelberg博弈引入數字市場可以使所有參與者的收益最大化,尤其是領導者的收益。此外,現有研究表明,在頻譜交易和資源分配中使用Stackelberg博弈模型,可以提高物聯網系統的網絡性能和穩健性。

  c:討價還價博弈

  最后一個方案是討價還價博弈。這種博弈論指的是銷售商和消費者達成協議的一種情況,為了達成這一協議,銷售商和消費者需要進行協商。在簡單的數字市場中,只有當供應商和消費者就某種商品的銷售價格達成一致時,交易才會發生。

  在這個定價模型中,將rv表示為確保供應商獲得可接受的收益的保留價格。同樣,消費者還提供rc作為消費者愿意購買的保留價格。同時,與其他博弈理論類似,供應商和消費者都提交了他們的定價策略Pv和Pc。

  圖片

  由于討價還價博弈是解決復雜談判條件的適當方案,因此它通常用于數據拍賣、網絡資源拍賣。

  最后,我們整理了現有的數據定價模型,見表2。

圖片

 ?。ū?. 定價數據模型)

  總之,在本章節,我們對數據定價進行了全面概述,并闡述了與大數據定價相關的主要概念,如數字商品定價原則、數據市場結構和數據定價策略。我們還詳細解釋了基于經濟的定價模型和基于博弈論的定價模型。盡管如此,大數據的模型相對較少,大多數最先進的定價模型都是針對傳統商品進行研究的。作為未來的研究方向,應在大數據科學方面做出更多努力,以了解不同類型的數據,并設計適當的模型,實現不同類型數據用戶的精準性。

更多精彩,請關注“官方微信”

11.jpg

 關于國脈 

國脈,是大數據治理、數字政府、營商環境、數字經濟、政務服務專業提供商。創新提出"軟件+咨詢+數據+平臺+創新業務"五位一體服務模型,擁有超能城市APP、營商環境流程再造系統、營商環境督查與考核評估系統、政策智能服務系統、數據基因、數據母體等幾十項軟件產品,長期為中國智慧城市、智慧政府和智慧企業提供專業咨詢規劃和數據服務,廣泛服務于發改委、營商環境局、考核辦、大數據局、行政審批局等政府客戶、中央企業和高等院校。

責任編輯:wuwenfei