量化拼車市場的效率(譯文-來自: Lyft)

閃念基因 發佈 2024-04-11T04:16:28.344977+00:00

圖片來自Unsplash上的Lisheng ChangLyft 市場的健康狀況取決於乘客和司機在空間和時間上的分布情況。在複雜的拼車空間中,定義「市場效率」和「供需平衡」等典型市場概念並不容易。一個簡單的問題,例如「我們現在有足夠的司機嗎?



Lyft 市場的健康狀況取決於乘客和司機在空間和時間上的分布情況。在複雜的拼車空間中,定義「市場效率」和「供需平衡」等典型市場概念並不容易。一個簡單的問題,例如「我們現在有足夠的司機嗎?」 根據上下文有不同的答案:

  • 在正確的地方是否有足夠的司機來維持良好的服務水平?
  • 假設無論距離多遠都會接受乘車請求,系統範圍內是否有足夠的司機?
  • 是否足以維持有吸引力的收益率?

每個問題指向不同的方向。能夠回答此類問題是運營健康的雙向市場的有趣(且具有挑戰性!)部分。

我們必須首先開發用于衡量和監控市場的診斷方法。診斷帶來了自身的巨大挑戰。在本文中,我們將討論如何解決三個主要考慮因素:

  • 豐富的公制選項。有許多運營指標,每個指標都有不同的優缺點和側重點。騎手方面的指標包括取消率、預計到達時間 (ETA)、取件時間和履行率。司機方面的指標包括司機小時數(在平台上花費的時間)、利用率(與乘客在一起的時間比例)和收入。平台指標包括乘車量、激勵支出效率和財務指標。即使對於熟練的分析師來說,同時監控這些指標的儀錶板也很困難,因為很難知道應該關注哪裡。此外,這些指標是嘈雜的,並且會受到不斷變化的市場條件和交通、天氣或機場延誤等外來衝擊的影響。
  • 缺乏可操作的輸出。指標跟蹤不會自動導致下一個最佳步驟。我們擁有多種槓桿工具箱,可用於改善市場健康狀況,包括定價、調度和各種激勵政策。我們如何從診斷映射到最佳拉動槓桿?
  • 混合消息。一長串嘈雜的指標通常會發出混雜的信息,讓人很難掌握核心到底發生了什麼。此外,這些指標在測量單位上通常是異構的,因此在它們之間進行定量權衡並不簡單。

最佳運輸

Lyft 平台的核心是派遣司機以滿足乘客需求的匹配算法。通過專注於這個核心系統,我們能夠消除來自下游檢查指標的大量噪音和複雜性。乘客和司機在空間和時間上的分布情況決定了我們的調度系統的有效性,從而提高了市場的效率。

本質上,我們想要量化這兩個分布之間的距離。為簡單起見,讓我們將空間和時間劃分為細胞單元;例如,我們可以使用geohashes、H3單元格或S2單元格作為空間,使用 1 分鐘或 5 分鐘的間隔作為時間。設dᵢsᵢ分別是單元格i中的騎手和司機人數。


定義分布之間距離的方法有很多種,但我們的起點是Wasserstein 距離。首先,定義一個非負值傳輸函數 γ(i, j)和一個成本函數c(i, j)。Wasserstein 距離是這樣的總成本的最小值:


這也稱為推土機距離,因為它測量移動供應分布以匹配需求分布所需的「工作」量,反之亦然。我們可以看到它是如何解決最佳運輸問題的,因為我們的目標是以儘可能少的工作完成必要的運輸量。在這裡,「工作」可能不是指體力勞動,而是包含可能適用於我們系統的任何資源限制。



這是一個良好的開端,但仍有許多缺點使其不適合我們的拼車環境。首先,ds可能有不同的總測度,這意味著上述優化沒有可行的解決方案。事實上,如果我們在給定時間總是有完全相同數量的乘客和司機使用 Lyft,那將是令人驚訝的。其次,Lyft 的工作方式是派遣司機前往乘客那裡接他們,而不是相反。也就是說,我們希望我們的交通功能能夠移動司機而不是乘客。

Zhou 等人提出了基於圖的均衡指標 (GEM)框架。(2021)整改短板。GEM 計算基於解決與拼車調度過程更相似的非對稱最優交通問題。


在這個等式中,γ是表示運輸計劃的矩陣;γ(i, j)是從單元格i傳輸到單元格j的供應量。c(i, j)捕獲運輸成本,可以將其編碼為單元格i和單元格j之間的旅行距離或時間。目標中的第一項衡量不平衡,第二項衡量總成本;λ是一個正則化參數,表明我們有多關心不平衡和成本之間的權衡。為簡單起見,我們排除了一些細節;該文件包含完整的詳細信息。

從這個優化的解決方案中,我們可以定義一些有用的數量。首先,我們定義本地供需 (SD) 缺口


正如周等人。(2021) 提出,可以通過選擇權重度量wᵢ並匯總局部差距來獲得全局診斷度量:


在將 GEM 用作診斷措施時,我們發現權重的選擇對得出的結論有很大的影響。而且,單一的觀點不足以準確地回答我們的問題。它不能單獨幫助我們形成利用供應滿足需求的市場效率概念,因為它無法代表供應方和需求方狀態之間的任何潛在權衡。

受這些觀察的啟發,我們開發了SD-GEM,這是一個雙向框架,可以全面表示拼車市場均衡狀態。

市場的兩面性觀點

我們可以使用相應的權重計算以需求為中心的市場視圖以供應為中心的市場視圖:


我們將使用一組程式化的調度示例來說明上面介紹的雙向視圖。粉色圓圈代表司機,藍色三角形代表請求。整個區域分為 4 個單元格。驅動程序只能匹配其當前或相鄰單元格中的請求,而不是對角線。黑色箭頭代表一些不明顯的匹配。網格周圍的數字對表示最佳調度供應與需求的比率。



圖(a)顯示了一個全球平衡的市場。騎手和司機都看到了相同的平衡狀態。圖 (b) 顯示了SD 錯位:騎手看到的是普遍供應不足的狀態,而司機看到的是普遍供應過剩的狀態。創業板的兩種觀點呈現符號相反的SD指數。這表明某些驅動程序不在正確的位置(在空間或時間上)以匹配請求,並且驅動程序重新定位策略可能具有很高的價值。圖(c)顯示了全球供應不足的市場,騎手通常看不到足夠的司機,而司機通常可以接觸到充足的騎手。圖 (d) 顯示了相反的情況:全球供應過剩市場,乘客通常會看到大量可用的司機,而司機通常看不到足夠的請求來滿足適當的利用率水平。GEM 雙視圖為我們提供了市場的低維表示,使我們無需手動解析上圖中細粒度的騎手和司機狀態即可採取行動。

城市概況

為了將雙重觀點轉化為可操作的見解,我們發現在總體水平上繪製以需求為中心和以供應為中心的指數的二維圖很有幫助。例如,這裡是雙視圖的散點圖,其中每個點代表一個單獨的拼車市場,聚合了多天的數據,x 軸是需求視圖,y 軸是供應視圖:



最佳擬合回歸線以藍色繪製。它的斜率非常接近正 1,表明供需之間通常存在一對一的權衡。通過注意某些市場在這張圖表上的位置,我們有一個信息豐富的起點來調查市場健康或特定的市場管理行動。

當我們放大單個市場並在同一圖表上繪製一天中的不同時間時,會出現更多有趣的模式。我們看到點雲的形狀非常不同,每個城市獨特的路網拓撲和土地分區在其中發揮了作用。



城市 3 是密集城區的一個示例,其中街道具有高度連通性,導致供需單元之間的可達性很高。因此,供求關係非常吻合。城市 2 的地理形狀呈細長狀,主幹道數量較少。因此,供應分配需要具有戰略性,以與需求分配很好地匹配。因此,由於任何增量供應或需求單位分布的隨機性,對於任何給定的以需求為中心的指數值,以供應為中心的指數往往存在更大的可變性。

一般而言,需求指數負向點的斜率小於正向點的斜率。一個直觀的解釋是,當需求指數為負時,增加更多的供應進入市場將更有可能被需求吸收(即額外供應更可能出現在供應相對較低而需求相對較高的地方,可能是由於影響的驅動程序激勵)。斜坡的平坦度或陡度取決於城市的拓撲結構和特定需求/供應塑造策略的有效性。

排隊的角度

為了更好地理解 SD-GEM 指數究竟在衡量什麼,從排隊論的角度來看會有所幫助。在任何給定時間,流入的請求都包含新請求以及來自先前時間窗口但尚未匹配的開放請求。請求流出包括匹配和取消的請求。司機流入包括新司機簽到、上一個時間窗口的閒置司機和完成行程但又可以為新乘客提供服務的司機。相應的司機流出包括匹配的司機和司機下車。

對於標準(非共享)遊樂設施,匹配是一種一對一的清關機制,其中乘客和司機以相同的速度退出隊列。給定單元的平衡隊列意味著從一個調度周期到下一個調度周期幾乎沒有需求或供應單位的積累。流入流和流出流之間的任何正差異將導致請求和/或驅動程序在下一個時間窗口保留在隊列中;因此,本地 SD 差距是這種預期積累的快照。

在系統層面,由於某些單元可能存在供應積累而其他單元可能存在需求積累,因此情況變得複雜。上面介紹的 SD-GEM 指數是細胞級積累條件的加權聚合。由於 SD 分布的內生性,具有大量單元級隊列的市場級系統具有額外的複雜性——司機在給定時間到達部分取決於早期時間段的請求目的地,因此需求模式具有對隊列平衡的影響。更全面地了解這種現象仍然是一個懸而未決的問題。



邊際值

我們可以利用GEM 優化問題中的對偶性來計算資源單位(供給和需求)的邊際價值對偶價值。邊際價值是經濟學和優化理論中的一個重要概念,表示相對於特定目標函數的額外資源單位的價值。



需求對偶為需求塑造策略提供了方便的診斷分析,以保持健康的市場平衡。例如,特定位置和時間的負對偶意味著需求可能會增加,因為增量請求會提高 GEM 目標值。另一方面,正對偶意味著市場平衡甚至可能隨著時空區需求的減少而改善。上圖中的左側圖可視化了需求對偶分布。

供應對偶反過來為供應定位策略提供指導性分析,因為它們表明最需要司機的地方,以及我們可能希望從哪裡為司機重新定位自己提供激勵。上圖中的右側圖可視化了供應對偶分布。我們看到它很好地對應於需求對偶分布的倒數,這是有道理的——我們最需要司機的區域通常是我們可能有太多需求的區域。在需求邊際值高的地方,個別需求單位導致效率低下,我們應該致力於減少該地區的需求或增加供應。哪裡貨源邊際價值很高,我們應該致力於減少該地區的供應或增加需求。我們可以用它來診斷我們的激勵和定價系統是否按預期運作,並指導政策的適當變化。

市場效率和政策評估

我們如何使用 GEM 雙重觀點來更準確地定義市場效率的概念?在二維(Ad,As)圖中,原點代表理想的有效狀態。任何偏離它的行為都會導致市場健康效率降低——司機可能會空轉更多,或者乘客可能需要等待更長時間才能滿足他們的要求。

我們可以使用下圖來理解這個二維空間中的運動。粉紅色的線表示單位梯度超平面,市場狀態將沿著該超平面移動,因為純 SD 體積移動。藍線是代表以市場交易量為條件的 SD 分布變化的正交補充。



讓我們來看一個具體的供應湧入案例。假設市場上出現了額外的驅動因素,使得總供應量增加,但供應分布的形狀沒有改變。可以看出,供應和需求指數都將增加一個常數α ,表示為沿粉紅色線從R1R2的移動。相比之下,有針對性的干預措施(例如定位激勵措施)使司機的分配更具戰略性且更符合需求,將導致R1R3向藍線方向移動。

我們可以將向粉線方向移動的政策變化稱為數量目標政策,將沿藍線方向的政策變化稱為分配目標政策。哪一個更好取決於市場的現狀。如果我們目前處於 R1 的第二象限(SD 偏差),則最好專注於調整供需 (R3),而不是獲取新的供應或需求 (R2)。如果我們目前處於 R4 的第一象限(供應過剩),則最好關注全球需求獲取 (R6) 而不是對齊 (R5)。

在 Lyft 的使用

與標準觀測指標相比,SD-GEM 框架具有一些主要優勢:

  • 它對供給側和需求側效應具有統一的衡量尺度,使分析權衡更容易。
  • 它同時代表均衡和效率方面的市場狀態。
  • 它直接反映了調度/匹配級別發生的事情,使其不易受到混淆和增加差異的影響。

鑑於它的好處,我們已經在 Lyft 的幾個有影響力的領域使用 SD-GEM 統計數據。首先,使用這些診斷填充儀錶板有助於分析師監控業務的健康狀況。其次,我們與內部客戶合作,獲取用於 ML 和預測模型的 SD-GEM 統計數據,他們通過提供精細的市場平衡功能來幫助提高預測性能。我們還在 A/B 測試中使用 SD-GEM 進行政策評估,尤其是當市場效率是重中之重且觀察指標無法提供清晰畫面時。


為市場效率和均衡開發一個有原則的框架幫助我們解決了我們在本文開頭提到的一些分析挑戰:大量的指標選項、缺乏可操作的輸出以及混合消息。我們將繼續在 Lyft 中為這項工作尋找更多用例。

致謝

我們要感謝 Ricky Chachra、Mark Huberty、John Kirn、Ido Bright 和 Nicholas Chamandy 提供的有益討論和建議。

作者:Alex Chin 和 Tony Qin

出處:https://eng.lyft.com/quantifying-efficiency-in-ridesharing-marketplaces-affd53043db2

關鍵字: