勵志

勵志人生知識庫

esmm模型

ESMM模型,全稱Entire Space Multi-task Model,是一種由阿里巴巴算法團隊提出的多任務學習模型,旨在解決轉化率預估(CVR)中的樣本選擇偏差(SSB)和數據稀疏(DS)問題。在信息檢索、推薦系統、線上廣告投放系統的點擊率(CTR)、轉化率(CVR)預估中廣泛套用。

ESMM模型的核心思想是通過引入點擊後轉化率(CTCVR)這一輔助任務,間接解決CVR的預估問題。具體來說,ESMM模型利用用戶行為序列數據在完整樣本空間建模,避免了傳統CVR模型經常遭遇的樣本選擇偏差和訓練數據稀疏的問題。該模型由兩個子網路組成,一個子網路用來擬合點擊率(CTR),另一個子網路用來擬合點擊後轉化率(CTCVR)。通過這兩個子網路的輸出相乘,可以得到交叉轉化率(CTCVR),從而間接預估CVR。這種方法不僅利用了全樣本空間的信息,還通過共享特徵嵌入層的方式,緩解了數據稀疏問題。

ESMM模型的損失函式是CTR和CTCVR的交叉熵之和。這種模型結構不僅簡化了整體設計,而且通過先驗知識——CTR和CTCVR之間的關係,改變了對CVR的預估方式,提供了對CVR預估問題的新思路。

在實際操作中,ESMM模型採用了乘法形式來避免除以一個很小的數導致的溢出問題,並確保pCVR的值在區間內。這種方法在整個樣本空間上建模pCTR和pCTCVR,與傳統CVR預估模型只在點擊樣本空間建模的方式形成鮮明對比。

綜上所述,ESMM模型通過引入CTCVR這一輔助任務,巧妙地解決了CVR預估中的樣本選擇偏差和數據稀疏問題,提高了CVR預估的準確性和效率。