勵志

勵志人生知識庫

iv怎麼算

IV(信息價值)的計算基於WOE(權重證據)的概念。以下是IV值計算的基本步驟:

分組處理:首先需要對原始變量進行分組處理,即分箱或離散化。常用的離散化方法包括等寬分組、等高分組或利用決策樹進行分組。

計算WOE:對於分組的第i組,WOE的計算公式如下:

WOE = (當前分組中響應客戶佔所有響應客戶的比例) - (當前分組中沒有響應的客戶佔所有沒有響應客戶的比例)

計算IV:IV衡量的是某一箇變量的信息量,它是對自變量WOE值的一箇加權求和。對於分組i,其對應的IV值計算公式如下:

IV(i) = Σ(WOE(j) * 權重(j))

權重(j) = 1 / (1 + Σ(WOE(k) * 權重(k)))

計算整體IV:在建模過程中,IV值主要用於特徵選擇。如果想要對變量的預測能力進行排序,可以按IV值從高到低篩選。

需要注意的是,在變量的任何分組中,不應出現響應數爲0或非響應數位0的情況。當變量的一箇分組的響應數位0時,對應的WOE就爲負無窮,此時IV值爲正無窮。

以上步驟可以幫助你正確計算IV值,以評估變量的預測能力。