勵志

勵志人生知識庫

粗差剔除的方法

粗差剔除的方法主要包括:

3σ準則。適用於測量次數較多的情況,其基本思想是認為大部分數據服從常態分配,粗差會遠離數據的中心主體部分。如果數據點與均值的差值超過3倍的標準差,則認為該點是粗差。

格魯布斯準則。基於常態分配的統計特徵值,適用於測量次數較少的情況,相比3σ準則,其更適合小樣本數據。

狄克松準則。利用假設檢驗的方法來剔除可疑值,適用於測量次數較少且對數據精度要求較高的情況。

羅曼諾夫斯基準則。基於頻率近似等於機率的理論,適用於測量次數較少的情況,但計算過程較為複雜。

RANSAC算法。通過不斷調整模型參數來剔除外點,適用於模型參數可以通過疊代最佳化來估計的情況。

M估計。在誤差較大時使用其他函式替代二次函式,削弱大誤差對模型目標函式的主導作用,適用於對異常值敏感的模型。

每種方法都有其適用場景和優缺點,在實際套用中應根據數據的特性和處理需求選擇合適的粗差剔除方法。