R-squared,也被稱為確定係數,是一個用於衡量模型擬合度的統計量。它表示模型解釋的方差與總方差之間的比例。R-squared的公式可以表示為:
R-squared = SSR/TSS = 1 - RSS/TSS
其中:
SSR (Sum of Squared Regression) 是回歸模型預測值與均值之差的平方和,表示模型可以解釋的方差。
RSS (Sum of Squared Residuals) 是回歸模型預測值與實際觀測值之差的平方和,表示模型不能解釋的方差。
TSS (Total Sum of Squares) 是原始數據與均值之差的平方和,表示回響變數固有的方差。
由於SSR和RSS都是TSS的一部分,且TSS = SSR + RSS,R-squared的值總是在0到1之間。一個較高的R-squared值表示模型解釋了數據中較大的比例的變異,而一個較低的R-squared值則表示模型解釋的變異比例較小。