勵志

勵志人生知識庫

層次聚類是什麼

層次聚類是一種無監督機器學習中的聚類算法,它通過計算不同類別數據點間的相似度來創建一棵有層次的嵌套聚類樹。

層次聚類的過程從分配給每個類的所有數據點開始,然後,根據一定的相似度計算方法,如最小距離、最大距離、平均距離、中心距離或 Ward 係數,將兩個距離最近的類合併成一箇新類。這個過程會重複進行,直到滿足某種停止條件,如只有一箇類剩餘,或者達到用戶定義的簇數上限。層次聚類可以分爲兩種主要類型:自底向上的聚合層次聚類和自頂向下的分拆層次聚類。聚合層次聚類從單個對象開始,逐步合併相似的簇,形成越來越大的簇,直到滿足某個終結條件;而分拆層次聚類則從將所有對象置於一箇簇開始,然後逐漸細分爲越來越小的簇,直到滿足終結條件。