聚類分析:將個體(樣品)或者物件(變數)按相似程度(距離遠近)劃分類別,使得同一類中的元素之間的相似性比其他類的元素的相似性更強。目的在於使類間元素的同質性最大化和類與類間元素的異質性最大化。其主要依據是聚到同一個資料集中的樣本應該彼此相似,而屬於不同組的樣本應該足夠不相似。
常用聚類方法:
1、系統聚類法;
2、K-均值法;
3、模糊聚類法;
4、有序樣品的聚類,
5、分解法;
6、加入法。
注意事項:
1、系統聚類法可對變數或者記錄進行分類,K-均值法只能對記錄進行分類;
2、K-均值法要求分析人員事先知道樣品分為多少類;
3、對變數的多元正態性,方差齊性等要求較高。