當前位置:趣味科普網>經驗>

kmeans原理

經驗 閱讀(1.95W)

kmeans原理

kmeans原理如下:

輸入:聚類個數k,以及包含n個數據物件的資料庫。輸出:滿足方差最小標準的k個聚類。

K-means演算法是很典型的基於距離的聚類演算法,採用距離作為相似性的評價指標,即認為兩個物件的距離越近,其相似度就越大。該演算法認為簇是由距離靠近的物件組成的,因此把得到緊湊且獨立的簇作為最終目標。K-Means演算法是無監督的聚類演算法,它實現起來比較簡單,聚類效果也不錯,因此應用很廣泛。K-Means演算法有大量的變體,本文就從最傳統的K-Means演算法講起,在其基礎上講述K-Means的優化變體方法。包括初始化優化K-Means++,距離計算優化elkanK-Means演算法和大資料情況下的優化MiniBatchK-Means演算法。