• 您現在的位置是:首頁 >教育 > 2021-11-15 16:43:37 來源:

    聚類和分類的區別

    導讀 聚類是指計算機根據樣本之間的相似性將整個樣本集聚類成若干類的過程。目標是使屬于同一類的樣本盡可能相似,而屬于不同類的樣本明顯不同。

    聚類是指計算機根據樣本之間的相似性將整個樣本集聚類成若干類的過程。目標是使屬于同一類的樣本盡可能相似,而屬于不同類的樣本明顯不同。系統聚類法和k-Means算法是目前聚類分析中應用最廣泛的兩種方法。分類是基于每個類別中若干樣本的數據信息,總結分類的規律性,建立判別公式和規則。

    以及聚類和分類當遇到新的樣本時,只需要根據判別公式和判別規則來判斷樣本所屬的類別。分類技術包括統計學、模式識別、人工智能、神經網絡等領域。目前常用的分類方法包括貝葉斯判別法、K近鄰法、支持向量機(SVM)法、決策樹法等。聚類是一個無監督的學習過程,而分類是一個有指導的學習過程。

    聚類和分類的區別在于事先沒有類表,完全根據樣本之間的相似度進行聚類,即類前有樣本;分類是基于一個預先確定的類表,將類表中的項目分配給樣本,即樣本之前有類。

  • 成人app