KNN智能分類(lèi)算法的基本思想是計(jì)算訓(xùn)練樣本和新樣板之間的距離,然后找到最近的 K 個(gè)相鄰樣本數(shù)據(jù),根據(jù)這些相鄰樣本數(shù)據(jù),來(lái)判定新的樣本類(lèi)別。如果屬于同一類(lèi),則判定樣本屬于這個(gè)類(lèi)別; 如果不屬于這個(gè)類(lèi)別,則對(duì)候選類(lèi)別進(jìn)行評(píng)分,按照規(guī)則確定新樣本的類(lèi)別。最后,把新的測(cè)試樣本歸類(lèi)到最近的 K 個(gè)訓(xùn)練樣本中出現(xiàn)頻率最大的。使用 KNN算法分類(lèi)是基于臨近樣本數(shù)據(jù)具有類(lèi)似的預(yù)測(cè)值,基本思想是在多維空間 Rn中搜索未知樣本,找到與未知樣本最近鄰的 K 個(gè)點(diǎn),并根據(jù) K 個(gè)點(diǎn)來(lái)判斷未知的樣本數(shù)據(jù)。這 K 個(gè)點(diǎn)便是待分類(lèi)樣本的 k - 最近鄰。綜合上述過(guò)程,對(duì)基于 KNN 算法的農(nóng)機(jī)虛擬云制造系統(tǒng)設(shè)計(jì)過(guò)程如下:1) 尋找合適的農(nóng)機(jī)部件制造服務(wù)候選資源訓(xùn)練數(shù)據(jù)集。農(nóng)機(jī)部件制造服務(wù)候選資源訓(xùn)練數(shù)據(jù)集需要對(duì)歷史數(shù)據(jù)具有很好的覆蓋功能,這樣才有利于對(duì)近鄰的預(yù)測(cè)。選取的訓(xùn)練數(shù)據(jù)要有代表性,既要保證訓(xùn)練樣本數(shù)據(jù)集的大小,又要保證數(shù)據(jù)集的精度。2) 確定距離函數(shù)。距離函數(shù)的選取比較重要,決定哪些服務(wù)候選資源是 K 個(gè)待分類(lèi)的近鄰,其選取取決于實(shí)際的數(shù)據(jù)和決策。如果樣本是空間上分布的點(diǎn),則可以選用歐幾里得距離。3) 決定 K 取值。K 值的選取對(duì)分類(lèi)影響較大,一般可以初始確定一個(gè)值,通過(guò)不斷調(diào)試,得到合適的值。4) 確定候選資源的類(lèi)別。候選資源的最終確定可以根據(jù)類(lèi)別中出現(xiàn)頻率最高的來(lái)選擇,如果最高的不只一個(gè),可以選擇最近鄰的。農(nóng)機(jī)部件制造服務(wù)候選資源的選擇,可以有效地縮短農(nóng)機(jī)制造的整個(gè)設(shè)計(jì)和加工流程,從而提高農(nóng)機(jī)現(xiàn)代化設(shè)計(jì)和制造的效率。