基于密度的聚類(lèi)方法,依據(jù)樣本空間中點(diǎn)的密度,對(duì)樣本進(jìn)行聚類(lèi)的算法中,預(yù)期要發(fā)現(xiàn)的簇是由滿(mǎn)足預(yù)定樣本數(shù)量閾值要求的點(diǎn)集組成,并且不同的類(lèi)簇由樣本數(shù)閾值低于指定值的點(diǎn)集( 離群點(diǎn)集合) 分割?;诿芏鹊乃惴ㄗ罱K要滿(mǎn)足過(guò)濾密度低于閾值的樣本區(qū)域,發(fā)現(xiàn)密度等于或高于指定閾值的區(qū)域。在此類(lèi)算法中,無(wú)需指定簇的數(shù)量。基于密度聚類(lèi)方法可以用于空間數(shù)據(jù)的聚類(lèi)。數(shù)據(jù)挖掘領(lǐng)域中典型的基于密度的算法有:1) DBSCAN。依據(jù)用戶(hù)給定參數(shù),不斷發(fā)現(xiàn)給定半徑內(nèi)的點(diǎn)數(shù)達(dá)到指定數(shù)量的高密度區(qū)域,并不斷生長(zhǎng)高密度區(qū)域。2) DENCLUE。聚類(lèi)過(guò)程中依據(jù)樣本點(diǎn)在指定空間中的密度進(jìn)行聚類(lèi)。3) OPTICS、DBCLASD、CURD。這些算法中,針對(duì)數(shù)據(jù)在數(shù)據(jù)集中呈現(xiàn)出的高密度區(qū)域的形狀和密度,對(duì)DBSCAN 做了些補(bǔ)充或修正。以上3 種基于密度的聚類(lèi)算法中,DBSCAN 聚類(lèi)算法是一種常用的聚類(lèi)算法。算法執(zhí)行過(guò)程中,首先需要指定類(lèi)簇的半徑域Eps 和最小對(duì)象數(shù)目Min Pts;然后根據(jù)Eps 和Min Pts 判斷對(duì)象集中的對(duì)象的屬性( 即核心點(diǎn)、邊界點(diǎn)、噪聲) ; 最后根據(jù)當(dāng)前對(duì)象屬性判斷當(dāng)前對(duì)象域是否構(gòu)成一個(gè)類(lèi)簇,并依據(jù)此方法判斷數(shù)據(jù)集中每個(gè)點(diǎn)的屬性。DBSCAN 算法可以對(duì)農(nóng)業(yè)機(jī)械作業(yè)軌跡圖像點(diǎn)進(jìn)行密度識(shí)別,挖掘其分布特征,并找到軌跡點(diǎn)較密的區(qū)域,從而發(fā)現(xiàn)軌跡點(diǎn)較集中的簇,可以識(shí)別軌跡中離群點(diǎn)。該算法的特點(diǎn)是可以挖掘不同形狀的類(lèi)簇,可以有效地排除離群點(diǎn),同時(shí)較適合空間和時(shí)間軌跡數(shù)據(jù)的聚類(lèi)。實(shí)踐證明: 算法對(duì)Eps 和Min Pts 的設(shè)置較敏感,如設(shè)置不當(dāng)可能造成聚類(lèi)效果下降。依據(jù)農(nóng)業(yè)機(jī)械田間作業(yè)軌跡數(shù)據(jù)的特征,本研究選擇DBSCAN 作為軌跡聚類(lèi)算法。農(nóng)業(yè)機(jī)械軌跡聚類(lèi)流程如下:1) 算法輸入。作業(yè)周期內(nèi)時(shí)空軌跡數(shù)據(jù)、半徑Eps 和最小軌跡數(shù)Min Pts。2) 算法輸出。農(nóng)業(yè)機(jī)械作業(yè)軌跡類(lèi)簇集。方法:1) 放入所有軌跡點(diǎn)到Data Point 庫(kù),從Data Point隨機(jī)取出一個(gè)點(diǎn)。2) IF Eps領(lǐng)域中至少包含Min Pts個(gè)軌跡點(diǎn),THEN 記當(dāng)前點(diǎn)為核心軌跡點(diǎn),并創(chuàng)建一個(gè)簇,放入其到簇庫(kù)C 中。ELSE IF 當(dāng)前點(diǎn)是邊界點(diǎn),THEN歸入所屬簇ELSE判斷其為離群點(diǎn)。3) 從Data Point 庫(kù)中隨機(jī)取出下一個(gè)點(diǎn)。4) 并重復(fù)步驟2) 和3) ,直到所有點(diǎn)處理完畢。