基于密度的聚類方法,依據(jù)樣本空間中點的密度,對樣本進行聚類的算法中,預(yù)期要發(fā)現(xiàn)的簇是由滿足預(yù)定樣本數(shù)量閾值要求的點集組成,并且不同的類簇由樣本數(shù)閾值低于指定值的點集( 離群點集合) 分割?;诿芏鹊乃惴ㄗ罱K要滿足過濾密度低于閾值的樣本區(qū)域,發(fā)現(xiàn)密度等于或高于指定閾值的區(qū)域。在此類算法中,無需指定簇的數(shù)量?;诿芏染垲惙椒梢杂糜诳臻g數(shù)據(jù)的聚類。數(shù)據(jù)挖掘領(lǐng)域中典型的基于密度的算法有:1) DBSCAN。依據(jù)用戶給定參數(shù),不斷發(fā)現(xiàn)給定半徑內(nèi)的點數(shù)達(dá)到指定數(shù)量的高密度區(qū)域,并不斷生長高密度區(qū)域。2) DENCLUE。聚類過程中依據(jù)樣本點在指定空間中的密度進行聚類。3) OPTICS、DBCLASD、CURD。這些算法中,針對數(shù)據(jù)在數(shù)據(jù)集中呈現(xiàn)出的高密度區(qū)域的形狀和密度,對DBSCAN 做了些補充或修正。以上3 種基于密度的聚類算法中,DBSCAN 聚類算法是一種常用的聚類算法。算法執(zhí)行過程中,首先需要指定類簇的半徑域Eps 和最小對象數(shù)目Min Pts;然后根據(jù)Eps 和Min Pts 判斷對象集中的對象的屬性( 即核心點、邊界點、噪聲) ; 最后根據(jù)當(dāng)前對象屬性判斷當(dāng)前對象域是否構(gòu)成一個類簇,并依據(jù)此方法判斷數(shù)據(jù)集中每個點的屬性。DBSCAN 算法可以對農(nóng)業(yè)機械作業(yè)軌跡圖像點進行密度識別,挖掘其分布特征,并找到軌跡點較密的區(qū)域,從而發(fā)現(xiàn)軌跡點較集中的簇,可以識別軌跡中離群點。該算法的特點是可以挖掘不同形狀的類簇,可以有效地排除離群點,同時較適合空間和時間軌跡數(shù)據(jù)的聚類。實踐證明: 算法對Eps 和Min Pts 的設(shè)置較敏感,如設(shè)置不當(dāng)可能造成聚類效果下降。依據(jù)農(nóng)業(yè)機械田間作業(yè)軌跡數(shù)據(jù)的特征,本研究選擇DBSCAN 作為軌跡聚類算法。農(nóng)業(yè)機械軌跡聚類流程如下:1) 算法輸入。作業(yè)周期內(nèi)時空軌跡數(shù)據(jù)、半徑Eps 和最小軌跡數(shù)Min Pts。2) 算法輸出。農(nóng)業(yè)機械作業(yè)軌跡類簇集。方法:1) 放入所有軌跡點到Data Point 庫,從Data Point隨機取出一個點。2) IF Eps領(lǐng)域中至少包含Min Pts個軌跡點,THEN 記當(dāng)前點為核心軌跡點,并創(chuàng)建一個簇,放入其到簇庫C 中。ELSE IF 當(dāng)前點是邊界點,THEN歸入所屬簇ELSE判斷其為離群點。3) 從Data Point 庫中隨機取出下一個點。4) 并重復(fù)步驟2) 和3) ,直到所有點處理完畢。