记录聚类分析的尝试和学习,比较粗糙的记录,想要了解工具具体用法建议去看链接里的视频,讲的很清楚。

参考资料来自:Clustering in ArcGIS Pro 中的视频1以及Spatial Statistics: Machine Learning-Based Cluster Analysis - Esri Videos: GIS, Events, ArcGIS Products & Industries

-------------------------------分割线-----------------------------------

我的数据:一套带有年份属性的栅格数据,想要用数学语言分析且表示出年份分布的空间分布规律

第一步:把栅格数据按照分析目标属性转换为点图层,聚类分析需要shp文件

1.【Optimized Hot Spot Analysis】:为了了解点是随机分布的还是有规律的?检测出的hot sopt表示这一块区域的值对比整个研究区域是显著高的,cold spot则是显著低的。

工具界面:

在本数据里,高值代表了年份大的,低值代表了年份小的,所以能得到空间分布情况大致为西部中部晚,东部早。但我需要按照具体的年份聚类呢?找新工具:

2.【Density-based Clustering】:能够同时考虑多种属性进行聚类,例如结合属性数值,位置,甚至现在能够再结合上时间。

工具界面:

有三种聚类方法:“DBSCAN”需要手动设定distance,“HDBCAN”则是机器自动设定,"OPTICS"计算点和点之间的距离,能够展示出reachability plot,可以用于找到适合数据的distance,来校正类别,把某一类再区分,或者合并相似的类别,提高聚类准确性。参考视频如下:

 视频中的演示demo使用了700个点左右,设置的minimum features为20。换算比例我这里大概设置4300,看起来效果不太行,我又尝试了2000,500和1000。

当我以为根据位置分类的话因为我是栅格转换为点,点聚集的都是均匀的,所以才会出现中部的点聚类只能有两类的时候,发现1000聚类有很多类了,再试试1500发现也不行。决定用1000作为最合适的值

来试一试"OPTICS"的距离图进行微调。只设置好这两个参数,search distance我也不太确定,设置100km发现结果里只有一类,尝试50km发现这次聚类了

输出结果中有一个推荐的sensitivity,作为cluster sensitivity再运行一次。

 

 关于时间字段,工具的解释是:“包含数据集中每个记录的时间戳的字段。此字段的类型必须为日期。”所以需要将属性列中添加好时间字段

3.【Colocation Analysis】:可以分析两种类别的分布规律及其联系。下图举例是指花对蜜蜂的colocate分析。我的数据不涉及,没有尝试。

 

 4.【Multivariate Clustering】:多属性值的数据,将属性作为不同的维度构造一个属性空间进行聚类。图所示三个属性三个维度,分类数值的情况还有一个箱线图展示不同分组的对应不同属性的数值高低。进一步的工具【Spatially Constrained Multivariate Clustering】在考虑多属性的基础上再加上了位置的限制,属性和位置都邻近才分为一类。我的数据没有多属性数据就没有尝试。

         

视频中演示【Spatially Constrained Multivariate Clustering】时,根据第一遍输出的结果,又对聚类类别数量进行微调,再运行一遍工具。

 5.【Build Balanced Zones】:genetic algorithm的原理进行计算,我理解的大概意思:如下图展示指定了4 zones,取随机种子聚类为四类,可以有不同的聚类对应其拟合效果分数,拟合最好的几组又互相交换之类的。循环这个过程直到拟合效果分数不再变得更高。

 进行尝试:先统计属性。视频中举例,按照兴趣属性的number of unique values的值作为输入值。

 我这里有22类,尝试以22进行分类好像有些多,想根据自己的需求分类。试试6类

 

 如果还要加入其他属性限制,下面还能继续定义,我这里没有其他属性了,没试。

又继续试了试分10类:

 

综上,我的数据比较合适的方法为【Optimized Hot Spot Analysis】看高低值分布情况 和【Density-based Clustering】&【Build Balanced Zones】聚类。但都需要多次调整,以展示想要的聚集效果,视频末尾的问答中主持人人也说,没有规定的数值也没有类似R2这样可以评价效果的数值,每个人根据研究的兴趣方向决定了最终的聚类结果。

 

 

 

 

 

 

推荐链接

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。