如何对一组时间序列数据进行聚类?目的是将股价波动及走势相似的公司分到一类。 举报 理由 举报 取消 比如现在有300家公司一年的股票价格(时间都是2014.9.1~2015.9.1),如何将这300家公司根据股价走势分类,将股价波动及走势相似的公司分到一类?无监督,分成几类事先不知道。 2018年1月25日 4 条回复 1132 次浏览 分析,学习,数据,数据挖掘,机器,统计
回复 ( 4 )
这取决于你想怎么分,你认为什么样的叫做类似,聚类首先要定义距离,在进行数学定义之前,你首先给出一个物理上的目标。
将每个公司的股票数据视为一个向量,就已经符合聚类算法的输入了。距离你得挑一个。如果你要看走势,也许可以将股价归一化之后,直接用差的平方和?
请问哪里有这样的数据集
spss-分析-聚类