最近快播案炒的沸沸扬扬,作为一个技术人员,从技术的角度考虑大数据能否识别淫秽视频!本人才疏学浅,了解十分有限,求大神分析从大数据聚类和机器学习两个领域来做这件事的可行性
查看全文基于密度的聚类算法,其聚类结果的意义是什么?
这里默认用欧氏距离评价点的相似度。这些聚类算法对数据点的划分是符合“人类直觉”的,如上图的数据集会被划分成一大一小两个簇,但是对于橙色点A及其周围的点而言,它们虽然属于黑色簇,但是平均而言和绿色簇中的点更为相似,对黑色簇整体提取特征的话,结果也会和A的特征大相径庭。此时聚类结果的意义是什么?
查看全文如何评价主流聚类算法时间复杂度, 比如k
suppose that there are k cluster center, n data points and d dimension for every data points. compare their time complexity.Additional question: what is the fastest clustering algorithm in the world except for the three above, no matter how its accuracy is. Can the fastest algorithm obtain ~ O(log n) ?
查看全文