一组是Decision Tree,一组是SVM,一组是Adaboost,为什么最后留出1/4的数据validation时正确率都在95%以上,但是提交测试时正确率只有75%?大概1800组数据,维度是20000左右的sparse数据。(遇到这种情况很奇怪,希望能听到大家的见解和常见调参数的技巧,我怀疑是overfitting了)
查看全文关于数据挖掘和数据集成?
数据预处理的主要任务包括:数据清洗 数据集成 数据转换 数据归约 数据离散化。为什么只有“数据集成”单独出了书,而剩下的却没有?(我不是处女座)是因为“数据集成”的内容已经多到可以单独成册了,还是因为“数据集成”很重要?PS:大家发现了吗,华章计算机科学丛书,花纹可以拼接到一起,如下图~[img=1112832840]
查看全文什么软件可以通过拖拖拽拽的方式编程吗?
拖拽组件等方式。已知的有visual basic,lego的ev3机器人。还有clementine等。印象中苹果也出过,不过忘记名字了。还有其他比较好用的大家也可以介绍下。
查看全文