帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

通过 Foursquare 的行人流量预测苹果零售店的销售数据有哪些局限性?

类似的预测方法还有其他可以应用的地方吗?Foursquare CEO Jeff Glueck 周五在 Medium 上称,「如果把 Foursquare 的行人流量与苹果的销售数据绘制在一张图表中,就会发现它们两个的图形非常相近。via 这公司根据人流量预测iPhone6s首周卖了1500万」 via Foursquare’s Prediction: Apple Will Sell 13–15 Million iPhones This Weekend — Foursquare Direct — Medium » Foursquare’s Prediction: Apple Will Sell 13

查看全文

adaboost为什么不容易过拟合呢?

刚刚接触机器学习,adaboost对训练数据分类的非常精细,为什么不会过拟合呢?是迭代过程中基函数会自己做权衡,不会为了一些明显的噪声去增加err(损失),从而对噪声有一定的容忍度吗?

查看全文

关于数据挖掘和数据集成?

数据预处理的主要任务包括:数据清洗 数据集成 数据转换 数据归约 数据离散化。为什么只有“数据集成”单独出了书,而剩下的却没有?(我不是处女座)是因为“数据集成”的内容已经多到可以单独成册了,还是因为“数据集成”很重要?PS:大家发现了吗,华章计算机科学丛书,花纹可以拼接到一起,如下图~[img=1112832840]

查看全文

如何计算基于特征的相似度?

假设电商网站用户有若干特征,每个特征对应一个分布,比如类别:得到向量(0.2,0.4…)表示该用户0.2的概率购买生活用品,0.4的概率是数码产品…, 按价格段分(0.4,0.3…)表示0-300的购买概率是0.4, 300-500的概率是0.3…如何计算不同用户的相似度?一种简单的方法是基于逻辑回归构造不同的特征的权重,按特征分别计算相似度,再加权。请教大家 还有什么其余的方法吗

查看全文