之前一直把心思放在有监督的文本分类学习上。最近将一些概念复习时发现了LSA,PLSA这些东东,但是无奈不是非常得明白(主要是应用上的,例如输入是文档词条矩阵,那么输出呢?经过SVD分解之后的矩阵?)。想求教下各位大大,现在有没有相关的应用场景?LSA和监督分类算法结合的?
查看全文如何进行feature selection以及weka上的具体操作?
我有一组数据,有50多个属性(记为Attribute 1, Attribute 2, …, Attribute n),均为数值型,现在我想对Attribute1进行预测,并想知道Attribute 2-n哪些属性对预测Attribute 1 有帮助,需要进行 feature selection。 请问我应如何进行feature selection呢?在Weka上怎么实现?
查看全文在机器学习的项目中,特征是如何被找出来的?
在我所接触过的特征学习的项目中(学校,工作),特征都是由人提取出来的。比如我们要预测天气,那么就直观的去想象什么因素可能与之后的天气有关,湿度,温度,是否有云,etc.。但是,这样的提取特征不仅仅需要很专业的知识,而且有些时候人的思维是有局限的,很难做到特征的准确性,高覆盖性。那么在工业中,是否有算法用来确定特征,而非“手工特征工程”。
查看全文请教QQ空间这个产品的用户人群 产品分析 各种分析?
1.在产品的角度来分析这款产品2.在营销的角度来研究QQ空间3.在推广角度分析请各位专家 从产品分析 竞品 用户人群画像 营销技巧 推广手段等等方面 来给我指点指点分析分析
查看全文机器学习特征选取的boruta算法思路?
是比较某个特征shuffle与否,对结果是否影响较大来确定特征的重要性,但是boruta的具体步骤不明白Z score究竟是怎么算的,求教
查看全文怎样了解精英人士的喜好?
想了解企业家、社会精英、中产阶级中压力大的那群人(主要是男人),他们的喜好是什么?阅读什么杂志和书籍?上什么网站?喜欢浏览和转发什么类型的内容?不是为了泡他们,只是工作中针对的人群经常有这类人,生活中实在没有什么机会了解,所以在这里问下知友。
查看全文