用爬虫爬下来了quora上面,climate change主题下一半的问题和回答,以及回答的相关信息,现在想研究回答点赞数受哪些因素(如回答观看量、作者粉丝数、回答发布时间、回答文本长度、图片数量、以及文本特征)的影响,希望建立多元回归模型。然而,因变量和自变量都不是正态分布的,而是长尾分布(看起来是),由于我没有学过计量,想请教各位大大,这个模型应该怎么建,或者就是求合作吧。数据是很棒的,应该能发不错的文章。
查看全文数据挖掘是怎样的一种工作?
在下最近开始做数据这方面的工作,之前也不是混互联网的,经验比较少,不知道数据分析业界是怎样的,所以上来求前辈分享一下经验。 入坑的时候,算法,操作系统,网络编程,设计模式等都学得可以,本来打算是往后台开发方向去的。不料被安排到了数据分析。 当时没考虑这么多,反正数据挖掘这么火热。。。然而现在慢慢发现此坑巨深,cs也要,数学也要,普通人真的很难做些像样的东西出来,平时的工作就是调调包,改改参数。 我也做过几个轮子,svm,神经网络,决策树,apriori,knn都造过,hadoop和spark也会用。轮子都很复杂,看看原理还好,实现起来有时感觉真的挺恶心的,所以感觉很难造出些给力的成果来。毕竟花大量工夫把轮子做出来也不一定有现成的轮子 […]
查看全文AlphaGo 4:1胜李世石后通过大数据人工智能有可能被用于股市炒股吗?
AlphaGo下棋就是通过庞大的数据从而战胜了李世石,那么用在股市呢,分析各方面动向,会不会就可以洞悉涨跌
查看全文微信有没有做过“使用频率最高的表情”数据统计?
就是突然很想知道,大家在微信里用得最多的表情是啥,男女分别最喜欢用哪个,各年龄段有啥不同?我猜40+的 这个频率很高。 排名应该不低。
查看全文版权局发打击网络盗版 是否侵害了网盘用户的隐私权?
最近版权局打击盗版要求网盘服务商需制止用户上传未经授权的作品,并且删除作品。那么他是已什么方式窥视到我网盘里的内容并且将其删除的呢?是否涉嫌侵犯用户隐私权?我网盘里的音乐书籍视频是否都会被删除?会不会存在误删?
查看全文如何才能找到一份与数据分析相关的实习工作?
本人熟悉 excel,掌握常用的函数;熟悉 sql 语言,会使用 Microsoft SQL Server 数据库;会使用R语言进行简单的数据分析;掌握 C、C++语言编程;了解常用的数据挖掘算法;数据分析和数据挖掘的基础知识都是自学的,所以没有相关的项目经历,现在想寻求一份偏向业务方面的助理数据分析师的实习工作,目前已经投递了很多家公司,但都没有了音信。希望各位大神指点迷津。[抱拳][抱拳][抱拳]
查看全文SAP哪个模块最有发展前景,而且需求比较大的?
本人大三女学生,在读专业电子商务,就读学校广东外语外贸大学。如果以后想往SAP这个方向发展的话,应该专注于哪个模块比较好。还有是否能自学?还是必须去参加培训的?最后就是应该考研还是尽早找实习?(第一次提问这种专业性问题,请多多指教)
查看全文