怎么判断大数据的真实性?

理由
举报 取消

举例来说,很多人在QQ、微博上的个人信息都是乱填,性别明明是妹子却填男性,2、30的人填2、3岁,7、80岁的也不少。这样对于网络群体特征的判断是否会失真?再进一步思考,对于艾瑞、易观、亿邦动力这类网站提供的种种行业数据报表,其真实性和准确性是如何保障的?如果数据谈不上真实可靠,可能会带来哪些影响?

2017年12月23日 3 条回复 1070 次浏览

发起人:MEBN 初入职场

明月前溪后溪

回复 ( 3 )

  1. 数据哥
    理由
    举报 取消

    大数据只是预测一个大致情况,并不能做到非常精准,在国内尤其如此!为了政绩,各级政府会把上报的信息添加水分,如此到了最上层水分就超级大!ZF尚且如此,个人以及商家就更不好说了,大数据太老实,人性是不好预测的。

  2. 匿名用户
    理由
    举报 取消

    大数据是分析总体趋势的,不是针对个案的。

    但借助更多的信息是有可能做出一些判断的:

    1. 分析海量数据的发言习惯,判断出男女在遣词造句的异同,判用户性别,但这种判断只是一种参考,不能保证绝对准确。

    2.汇集更多的信息分析,如用户的在某个认证系统中关联过手机号(比如银行系统),手机号又通过移动QQ或微信登陆,如果你能整合这些信息,那么就可以找到用户的准确信息。

    大数据的含义不仅是数量,还有更多的维度,我们生活中会形成方方面面的数据,只是传统业务没有整合这些数据。在一个大数据公司的体验室看到过这样的场景:一个人走进去,识别系统自动扫描他口袋里的身份证,随后屏幕上列出这个人的生活数据,如机票信息、商场信息、旅馆信息、借贷信息、个人微博、公司情况、医疗情况、甚至最近在银行的 WiFi上浏览了哪些网页…

  3. TransmitToLarry
    理由
    举报 取消

    有方法的,好像是要用到cross sectional analysis,然後就一堆數學去調整。

    如果政府,商家的報表都完全可信,豬也可以上樹了

我来回答

Captcha 点击图片更换验证码