我的研究心得

天猫双11数据造假吗?从统计学的角度看看


天猫双11刚刚结束,突然爆出说,天猫双11的数据造假为什么这么说?因为有人拿着历年天猫成交额的数据做了一个分析。发现天猫历年的成交数据太过完美,不像是真的,还有可能像是人工伪造的数据。那我们就来看一看他说的是不是真的。

天猫历年的成交数据都有公布,所以这个数据拿到起来很容易:


成交额(亿)
20090.5
20109.36
201152
2012191
2013352
2014571
2015912
20161207
20171682.69
20182135
20192684

我们利用Excel来做一个数据拟合,可以发现,拟合度确实非常高,R-squared达到了99.96%。自变量与因变量之间的相关性很高。我们知道拟合度越高就证明模型对于数据的预测越精准。所以天猫双11的数据从统计上来看确实非常符合预测,与爱。数据预测里合度非常高。

这种拟合程度非常高有意义吗??它只能告诉我们模型值和训练样本的值拟合度非常高。模型可以很好的去预测你的训练样本,但是对于实际样本,对于非训练样本的预测,模型并不一定能产生很好的效果。

这种统计上的预测有意义吗?我觉得对于学术研究可能有意义。但是意义也不是非常大,世界上的函数有很多种,无论你多么奇特的数据都能找到一种函数去高度拟合。拟合度非常高也并不一定就能说明阿里巴巴数据造假。我觉得如果你能从财务数据上面分析找到漏洞,这样的意义更大。

阿里巴巴有造假的动力吗?

对阿里巴巴来讲,它有动力去造假吗?我觉得这个动力不是很大,虽然说夸大天猫双11的成交额有利于提升大家对于公司经营的信心,但是如果你的成交额提升了,利润没有相应的提升那么公司就经营的不好,公众会质疑你的公司经营能力。

更重要的是阿里巴巴是一家上市公司,在美国上市了,他的业绩他的财务指标是要公布的,他散布的消息对股价会有影响,所以也必须符合法律规定的要求,符合证券交易所的要求。

如果阿里巴巴要报价,那他造假的成本未免太大了。既要满足内部的员工,又要符合法律符合财报的要求。而造假的好处仅仅是在公众传播上取得一个很好的表现,但为了这个公众传播上的好处,去违背法律的要求去触犯法律,得不偿失。

阿里巴巴公布的成交数据一定是真的吗?

那我们反过来问一下,阿里巴巴公布的成交数据一定是真的吗?我觉得数据肯定是真实的数据,但是这个数据统计的口径由阿里巴巴自己掌控。做数据的人都知道,数据有很多统计口径数据统计的指标,入选的指标也有很多可以操作的空间。目前没有一个公正的第三方,也不可能有公正的第三方去真正核实阿里巴巴公布的成交数据。

我们要换一个角度去想,阿里巴巴公布成交数据仅仅是一个公关措施,是一个宣传手段。至于这个手段是不是合理,他的数据有没有夸大?留给证券交易所去核实普通人只需要关注你有没有购买东西,你购买的东西是不是真的便宜?


ETC注销ETC充值ETC客服ETC扣费查询


ETC发行合作