谈谈网络时代大数据及分析起诉韩寒小实例-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读谈谈网络时代大数据及分析起诉韩寒小实例

谈谈网络时代大数据及分析起诉韩寒小实例

2015-01-14

谈谈网络时代大数据及分析起诉韩寒小实例

　　随着阿里巴巴的上市，马云成为中国首富，猫眼看人里关于阿里巴巴的大数据分析的内容层出不穷。大多是用耸人听闻的言论，指责阿里巴巴境外上市导致大数据外泄，影响国家安全，对中国经济运行造成不可估量的损失。

　　很多猫友从以往的常识和逻辑方面判断能够得出阿里巴巴的大数据并不影响国家安全的结论，但是，对于大数据概念认知比较少，评论起来无从入手。

　　本文希望用最朴实的语言描述大数据，让大家能对大数据有基本认识。同时，后面附大数据统计的应用实例：即通过大数据统计分析网友司马3忌对韩寒起诉的影响。

　　所谓数据统计，就是用统计学的方法分析概率和趋势

　　由于传统方法无法对每一个终端样本详细取样，导致很多经济社会数据只能通过抽样调查统计。

　　例如，收视率调查。电视台无法得到每户家庭的收看节目的数据，所以只能抽样调查。

　　在网络时代，每一个网络服务提供商不需要做抽样调查，而是建立庞大的数据库，记录一切用户的行为特征，用这些特征作为数据基础。这就是大数据，用不同的方式对这些数据进行提取、整理、分析的手段就是大数据分析。

　　最简单的例子就是你打开任何一款炒股软件，它都是基于大数据的。每只股票从上市起所有相关数字全部被精准记录，从无遗漏。

　　阿里巴巴的大数据是否会影响国家安全?

　　个人认为不会，并且大数据无法隐藏。原因如下：

　　1.阿里巴巴的大数据是每种产品的购买记录，只说明产品的销量趋势。

　　2.每个公司对自己的大数据是企业的核心资产，如美国任何投资者、美国国务院希望获得阿里巴巴的大数据，也需要通过法院的批文，即使拿到，企业也有权拒绝。美国国务院屡次索要用户资料以便反恐需要都被苹果拒绝。

　　3.大数据本身就没有办法隐藏，如阿里巴巴的产品销售情况是在每一个商品的展示页面清楚明白的呈现出来。只要会最简单的网络及编程技术，都可以编写软件，借助大型服务器矩阵，放出无数爬虫，对每个页面进行信息提取和整理，得到大数据。

　　举个例子：比如如果想获得猫眼看人的大数据，用20m光纤宽带约2天即可完成对整个论坛数据的镜像保存。

　　4.如中国政府认为被美国搜集了大数据，一样可以如前面所述，通过对美国亚马逊、facebook、推特等进行爬虫提取搜集信息得到美国的大数据进行反制。

　　接下来通过大数据分析司马三忌起诉韩寒，对韩寒的影响。

　　可以看到在10月09日，如红圈所示，媒体的报道从之前的一平如水，到出现一波小高潮。韩黑是否觉得有点小激动呢?

　　嘿嘿，上图只是9月12日到10月11日的。我们换个图，看看最近半年的大数据。

　　从这张图就可以看出，司马三忌起诉韩寒对媒体的影响力。

　　红圈1是韩寒的后会无期宣传期间的媒体报道力度。

　　红圈3是司马三忌起诉的媒体报道力度。

　　那么，红圈2比红圈3的媒体报道力度更大。

　　红圈2是9月11日的媒体报道，那一天韩寒发生了什么事呢?

　　看下面的图就一目了然了：

　　原来司马三忌起诉的影响力还不如韩寒老婆生二胎，哈哈!

　　以上就是对大数据的介绍和分析，以及实例应用。

　　大数据是个好东西，只要随便挖掘数据，就可以让我们对事物的认知突破我们自己视野的局限，起码不会表现的很愚昧了。

　　例如很多韩黑认为司马三忌起诉韩寒，会给韩寒带来致命打击。

　　但大数据就告诉我们，我们的认知是局限在只上猫眼，而大数据挖掘整个互联网，互联网的大部分媒体关注国民岳父老婆生二胎更多一点。

　　同样，大数据也可以有利于作出决策，试着证明如下：

　　如很多脑残黑粉所臆想的，关于韩寒代笔的舆论铺天盖地，对韩寒造成很大打击而事实上，通过挖掘数据以韩寒代笔和韩寒进行分析可以看到，韩寒代笔的关注度(蓝线)始终是一条接近X轴的直线这说明韩寒代笔的质疑的声音基本没有变化，不变高，也不变低这也揭示了孜孜不倦的揭示韩寒代笔的这部分声音没有减少，没有增加而韩寒的关注度随着他的动向呈现高低起伏。

　　取韩寒关注度最低的点，关注指数为5720，韩寒代笔的关注指数为132，占总关注比例为2.308%

　　假如你是韩寒，或者韩寒的经纪公司，那么，你会得出如下结论：

　　1.对韩寒代笔的关注度占的比例只有2%

　　2.质疑韩寒的人是坚决的、持之以恒的，但他们的质疑并没有扩散。

　　那么，你会做如下论断和决策：

　　1.你改变不了质疑韩寒的人，他们过去会，未来也会坚持咬定韩寒代笔。

　　2.上述人群不会变多、也不会变少。

　　3.你不需要试图去改变，因为你的试图的成本和收益不成正比。

　　4.最好的办法就是由这些人去质疑吧，因为他们只占2%，相比任何一个明星的anti-fan，都不多。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；