
还想在大数据面前隐身?这21个方面你该注意了
你认为大数据对你的了解有多少?答案是相当多。
每次我们用电脑、用手机或是用平板电脑打开一款App时,都会以数字的形式留下浏览的痕迹和路线。绝大多数人都知道,遇到问题就找谷歌,想要与朋友互动就找facebook。但其实我们了解的只是这些网络的基本用途,我们所掌握的也只不过是一个模糊的概念。事实上,互联网所具备的更深层次的内容我 们根本是看不到的。
如今的大数据几乎可以将我们每一个人都看透,我总结了一下,大概表现在21个方面。下面我便开始一一列举:
NO.1 首先,对于你不懂的问题和搜索的内容,Google、Bing和Yahoo!这类搜索引擎肯定是能够给出答案的。其次,对于你浏览过的所有网站,哪怕是所谓的无痕浏览,ISP(Internet Service Provider,即互联网服务提供商)都会详尽地记录下来。
NO.2 Google知道你的年龄和性别,千万别以为你没有主动透露,他们就无从知晓。作为各种广告的发送对象,他们会给你建立一份综合全面的档案,其中包括你的各种兴趣爱好(这方面你是可以自己进行编辑的),他们会据此来给你发送适当类型的广告。
NO.3 Facebook对你的人际关系了如指掌,哪段关系急需挽救它都知道。公司会根据你在Facebook上的各种活动和状态的更新,来预测你的某段朋友关系是否能够维持下去,这种预测的准确性有时简直高得惊人。
NO.4 Google知道你去过的每一个地方。如果你使用的还是Android版的手机,那它的记录就更全了。
NO.5 在英国,你在每一个角落都能够看到闭路电视,所以不管你此时此刻人在哪里,警察都能够查到。他们可以调取全国范围内成千上万个网络摄像头中的数据信息进行定位,这些摄像头可以对车辆的牌照进行扫描,并且拍下每辆车和每位司机的照片。而在美国,情况大致也是一样的。
NO.6 你的手机能够在行进的路途中测量你的速度。(但他们不会将这些信息分享给警察,所以你应该感到庆幸。)
NO.7 你的手机或许还能够根据各种地理或消费信息推断出你家住哪里,公司在哪里。
NO.8 不光是人,就连你的猫在哪里,互联网都一清二楚。通常我们在Instagram或其他社交媒体网络上晒出猫咪照片的同时,会选择分享自己所在的位置。于是它就会利用各种隐形的元数据来获取到准确的地理定位。
NO.9 信用卡公司将你所有的购物清单都记录在案。虽然信用卡公司对客户在何时何地买了何种物品有记录是一件无可厚非的事情,但是有些人可能会担心这些数据影响到自己的信用分数和等级。因为公司会根据你所购买的商品和你所光顾的商店等购物信息来确定你是否存在信用风险。
NO.10 你经常光顾的百货商店会记录下你喜欢的品牌。对于百货商店或药房来说,每完成一笔交易,他们就会收集到大量有关你的购买行为习惯和偏好的数据信息。由于这些商店或药房均是连锁经营,所以当你下次光顾其网站时,他们就可以利用这些数据为你提供个性化的服务,并赠送符合你喜好的优惠券。
NO.11 人力资源总监能够预测到你打算什么时候辞职。现在市场上有一家叫做Workday的人力资源软件公司,它在进行多次的测试之后成功研究出一种算法,能够对文件中的文本进行分析,并根据这些信息进行推测,以掌握员工什么时候有辞职的打算。
NO.12 Target会比你的家人还要更早地知道你怀孕的消息。
NO.13 不管你看什么类型的视频,哪怕只是搜索了一下,并没有点击播放,YouTube都有完整的记录。
NO.14Amazon知道你喜欢的图书类型,Netflix知道你喜欢的视频和影片类型。甚至那些公共图书馆都知道你喜欢光顾的媒体种类。
NO.15 Apple和Google对于你向Siri和Cortana提出的请求也了如指掌。
NO.16 孩子玩的芭比娃娃也会记录下她和孩子们之间的对话,并将这些信息传回Mattel公司。
NO.17 在诸如芝加哥和堪萨斯城这类的大城市中,警察局甚至可以在你实施犯罪之前将你拿下,阻止你的恶行。
NO.18 汽车保险公司可以随时随地地掌握你的行踪,包括行车的位置和时间,以便于在出现违反条例行为的时候对你做出惩罚。哪怕你之前从来没有提起过索赔,它也会照样惩罚你。
NO.19 某些数据经纪人还会帮助不道德的公司对那些弱势消费者进行身份鉴定。举个例子,他们可能会把某个地区内信用紧缩的家庭罗列出来,接着直接上门向其推销一些发薪日贷款。
NO.20 Facebook可以根据你给别人点的赞来判断你的喜好,进行简单的大数据分析,掌握你对生活的满意程度以及你的情绪稳定程度。
NO.21 所有你使用的手机App都会牵涉到你的个人数据信息。比如Angry Birds就需要获取你手机中的联系人信息以及你的地理定位。再比如Bejeweled需要获取你的手机号码。更有甚者,有些App还会在你使用的过程中要求扩音器打开,以获取周围的声音和情况。
以上所列举的21个方面还只是冰山一角。随着我们对大数据的依赖性越来越高,我们也越来越享受大数据给我们带来的便利,所以有的时候被要求获取数据也就不那么反感,甚至会欣然接受。举个例子,iPhone版本的Health App就能够收集很多私人的、健康方面的数据信息,大概是因为涉及到身体健康,大家也都不会抗拒。
但尽管如此,作为消费者,我们还是有主动选择的权利。因此我们在什么时候将自己的信息透露给什么人,都要做到自己心里有数,要自己根据情况来做出选择。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14