
用R做数据分析(1)_R简介_数据分析师
R语言是由 Ross Ihaka、Robert Gentleman二位创建的,这也许可以解释为什么叫R语言。现在由“R开发核心团队”负责开发。R是基于S语言的一个GNU项目。
一、 R语言介绍
R是为统计计算和作图的一门语言和环境。是一个GNU项目,和S语言和环境很相似,S语言是由BELL实验室的John Chambers和他的同事开发的。R语言可以认为是从S语言衍生而来的,他们之前有很重要的不同,但是大多数用S语言写的代码也可以在R中运行。
目前R在高校非常流行,特别是随着这几年互联网的发展,(R在一些大公司的运用得到的实践,例如:国外的google、linkdin、facebook等,国内一些大型互联网公司也在开始使用R),及随着互联网版权的意识增强,也促使了R在互联网的发展。当然R在很多领域都有很广泛的运用。
R语言是开源的,同时可以运行在各种平台上(Linux、Windows、MacOS等)。R的许多软件包是由R语言、 LaTeX、Java及最常用C语言和Fortran撰写。
可以说现在R包含各种各样的功能,可以说目前你能想到的功能,都可以找到一个或者多个R包来实现。几千个R包,哪个才最适合你呢?“最适合你自己的R包,也许就是你自己写的那个包”。
二、 R软件安装下载
CRAN地址:http://www.r-project.org/,什么是CRAN:
CRAN为Comprehensive R Archive Network(R综合典藏网)的简称。它除了收藏了R的执行档下载版、源代码和说明文件,也收录了各种用户撰写的软件包。现时,全球有超过一百个CRAN镜像站。(来源http://baike.baidu.com/view/942569.htm)
根据你的操作系统,下载相应的R语言安装文件。
下载地址:http://ftp.ctex.org/mirrors/CRAN/
R安装
三、 R语言的特点
1、变量不需要申明即可引用。
2、R语言的核心是:向量。
3、R语言是一个函数语言。
4、向量中的下标是从1开始引用的。
5、R是脚本语言、面像对象;
四、 如何学学习R语言
《R语言学习由浅入深路线图》 这篇文章大家可以参考,这篇文章简单介绍了一下R学习的资料,大家可以根据需要进行参考。那么如何才能学好R,个人理解有以下几点:
1、不要期望你能学会R中所有的包。不要把目标定的那么高。
2、关键能理解R语言的内涵。多看看CRAN上的相关文档,例如:季刊、R语言相关新闻,特别是每次版本更新的一些内容。
3、运用
如果你是做数据分析相关的工作的,一定要把学习到的R语言知识运用到你的工作中,不管你把R语言当用一门编程语言还是统计工具,用的多了,自然你就有感觉,很多东西你就记住了。
4、持续
每天花点时间写几条R代码,实现一些小功能。如果你工作上就用R,那是最完美的。
5、多看
多看别人写的代码,R运用的案例。你可以google一下R会有很多好的博客,文章。很多人都是R的GREEK。
6、开放
一定要开放、分享的心态。多与别人交流,不要总是需求,一定要学习给予。(我是我个人观点,如果要真好用到R,让R发挥价值就是必须的。)
7、总结
学到的东西,及时做好总结,可以总结成案例或者笔记,如果可以欢迎分享给大家http://bbs.pinggu.org/forum-69-1.html
五、 我对R语言的理解和看法
随时互联网的发展,特别是互联网对于版权、成本的因素考虑,因为免费、开源使越来越多的公司开始用R语言来处理数据、分析数据、完成模型等,当然这其中也伴随着对于数据价值挖掘的,特别是在大数据的背景下,想通过对数据挖掘&分析建立自己的竞争优势。
R不仅 免费还有各种各样的的功能包资源。从某种程度上讲,任何你想要的功能应该都可以找到对应的包,只是说是否完全满足,对于一些算法研究人员来说,可以在原来的代码的基础进行借鉴。这也许就是为什么R最开始主要用到高校或者学术领域(当然和国外学者、专家这种自由、开放的环境或者意识有很关系,这也许就是为什么许多开源软件都是国外出来,很少看到国内的大公司有什么好的东西开源)。
很多行业人士都说R是未来的“王道”,就像unix的发展过程一样。我觉得未来一定有属于R的一片天空,而且这种天空可以说是接近无限。所以,对于有志于从事数据挖掘、数据分析这个行业的朋友来说,掌握R是也许会成为未来的必备技能(就像现在数据分析师大多要求会:SQL)。
最后,我对R语言的理解与总结可以概括为一句话:“开源、二次加工、分享精神”。
本文来源 :CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28PCU:游戏运营的 “实时晴雨表”—— 从数据监控到运营决策的落地指南 在游戏行业,DAU(日活跃用户)、MAU(月活跃用户)是衡量 ...
2025-08-28Excel 聚类分析:零代码实现数据分群,赋能中小团队业务决策 在数字化转型中,“数据分群” 是企业理解用户、优化运营的核心手段 ...
2025-08-28CDA 数据分析师:数字化时代数据思维的践行者与价值推动者 当数字经济成为全球经济增长的核心引擎,数据已从 “辅助性信息” 跃 ...
2025-08-28ALTER TABLE ADD 多个 INDEX:数据库批量索引优化的高效实践 在数据库运维与性能优化中,索引是提升查询效率的核心手段。当业务 ...
2025-08-27Power BI 去重函数:数据清洗与精准分析的核心工具 在企业数据分析流程中,数据质量直接决定分析结果的可靠性。Power BI 作为主 ...
2025-08-27CDA 数据分析师:数据探索与统计分析的实践与价值 在数字化浪潮席卷各行业的当下,数据已成为企业核心资产,而 CDA(Certif ...
2025-08-27t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26