R 和 Python用于统计学分析,哪个更好?

开发 开发工具
毕竟R这门语言本身就是为统计而生的,而且是统计学专家在维护R社区,沉淀了数理统计领域众多权威算法、函数、工具。

知乎有人提问,R 和 Python (numpy scipy pandas) 用于统计学分析,哪个更好?

从专业角度来看,「R在统计分析领域肯定是强于Python的。」

毕竟R这门语言本身就是为统计而生的,而且是统计学专家在维护R社区,沉淀了数理统计领域众多权威算法、函数、工具。

同时R的可视化功能也非常强大,很多顶级期刊论文也都用R做分析工具。

R不光比Python在统计上更强大,甚至和SAS、SPSS这些商业软件对比也不落下风,而且更灵活。

所以如果你的工作涉及重要的统计工作,建议用R。stackoverflow上有很多R的专业回答,但R在中文领域资料很少,要学好英文。

R的官方文档:https://cran.r-project.org/doc/manuals/r-release/R-intro.html

R包学习:https://cran.r-project.org/web/packages/available_packages_by_name.html

R入门书籍:《R语言实战》、《R语言编程艺术》

但R有两个缺点,首先语法比较绕,学习路径很陡峭;

再者应用领域集中在数理统计、可视化、机器学习上,拓展性稍弱。

而Python完美了解决了这两个问题,对初学者极其友好,网上有无数的Python资源。

并且Python出了统计分析,还能做各种各样的事,web、爬虫、GUI、自动化、AI等等,几乎无所不能。

对于统计分析领域,Python目前也有很多解决方案,虽然不及R专业,但基本上能满足95%以上的需求。比如说:

Scipy-科学计算库,包含的功能有最优化、线性代数、积分、插值、拟合、特殊函数、快速傅里叶变换、信号处理和图像处理、常微积分求解等其他科学与过程中常用的计算。

Numpy-数值计算库,提供了强大的数组计算功能,可用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效的多,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

StatsModels-统计建模库,提供了包含统计模型、统计测试和统计数据挖掘的各种函数和模块。

Pandas-数据分析库,基于NumPy的一种工具,为解决数据分析任务而生。纳入大量库和一些标准的数据模型,提供高效地操作大型数据集所需的工具及大量的能快速便捷处理数据的函数和方法。

Sympy-科学计算库,类似matlab,用一套强大的符号计算体系完成诸如多项式求值、求极限、解方程、求积分、微分方程、级数展开、矩阵运算等等计算问题。

...

如果你的工作中只是偶尔会用到统计分析,还会兼顾其他数据场景,那么建议你用Python,可以囊括你所有的需求。

如果你的工作场景会涉及到大数据,那么可以考虑Scala作为补充。

下面是R、Python、Scala三种语言在数据分析领域最受欢迎的工具包,供参考:

责任编辑:姜华 来源: 今日头条
相关推荐

2021-06-28 11:17:14

CoutPrintf接口

2017-03-02 14:52:46

2015-08-28 09:41:24

统计

2013-05-29 09:53:39

2021-08-18 09:11:59

统计学数据分析检验

2018-08-09 18:27:03

编程语言JavaPython

2015-10-29 09:56:23

小数据大数据统计学

2020-06-23 07:48:18

Python开发技术

2019-07-27 09:40:56

MySQLPG数据库

2022-09-02 08:28:44

AWS多云云提供商

2015-10-22 10:54:24

小数据统计

2023-08-24 17:14:05

统计学

2016-08-05 14:23:15

系统

2015-07-29 11:27:28

大数据时代数据分析统计学

2020-07-09 08:08:02

JavaPython编程语言

2020-12-08 10:25:56

HibernateMyBatis数据库

2015-08-17 09:43:08

2020-06-08 11:30:04

PGMySQL数据库

2020-08-18 16:10:44

ManjaroArch LinuxLinux

2019-04-23 08:23:51

统计学机器学习人工智能
点赞
收藏

51CTO技术栈公众号