Centos上安装R语言

0、下载r-x.x.x.tar.gz,解压,在./configure之前先看1、2
1、yum install readline-devel(解决错误“ –with-readline=yes (default) and headers/libs are not available”)
2、yum install libXt-devel(解决错误“–with-x=yes (default) and X11 headers/libs are not available”)
3、./configure
4、make
5、make install

R在数据分析中应用的概括

r能做的可归纳为:数据分析,结果报告,发布结果;

 

1、探索性数据分析

画图,观察数据属性,数据模式;

频率直方图,时间序列;(分别从时域及频域的角度看)

不同分类结果,多图合并分析;

2、统计推断

由于抽样等各种因素带来的不准确性,所以我们得到的结论有可能是错的。所以做统计推断时我们强调得到推断结果+该结果可能错误的概率,即:

推断结果+结果的错误率(小于5%,则可以接受)

3、回归分析(线性模拟拟合数据)

预测量(因变量,如房屋面积、地理位置、卧室数目等)

变量(如房价)

得到预测量与变量关系,以做预测

4、机器学习

训练模型+预测

典型的分类问题 ,caret包

5、开发数据产品

工具:google vis  — r制作网页,调用google charts -> 交互式html

Manipulate — 人机交互

Rcharts — 使用r制作js交互式网页

Shinny —  制作交互式网页平台

一个发布shinny的网站:Shinnyapps.io

Slidify — 生成类似ppt的报告

 

其他:

发布项目的途径:Github, Rpubs

r下载 r: https://www.r-project.org/

Rstudio : http://www.rstudio.com/

包查看:cray.r-project.org

在rstudio中:

安装包:install.packages(“caret”)

载入包:library(caret),

一般包带有一些数据集可供使用:

查看载入包的数据包:data() ;查看数据详情:?Somedataname