博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
R笔记1
阅读量:5307 次
发布时间:2019-06-14

本文共 2391 字,大约阅读时间需要 7 分钟。

gsub format

> measurements<-c('3.95*3.99*2.43mm','3*3*5mm','2*2*2mm')> measurements[1] "3.95*3.99*2.43mm" "3*3*5mm"          "2*2*2mm"         > # 去掉mm后缀> a<-gsub('mm','',measurements)> a[1] "3.95*3.99*2.43" "3*3*5"          "2*2*2"         > library(plyr)> ?strsplit> # 用 * 将数据分隔开,并将列表型数据转换为数据框格式> strsplit(a,'[*]')[[1]][1] "3.95" "3.99" "2.43"[[2]][1] "3" "3" "5"[[3]][1] "2" "2" "2"> res <-ldply(strsplit(a,'[*]'))> # 重命名数据框> names(res)<-c('L','W','H')> # 更改各个变量的数据类型为数值型> res     L    W    H1 3.95 3.99 2.432    3    3    53    2    2    2> str(res)'data.frame':   3 obs. of  3 variables: $ L: chr  "3.95" "3" "2" $ W: chr  "3.99" "3" "2" $ H: chr  "2.43" "5" "2"> res<- as.data.frame(sapply(res,FUN=as.numeric))> head(res)     L    W    H1 3.95 3.99 2.432 3.00 3.00 5.003 2.00 2.00 2.00> str(res)'data.frame':   3 obs. of  3 variables: $ L: num  3.95 3 2 $ W: num  3.99 3 2 $ H: num  2.43 5 2
> #从定性角度,通过可视化来进行数据的探索性分析,强烈推荐使用GGally包中的ggpairs()函数,> #该函数将绘制两辆变量的相关系数、散点图,同时也绘制出单变量的密度分布图> library(ggplot2)> library(GGally)> head(iris)  Sepal.Length Sepal.Width Petal.Length Petal.Width Species1          5.1         3.5          1.4         0.2  setosa2          4.9         3.0          1.4         0.2  setosa3          4.7         3.2          1.3         0.2  setosa4          4.6         3.1          1.5         0.2  setosa5          5.0         3.6          1.4         0.2  setosa6          5.4         3.9          1.7         0.4  setosa> ggpairs(iris[,1:4])> ggsave("aaaaa.png")Saving 8.46 x 5.03 in image

1

> memory.limit() #查看系统规定的内存使用上限[1] 4077> memory.limit(newlimit)#更改到新的上限Error in memory.limit(newlimit) : object 'newlimit' not found> #养成清理内存的习惯> rm(object) #删除变量Warning message:In rm(object) : object 'object' not found> gc()    #在rm()后,记得使用gc()做garbage collection ,否则内存是不会释放的,相当于没有做rm()          used (Mb) gc trigger  (Mb) max used  (Mb)Ncells 1330209 71.1    2164898 115.7  2164898 115.7Vcells 6475711 49.5   10202170  77.9  8435142  64.4
> td=data.frame(c('2016-01','2016-02'),stringsAsFactors =F)> td  c..2016.01....2016.02..1                 2016-012                 2016-02> td2<- sapply(td,paste,"-01",sep="")> td2     c..2016.01....2016.02..[1,] "2016-01-01"           [2,] "2016-02-01"           > as.Date(td2[,1])  #画图用[1] "2016-01-01" "2016-02-01"> format(as.Date(td2[,1]),"%Y-%m")[1] "2016-01" "2016-02"

转载于:https://www.cnblogs.com/li-volleyball/p/5399074.html

你可能感兴趣的文章
Python学习之路:新式类VS经典类
查看>>
Oracle数据库和实例
查看>>
青海行--(7月19日)麦积山石窟
查看>>
《跟我学IDEA》五、快捷键(编码利器)
查看>>
NTP服务器配置
查看>>
04_web基础(七)之jsp
查看>>
BugTracker.NET安装指南
查看>>
openoj的一个小比赛(J题解题报告)poj1703(并查集)
查看>>
pku 1125 Stockbroker Grapevine 第一周训练——最短路
查看>>
【转】OO无双的blocking/non-blocking执行时刻
查看>>
eclipse,python
查看>>
深入理解java集合框架(jdk1.6源码)
查看>>
php截取后台登陆密码的代码
查看>>
选假球的故事
查看>>
ul li剧中对齐
查看>>
关于 linux 的 limit 的设置
查看>>
模块搜索路径
查看>>
windows下编译安装BOOST
查看>>
第四代iPhone电池仍然不可以更换(转)
查看>>
ibatis中的符号#跟$区别
查看>>