R语言基础之数据结构(对象类别)
`
R语言数据结构之向量
vector
用法:vector(“数据类型”,“length=向量长度”)
强制转换类型
as.character("变量名")
as.logical("变量名")
c函数
x <- c("参数1","参数2","参数3"....)
给变量参数取名字
names(x) <- c("名字1","名字2","名字3"....)
R语言数据结构之矩阵
创建矩阵
x <- matrix(1:6 , nrow = num , ncol = num) #1:6可写可不写,是对创建的数组进行赋值,并且按列赋值,若不写,则数组内无值
矩阵 = 向量 + 维度
例:
创建一个向量x
x <- 1:6
给向量x增加一个2行3列的维度
dim(x) <- c(2,3)
则相当于
x <-matrix(1:6,nrow = 3,ncol = 2)
将矩阵y和y2按列拼接
rbind(y,y2)
将矩阵y和y2按行拼接
cbind(y,y2)
查看矩阵x的维度 dim(x)
查看矩阵x的属性 character(x)
R语言数=数据结构之数组
数组的维度可以大于2
x <- array(1:24,dim = c(2,3,4))
x <- array(1:24,dim = c(2,3,4))
x
, , 1
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
, , 2
[,1] [,2] [,3]
[1,] 7 9 11
[2,] 8 10 12
, , 3
[,1] [,2] [,3]
[1,] 13 15 17
[2,] 14 16 18
, , 4
[,1] [,2] [,3]
[1,] 19 21 23
[2,] 20 22 24
R语言数据结构之列表
list
列表中的数据类型可以不同
x <- list(1:4)
x <- list(a=1,b=2,c=3)
x <- list(c(1,2,3),c(4,5,6))
利用列表给矩阵每一个元素起名字
x <- matrix(1:6,nrow = 2,ncol = 3)
dimnames(x) <- list(c("a","b","c"),c("d","e","f))
R语言数据结构之数据框
数据框--存储表格数据,视为各元素长度相同的列表
每个元素代表一列数据
每个元素的长度相同,及行数相同
元素类型可以不同
创建一个数据框:
df <- data.frame(第一列数据,第二列数据,....)
查看数据框有多少行多少列
nrow(df)
ncol(df)
R语言数据结构之因子
factor
主要用于分类数据
分类数据分为有序的和无序的
因子:整数向量+标签
male/female:1/2
用levels设置因子中谁是基线水平
levels是因子的一个属性,还可以去掉因子的属性去看里面的内容unclass()
unclass(x)
[1] 1 1 2 2 1
attr(,"levels")
[1] "female" "male"
R语言数据结构之缺失值
缺失值missing value
NA/NaN:NaN属于NA,NA不属于NaN
NaN一般用书表示数字的缺失值
NA可以表示数据的缺失值范围更广,整数,字符型等,NA有类型属性
is.na() /is.nan()
`
> x <- c(1,NA,2,NA,3)
> is.na(x)
[1] FALSE TRUE FALSE TRUE FALSE
> is.nan(x)
[1] FALSE FALSE FALSE FALSE FALSE
R语言数据结构之日期时间
data ,time
日期:Date
获取日期类型的数据:x <- Sys.Date()
把任意一个日期存储为Date类型:x <- as.Date("2015-01-01")
获取Date中的信息
weekends(x)
months(x)
quarters(x)
julian(x) # Date存的日期距离1970年1月1日的天数
日期预算
x4-x3
as.numeric(x4-x3)
时间:POSIXct/POSIXlt
POSIXct:整数,常用于存入数据框
POSIXlt:列表,还包含星期、年、月、日等信息
x <- Sys.time()
p <- as.POSIXlt(x) #强制转换
names(unclass(p)) #看内容
p$sec #看秒
x1 <- "Jan 1,2015 01:01"
strptime(x1,"%B %d, %Y %H:%M") #将一个表示日期时间的字符串转换为日期时间类型的数据
