在数据处理分析过程中,分类变量的值有时候是试用数值来表示,从直观上并不能理解其含义,必须要有赋值对照表才能辅助理解。R语言在加标签上的功能并不常用,好在R语言可以直接处理分析字符串,在分析前把相应赋值改为具体含义的文字即可。例如,常见数据中使用1和2表示性别的男和女,直接利用1和2我们并不能准确认为就是1=男,2=女。可以赋值转换后再行分析。下面以数据集中糖尿病这个变量的赋值说明。
library(readxl) data<-read_xlsx("d:/DEMO数据.xlsx") data$糖尿病<-factor(data$糖尿病, levels=c("0","1"), labels=c("无糖尿病","有糖尿病") )
代码运行以后,变量糖尿病下的值就由原来的"0"和"1",改为了"无糖尿病"和"有糖尿病"。
当然,也可以使用前面文章中介绍的within()函数生成新变量,再利用新变量分析也是一个解决赋值问题的思路。