1. 变量与赋值
变量命名:变量名可以由字母、数字、点(.)和下划线(_)组成,但必须以字母或点开头(如果以点开头,则后面不能紧跟数字)。R语言是区分大小写的。
赋值:使用=或<-进行赋值,例如x <- 10表示将数字10赋值给变量x。
2. 数据类型
R语言支持多种数据类型,包括:
数字型:用于存储数字,如age <- 30。
字符型:用于存储文本或字符序列,如name <- "张三"。
逻辑型:只有两个可能的值,TRUE(真)或FALSE(假),如is_student <- TRUE。
复数型:用于存储复数,如z <- 1+4i。
因子类型:处理分类数据的专用类型,如blood_type <- factor(c("A", "B", "O", "AB"))。
日期和时间:通过Date和POSIXt类处理,如Sys.Date()返回当前日期。
3. 基本操作符与表达式
算术操作符:+、-、*、/、%%(求余数)、%/%(整除)、^(幂运算)。
比较操作符:<、>、<=、>=、==、!=。
逻辑操作符:&(逻辑与)、|(逻辑或)、!(逻辑非)。
4. 数据结构
R语言提供了多种数据结构,以适应不同的数据类型和分析需求:
向量(Vector):一维数组,由相同类型的元素组成,使用c()函数创建,如v <- c(1, 2, 3, 4, 5)。
矩阵(Matrix):二维数组,使用matrix()函数创建,如m <- matrix(1:9, nrow = 3, ncol = 3)。
数组(Array):矩阵的高维扩展,使用array()函数创建,如a <- array(1:8, dim = c(2, 2, 2))。
数据框(Data Frame):用于存储表格数据,每列可以是不同的数据类型,使用data.frame()函数创建,如df <- data.frame(Name = c("Alice", "Bob"), Age = c(24, 25), Gender = c("Female", "Male"))。
列表(List):可以包含不同类型的数据结构,使用list()函数创建,如l <- list(1, "a", TRUE, c(1,2,3))。
5. 函数与包
内置函数:R语言提供了大量的内置函数,如mean()(计算平均值)、sum()(求和)、sd()(计算标准差)等。
自定义函数:用户可以使用function()关键字定义自己的函数,如my_function <- function(x) { x + 1 }。
包:R语言的功能通过包来扩展,用户可以根据需要安装和加载不同的包,如install.packages("ggplot2")用于安装ggplot2包,library(ggplot2)用于加载ggplot2包。
6. 流程控制
R语言支持基本的流程控制结构,包括:
if语句:用于条件判断,如if (x > 0) { print("x是正数") }。
循环:包括for循环和while循环,用于重复执行代码块。
7. 注释
使用#进行单行注释,如# 这是一个注释。
8. 输入输出
输出:使用print()、cat()等函数输出结果。
输入:可以使用scan()函数从键盘读取输入,或使用read.csv()、read.table()等函数从文件中读取数据。