网站首页 > 技术文章 正文
文末领取
【7类SQL数据分析常用语句】
R语言所处理的工作层
解释一下:最下面的一层为数据源,往上是数据仓库层,往上是数据探索层,包括统计分析,统计查询,还有就是报告。
再往上的三层,分别是数据挖掘,数据展现和数据决策。
由上图可知,R语言是可以用于数据挖掘,数据展现,而后领导根据展现的数据来决策,R语言在数据展现的方面,拥有很强大的功能。
R语言的数据结构
包括如下的几项:向量c,矩阵matrix,数组array,数据框dataframe,列表list和因子factor
1. 向量
创建向量的方法一共有三种,分别如下:
使用c的这个方法:
解释一下,就是创建x1向量,x2向量,然后分别使用length和mode函数,获得向量的长度和向量的类型,上面显示的向量的类型是numeric,即为数字类型。
然后,分别使用rbind(x1,x2)和cbind(x1,x2)两个方法分别对两个向量进行行组合和列组合。
那么向量是否可以为别的类型呢?答案很显然是可以的,如下所示,向量中只要含有字符串,那么这个向量就是字符类型的。
创建向量的方法,及向量的截取:
由上面的代码可知,不写c的情况下,可以直接使用来完成向量的创建,而切在常见的同时,根据加减乘来决定所创建向量的具体的形式”
向量中元素的选取和别的语言中的数组的方法是相同的,不同的是,他可以加上一个负号进行选取,而后选取的结果就是去掉这个元素之后的其他的元素。
这种方法不单单适用于单个元素,依旧适用于多个元素,多个元素的时候使用来完成。
创建向量的方式:
这种创建方式,长的和第一种方法有点相同,其效果和第二个方法的效果又有点相似,其中by其表示等差,length表示的是个数,根据个数来判断方差到底是多少?
这三种创建向量方法的总结对比,似乎会得到一个结论:
第一种,适合于创建有限个少量的元素的向量
第二种,适合于创建大量元素,但是这些元素之间关系不是那么强烈的向量
第三种,适合创建拥有等差性质的向量
下面的时候,还有一个创建向量的方法。
最后还有一个向量,是R语言之中内置的常向量,用来表示a,b,c,d...z等26个字母
2. 使用特定的函数,对向量进行操作
这里包括了which函数,其中which.max和which.min分别用来取向量中的最大值和最小值的下标,注意是下标,不是对应的值,还可以用来去特定范围和特定值的下标,而后便是rev函数和sort函数,分别用来进行反转和排序。
3. 矩阵
不同于创建向量的方法,矩阵的创建方法只有一种,且是在向量的基础上,对向量进行按列和按行进行排序得到的结果。
由上面可知,前面有关三个创建向量的方法是有误的,c方法很显然也可以用来创建大量的元素的向量,用matrix方法对向量进行组合的时候,默认是安装列来进行书序的组合,比如第一个,矩阵,按照列,第一个列是1,2,3,第二列才是4,5,6所以就是明显的按列进行,如果改为用byrow=T,则改为按行来排列。
4. 数组
5. 数据框
数据框的构建也只有一种方法,他的也是有向量组合而成,由此可以见得,向量是R语言最根本对的数据结构,如果没有向量,一切都是不行的。
同时不同于矩阵,他的每一个列可以和其他的列是不同的类型。
6. factor
下图所示,iris是R语言内置的数据框,如果使用facotor就可以选择其中的一列
如上图所指示,就是去的列的值了,字面的上的意思就是取得影响因子。
7. 列表
所谓列表,可以看成是有序个元素的集合,他存进去的顺序很显然是和取出来的书序是相等的。
R语言计算相关的函数
1. 普通运算
由上图所示,mean是求平均值,sum是求和,max( )是求最大值,,min 是求最小值
2. 矩阵运算
包括加减乘除,求特征值和特征向量等等
其加法减法的表示没有啥特殊的,同时需要注意的是,t是表示转置,他的功效很大,还可以吧转化为矩阵,如下图所示:
就完成了到行矩阵的转换,同时也完成了行矩阵到列矩阵的转换
矩阵的乘法,就是%*% ,纯粹的*只是矩阵的元素相乘。diag函数,可以根据矩阵获得列表对象线上的元素,当然还可以根据对角线上的元素,来创建一个矩阵,同时可以用来构建单位阵。
如下计算,rnorm是去的随机数,solve函数是用求得矩阵a的逆矩阵,即为矩阵的除法
如下图所示,solve函数依旧可以用来解方程组:
如下图所示,eigen函数就是用来取得一个矩阵的特征向量和特征值,同时可以使用$来取出
R的语句
1. for语句
不同于别的语法,for循环之中,没有必要初始化值,a或者b有一个初始化的值
2. while 循环语句
不同于上面的,a需要有初始的值,也还要控制i的加减
一些其他的特殊的函数
注意在,文本中,如果想加载这个文件打印,就需要在文本的代码之中,使用print函数。
soure函数
print函数
正态分布函数rnorm
泊松分布函数rpois
指数分布函数rexp
Gamma分布函数rgamma
均匀分布函数runif
二项分布函数rbinom
几何分布函数rgeom
End.
来源:博客园
【7类SQL数据分析常用语句】
· 爱数据每周免费直播 ·
直播主题:如何应聘在线医疗行业数据分析岗位
直播内容:
在线医疗数据岗位分析
在线医疗领域职业生涯规划
在线医疗领域公司岗位说明
直播时间:3月19日 下周四晚20:30准时直播分享
- 上一篇: R语言作图:如何在数据可视化过程中调整因子顺序
- 下一篇: 「每天一道练习题」C语言顺序程序设计练习题
猜你喜欢
- 2024-10-07 R语言实践问题与解决方法记录(一)
- 2024-10-07 R数据分析:使用R语言进行卡方检验
- 2024-10-07 R数据分析:如何用R做多重插补,实例操练
- 2024-10-07 R语言——关联规则(r语言关联规则分析)
- 2024-10-07 R语言数据质量分析(r语言数据分析步骤)
- 2024-10-07 R语言风险价值VaR(Value at Risk)和损失期望
- 2024-10-07 R语言——几个基础统计(r语言统计学)
- 2024-10-07 干货 | 超实用的【R语言与高级医学统计学】课程,科研人必备
- 2024-10-07 R语言中因子的创建与使用(r语言中因子指什么)
- 2024-10-07 协同过滤的R语言实现及改进(协同过滤算法改进)
- 1517℃桌面软件开发新体验!用 Blazor Hybrid 打造简洁高效的视频处理工具
- 593℃Dify工具使用全场景:dify-sandbox沙盒的原理(源码篇·第2期)
- 521℃MySQL service启动脚本浅析(r12笔记第59天)
- 489℃服务器异常重启,导致mysql启动失败,问题解决过程记录
- 488℃启用MySQL查询缓存(mysql8.0查询缓存)
- 476℃「赵强老师」MySQL的闪回(赵强iso是哪个大学毕业的)
- 456℃mysql服务怎么启动和关闭?(mysql服务怎么启动和关闭)
- 453℃MySQL server PID file could not be found!失败
- 最近发表
-
- PS所有滤镜的说明(六)(ps滤镜详解)
- 5款小白也能用的在线图片编辑器!电商效率飙升就靠它!
- Java变量(java变量有什么作用)
- Java面试常见问题:Java注解(java中的面试题)
- Java编程入门第一课:HelloWorld(java编程从入门到实践)
- Java基础教程:Java继承概述(java里继承的概述)
- java基础之——访问修饰符(private/default/protected/public)
- 如何规划一个合理的JAVA项目工程结构
- 将机器指令翻译成 JavaScript -- 终极目标
- Web 服务器基准测试:Go vs. Node.js vs. Nim vs. Bun
- 标签列表
-
- cmd/c (90)
- c++中::是什么意思 (84)
- 标签用于 (71)
- 主键只能有一个吗 (77)
- c#console.writeline不显示 (95)
- pythoncase语句 (81)
- es6includes (73)
- windowsscripthost (67)
- apt-getinstall-y (86)
- node_modules怎么生成 (76)
- c++int转char (75)
- static函数和普通函数 (76)
- el-date-picker开始日期早于结束日期 (70)
- js判断是否是json字符串 (67)
- checkout-b (67)
- c语言min函数头文件 (68)
- asynccallback (71)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- java (73)
- js数组插入 (83)
- mac安装java (72)
- eacces (67)
- 查看mysql是否启动 (70)
- 无效的列索引 (74)