威海市建设工程协会网站企业网站建设 管理 维护

当前位置: 首页 > news >正文

威海市建设工程协会网站,企业网站建设 管理 维护,专业集团门户网站建设方案,个人网页制作成品图文章目录 R语言介绍R语言基本语法R语言常用函数有哪些R语言数据结构向量矩阵数组和列表数组列表 数据框因子 R如何导入数据如何在R语言中导出数据#xff1f;R语言图形绘制描述性统计描述统计也可以这样来计算 统计推断配对设计t检验样本均数和总体均数t检验两#xff08;独立… 文章目录 R语言介绍R语言基本语法R语言常用函数有哪些R语言数据结构向量矩阵数组和列表数组列表 数据框因子 R如何导入数据如何在R语言中导出数据R语言图形绘制描述性统计描述统计也可以这样来计算 统计推断配对设计t检验样本均数和总体均数t检验两独立样本t检验R语言组间差异的非参数检验单因素方差分析R语言双因素方差分析方法R语言重复测量方差分析 回归分析R语言回归分析R语言多元回归分析R语言logistic回归分析 R语言主成分和因子分析R语言聚类分析方法数据分析中缺失值的处理方法 我与Bing chatGPT关于R语言的会话 Bing chatGPT对每个问题给出的答案都很简洁但是给出了进一步的参考链接。不妨深入研究具体的内容获得更详细的内容。 R语言介绍 1 R语言 - 维基百科自由的百科全书 2 R 语言教程 | 菜鸟教程 3 R语言安装教程 4 R: The R Project for Statistical Computing 5 R: What is R? - r-project.org 你好这是必应。我可以帮你介绍一下R语言。R语言是一种用于统计分析、绘图和数据挖掘的编程语言和操作环境1 2。它是一个自由、免费、开源的软件可以在多种平台上运行3 4。R语言是基于S语言的S语言是一种在贝尔实验室开发的统计计算语言4。R语言有很多用户编写的扩展包可以提供更多的功能和应用1。 如果你是一个数学研究工作者或者对统计分析、绘图和数据挖掘感兴趣R语言可能是一个很好的选择。但是如果你是一个计算机程序的初学者或者想了解通用编程R语言可能不是一个理想的选择你可以考虑Python、C或Java等其他语言2。R语言是一种解释型的语言它的执行速度比编译型的语言慢得多不利于优化2。 要使用R语言你需要先安装R软件3 4然后可以使用R自带的控制台或者其他集成开发环境IDE来编写和运行R代码5。你也可以从CRANComprehensive R Archive Network或者其他网站下载和安装R扩展包3 4来增加R的功能和应用。 我希望这些信息对你有用。 R语言基本语法 R语言的基本语法包括以下几个方面 赋值操作R语言使用符号“-”或“”来给变量赋值例如 x - 10 或 y “Hello”。注释R语言使用符号“#”来表示注释注释是对代码的说明不会被执行例如 # 这是一个注释。输出R语言使用函数 print() 来输出值或表达式例如 print(“R语言”) 或 print(23)。数据类型R语言支持多种数据类型如数值、字符、逻辑、复数、因子、向量、矩阵、数组、列表和数据框等。数据结构R语言的数据结构是指数据的组织形式如向量是一维的数据结构矩阵是二维的数据结构数组是多维的数据结构列表和数据框是混合类型的数据结构等。运算符R语言有多种运算符如算术运算符 - / ^ %% %/%、关系运算符 ! 、逻辑运算符! | xor、赋值运算符- - - -和特殊运算符: %in% %%等。控制流程R语言有多种控制流程语句如条件语句if else ifelse switch、循环语句for while repeat break next、函数定义function和异常处理try catch finally等。 你可以参考以下网站来学习更多关于R语言基本语法的内容 1 R语言基础语法 - 简书2 R 基础语法 | 菜鸟教程3 R语言实战之R语言基础语法精讲一 - 知乎 R语言常用函数有哪些 R语言有很多常用的函数根据功能不同可以分为以下几类 数学函数如 abs() 求绝对值 sqrt() 求平方根 log() 求对数 sin() 求正弦 cos() 求余弦等。 统计函数如 mean() 求均值 sd() 求标准差 var() 求方差 median() 求中位数 max() 求最大值 min() 求最小值等。 概率函数如 dnorm() 求正态分布的密度函数 pnorm() 求正态分布的分布函数 qnorm() 求正态分布的分位数函数 rnorm() 生成正态分布的随机数等。一般来说概率函数的命名规则是 [x][function]其中 x 表示指定的分布如 norm 表示正态分布 function 表示函数类型如 d 表示密度函数 p 表示分布函数 q 表示分位数函数 r 表示随机数函数等。字符处理函数如 paste() 连接字符串 substr() 提取子字符串 nchar() 计算字符串长度 toupper() 转换为大写字母 tolower() 转换为小写字母等。其他函数如 length() 计算对象长度 dim() 获取对象维度 class() 获取对象类型 summary() 获取对象摘要信息 help() 获取帮助文档等。 你可以参考以下网站来学习更多关于R语言常用函数的内容 1 R语言常用函数总结大全_r语言函数大全及详解_王亨的博客-CSDN博客 2 R语言常用函数汇总 - 知乎 3 R语言常用函数整理基础篇 - 简书 R语言数据结构 R语言中的数据结构是用于保存多个值的工具。 R的基础数据结构通常按其维度1D、2D或nD以及它们是同质的所有元素必须是相同的类型还是异质的元素通常有各种类型来组织。 常见的数据结构包括向量、矩阵、数组、列表、数据框和因子等12。 向量是由相同基本类型元素组成的序列相当于一维数组。矩阵是由相同类型的元素组成的二维数组12。 向量 在R中可以使用c()函数来创建向量。例如要创建一个由1、2、3组成的向量可以使用以下代码 vector1 - c(1, 2, 3)在R中可以使用方括号[]来访问向量中的元素。例如要访问向量vector1中的第2个元素可以使用以下代码 vector1[2]矩阵 在R中可以使用matrix()函数来创建矩阵。例如要创建一个由1、2、3和4、5、6组成的2x3矩阵可以使用以下代码 matrix1 - matrix(c(1, 2, 3, 4, 5, 6), nrow 2)在R中可以使用方括号[]来访问矩阵中的元素。例如要访问矩阵matrix1中的第1行第2列的元素可以使用以下代码 matrix1[1, 2]数组和列表 在R中数组和列表都是一种数据结构但它们有不同的特点。数组是一种多维数据结构其中所有元素必须是相同的数据类型。列表是一种可以包含不同数据类型元素的一维或多维数据结构12。 数组 在R中可以使用array()函数来创建数组。例如要创建一个由1、2、3和4、5、6组成的2x3x1数组可以使用以下代码 array1 - array(c(1, 2, 3, 4, 5, 6), dim c(2, 3, 1))在R中可以使用方括号[]来访问数组中的元素。例如要访问数组array1中的第1行第2列的元素可以使用以下代码 array1[1, 2, 1]列表 在R中可以使用list()函数来创建列表。例如要创建一个包含向量vector1和矩阵matrix1的列表可以使用以下代码 list1 - list(vector1, matrix1)在R中可以使用方括号[]或双方括号[[]]来访问列表中的元素。例如要访问列表list1中的第1个元素可以使用以下代码 list1[[1]]数据框 在R语言中数据框是一种基础数据格式类似于Excel中的表格形式数据。数据框是一种二维的表格结构每一列可以包含不同模式数值型、字符型等的数据每一列都有一个唯一的列名长度都是相等的。你可以使用data.frame()函数来创建数据框。例如下面的代码创建了一个包含site、season和pH三列的数据框 df - data.frame(site c(A, B, C), season c(spring, summer, fall), pH c(7.2, 6.8, 7.1))你可以使用方括号[]或双方括号[[]]来访问数据框中的元素。例如要访问数据框df中的第1行第2列的元素可以使用以下代码 df[1, 2]因子 在R语言中因子factor是一种特殊的数据类型用于存储不同类别的数据可以用来对数据进行分组。例如人的性别有男和女两个类别根据年龄可以将人分为未成年人和成年人考试成绩可以分为优、良、中、差等。你可以使用factor()函数来创建因子。例如下面的代码创建了一个包含性别和年龄两列的因子 sex - factor(c(“男”, “女”, “男”, “女”), levels c(“男”, “女”)) age - factor(c(“18”, “18”, “18”, “18”), levels c(“18”, “18”)) 你可以使用方括号[]或双方括号[[]]来访问因子中的元素。例如要访问因子sex中的第1个元素可以使用以下代码 sex1 R如何导入数据 R语言中有多种方法可以导入数据其中最常用的方法是使用read.table()函数。read.table()函数可以从带分隔符的文本文件中导入数据并将其保存为一个数据框。例如要从名为data.csv的文件中导入数据可以使用以下代码 mydataframe - read.table(“data.csv”, header TRUE, sep “,”) 其中header TRUE表示第一行包含列名sep ,表示使用逗号作为分隔符。你还可以使用read.csv()函数来读取.csv文件该函数是read.table()函数的一个特例。例如要从名为data.csv的文件中导入数据可以使用以下代码 mydataframe - read.csv(“data.csv”) 如何在R语言中导出数据 R语言中有多种方法可以导出数据其中最常用的方法是使用write.table()函数。write.table()函数可以将数据框中的数据写入到文本文件中。例如要将名为data.csv的文件导出为逗号分隔的文本文件可以使用以下代码 write.table(mydataframe, file “data.csv”, sep “,”, row.names FALSE) 其中file data.csv表示将数据写入到名为data.csv的文件中sep ,表示使用逗号作为分隔符row.names FALSE表示不包含行名。你还可以使用write.csv()函数来将数据框导出为.csv文件该函数是write.table()函数的一个特例。例如要将名为data.csv的文件导出为.csv文件可以使用以下代码 write.csv(mydataframe, file “data.csv”, row.names FALSE) R语言图形绘制 R语言提供了许多绘图函数包括plot()、hist()、boxplot()、barplot()、pie()等等。这些函数可以用于绘制各种类型的图形如散点图、直方图、箱形图、条形图和饼图等等。你可以根据需要选择适当的函数来绘制你想要的图形。 例如要绘制一个简单的散点图可以使用以下代码 x - c(1, 2, 3, 4, 5) y - c(2, 4, 6, 8, 10) plot(x, y) plot()函数是R语言中最基本的绘图函数之一主要用于绘制散点图和折线图。它有许多参数包括x、y、type、xlim、ylim、log、main、sub、xlab、ylab等等。其中x和y是必需的参数它们分别指定了横坐标和纵坐标的数据。type参数控制要绘制的图的类型例如要创建在数据点之间带有线的图请使用type “ l”要仅绘制点请使用type “ p”并绘制线条和点请使用type “ b”1 这将绘制一个由5个点组成的散点图其中x轴表示x向量中的值y轴表示y向量中的值。 在R语言中图形绘制参数包括符号、线条、颜色、文本参数、图形尺寸及边界等。你可以使用par()函数来设置这些参数。例如要设置符号的大小和颜色可以使用以下代码 par(pch 19, col “red”) 这将设置符号的大小为19颜色为红色。你还可以使用其他参数来设置线条的类型、颜色和宽度文本的字体、大小和颜色图形的尺寸和边界等等。 描述性统计 这一章介绍了基本的统计方法包括描述性统计、频率和列联表、相关和协方差、t检验和非参数统计。你将学习如何用R导入数据并用各种函数对数据进行组织和转换使之成为有用的格式。然后我们回顾了可视化数据的基本方法。 你的数据组织好后你通常需要先用数字描述每个变量的分布然后探索选定变量之间两两的关系。目标是回答这样的问题 现在汽车的油耗是怎样的具体来说在对汽车品牌和型号进行调查时每加仑英里数平均值、标准差、中位数、范围等的分布是怎样的在一次新药试验后药物组和安慰剂组的结果无改善、有些改善、明显改善是什么参与者的性别是否对结果有影响 收入和预期寿命之间有什么相关性它是否显著不同于零在美国不同地区犯罪是否更可能受到监禁地区之间的差异是否具有统计学意义 用R进行基本描述性和推断性统计的函数。首先我们将看看定量变量的位置和尺度的度量。然后你将学习如何生成分类变量的频率和列联表以及相关的卡方检验。接下来我们将研究连续和有序变量可用的各种形式的相关系数。最后我们将通过参数t检验和非参数曼-惠特尼U检验克鲁斯卡尔-沃利斯检验方法研究组间差异。虽然我们的重点是数字结果但我们将在整个过程中提到可视化这些结果的图形方法。 本章涵盖的统计方法通常在大学一年级的统计课程中教授。如果这些方法对你来说不熟悉两本优秀的参考书是McCall (2000) 和 Kirk (2008)。或者每个主题都有许多有用的在线资源如维基百科。 7.1 描述性统计 在本节中我们将看看连续变量的中心趋势、变异性和分布形状的度量。为了说明目的我们将使用第一章中你见过的汽车趋势杂志汽车路测mtcars数据集中的几个变量。我们关注每加仑英里数mpg、马力hp和重量(wt): myvars - c(mpg,hp,wt) head(mtcars[myvars])首先我们将看看所有32辆车的描述性统计。然后 我们将按传动类型查看描述性统计 R语言中计算描述性统计的方法。它介绍了mtcars数据集中的几个变量如变速箱类型am和发动机缸配置vs。它还展示了如何使用summary()函数和sapply()函数来获取最小值、最大值、四分位数、均值等统计量。这些函数可以用于数值变量和因子变量。 myvars - c(mpg, hp, wt) summary(mtcars[myvars]) 关于R语言中的apply()函数和sapply()函数的用法。apply()函数可以对数组、矩阵或数据框的某一维度行或列应用一个函数返回一个向量、数组或列表。sapply()函数可以对数据框的每一列应用一个函数返回一个向量或矩阵。这些函数可以使用R中内置的或自定义的任意函数例如mean(), sd(), var(), min(), max(), median(), length(), range(), quantile()等。fivenum()函数可以返回Tukey的五数概括最小值、下四分位数、中位数、上四分位数和最大值。123 sapply(x, FUN, options) mystats - function(x, na.omitFALSE){ if (na.omit) x - x[!is.na(x)] m - mean(x) n - length(x) s - sd(x) skew - sum((x-m)^3/s^3)/n kurt - sum((x-m)^4/s^4)/n - 3 return(c(nn, meanm, stdevs, skewskew, kurtosiskurt)) } myvars - c(mpg, hp, wt) sapply(mtcars[myvars], mystats)假如要去掉缺失值函数可写成 sapply(mtcars[myvars], mystats, na.omit TRUE)描述统计也可以这样来计算 library(Hmisc) myvars - c(mpg, hp, wt) describe(mtcars[myvars])统计推断 统计推断是指根据样本数据去推断总体数量特征的方法1。它是在对样本数据进行描述的基础上对统计总体的未知数量特征做出以概率形式表述的推断1。统计推断是在概率论的基础上依据样本的有关数据和信息对未知总体的质量特性参数做出合理的判断和估计2。 统计推断和数据分析是两个不同的概念。数据分析是指对数据进行收集、处理、分析和解释的过程目的是从数据中提取有用的信息以便做出决策1。而统计推断是指根据样本数据推断总体数量特征的方法主要可以分为参数估计问题和假设检验问题2。 简单来说数据分析是一种方法而统计推断是一种统计学方法1。 配对设计t检验 要在 R 中执行配对样本 t 检验可以使用 t.test 函数12。 该函数将两个数值向量作为输入并返回一个 t 检验结果对象其中包含检验统计量、自由度、p 值和置信区间1。 下面是如何使用 t.test 函数在 R 中执行配对样本 t 检验的示例 创建两个数值向量 x - c(1 2 3 4 5) y - c(2 4 6 8 10)执行配对样本 t 检验 t.testx y paired TRUE 这将输出以下结果 配对 t 检验 数据x 和 y t -5.7446df 4p 值 0.005165 备择假设均值的真实差值不等于 0 95% 置信区间 -3.635609 -1.164391 样本估计 差值的平均值 -2 样本均数和总体均数t检验 总体均数t检验是一种假设检验方法主要用于样本含量较小例如n30总体标准差σ未知的正态分布。目的是用来比较样本均数所代表的未知总体均数μ和已知总体均数μ01。 在R语言中样本均数和总体均数t检验可以使用t.test()函数进行1。例如我们有一个数据集a我们可以使用以下代码进行样本均数和总体均数t检验 t.test(a,mu0) 其中a是数据集的名称mu是总体均数1。 两独立样本t检验 独立样本t检验是一种用于比较两个独立组的平均值是否存在差异的方法1。例如假设我们测量了100个人的体重50名女性A组和50名男性B组。我们想知道女性的平均体重mA与男性mB是否存在差异。在这种情况下我们有两组不相交的数据因此使用独立样本t检验1。 在R语言中独立样本t检验可以使用t.test()函数进行1。例如我们有两个数据集a和b我们可以使用以下代码进行独立样本t检验 t.test(a,b) 其中a和b是两个数据集的名称。如果我们想要更多的参数控制可以使用以下代码 t.test(a,b,var.equalTRUE,conf.level0.95) 其中var.equal表示方差是否相等conf.level表示置信度水平。 R语言组间差异的非参数检验 在R语言中组间差异的非参数检验可以使用kruskal.test()函数进行1。例如我们有一个数据集a我们可以使用以下代码进行组间差异的非参数检验 kruskal.test(a~b) 其中a是数据集的名称b是分类变量2。 1: CDA数据分析师官网 2 单因素方差分析 在R语言中单因素方差分析可以使用aov()函数进行1。例如我们有一个数据集a我们可以使用以下代码进行单因素方差分析 fit - aov(a~b, data data) summary(fit) 其中a是数据集的名称b是分类变量2。 1: R语言教程 2: 知乎 R语言双因素方差分析方法 在R语言中双因素方差分析可以使用aov()函数进行1。例如我们有一个数据集a我们可以使用以下代码进行双因素方差分析 fit - aov(a~bc, data data) summary(fit) 其中a是数据集的名称b和c是分类变量1。 1: CSDN R语言重复测量方差分析 在R语言中重复测量方差分析可以使用ezANOVA包进行1。例如我们有一个数据集a我们可以使用以下代码进行重复测量方差分析 library(ez) fit - ezANOVA(data a, dv .(b), wid .©, within .(d), between .(e), type 3) summary(fit) 其中a是数据集的名称b是因变量的名称c是被试编号的名称d和e是分类变量1。 library(readxl) # 读取数据 data - read_excel(file.choose())data\(Subject - as.factor(data\)Subject) data\(Familiarity - as.factor(data\)Familiarity) data\(Density - as.factor(data\)Density) attach(data) # 将数据框的变量列直接添加到R的搜索路径调用时就不用加上\( str(data) head(data) library(ez) # 加载包 model - ezANOVA(data, dv Score, wid Subject, within .(Familiarity, Density), type 3, detailed T) model数据下载地址 reading.xlsx 提取码854g 回归分析 R语言回归分析 在R语言中简单回归分析可以使用lm()函数进行1。例如我们有一个数据集a我们可以使用以下代码进行简单回归分析 fit - lm(b ~ c, data a) summary(fit) 其中a是数据集的名称b是因变量的名称c是自变量的名称1 R语言多元回归分析 在R语言中多元回归分析可以使用lm()函数进行1。例如我们有一个数据集a我们可以使用以下代码进行多元回归分析 fit - lm(b ~ c d, data a) summary(fit) 其中a是数据集的名称b是因变量的名称c和d是自变量的名称1。 R语言logistic回归分析 在R语言中logistic回归分析可以使用glm()函数进行1。例如我们有一个数据集a我们可以使用以下代码进行logistic回归分析 fit - glm(b ~ c d, data a, family binomial(link “logit”)) summary(fit) 其中a是数据集的名称b是因变量的名称c和d是自变量的名称1。 R语言主成分和因子分析 R语言主成分和因子分析 主成分分析PCA的目标是用一组较少的不相关变量代替大量相关变量同时尽可能保留初始变量的信息这些推导所得的变量称为主成分它们是观测变量的线性组合。 \) PC_1 \alpha_1X_1\alpha_2X_2\alpha_3X_3…\alpha_nX_n \( 探索性因子分析 如果你的目标是寻求可解释观测变量的潜在隐含变量可使用因子分析。 EFA的目标是通过发掘隐藏在数据下的一组较少的、更为基本的无法观测的变量来解释一组可观测变量的相关性。这些虚拟的、无法观测的变量称作因子。每个因子被认为可解释多个观测变量间共有的方差因此准确来说它们应该称作公共因子。 \) X_i \alpha_1F_1 \alpha_2F_2 \alpha_3F_3… \alpha_nF_n $ 其中是第i个可观测变量i 1…k是公共因子j 1…p并且pk。是变量独有的部分无法被公共因子解释。可认为是每个因子对复合而成的可观测变量的贡献值。 在R语言中主成分和因子分析可以使用prcomp()和factanal()函数进行1。例如我们有一个数据集a我们可以使用以下代码进行主成分和因子分析 fit - prcomp(a) summary(fit) fit - factanal(a, factors 3) print(fit, digits 2, cutoff 0.6, sort TRUE) 其中a是数据集的名称。 1: 简书 R语言聚类分析方法 按照一定的相似性度量方式把接近的一些个体聚在一起。这里主要是相似性度量不同的数据类型我们需要用不同的度量方式。除此之外聚类的思想也很重要要是按照聚类思想来说主要有这么几大类第一大类是基于分割的聚类比如k-means以及按照这个思路进行了简单扩展的几个聚类如k-median等。第二大类呢就是层次聚类它其实是把个体之间的关系进行了一个层次展示具体聚为几类由人为进行设定。第三大类呢就是基于密度的聚类这里不要讲基于密度的聚类和基于概率密度分布的聚类相混淆这其实是一样的比如混合模型就是基于概率分布的聚类而DBSCAN就是基于密度的聚类实际上这里密度是指一指局部密度而不是概率密度分布。那么第四大类呢就是基于概率密度分布的聚类这一类聚类方法主要是假设数据来自某个概率分布或者是某几个概率分布的组合进而进行参数估计确定分布的样子再反过来看看样本点属于哪一类。那么第五大类呢是矩阵的分解Nonnegative Matrix Factorizations 这一大类其实和之前的几类明显不同比如SVD分解或者其他的分解其实在文本挖掘或者推荐算法里边都属于聚类。最后一大类就是谱聚类了。 在R语言中聚类分析可以使用kmeans()和hclust()函数进行1。例如我们有一个数据集a我们可以使用以下代码进行聚类分析 fit - kmeans(a, 3) print(fit) fit - hclust(dist(a)) plot(fit) 其中a是数据集的名称1。 数据分析中缺失值的处理方法 在R语言中处理缺失值的方法有很多。其中最简单的方法是删除缺失值所在的行R语言中提供了两种删除缺失值的函数分别是complete.cases()函数和na.omit()函数1。此外还有一些其他的方法如插值法、回归法、均值法等等2。 例如我们有一个数据集a我们可以使用以下代码删除缺失值所在的行 a - na.omit(a) 或者使用以下代码删除包含缺失值的列 a - a[, colSums(is.na(a)) 0] 如果你想用均值来填补缺失值可以使用以下代码 a[is.na(a)] - mean(a, na.rm TRUE) ** 与chatGPT的会话结束 ***