R语言均值,中位数和模式-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读R语言均值,中位数和模式

R语言均值,中位数和模式

2017-06-20

R语言均值,中位数和模式

在R 统计分析是通过用许多内置函数来执行的。大多数这些函数是R基本包的一部分。这些函数需要R向量作为输入参数并给出结果。

我们正在讨论本章中的函数是平均数，中位数和模式。

平均值

它是通过取的值的总和，并除以一个数据系列的数量计算的。

函数mean()是用来计算这在R语言中

语法

用于计算平均值在 R 中的基本语法是：

mean(x, trim = 0, na.rm = FALSE, ...)

以下是所使用的参数的说明：

x 是输入向量。

trim 用于删除一些要素/空格从排序向量的两端。

na.rm 用于从输入矢量删除丢失的值。

示例

# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)

# Find Mean.
result.mean <- mean(x)
print(result.mean))

当我们上面的代码执行时，它产生以下结果：

[1] 8.22

应用修剪选项

当修剪参数被提供时，在向量中的值获得排序，然后观察所需要的数据从计算平均丢弃。

当trim =0.3，是从每一端的3个值将被从找到中计算删除的意思。

在这种情况下，排序矢量为（-21，-5，2，3，4.2，7，8，12，18，54）和从向量表除去，用于计算平均值的值从（-21，-5,2）左侧和从（12,18,54）右边。

# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)

# Find Mean.
result.mean <- mean(x,trim=0.3)
print(result.mean

当我们上面的代码执行时，它产生以下结果：

[1] 5.55

应用NA选项

如果有缺失值，则意味着函数返回 NA。

从计算中使用 na.rm= TRUE 删除缺失值。这意味着删除 NA 值。

# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5,NA)

# Find mean.
result.mean <- mean(x)
print(result.mean)

# Find mean dropping NA values.
result.mean <- mean(x,na.rm=TRUE)
print(result.mean)

当我们上面的代码执行时，它产生以下结果：

[1] NA
[1] 8.22

中位数

在一个数据串的中间最值被称为中值。median() 函数用于在 R 中计算此值。

语法

在 R 中用于计算中位数的基本语法是：

median(x, na.rm = FALSE)

以下是所使用的参数的说明：

x 是输入向量。

na.rm 用于从输入矢量删除丢失的值。

例子

# Create the vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)

# Find the median.
median.result <- median(x)
print(median.result)

当我们上面的代码执行时，它产生以下结果：

[1] 5.6

模式

模式是一个具有最高发生次数的一组数据的值。不同于平均数和中位数，模式可以同时拥有数字和字符数据。

R没有一个标准的内置函数来计算模式。因此，我们创建一个用户函数来计算在R数据集的模式，该函数将向量作为输入，并给出了模式的值输出。

示例

# Create the function.
getmode <- function(v) {
uniqv <- unique(v)
uniqv[which.max(tabulate(match(v, uniqv)))]
}

# Create the vector with numbers.
v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)

# Calculate the mode using the user function.
result <- getmode(v)
print(result)

# Create the vector with characters.
charv <- c("o","it","the","it","it")

# Calculate the mode using the user function.
result <- getmode(charv)
print(result)