R에서 벡터의 최빈값 찾기
이 기사에서는 R에서 벡터의 모드를 찾는 방법에 대한 몇 가지 방법을 설명합니다.
사용자 지정 함수를 사용하여 R 벡터의 최빈값 찾기
모드는 값 집합에서 최대 발생 값을 나타내는 가장 기본적인 통계 개념 중 하나입니다. 결과적으로 숫자 또는 문자 기반과 같은 다양한 데이터 유형에서 관찰 될 수 있습니다. R 언어에는 모드 계산을위한 내장 함수가 없지만unique
,which.max
,tabulate
및match
함수를 사용하여 구현할 수 있습니다. x
로 표시된 하나의 인수를 사용하는FindMode
라는 함수를 정의합니다. 처음에는unique
함수가x
에서 호출되고 별도의 개체에 저장됩니다. unique
는 세트에서 중복되지 않은 값을 추출합니다. 벡터 객체, 데이터 프레임 또는 배열을 첫 번째 인수로 사용할 수 있습니다.
그런 다음match
로 시작하여 두 개의 벡터를 취하고 그로부터 위치 일치 벡터를 반환하는 다중 연결 함수가 있습니다. tabulate
함수는 각 정수가 벡터에 나타나는 횟수를 계산하고 반환합니다. 반환 된 벡터에는 인수 벡터의 최대 정수보다 작거나 같은 모든 정수의 개수가 포함됩니다. 마지막으로which.max
함수는 정수 벡터에서 최대 요소의 인덱스를 찾습니다. apply
함수를 사용하여 데이터 프레임의 모든 열에서FindMode
함수를 호출 할 수 있습니다. 이 경우 데이터 프레임으로 저장된 간단한 정수 벡터를 선언 한 다음apply
함수에 전달하여 평균을 계산합니다.
library(purrr)
FindMode <- function(x) {
u <- unique(x)
u[which.max(tabulate(match(x, u)))]
}
x <- c(12, 44, 3, -4.2, 3, 3.2, 54, 4, -11, -8, 2.5)
df <- data.frame(x)
apply(df, 2, FindMode)
출력:
x
3
또는 데이터 프레임에서 직접FindMode
함수를 호출 할 수 있습니다. 다음 예제 코드는datasets
패키지에 포함 된cars
데이터 세트의 사용법을 보여줍니다.
library(purrr)
FindMode <- function(x) {
u <- unique(x)
u[which.max(tabulate(match(x, u)))]
}
apply(cars, 2, FindMode)
출력:
speed dist
20 26
map_dbl
을 사용하여 R의 각 데이터 프레임 열에FindMode
함수를 적용합니다
주어진 데이터 프레임의 각 열에 대한 평균을 찾는 또 다른 유용한 함수는tidyverse
에 포함 된purrr
패키지의 일부인map_dbl
입니다. 이러한 메서드는 벡터 개체에서 호출되지 않습니다.
library(purrr)
FindMode <- function(x) {
u <- unique(x)
u[which.max(tabulate(match(x, u)))]
}
x <- c(12, 44, 3, -4.2, 3, 3.2, 54, 4, -11, -8, 2.5)
df <- data.frame(x)
map_dbl(df, FindMode)
map_dbl(cars, FindMode)
출력:
x
3
speed dist
20 26
Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.
LinkedIn Facebook