R에서 diff 함수 사용
요소 간의 차이를 계산하는 것은 기본적인 작업입니다. 또한 연속 요소 간의 차이를 쉽게 계산할 수 있지만이를 수동으로 달성하는 대규모 데이터 세트의 경우 한 줄씩 효율적이지 않습니다.
R 프로그래밍에서diff()
는 벡터의 연속 요소 간의 차이를 계산하여 함수에 전달합니다. 최종 결과도 벡터입니다. 예를 들면 :
x <- c(5,3,4,3,8,9,4,8,1)
diff(x)
[1] -2 1 -1 5 1 -5 4 -7
위의 예에서 볼 수 있듯이diff()
함수는 연속 요소 (3-5 = -2, 4-3 = 1, ….) 간의 차이를 반환합니다. 또한 결과 벡터에는 요소가 하나 적습니다. 이는 마지막 요소의 차이를 계산할 수 없기 때문입니다.
diff()
함수에 두 개의 매개 변수를 추가 할 수도 있습니다. 이들은lag
및differences
매개 변수입니다.
lag
매개 변수는 차이가 계산되는 요소 간의 간격을 지정할 수 있습니다. 기본적으로 1입니다. lag
매개 변수가 2이면diff()
함수는 첫 번째와 세 번째 요소, 두 번째와 네 번째 요소 등의 차이를 계산합니다. 다음 예제는 문제를 해결합니다.
diff(x, lag = 2)
[1] -1 0 4 6 -4 -1 -3
differences
매개 변수는 차이의 순서를 지정하는 데 사용됩니다. 예를 들어 2로 설정합니다. 그런 다음 먼저 주어진 벡터 요소 간의 차이를 계산 한 다음 결과 벡터의 연속 요소의 차이를 다시 계산합니다. 다음 코드 스 니펫이이를 설명합니다.
diff(x)
[1] -2 1 -1 5 1 -5 4 -7
diff(x, differences = 2)
[1] 3 -2 6 -4 -6 9 -11
이 두 매개 변수를 한 번에 특정 값으로 설정할 수도 있습니다. 예를 들어 아래 코드에서는 lag
를 2로, differences
를 2로 설정했습니다.
diff(x, differences = 2, lag = 2)
[1] 5 6 -8 -7 1
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedIn