Programing/R- programming

R 변동계수의 정의와 의미(coefficient of variation)

sosal 2014. 10. 17. 19:43
반응형


/*

 http://sosal.kr/
 * made by so_Sal
 */


변동계수(CV) - Coefficient of Variation


변동계수는 위와 같이, 표준편차에 평균값을 나눈 값입니다.


 * 변동계수 = 표준편차 / 평균

 * CV(x) = sd(x) / mean(x)



표준편차는 절대적인 수치의 떨어진 정도를 나타냅니다.

따라서 수의 평균이 커질수록 표준편차 역시 커지는 경향이 있습니다.




ex 1)

> v1 = c(1, 3, 5)

> v2= c(5, 15, 25) 


위의 세 숫자로 이루어진 두 벡터(v1, v2)는 비율이 1:3:5 로 동일하지만

절대적인 수치가v2가 크기 때문에 표준편차 역시 v2가 높은 경향을 띄게 됩니다.


> sd(v1)

[1] 2

> sd(v2)

[1] 10


따라서 v2의 표준편차는 v1보다 5배 큽니다.



하지만 절대적인 수치 값을 나타내는 표준편차는

서로 다른 평균값을 가지는 샘플들의 비교시에는 적합하지 않게 됩니다.


예를 들어, 남학생의 몸무게 표준편차와 여학생의 몸무게 표준편차를 계산했을 때,

일반적으로 남학생들의 몸무게가 크기 때문에 표준편차 역시 큰 값을 띄게 되는 경향이 있습니다.


이러한 평균값의 차이로 인해 달라지는 표준편차를 조정한 것이 바로 변동계수입니다.






ex 2)

비율은 같지만, 절대적인 크기가 다른 두개의 벡터를 생성합니다.

> v1 = c( 3,5,6,8,9,11,15)

> v2 = v1*10

(v2는 v1 샘플의 모든 데이터의 10배에 해당되는 값을 가진다.)


> v1.cv = sd(v1) / mean(v1)

> v2.cv = sd(v2) / mean(v2)

(v1와 v2의 CV. 변동계수를 구합니다.)


> v1.cv

[1] 0.4934162

> v2.cv

[1] 0.4934162


두 변동계수의 값은 동일한것으로 나옵니다.

즉 절대적인 값의 크기보다는 비율에 의한 편차를 확인하기 위한 변동계수입니다.