Programing/R- programming

R에서 히스토그램(Histogram), 줄기잎그림(stem)

sosal 2014. 10. 17. 14:53
반응형


/*

 http://sosal.kr/
 * made by so_Sal
 */


막대 도표 (Histogram).

히스토그램이라고 불리는 그래프 통계방식.


데이터의 집합인 샘플에서 계급을 나누어, 계급에 속하는 데이터의 개수(빈도)    를 나타내는 방법




그림 출처 - 네이터 백과사전

http://terms.naver.com/entry.nhn?docId=707162&cid=42318&categoryId=42318



- 데이터 생성

> a = sample(1:100, 200, replace=T)


- 히스토그램 그리기

> hist(a)



0~10, 11~20, 21~30... 이렇게 각 계급을 나누어 빈도수(Frequency)를 나타낸다.

단순한 빈도가 아니라, 백분율(%)을 구하고 싶다면, 함수의 인자로 probability=TRUE 를 주면 된다.


> hist(a, probability=T)


Y축이 빈도수(Frequency)가 아니라, Density로 바뀐것을 보실 수 있습니다.

히스토그램의 위에 매끈한 추정선 분포를 추가하고 싶으면 lines 함수를 이용하면 됩니다.


> lines(density(a), col="red")



줄기-잎 그림(Stem-and Leaf plot)

히스토그램과 비슷한 성질로 데이터를 나타내는 줄기 잎그림은 stem() 함수로 나타낼 수 있습니다.



> stem(a)


  The decimal point is 1 digit(s) to the right of the |


  0 | 22223344

  0 | 5555678889999

  1 | 001111112222334

  1 | 66677889

  2 | 000223334

  2 | 555666778899

  3 | 11113444

  3 | 5555778999

  4 | 00001233344

  4 | 555678899

  5 | 0134

  5 | 66667778889

  6 | 002233444

  6 | 6889

  7 | 0112334444

  7 | 555556666677889

  8 | 00000112333

  8 | 5678889

  9 | 00011123333444

  9 | 555558889999


볼드체로 되어있는   6 | 002233444의 의미는 60, 60, 62, 62, 63, 63, 64, 64, 64 입니다.

좌측은 10의자리, 우측은 1의 자리 숫자의 나열입니다.