아재도 하는 통계

[50원] [통계학개론] 제2장 자료의 구조(1)

열심남 2019. 8. 20. 17:48
반응형

통계학에서의 자료 분석 단계 중 자료의 정리와 요약 법을 2장에서는 소개합니다.

 

자료의 종류는 해당되는 변수의 수에 따라 

  • 단일변량자료(univariate data)
  • 다변량 자료(mulivariate data)
  • 이변량 자료(bivariate data)

 

자료의 종류에 따라

  • 질적자료(qualitative data)  ==> 범주형 자료(categorical data)
  • 양적 자료(quantitative or measurement data)

 

 

도수(count, frequency) : 각 범주와 범주에 속한 자료의 개수

도수분포표(frequency table)

상대 도수(relative frequency)

 

R code

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
#2.2 표와 그래프
#(1) 질적자료
#예제2.1 : 후보 A, B, C에 대해 2,800명이 투표한 결과 
#    A : 1520표, B : 770표, C: 510표
#돗수 분포표 (frequency table)
a <- rep("A", 1520) ; a
b <- rep("B",770) ; b
c <- rep("C",510) ; c 
x <- c(a,b,c) ;x
 
> table(x)
x
   A    B    C 
1520  770  510 
 
> y <- as.matrix(table(x)) ;y
  [,1]
A 1520
B  770
C  510
 
> y[,1]
   A    B    C 
1520  770  510 
 
> freq <- y[,1] ;
> freq
   A    B    C 
1520  770  510 
 
> relative_freq <- freq/sum(y)
 
> z <- cbind(freq, relative_freq) ;z
  freq relative_freq
A 1520     0.5428571
B  770     0.2750000
C  510     0.1821429
cs

 

 

파이차트 그리기

파레토 그림
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

 

양적자료의 표현중 이산형 자료에 대한 표현 : 막대그래프와 히스토그램그리기

 

도수분포표 만들기 R code

막대그래프와 히스토그램

1
2
3
4
5
6
7
8
9
10
11
> #예제 :2.5. 예제2.4의 자료에 대한 막댁림과 히스토그램을 그려라
> #막대그림
> x <- c(1,1,1,3,0,0,1,1,1,0,2,2,0,0,0,1,2,1,2,0,0,1,6,4,3,3,1,2,4,0) ;x
 [1] 1 1 1 3 0 0 1 1 1 0 2 2 0 0 0 1 2 1 2 0 0 1 6 4 3 3 1 2 4 0
> barplot(table(x))
> par(mfrow=c(1,2))
> barplot(table(x),xlab = "Mistatkes",ylab="count",main="예제2.5 막대그래프")
> #히스토그램
> hist(x)
> #히스토그램 (histogram)
> data()
cs

 

 

 

다음 포스팅에서는 양적 자료 중에 연속형 자료를 표현하는 법에 대해서 포스팅하겠습니다.

R 활용 통계학개론, 자유아카데미
반응형