반응형
통계학에서의 자료 분석 단계 중 자료의 정리와 요약 법을 2장에서는 소개합니다.
자료의 종류는 해당되는 변수의 수에 따라
- 단일변량자료(univariate data)
- 다변량 자료(mulivariate data)
- 이변량 자료(bivariate data)
자료의 종류에 따라
- 질적자료(qualitative data) ==> 범주형 자료(categorical data)
- 양적 자료(quantitative or measurement data)
도수(count, frequency) : 각 범주와 범주에 속한 자료의 개수
도수분포표(frequency table)
상대 도수(relative frequency)
R code
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
|
#2.2 표와 그래프
#(1) 질적자료
#예제2.1 : 후보 A, B, C에 대해 2,800명이 투표한 결과
# A : 1520표, B : 770표, C: 510표
#돗수 분포표 (frequency table)
a <- rep("A", 1520) ; a
b <- rep("B",770) ; b
c <- rep("C",510) ; c
x <- c(a,b,c) ;x
> table(x)
x
A B C
1520 770 510
> y <- as.matrix(table(x)) ;y
[,1]
A 1520
B 770
C 510
> y[,1]
A B C
1520 770 510
> freq <- y[,1] ;
> freq
A B C
1520 770 510
> relative_freq <- freq/sum(y)
> z <- cbind(freq, relative_freq) ;z
freq relative_freq
A 1520 0.5428571
B 770 0.2750000
C 510 0.1821429
|
cs |
파이차트 그리기
파레토 그림
|
|
양적자료의 표현중 이산형 자료에 대한 표현 : 막대그래프와 히스토그램그리기
도수분포표 만들기 R code
막대그래프와 히스토그램
1
2
3
4
5
6
7
8
9
10
11
|
> #예제 :2.5. 예제2.4의 자료에 대한 막댁림과 히스토그램을 그려라
> #막대그림
> x <- c(1,1,1,3,0,0,1,1,1,0,2,2,0,0,0,1,2,1,2,0,0,1,6,4,3,3,1,2,4,0) ;x
[1] 1 1 1 3 0 0 1 1 1 0 2 2 0 0 0 1 2 1 2 0 0 1 6 4 3 3 1 2 4 0
> barplot(table(x))
> par(mfrow=c(1,2))
> barplot(table(x),xlab = "Mistatkes",ylab="count",main="예제2.5 막대그래프")
> #히스토그램
> hist(x)
> #히스토그램 (histogram)
> data()
|
cs |
다음 포스팅에서는 양적 자료 중에 연속형 자료를 표현하는 법에 대해서 포스팅하겠습니다.
반응형
'아재도 하는 통계' 카테고리의 다른 글
[50원] [통계학개론] 제2장 자료의 구조(2) (0) | 2019.09.05 |
---|