자료구조의 중심을 나타내는 척도로 대표적인게 평균(average)과 중앙값(median)이 있습니다. 표본자료에 대하여 구한 평균을 표본평균(sample mean)이라하고, 모집단 전체 자료에 대한 평균을 모평균(population mean)이라고 한다. 표본평균은 모평균을 추정하는 값으로 좋은 성질을 가지고 있지만, 바깥점(outlier, 혹은 이상치)에 의하여 영향르 많이 받는다. 이러한 단저믈 보완하는 척도로 중앙값이 있으며, 중앙값은(median)은 자료들을 크기순으로 정렬(sort)하였을때 순서에 따라 가장 가우데 있는 값(middle value)를 의미한다. 자료의 갯수가 짝수개인경우 가운데 두값의 평균을 중앙값으로 사용한다. 표본중앙값은 표본평균과 달리 이상치에 영향을 받지 않은편으로 탐색적..
아재도 하는 통계
통계학에서의 자료 분석 단계 중 자료의 정리와 요약 법을 2장에서는 소개합니다. 자료의 종류는 해당되는 변수의 수에 따라 단일변량자료(univariate data) 다변량 자료(mulivariate data) 이변량 자료(bivariate data) 자료의 종류에 따라 질적자료(qualitative data) ==> 범주형 자료(categorical data) 양적 자료(quantitative or measurement data) 도수(count, frequency) : 각 범주와 범주에 속한 자료의 개수 도수분포표(frequency table) 상대 도수(relative frequency) R code 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22..