2020/05

오늘은 지난번 포스팅에 이어 두 번째로 식품섭취량 조사 DB를 가지고 데이터 탐색을 해보겠습니다. 지난번 포스팅을 못 보신 분들은 먼저 보시면 됩니다. [데이터소개] 국민건강영양조사 1편 [데이터 소개] 국민건강영양조사 1편(Feat. 질병관리본부 KCDC) 들어가며 코로나-19(COVID-19) 사태로 대한민국에서 가장 바쁜신 분들이 바로 질병관리본부 직원들이지 않을까 싶습니다. (국민의 한사람으로서 이 자리를 빌어 감사의 인사를 전합니다.) 오늘은 �� uincity.tistory.com 식품섭취조사(hn18_24rc) 데이터 탐색 DataExplorer 패키지로 살펴보기 해당 파일은 509,819개의 데이터(rows)와 114개의 변수(columns)로 되어 있습니다. 1 2 > dim(df_hn1..
들어가며 코로나-19(COVID-19) 사태로 대한민국에서 가장 바쁜신 분들이 바로 질병관리본부 직원들이지 않을까 싶습니다. (국민의 한사람으로서 이 자리를 빌어 감사의 인사를 전합니다.) 오늘은 그 질병관리본부에서 관리하고 조사하는 '국민건강영양조사'라는 데이터를 소개해 볼까 합니다. 제목에서 느껴지시겠지만 건강과 영양섭취에 대한 우리나라 국가 통계입니다. 아래 최근 기사를 보시면 국민건강영양조사를 통해 코로나19의 면역여부를 체크해보겠다는 내용같습니다. 코로나19 집단면역 조사한다... 당국 "국민영양조사 통해 확인" - 연합뉴스 2020-04-30 코로나19 집단면역 조사한다…당국 "국민영양조사 통해 확인"(종합) | 연합뉴스 코로나19 집단면역 조사한다…당국 "국민영양조사 통해 확인"(종합), 신..
들어가며 간만에 돌아왔습니다. 오늘은 한우 사육량 데이터를 가지고 데이터 시각화를 통해서(쉬운 말로 그림과 도표를 잘 그려서) 인사이트(Insight)를 도출해보도록 하겠습니다. (데이터에서 어떤 의미를 알아내어 보자) R에서는 기본적인 plot 외에도 ggplot2라는 막강한 패키지가 데이터 시각화를 주도하고 있습니다. ggplot의 gg의 의미가 grammar of Graphics라는 의미로 그래픽을 문법(텍스트 명령어)으로 나타낸다는 의미입니다. 그래서 각종 명령어와 함수를 익혀놓으면 강력한 시각화가 가능합니다만, 역시 익숙해지기 전까지는 어려운 영역이기도 합니다. 제가 전에 포스팅했던 대부분의 데이터 분석 포스팅에도 미약하지만 ggplot을 대부분 사용했었습니다. 그만큼 필수적이기도 합니다. 데이..
열심남
'2020/05 글 목록