'데이터 분석'에 해당되는 글 1건

  1. 2019.11.06 :: 2019년 자동차 데이터 분석
R 프로그래밍 2019. 11. 6. 13:42

네이버나 다음 등의 포털사이트에서 2019년 자동차 데이터를 수집하였습니다.

네이버 자동차 데이터 (https://auto.naver.com/car/lineup.nhn?yearsId=130559)

 

변수로는 모델, 가격, 연비(도시),연비(고속도로), 연료타입[가솔린, 디젤, 하이브리드], 제조사, 모델[세단,SUV], 차종, 국산/수입, 마력, 차중량을 사용하였습니다.

 

데이터는 총 303개 모았습니다.

 

수치형 변수들의 산점도

수치형 변수들의 상관계수

자동차 타입별 레이더 차트

비지도학습으로 군집을 6개로 나눈 그래프  (K-means 클러스터링)

Hierarchical 클러스터링(계층화) 결과, 그려진 모양에 맞춰서 빨간색으로 클러스터를 표현했습니다. 분류 시 2개 혹은 3개로 분류하는 것이 좋아보입니다.

 

R 코드와 데이터는 (https://github.com/sealwh/cars)에서 다운받으실 수 있습니다.

posted by 스노(Snow)
: