'문제만들기'에 해당되는 글 1건
- 2019.11.06 :: 2019년 자동차 데이터 분석
R 프로그래밍
2019. 11. 6. 13:42
네이버나 다음 등의 포털사이트에서 2019년 자동차 데이터를 수집하였습니다.
네이버 자동차 데이터 (https://auto.naver.com/car/lineup.nhn?yearsId=130559)
변수로는 모델, 가격, 연비(도시),연비(고속도로), 연료타입[가솔린, 디젤, 하이브리드], 제조사, 모델[세단,SUV], 차종, 국산/수입, 마력, 차중량을 사용하였습니다.
데이터는 총 303개 모았습니다.
수치형 변수들의 산점도
수치형 변수들의 상관계수
자동차 타입별 레이더 차트
비지도학습으로 군집을 6개로 나눈 그래프 (K-means 클러스터링)
Hierarchical 클러스터링(계층화) 결과, 그려진 모양에 맞춰서 빨간색으로 클러스터를 표현했습니다. 분류 시 2개 혹은 3개로 분류하는 것이 좋아보입니다.
R 코드와 데이터는 (https://github.com/sealwh/cars)에서 다운받으실 수 있습니다.
'R 프로그래밍' 카테고리의 다른 글
[R] ggplot2 발표 자료 코드 (0) | 2021.06.02 |
---|---|
GGPLOT2을 이용한 데이터 분석 (DIAMOND) (0) | 2019.11.06 |
설문조사를 통한 유튜브 특성 조사 (0) | 2019.11.06 |
[R프로그래밍] 통계관련함수 (0) | 2019.10.06 |
[R프로그래밍] 연산자 (0) | 2019.10.06 |