[Visualization] Visualization 3
Visualization3
- Polar Coordinate - 극 좌표계를 알아보자.
- Pie Charts - Pie Chart와 그의 변형들에 대하여 알아보자.
- 다양한 시각화 Libraries - matplotlib, seaborn 이외의 Missingno, Treemap, Waffle chart, Venn에 대하여 알아보자.
Polar Coordinate
- 극 좌표계를 사용하는 시각
- 거리(R), 각(Theta)을 사용하여 plot
- 회전, 주기성 등을 표현하기에 적합
- projection = polar을 추가하여 사용하여 subplot 이 polar형식으로 그림
Data Converting
- X = R \(\cos\theta\)
- Y = R \(\sin\theta\)
Radar Plot
- 극좌표계를 사용하는 대표적인 차트
- 별모양으로 생겨 Star Plot으로 불리기도 함
- 중심점을 기준으로 N개의 변수 값을 표현 가능
- 데이터의 Quality를 포현하기에 좋음
- 운동선수 분석
- 캐릭터 분석
- 비교
- 주의!!
- feature는 독립적이며, 척도가 같아야 한다.
- ex) 자동차를 예시로 들면
- 안전성 평가, 소비자 만족도 5점 만점
- 최대 속도, 연비 등 절대적 수치.
다음 그림은 feature를 정렬 했느냐 안했느냐의 차이지만, 전혀 다르게 보인다.
Pie Charts
- 원을 부채꼴로 분할하여 표현하는 통계 차트이다.
- 가장 많이 사용하는 차트이다.
- but 비교가 어렵다.
- 유용성 떨어짐.
- 오히려 bar plot이 더 유용하다 (각도 « 길이 비교가 더 쉽다.)
- 다른것들과 함께 사용하는 것을 권장한다.
- 후에 waffle chart가 더 유용하다.
같은 데이터로 Pie chart와 Bar Chart를 비교하며 장단점을 비교하자.
- 장점 : 비율 정보에 대한 정보를 제공할 수 있다.
- 단점 : 구체적인 양의 비교가 어렵다.
Donut Chart
- 중간이 비어있는 Pie Chart
- 디자인적으로 선호된다.
- Plotly에서 쉽게 사용 가능.
- 허나 이쁘지만 비교가 어렵다.
Sunburst Chart
- 햇살(sunburst)을 닮은 차트
- 계층적 데이터를 시각화하는 데 사용.
- 구현 난이도에 비해 화려하다.
다양한 시각화 라이브러리
Missingno
결측치를 시각화하는 missingno
- 결측치(missing value)를 체크하는 시각화 라이브러리
- 빠르게 결측 치의 분포를 확인하고 싶을 때 사용
- pip install missingno
Treemap
- 계층적 데이터를 직사각형을 사용하여 포함 관계를 표현한 시각화 방법
- 사각형을 분할하는 타일링 알고리즘에 따라 형태가 달라진다.(핵심!)
- 사각형을 분할하여 전체를 나타내는 모자이크 플롯과도 유사
python에서의 2가지 방법
- pip install squarify
- Ploty의 treemap 사용
Waffle Chart
- 와플 형태로 discrete하게 값을 나타냄
- barplot을 쪼개서 정사각형으로 나타낸것과 비슷하다.
- icon을 사용해 Waffle Chart도 사용 가능
- pip install pywaffle
Venn
벤 다이어그램
- 집합(set) 등에서 사용하는 벤 다이어그램
- ppt나 adobe로 그리는 것이 훨씬 편하다.(추천안함)
- 최대한 지양한다.
- pip install pyvenn
- pip install matplotlib-venn
Comments