파이썬 시각화 차트 종류
1. Column/Bar chart
2. Dual Axis, 파레토 chart
3. Pie chart
4. Line chart
5. Scatter chart
6. Bubble chart
7. Heat map
8. Histogram
9. Box plot
10. Geo chart
pwd
# 필요한 라이브러리 임포트
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt # 시각화 라이브러리
import seaborn as sns # 시각화 라이브러리
from tqdm import tqdm_notebook # for문 진행상황을 게이지로 알려줌
# 파이썬 warning 무시
import warnings
warnings.filterwarnings(action='ignore')
#!pip install selenium
import re
import selenium
1. column 차트
marathon_2015_2017 = pd.read_csv('./marathon_2015_2017.csv') #정 위치설정 어려우면 새폴더 만들어서 모든 자료 한 장소에 두기
# 미국인 데이터만 가져오기
USA_runner = marathon_2015_2017[marathon_2015_2017.Country=='USA']
print(USA_runner.shape)
USA_runner.head(10)
USA_runner.info()
(1) State 별 runner 수
# column 그래프 그리기(필수)
plt.figure(figsize=(20, 7)) # 그래프 크기
runner_state = sns.countplot('State', data=USA_runner) # 그래프 함수 : sns.countplot() 사용
# column 그래프 부가 설명(옵션)
runner_state.set_title('Number of runner by State - USA', fontsize=25) # 제목
runner_state.set_xlabel('State', fontdict={'size':16}) # x축 이름
runner_state.set_ylabel('Number of runner', fontdict={'size':16}) # y축 이름
plt.show()
-> MA주가 가장 참가자 수가 많다. 남/녀 누가 더 많이 참가했을까?
(2) State, Gender 별 runner 수
# column 그래프 그리기(필수)
plt.figure(figsize=(20, 10)) # 그래프 크기
runner_state = sns.countplot('State', data=USA_runner, hue='M/F', palette={'F':'g', 'M':'r'}) # 그래프 함수 : sns.countplot() 사용
# hue : 칼럼명 기준으로 데이터 구분해줌
# column 그래프 부가 설명(옵션)
runner_state.set_title('Number of runner by State, Gender - USA', fontsize=18) # 제목
runner_state.set_xlabel('State', fontdict={'size':16}) # x축 이름
runner_state.set_ylabel('Number of runner', fontdict={'size':16}) # y축 이름
plt.show()
(3) 년도별 runner 수
# column 그래프 그리기(필수)
plt.figure(figsize=(20, 10)) # 그래프 크기
runner_state = sns.countplot('State', data=USA_runner, hue='Year') # 그래프 함수 : sns.countplot() 사용
# hue : 칼럼명 기준으로 데이터 구분해줌
# column 그래프 부가 설명(옵션)
runner_state.set_title('Number of runner by State, Year - USA', fontsize=18) # 제목
runner_state.set_xlabel('State', fontdict={'size':16}) # x축 이름
runner_state.set_ylabel('Number of runner', fontdict={'size':16}) # y축 이름
plt.show()
'Crawling > 데이터 시각화' 카테고리의 다른 글
데이터시각화_10가지_Scatter chart (0) | 2022.01.06 |
---|---|
데이터시각화_10가지_Line chart (0) | 2022.01.06 |
데이터시각화_10가지_Pie chart (0) | 2022.01.06 |
데이터시각화_10가지_Dual Axis, 파레토 chart (0) | 2022.01.06 |
pandas다루기_마라톤_시각화 (0) | 2022.01.06 |