본문 바로가기

Crawling/데이터 시각화

데이터시각화_10가지_Column/Bar chart

파이썬 시각화 차트 종류

1. Column/Bar chart
2. Dual Axis, 파레토 chart
3. Pie chart
4. Line chart
5. Scatter chart
6. Bubble chart
7. Heat map
8. Histogram
9. Box plot
10. Geo chart

 

pwd
# 필요한 라이브러리 임포트
import pandas as pd
import numpy as np

import matplotlib.pyplot as plt  # 시각화 라이브러리
import seaborn as sns            # 시각화 라이브러리

from tqdm import tqdm_notebook   # for문 진행상황을 게이지로 알려줌

# 파이썬 warning 무시
import warnings
warnings.filterwarnings(action='ignore')
#!pip install selenium
import re
import selenium

 

1. column 차트

marathon_2015_2017 = pd.read_csv('./marathon_2015_2017.csv') #정 위치설정 어려우면 새폴더 만들어서 모든 자료 한 장소에 두기
# 미국인 데이터만 가져오기
USA_runner = marathon_2015_2017[marathon_2015_2017.Country=='USA']
print(USA_runner.shape)
USA_runner.head(10)
USA_runner.info()

 

(1) State 별 runner 수

# column 그래프 그리기(필수)
plt.figure(figsize=(20, 7))                                # 그래프 크기
runner_state = sns.countplot('State', data=USA_runner)      # 그래프 함수 : sns.countplot() 사용

# column 그래프 부가 설명(옵션)
runner_state.set_title('Number of runner by State - USA', fontsize=25)   # 제목
runner_state.set_xlabel('State', fontdict={'size':16})                   # x축 이름
runner_state.set_ylabel('Number of runner', fontdict={'size':16})        # y축 이름
plt.show()

-> MA주가 가장 참가자 수가 많다. 남/녀 누가 더 많이 참가했을까?

 

 

(2) State, Gender 별 runner 수

# column 그래프 그리기(필수)
plt.figure(figsize=(20, 10))                                                                   # 그래프 크기
runner_state = sns.countplot('State', data=USA_runner, hue='M/F', palette={'F':'g', 'M':'r'})  # 그래프 함수 : sns.countplot() 사용
                                                      # hue : 칼럼명 기준으로 데이터 구분해줌
# column 그래프 부가 설명(옵션)
runner_state.set_title('Number of runner by State, Gender - USA', fontsize=18)   # 제목
runner_state.set_xlabel('State', fontdict={'size':16})                   # x축 이름
runner_state.set_ylabel('Number of runner', fontdict={'size':16})        # y축 이름
plt.show()

 

(3) 년도별 runner 수

# column 그래프 그리기(필수)
plt.figure(figsize=(20, 10))                                                                   # 그래프 크기
runner_state = sns.countplot('State', data=USA_runner, hue='Year')  # 그래프 함수 : sns.countplot() 사용
                                                      # hue : 칼럼명 기준으로 데이터 구분해줌
# column 그래프 부가 설명(옵션)
runner_state.set_title('Number of runner by State, Year - USA', fontsize=18)   # 제목
runner_state.set_xlabel('State', fontdict={'size':16})                   # x축 이름
runner_state.set_ylabel('Number of runner', fontdict={'size':16})        # y축 이름
plt.show()