본문 바로가기

데이터분석

(5)
#12 크롤링 맛보기와 HTML 연속, 데이터분석 입문_day12👍 🧑‍💻 12/29 슬기로운 코딩생활 크롤링 처음 해본 날. 크롬드라이버도 제대로 설치 못해서 강사님이 미리 짜놓으신 코드대로 엔터만 누른 거지만 돌아가는 게 신기함. 🖊️ 공부기록 네이버 사이트로 이동! 앞의 a 라는 태그는 href 라는 속성을 쥐고 있는 녀석. a 태그에 속해있는 속성중 하나가 href 인것! a태그의 하위로는 target, title 등이 있음
#9 교재로 다시 정리, 데이터분석 입문_day9🤪 🧑‍💻 12/23 슬기로운 코딩생활 데이터 과학을 위한 파이썬 프로그래밍/ 한빛 아카데미 진도 9~10장, 1장 ~ 3장까지 복습 연습문제 해답이 없는 게 아쉽다. 🖊️ 공부기록 *변수는 프로그램에서 특정값을 저장하는 공간의 이름을 의미한다. *파이썬에서 몫을 반환하는 연산자는 2개의 빗금기호(//)이고 나머지 연산자는 백분율 기호(%)이다. 증가연산과 감소 연산 a+= 1은 a = a+1 과 같은 뜻으로 사용된다. a-= 1은 a = a-1과 같은 뜻으로 사용된다. 정수형과 실수향 간 변환 a = float() → a를 실수형으로 변환 a = int() → a를 정수형으로 변환 → 소수점 이하의 내림이 발생한다는 사실 잊지 말기 a = str() → a를 변수형으로 변환 자료형 확인하기 → type()..
#7 NumPy시작, 데이터분석 입문_day7😬 🧑‍💻 12/21 슬기로운 코딩생활 1. 타이타닉 실제 데이터로 판다스 2. 넘파이 시작. 3. 일주일 내내 머리 아픈 점 : 강사 설명 들으면 쉬운 거 같은데 시트보면 머리가 하애지고 유튜브 보면 알 거 같은데 나보고 해보라면 못 하겠음 🖊️ 공부기록 NumPy pwd : 위치 1. Numpy arrays 1D array : axis0 2D array : axis0, axis1 3D array : axis0, axis1, axis2 2. Creating arrays a = np.array([1,2,3]) a —>array([1, 2, 3]) 이거는 일차원 구조 b = np.array([(1.5,2, 3), (4, 5, 6)], dtype=float) b —> array([[1.5, 2. , 3. ], ..
#6 미쳐버리겠네, 데이터분석 입문_day6😬 🧑‍💻 12/20 슬기로운 코딩생활 조나 어렵네.. 판다스 50번까지 복습(인데도 모르겠음) & 타이타닉 실제 데이터를 가지고 재복습 🖊️ 공부기록 *pwd : 내가 지금 어디에서 작업하고 있는지 알려주는 것 # Part 1 - Exploring Data import pandas as pd #데이터테이블 import numpy as np #수치계산 시각화 관련 라이브러리 import matplotlib.pyplot as plt # 시각화 plt.style.use('seaborn-whitegrid') # 스타일 적용 import seaborn as sns # 시각화 import missingno # null값 시각화 #데이터로드 test = pd.read_csv('data_titanic/test.csv')..
#5 판다스 배우기, 데이터분석 입문_day5😣 🧑‍💻 12/17 슬기로운 코딩생활 나 정도의 생초짜는 거의 없는 거 같네.. 완주를 목표로 하자 🖊️ 공부기록 1. Pandas 란? import pandas as pd import numpy as np 2. Pandas 자료구조 2-1. Series # Series 정의하기 obj = pd.Series([4, 7, -5, 3]) obj # Series의 값만 확인하기 obj.values # Series의 인덱스만 확인하기 obj.index # Series의 자료형 확인하기 obj.dtypes # python의 dictionary 자료형을 Series data로 만들 수 있다. # dictionary의 key가 Series의 index가 된다 sdata = {'Kim': 35000, 'Beomwoo':..