본문 바로가기

국비교육 빅데이터 분석과정 수업일지

#1 작은발자국, 데이터분석 입문_day1 😊

 

🧑‍💻
12/13 SmallStep Start !

코딩에 대해 하나도 아는 게 없고 관심도 없었다.

데이터 수집 및 분석을 위해 배우는 파이썬 입문 과정 시작합니다.

 

💡
커리큘럼

파이썬 기초 - 파이썬 환경설정 및 파이썬 기초

파이썬 응용 - 웹크롤링, 데이터 시각화, 자연어처리

인공지능 심화 - 머신러닝, 딥러닝

 

➡️
포트폴리오 방향성

포트폴리오 방향성은 꾸준히 고민 !

포트폴리오 예시

  • 인플루언서 리뷰 분석한 마케팅 전략)
  • 이모티콘을 많이 쓰는 사람들의 구매패턴 분석
  • 한국어에 맞는 의역을 적용한 번역 데이터 분석

 

파이썬으로 할 수 있는 건?

  • 웹사이트 개발 (프레임워크 활용 ← Django, Flask)
  • 데이터 수집 및 미래 예측 수집(크롤링) → 시각화 → 추천시스템

 

🖊️
공부기록

1. 기본 개념

  • 디렉토리 = 폴더
  • 코딩은 기본적으로 계산기
  • SyntaxError: invalid syntax : 문법오류
  • 대부분 에러는 오타 때문! → Tab 자동완성을 잘 활용하자 (굵게 ctrl + b)
  • 따옴표 안에 있는 건 "문자" '문자'
  • 문자열 안에 따옴표 넣고 싶으면 겉 -> 큰 따옴표 혹은 백슬래시
  • 따옴표 없으면 변수

🙂'Tab'키로 자동완성 !

  • 함수정의 → 세글자정도 입력 후 tab키
  • 자동완성 예시
    1. lottery = [3,1,21,15,152,124] #lottery 변수정의
    2. lot 입력 → tab키 → lottery 자동완성

 

2. 개발환경 세팅, 파이썬 기초!

주피터 노트북 세팅

  • 설치할 때 All User + Path 추가로 해줘야 함. (아니면 따로 환경변수 설정해야함)

Jupyter

  • code - 코딩
  • markdown-제목 달 때
  • Raw - 메모장
  • 프롬프트 the prompt -명령어(코드)를 파이썬 프롬포트에 입력하면 파이썬이 응답
  • 연산자 operators - +나 *같은 연산자를 사용한다
  • ## 설명 -> 제목 달기

 

함수 vs 메소드

  • 메소드는 함수의 일부, 특정 자료형에만 사용함ex) upper 메소드는 문자열에만 사용 가능. ex) jjs.upper() → JJS
  • 함수는 ex) len("jjs") → 3
  • 메소드 (Method)- 문자열에서만 쓸 수 있는 명령어 예> "ola".upper() → OLA
  • 함수 -문자열, 숫자 등 여러 객체 사용 가능 예> len("ola") → 글자수

 

변수

: 여러 번 사용될 수 있게 이름을 붙인 것

= (==와 다르다는 점 주의)

  • print()는 함수 안에 있는 내용을 출력할 때, 여러 내용을 확인하고 싶을 때 유용하게 사용

 

데이터 보관소 : 리스트, 딕셔너리

문자열과 정수 외에 객체를 정렬할 수 있는 방법

 

 

리스트 vs 딕셔너리

  • 리스트(list) : 서로 다른 객체를 일렬로 나열한 것
  • 딕셔너리(dictionary) : 이름을 사용해 값을 찾는 것. 리스트와 유사하지만 인덱스가 아닌 키로 값을 찾는다.
  • 키는 문자든 숫자든 상관 없다. 키(key)와 값(value)이 서로 연관되어 있거나 효과적으로 어떤 값을 찾을 때.
  • 딕셔너리는 리스트와 유사하지만 변경 가능. 즉 키, 값을 나중에  추가 가능

리스트 정렬

  • lottery. sort() → 정렬
  • lottery. reverse() -> 내림차순 정렬
  • lottery.append() → 값 추가

리스트 인덱싱

  • 첫 번째 숫자 하나만 보여주고 싶다면 인덱스(indexes)사용
  • 인덱스는 리스트 내 아이템 "위치"를 나타내는 숫자고 0부터 세는 것
  • print(lottery[])

딕셔너리

  • {}
  • 예> participant = {'name' : 'ola', 'country' = 'poland', 'favorite_numbers' : [7,22,32]}
  • 여기서 키(key)는 name, countrym favorite_numbers고
  • 값(value)은 ola, poland, 7,22,32
  • 개별 키의 값에 접근하려면 인덱스가 아닌 이름을 이용해 찾음

 


3. 기본 기능

  • 숫자 사이 왔다갔다 → alt + 화살표
  • 코드실행 : ctrl + enter, shift + enter
  • 자동완성 : 3글자 입력하고 tab
  • 위에 라인 추가 a
  • 아래에 라인 추가 b
  • 라인 제거 dd
  • 라인 나누기 ctrl + shift + -
  • 라인 합치기 shift + M
  • 들여쓰기 tab
  • 내어쓰기 shift + tab
  • 되돌리기 ctrl + z
  • 되돌리기 취소 ctrl + y