urllib, BeautifulSoup 으로 잡코리아 크롤링

import urllib

from bs4 import BeautifulSoup as bs

import pandas as pd

base_url = 'http://www.jobkorea.co.kr/Search/?stext={}&tabTy

def crawl(keyword, page_num):
    keyword = urllib.parse.quote(keyword)
    url = base_url.format(keyword,page_num)
    response = urllib.request.urlopen(url)
    soup = bs(response,'html.parser')
    name = [element.text for element in soup.select("a.name")][:19]
    detail = [element.text for element in soup.select("div.post-list-info > a.title")][:19]
    detail = [element.replace("\n","").replace("\r","") for element in detail]
    df = pd.DataFrame({'기업 이름' : name, '자세한 내용' : detail})
    return df

crawl("데이터",1)

df_list = [crawl("데이터", page) for page in range(1,10)]

df = df_list[0]
for i in range(len(df_list)-1):
    df = df.append(df_list[i+1])

df

df.to_excel("recuriut({}).xlsx", encoding='utf-8-sig')

저작자표시 (새창열림)

'Crawling' 카테고리의 다른 글

네이버 쇼핑 크롤링2_평점, 댓글수, (0)	2022.01.05
네이버 쇼핑 크롤링1_제목, url, 카테고리 (0)	2022.01.05
2. 네이버 블로그 내용 크롤링하기 (0)	2022.01.03
urllib.request 이용해 네이버뉴스 크롤링 (0)	2022.01.01
유튜브 영상 조회수 크롤러_youtube_crawl (0)	2021.12.31

왕초보 우당탕탕 고군분투 코딩배우기

urllib, BeautifulSoup 으로 잡코리아 크롤링

'Crawling' 카테고리의 다른 글

티스토리툴바

urllib, BeautifulSoup 으로 잡코리아 크롤링

'Crawling' 카테고리의 다른 글

'Crawling' Related Articles

티스토리툴바