Crawling
XML(RSS) 스크레이핑 후 파싱하기_날씨
km1n
2022. 1. 5. 14:23
# 서울/경기도 지역의 날씨
https://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp?stnId=109
import sys
from urllib.request import urlopen
# urlopen() 함수는 HTTPResponse 자료형의 객체를 반환합니다.
f = urlopen('https://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp?stnId=109')
# bytes 자료형의 응답 본문을 일단 변수에 저장합니다.
bytes_content = f.read()
# 추출한 인코딩으로 다시 디코딩합니다.
text_xml = bytes_content.decode('utf-8')
# 응답 본문을 표준 출력에 출력합니다.
print(text_xml)
# 파일로 저장하기
xml_file = open('rss.xml', 'w')
xml_file.write(text_xml)
xml_file.close()