[파이썬 초급 연습문제 #17] Web page 번역하기 (Decode A Web Page)

2019. 8. 28. 15:56컴퓨터_Com/파이썬 초급 연습문제_Exercise for bigginers

From www.practicepython.org 

 

Exercise 17: beutifulSoup과 requests 라이브러리를 이용하여 파이썬이 New Your Times의 모든 기사제목을 출력하는 프로그램을 만들어라. (New York Times homepage)


라이브러리(Libraries)

파이썬에는 다른 사람들이 이미 만들어 놓은 라이브러리가 매우 많이 존재한다. (예 : random) 라이브러리를 사용하기 위해서는 아래와 같은 순서를 따른다. 

1. 라이브러리를 설치한다.

2. import 한다. (예: import random)

3. 사용 시 라이브러리에 대한 문서를 참고한다. 

requests 라이브러리

파이썬의 라이브러리중 하나인 requests는 HTTP를 다루는 데에 사용된다. 예를 들어 아래와 같이 웹사이트의 HTML를 출력할 수 있다. 

 

1
2
3
4
5
6
import requests
 
url = 'http://github.com'
= requests.get(url)
r_html = r.text
print(r_html)
cs

 

BeautifulSoup 라이브러리

BeautifulSoup 라이브러리는 HTML 문서를 구조화하여 우리가 이해하기 쉽게 도와준다. 

 

1
2
3
4
5
from bs4 import BeautifulSoup
 
soup = BeautifulSoup(r_html)
title = soup.find('span''articletitle')
print(title)
cs

 


풀이

https://gist.github.com/mprat/df2969142a75b668456c#file-decode-web-page-no-comments-py 참조