관리 메뉴

FU11M00N

[Python] 웹 크롤링으로 내 블로그 제목만 출력하기 본문

Programming/Python

[Python] 웹 크롤링으로 내 블로그 제목만 출력하기

호IT 2020. 11. 6. 00:26

 

## parser.py
import requests
from bs4 import BeautifulSoup

## HTTP GET Request
req = requests.get('https://nevertrustbrutus.tistory.com/')
## HTML 소스 가져오기
html = req.text

soup = BeautifulSoup(html, 'html.parser')

my_titels= soup.select('strong.tit_post ')

index = 0
for key in my_titels:
    index += 1
    print(str(index) + ", " + key.text)
    if index >= 20:
        break

BeautifulSoup 을 이용해서 크롤링하기.

 

관리자도구 소스

 

현재 제목을 보면 Strong 태그에 class는 tit_post임.

그럼 soup.select를 이용해서 strong.tit_post를 뽑아옴.

 

출력 값

 

학교 영어 수업때 교수님이 갑자기 아무거나 데이터를 크롤링 하라고해서

10분만에 급조해서 만든 코드..

 

아래 사이트를 참조했습니다. 매우 설명이 잘 되어있음.

https://blockdmask.tistory.com/385

Comments