Notice
Recent Posts
Recent Comments
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 자바스크립트
- 자바스크립트 기본 문법
- 자바스크립트 API
- GIT
- 카카오프로젝트100
- 파이썬
- oracle
- Oracle SQL
- 보안뉴스
- 자바스크립트 element api
- 깃허브
- 카카오프로젝트
- 다크웹
- php
- 카카오프로젝트 100
- ES6
- 자바스크립트 node
- 보안뉴스 한줄요약
- 자바스크립트 jQuery
- 보안뉴스요약
- 오라클
- 보안뉴스 요약
- oracle db
- 랜섬웨어
- 자바스크립트 prototype
- 자바스크립트 객체
- 보안뉴스한줄요약
- python
- numpy
- javascript
Archives
- Today
- Total
FU11M00N
[Python] 웹 크롤링으로 내 블로그 제목만 출력하기 본문
## parser.py
import requests
from bs4 import BeautifulSoup
## HTTP GET Request
req = requests.get('https://nevertrustbrutus.tistory.com/')
## HTML 소스 가져오기
html = req.text
soup = BeautifulSoup(html, 'html.parser')
my_titels= soup.select('strong.tit_post ')
index = 0
for key in my_titels:
index += 1
print(str(index) + ", " + key.text)
if index >= 20:
break
BeautifulSoup 을 이용해서 크롤링하기.
현재 제목을 보면 Strong 태그에 class는 tit_post임.
그럼 soup.select를 이용해서 strong.tit_post를 뽑아옴.
학교 영어 수업때 교수님이 갑자기 아무거나 데이터를 크롤링 하라고해서
10분만에 급조해서 만든 코드..
아래 사이트를 참조했습니다. 매우 설명이 잘 되어있음.
'Programming > Python' 카테고리의 다른 글
[Python] 파이썬 생성자와 소멸자 (0) | 2020.11.10 |
---|---|
[Python] 파이썬 클래스와 메소드 ,객체,변수 (0) | 2020.11.10 |
[Python] write() byte, str 타입 에러 (0) | 2020.10.17 |
[python] 리눅스 에서 파이썬 여러버전 사용하기(업그레이드 or 다운그레이드)Alternatives 활용 (0) | 2020.10.14 |
[Python] 파일 입출력 (0) | 2020.10.13 |
Comments