* BeautifulSoup
1. html문서에서 원하는 정보를 손쉽게 가져올 수 있는 방법을 제공
2. 자동으로 인코딩을 유니코드로 변환해서 UTF-8로 출력
3. lxml, html5lib 파서를 이용함
* Scrapy
1. web scraper framework
2. 다양한 selector 지원
3. 파이프 라인
4. 로깅
5. 이메일
'개발 > Python' 카테고리의 다른 글
zlib Decompress issue (0) | 2019.02.12 |
---|---|
방화벽 로그파일 파싱 및 DB 연동 (0) | 2019.01.06 |
크롤링(Crawling)이란? 또는 파싱(Parsing)이란? 스크래핑이란? (0) | 2019.01.06 |