Python/project_practice

간단한 웹스크래핑 실행 파일 만들기

마게더 2022. 9. 14. 19:56
반응형

- 1. 사용 라이브러리 불러오기

데이터 프레임 활용 : pandas

데이터 전처리를 위한 : datime, re

웹 스크래핑을 위한 : bs4, urllib.request

 

2. list에 데이터를 append 하기 위한 빈 리스트 생성

 

3. 필요한 날짜 데이터 정의

 

4. 반복문에 사용될 번수를 페이지 번호로 설정

페이지 변수를 활용하여 1~10페이지까지 반복 범위 지정,

해당 웹페이지 스크래핑 - > 웹페이지 전체가 아닌 데이터가 포함된 일부 섹션 설정 (inven_contents 영역 설정) 

태그 추적을 통해 필요한 데이터 추출 

 

# select와 select_one 차이

# partition을 활용하여 슬라이싱 가능

# text / get_text() /.string 차이

 

5. 필요에 따라 데이터를 처리 및 가공

 

6. 설정된 서식에 따라 파일 저장

7. 저장된 파일 확인

pyinstaller를 활용하여 실행 exe 파일 생성

반응형