반응형
- 1. 사용 라이브러리 불러오기
데이터 프레임 활용 : pandas
데이터 전처리를 위한 : datime, re
웹 스크래핑을 위한 : bs4, urllib.request
2. list에 데이터를 append 하기 위한 빈 리스트 생성
3. 필요한 날짜 데이터 정의
4. 반복문에 사용될 번수를 페이지 번호로 설정
페이지 변수를 활용하여 1~10페이지까지 반복 범위 지정,
해당 웹페이지 스크래핑 - > 웹페이지 전체가 아닌 데이터가 포함된 일부 섹션 설정 (inven_contents 영역 설정)
태그 추적을 통해 필요한 데이터 추출
# select와 select_one 차이
# partition을 활용하여 슬라이싱 가능
# text / get_text() /.string 차이
5. 필요에 따라 데이터를 처리 및 가공
6. 설정된 서식에 따라 파일 저장
7. 저장된 파일 확인
pyinstaller를 활용하여 실행 exe 파일 생성
반응형
'Python > project_practice' 카테고리의 다른 글
게임 산업 뉴스 데일리 메일 서비스 (0) | 2023.02.17 |
---|---|
구글 플레이 리뷰 감성어 분석 워드클라우드 (1) | 2022.09.21 |