-
게시글 정보 추출Project/셔틀버스 결행 알리미 2023. 2. 12. 15:20
# 사용한 개발 언어: Python 3.10
# 사용한 패키지: Request, BeautifulSoup
학교 홈페이지의 공지사항 게시판은 '정적 페이지'로 BeautifulSoup을 이용하여 손쉽게 정보를 추출할 수 있었다.
많은 공지 게시글 중에서 셔틀버스와 관련된 게시글만 가져오기 위해 '셔틀' 이란 단어를 검색해 나온 결과를 가져왔다. 이후 게시글의 제목과 URL을 추출하였다.
게시글의 URL를 비교해 보면 '&nttNo=' 뒤의 숫자만 다른 것을 확인할 수 있다.
이것으로 '&nttNo=' 뒤에 나오는 숫자가 게시글의 고유 번호인 것을 알 수 있었다.
실제로 다른 게시판의 글일지라도 '&nttNo=' 뒤의 숫자만 변경하면 해당 게시글로 이동할 수 있었다.
따라서 해당 게시글 번호를 DB의 pk로 지정하여 새로운 게시글이 등록되었는지 판단하는 데 사용하면 될 것 같다.
이후에는 DB와 연동하여 게시글 번호를 기록하고, 새 게시글을 판단하여 새 게시글에 대한 정보만 가져와 추출하는 과정이 필요해 보인다.
'Project > 셔틀버스 결행 알리미' 카테고리의 다른 글
(Patch) 알림 누락과 실수 (0) 2023.09.26 서비스 배포 및 운영 (0) 2023.05.06 텔레그램 채널 연동 (0) 2023.02.13 기획 (0) 2023.02.11