ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 게시글 정보 추출
    Project/셔틀버스 결행 알리미 2023. 2. 12. 15:20

    # 사용한 개발 언어: Python 3.10

    # 사용한 패키지: Request, BeautifulSoup

     

    학교 홈페이지의 공지사항 게시판은 '정적 페이지'로 BeautifulSoup을 이용하여 손쉽게 정보를 추출할 수 있었다.

    많은 공지 게시글 중에서 셔틀버스와 관련된 게시글만 가져오기 위해 '셔틀' 이란 단어를 검색해 나온 결과를 가져왔다. 이후 게시글의 제목과 URL을 추출하였다.

     

    게시글의 URL를 비교해 보면  '&nttNo=' 뒤의 숫자만 다른 것을 확인할 수 있다.

    이것으로 '&nttNo='  뒤에 나오는 숫자가 게시글의 고유 번호인 것을 알 수 있었다.

    실제로 다른 게시판의 글일지라도 '&nttNo='  뒤의 숫자만 변경하면 해당 게시글로 이동할 수 있었다.

    따라서 해당 게시글 번호를 DB의 pk로 지정하여 새로운 게시글이 등록되었는지 판단하는 데 사용하면 될 것 같다.

     

    이후에는 DB와 연동하여 게시글 번호를 기록하고, 새 게시글을 판단하여 새 게시글에 대한 정보만 가져와 추출하는 과정이 필요해 보인다.

     

    'Project > 셔틀버스 결행 알리미' 카테고리의 다른 글

    (Patch) 알림 누락과 실수  (0) 2023.09.26
    서비스 배포 및 운영  (0) 2023.05.06
    텔레그램 채널 연동  (0) 2023.02.13
    기획  (0) 2023.02.11