Python 지니 차트 크롤링하기
파이썬으로 웹 크롤링 하기!! 조원분들과 토이 프로젝트를 진행하고 있었다주제는 Vector DB와 RAG를 구축하여 사연을 받고 해당 사연과 비슷한 감성의 노래를 Vector DB에서 찾아 추천해주는 시스템이다. LLM은 gpt-4o-mini를 썻던 걸로 기억한다 내가 맡은 부분은 Vector DB에 넣을 노래 자료, 제목, 가수, 가사를 크롤링해서 1000개 준비하기!!일단 지니차트에서 TOP 200을 2025년,24년,23년,22년,21년 자료를 가지고 온다. 이 때 가사까지는 못 가지고 오니제목과 가수만 가지고 온다 import requestsfrom bs4 import BeautifulSoupimport datetimeimport timeimport jsondef crawl_genie_chart_..