링크가 복사되었습니다!
PORTFOLIO

실무 중심의 디지털 핵심 역량 프로젝트

'팀프리즘' 팀
프로젝트
지능형 미디어 분석 시스템
수강과정
[ IBM x RedHat ]
수강기간
25.08.26~26.02.24
팀원
박O(컴퓨터학과),노O우(경제학과),심O준(섬유패션비즈니스학과)
이O혁(산업디자인학과),전O식(International Studies)
주요 기술
- Auto-Craw ling Pipeline : BeautifulSoup4 기반 DOM 분석 및 main.py 자동화 파이프라인 구축
- Data Processing : HTML 태그 제거 및 정제 후 DB 적재,기사/사용자 엔드포인트 구현
프로젝트 소개
지능형 미디어 분석 시스템은 주기적으로 기사를 크롤링 해온 후, 이슈별로 기사들을 Clustering 합니다.
이들은 임베딩 벡터 정보로 변환되어 Vector DB에 저장되며, 추후 RAG로 이용이 가능합니다.
이후 각 군집마다 LLM이 기사들을 요약하여, 최대한 언론사의 주관이 묻지 않은 객관적인 기사를 쓰도록 유도합니다.
독자들은 LLM이 쓴 기사가 어떤 언론사의 어떤 기사를 참고하여 썼는지 알 수 있습니다.
  • Part1 프로젝트 목록 확립
  • Part2 프로젝트 개발 사항
  • Part3 기능 개발
  • Part4 문제점 개선
포트폴리오
포트폴리오
포트폴리오
포트폴리오