PORTFOLIO
실무 중심의 디지털 핵심 역량 프로젝트
'팀프리즘' 팀
- 지능형 미디어 분석 시스템
- 수강과정
- [ IBM x RedHat ]
- 수강기간
- 25.08.26~26.02.24
- 팀원
-
박O(컴퓨터학과),노O우(경제학과),심O준(섬유패션비즈니스학과)
이O혁(산업디자인학과),전O식(International Studies) - 주요 기술
-
- Auto-Craw ling Pipeline : BeautifulSoup4 기반 DOM 분석 및 main.py 자동화 파이프라인 구축
- Data Processing : HTML 태그 제거 및 정제 후 DB 적재,기사/사용자 엔드포인트 구현 - 프로젝트 소개
-
지능형 미디어 분석 시스템은 주기적으로 기사를 크롤링 해온 후, 이슈별로 기사들을 Clustering 합니다.
이들은 임베딩 벡터 정보로 변환되어 Vector DB에 저장되며, 추후 RAG로 이용이 가능합니다.
이후 각 군집마다 LLM이 기사들을 요약하여, 최대한 언론사의 주관이 묻지 않은 객관적인 기사를 쓰도록 유도합니다.
독자들은 LLM이 쓴 기사가 어떤 언론사의 어떤 기사를 참고하여 썼는지 알 수 있습니다.
- Part1 프로젝트 목록 확립
- Part2 프로젝트 개발 사항
- Part3 기능 개발
- Part4 문제점 개선



