TL;DR 기존 Trafilatura + Requests 조합은 JavaScript 기반 사이트에서 본문 추출 한계 발생 Playwright 도입 후 requests에서 실패한 biz.chosun.com 등은 100% 추출 성공 www.msn.com 등 일부 사이트는 여전히 추출 실패, 특화된 로직 필요 처리 속도는 requests 대비 평균 10배 감소하여 성능 최적화 필요 Playwright 병렬화를 통한 처리 시간 단축이 핵심 개선 과제 향후 개선 ..