청소년과 청년을 대상으로 한 데이터 분석 교육을 준비하며, YouTube 영상 댓글 데이터를 크롤링하여 텍스트 마이닝 기법으로 분석하고 워드클라우드로 시각화하는 프로젝트를 진행했습니다. 실제 사용자 반응을 수집·분석하는 과정을 통해 데이터 기반 인사이트를 도출하는 경험을 쌓았으며, 이 과정에서 웹 크롤링과 데이터 시각화 역량을 함께 강화할 수 있었습니다.
교안 내용
100% 외부 공유가 불가능하여, 일부 교안과 코드만 공유합니다.
총 47쪽 분량의 교안으로 구성되어 있습니다.
교안 일부 내용
일부 코드 - 크롤링, 워드클라우드
크롤링
워드클라우드
사용 기술 및 기술 스택
Python 환경: Anaconda
데이터 수집
selenium, webdriver_manager → 동적 웹 크롤링
BeautifulSoup → HTML 파싱
pandas → 크롤링한 댓글 데이터 저장(csv)
데이터 분석 & 시각화
pandas → 텍스트 데이터 처리
wordcloud → 댓글 키워드 빈도 기반 워드클라우드 생성
matplotlib → 시각화 출력
PIL, numpy → 사용자 정의 마스크 이미지 적용
주요 특징
자동화된 데이터 수집: YouTube 페이지에서 댓글을 스크롤 다운하며 자동으로 크롤링 → CSV 파일로 저장