데이터분석Python교안제작

[교안 제작] 내가 좋아하는 유튜브 영상 댓글 수집하고 한눈에 보기!

Chae-hyeon Kim
2022년 11월 8일

프로젝트명

내가 좋아하는 유튜브 영상 댓글 수집하고 한눈에 보기!(크롤링 및 워드클라우드 시각화)

프로젝트 소개

청소년과 청년을 대상으로 한 데이터 분석 교육을 준비하며, YouTube 영상 댓글 데이터를 크롤링하여 텍스트 마이닝 기법으로 분석하고 워드클라우드로 시각화하는 프로젝트를 진행했습니다. 실제 사용자 반응을 수집·분석하는 과정을 통해 데이터 기반 인사이트를 도출하는 경험을 쌓았으며, 이 과정에서 웹 크롤링과 데이터 시각화 역량을 함께 강화할 수 있었습니다.

교안 내용

  • 100% 외부 공유가 불가능하여, 일부 교안과 코드만 공유합니다.
  • 총 47쪽 분량의 교안으로 구성되어 있습니다.

교안 일부 내용

%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA_2025-09-21_%E1%84%8B%E1%85%A9%E1%84%92%E1%85%AE_5.05.23.png

%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA_2025-09-21_%E1%84%8B%E1%85%A9%E1%84%92%E1%85%AE_5.05.05.png

%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA_2025-09-21_%E1%84%8B%E1%85%A9%E1%84%92%E1%85%AE_5.05.14.png


일부 코드 - 크롤링, 워드클라우드

  • 크롤링

image.png

  • 워드클라우드

image.png


사용 기술 및 기술 스택

  • Python 환경: Anaconda
  • 데이터 수집
    • selenium, webdriver_manager → 동적 웹 크롤링
    • BeautifulSoup → HTML 파싱
    • pandas → 크롤링한 댓글 데이터 저장(csv)
  • 데이터 분석 & 시각화
    • pandas → 텍스트 데이터 처리
    • wordcloud → 댓글 키워드 빈도 기반 워드클라우드 생성
    • matplotlib → 시각화 출력
    • PIL, numpy → 사용자 정의 마스크 이미지 적용

주요 특징

  • 자동화된 데이터 수집: YouTube 페이지에서 댓글을 스크롤 다운하며 자동으로 크롤링 → CSV 파일로 저장
  • 텍스트 전처리: 댓글 내용을 문자열로 변환하고 불필요한 텍스트를 제거
  • 워드클라우드 시각화:
    • 댓글에서 가장 많이 등장하는 단어를 시각적으로 표현
    • 마스크 이미지를 적용해 특정 모양(예: 캐릭터, 아이콘)으로 워드클라우드 생성
  • 결과물: 사용자가 작성한 댓글 키워드의 전반적 경향을 직관적으로 확인 가능