데이터분석Python교안제작
[교안 제작] 내가 좋아하는 유튜브 영상 댓글 수집하고 한눈에 보기!
Chae-hyeon Kim
2022년 11월 8일
목차
프로젝트명
내가 좋아하는 유튜브 영상 댓글 수집하고 한눈에 보기!(크롤링 및 워드클라우드 시각화)
프로젝트 소개
청소년과 청년을 대상으로 한 데이터 분석 교육을 준비하며, YouTube 영상 댓글 데이터를 크롤링하여 텍스트 마이닝 기법으로 분석하고 워드클라우드로 시각화하는 프로젝트를 진행했습니다. 실제 사용자 반응을 수집·분석하는 과정을 통해 데이터 기반 인사이트를 도출하는 경험을 쌓았으며, 이 과정에서 웹 크롤링과 데이터 시각화 역량을 함께 강화할 수 있었습니다.
교안 내용
- 100% 외부 공유가 불가능하여, 일부 교안과 코드만 공유합니다.
- 총 47쪽 분량의 교안으로 구성되어 있습니다.
교안 일부 내용



일부 코드 - 크롤링, 워드클라우드
- 크롤링

- 워드클라우드

사용 기술 및 기술 스택
- Python 환경: Anaconda
- 데이터 수집
- selenium, webdriver_manager → 동적 웹 크롤링
- BeautifulSoup → HTML 파싱
- pandas → 크롤링한 댓글 데이터 저장(csv)
- 데이터 분석 & 시각화
- pandas → 텍스트 데이터 처리
- wordcloud → 댓글 키워드 빈도 기반 워드클라우드 생성
- matplotlib → 시각화 출력
- PIL, numpy → 사용자 정의 마스크 이미지 적용
주요 특징
- 자동화된 데이터 수집: YouTube 페이지에서 댓글을 스크롤 다운하며 자동으로 크롤링 → CSV 파일로 저장
- 텍스트 전처리: 댓글 내용을 문자열로 변환하고 불필요한 텍스트를 제거
- 워드클라우드 시각화:
- 댓글에서 가장 많이 등장하는 단어를 시각적으로 표현
- 마스크 이미지를 적용해 특정 모양(예: 캐릭터, 아이콘)으로 워드클라우드 생성
- 결과물: 사용자가 작성한 댓글 키워드의 전반적 경향을 직관적으로 확인 가능