데이터분석Python교안제작
[교안 제작] 데이터로 찾은 최고의 포켓몬은 누구?
Chae-hyeon Kim
2023년 4월 19일
목차
프로젝트명
데이터로 찾은 최고의 포켓몬은 누구?
프로젝트 소개
청소년 대상 데이터 분석 강의를 위해 Kaggle의 Pokemon.csv 데이터를 활용한 프로젝트를 진행했습니다. 포켓몬 관련 아이템의 인기를 반영해 데이터를 분석·시각화하고, 이를 교재화하여 학습자가 데이터 분석을 보다 흥미롭게 접할 수 있도록 강의안을 구성했습니다.
교안 내용
- 100% 외부 공유가 불가능하여, 일부 교안과 코드만 공유합니다.
- 총 103쪽 분량의 교안으로 구성되어 있습니다.
포켓몬 데이터 준비하기


포켓몬 데이터 시각화하기


일부 코드


사용 기술 및 기술 스택
환경
- Google Colab
- 로컬 경로에서 CSV 로딩
데이터 처리
- pandas, numpy
시각화
- matplotlib.pyplot(정적 그래프)
- seaborn(분포/비교 그래프)
- plotly.express(인터랙티브 히스토그램)
주요 특징
- 데이터 로딩 & 기본 탐색
- Pokemon.csv 불러오고 기본 구조 파악(컬럼, 결측·형 변환 점검)
- 능력치 중 HP, Attack 등 핵심 컬럼을 중심으로 기술 통계/분포 확인
- 탐색적 데이터 분석(EDA)
- 히스토그램/박스플롯으로 능력치 분포 비교
- 타입 간 비교 시각화(예: Dragon 타입의 공격력(Attack)이 Grass/Water 대비 높게 분포하는지 비교)
- 그룹 집계(타입/조건별 평균·중앙값 등)로 상대적인 강·약점 해석
- 시각화 스토리텔링
- matplotlib + seaborn으로 정적 그래프 구성
- plotly.express로 인터랙티브 히스토그램 제공(마우스오버/줌 등 상호작용)
- 마크다운 셀에 해석을 덧붙여 학습·강의용 설명 강화
- 분석 흐름의 재현성
- 셀 순서에 따른 실행으로 전처리 → 시각화 → 인사이트 도출까지 단일 노트북 내에서 재현 가능
- 결과 그래프와 해설을 한 자리에서 확인할 수 있어 강의 자료로 전환 용이