데이터분석Python
[데이터 분석] 대전광역시 지하철 시간대별 승하차 추이 분석
Chae-hyeon Kim
2023년 11월 1일
목차
프로젝트명
대전 지하철 시간대별 승하차 추이 분석
프로젝트 소개
공공데이터포털에서 제공하는 2022년도 대전광역시 지하철 시간대별 승하차 인원 데이터를 활용하여 승하차 추이 분석을 진행했습니다. “대전역 이용자가 가장 많을 것”이라는 가설로 시작했으며, 실제로 2022년 9월 8일(추석 연휴 전날) 대전역에서 1년 중 가장 많은 이용 인원이 기록됨을 확인했습니다. 또한 특정 역의 시간대별 이용자 수를 분석하여, 일상에서 접할 수 있는 데이터를 기반으로 실질적이고 흥미로운 분석 경험을 할 수 있었습니다.
코드 링크
https://colab.research.google.com/drive/1AECUCyrHVZguIDxID2sOP42PBooFMCuh?usp=sharing
코드 일부 내용
- 막대 그래프 그리기

- 파이 그래프 그리기

- 선 그래프 그리기

사용 기술 및 기술 스택
- 환경
- Google Colab
- 데이터 처리
- pandas, numpy, csv
- 시각화
- matplotlib, koreanize-matplotlib
- 기타
- datetime
주요 특징
- 데이터 로딩
- CSV 파일(시간대별승하차인원_2022년 01_12월.csv, CP949 인코딩) 불러오기
- info(), head()를 활용해 데이터 구조 확인
- 데이터 전처리
- '날짜' 컬럼을 datetime 타입으로 변환
- '총인원' 컬럼 추가(승차 + 하차 합산)
- 탐색적 데이터 분석(EDA)
- 월별/요일별/시간대별 승하차 인원 집계
- 새벽·심야 데이터에 대한 참고사항(첫차 전, 행사 등으로 인한 연장 운행 데이터 처리)
- 시각화
- 시간대별 승하차 인원을 막대그래프/라인차트로 표현
- 요일별/월별 패턴 비교
- koreanize-matplotlib을 적용해 한글 라벨 깨짐 문제 해결
- 도메인 인사이트
- 실제 대전교통공사 운행 정보(첫차: 05:30, 막차: 23:32 기준)와 비교하여 데이터 해석
- 새벽 1시 이후 데이터는 특수 상황(행사 등)으로 설명