- 2017 전국 교통사고 데이터 라인 포트 1)pandas 라이브러리의 read_csv를 이용하여 파일 읽기 2) 한글로 작성되었으므로 euc-kr로 인코딩한다.
요일별 사망 교통사고 시각화 – 요일당 사고건수 출력요일별 사고건수를 카운트하여 요일순으로 정렬 후 y에 저장
- 요일별 사고 건수 카운트한 y값을 토대로 막대그래프로 그리기 1) xlim, ylim으로 x.y축 범위 설정 2) xlabel, ylabel에서 x, y축 의미하는 제목 설정 3) title에서 전체 그래프 제목 설정
차대차 사건 중 사망하거나 다친 사람이 많은 발생지의 시도를 시각화함 – 사고 유형_대분류에서 차대차인 행만을 출력하여 발생 지시도에 있는 각각의 데이터 횟수를 구함 1) 각 발생 지시도별로 묶기 위해 groupby 적용 후 종합적으로 구함 2) 구한 횟수는 final 변수에 저장
- 차 vs 차량 교통사고 사상자 수 시각화 1) figure 함수를 이용하여 그래프 확대 조절 2) fig size = (x축 크기, y축 크기) → 그래프 크기 조절 3) xlabel, ylabel에서 x축과 y축 이름 지정 4) title로 그래프 제목 쓰기
그래프 시각화
교통사고가 가장 많이 발생하는 시간대 시각화 – 시간대를 ‘0~2’, ‘3~5’, ‘6~8’, ‘9~11′, ’12~14′, ’15~17′, ’18~20′, ’21~23’ 구간으로 나눠 시간대별 사고 건수 구하기 1) bins에는 값을 나눠주는 범위를 적어주기 3) 그대로 출력하면 사고 건수 기준으로 하향 순서가 되므로 시간대를 기준으로 정렬해 주기 → sport_index() 사용
시간대별 사고 건수 출력
- 파이함수에서 시간대별 사고 건수 시각화 1)pie 함수를 사용하여 파이 차트 그림 2)pie(데이터, 라벨 3)pie 함수 중 autopct 속성은 자동으로 데이터 값의 크기에 따라 비율 조절 4)%f → 소수점 자릿수를 조절하여 값 출력
파이 그래프※※ 각 그래프의 장점※※ 선 그래프: 변화를 비교하기에 유리한 막대 그래프: 범용적인 차트, 변화와 비교 파악하는 데 모두 사용 가능 차트 그래프: 데이터를 비교 용이