본문 바로가기

IT/프로젝트 및 실습

python을 이용한 연도별 출생아 수 계산하기





다음 프로젝트는 서적 '초보자를 위한 파이썬 200제'를 기반으로한 포스팅입니다.




미국의 Social Security Administarion은 1880년 이후 현재까지 미국에서 출생한 남녀 아기들의 이름별 출생아 수를 년도별로 저장한 데이터를 일반인에게 공개하고 있다.


다음의 링크 https://catalog.data.gov/dataset/baby-names-from-social-security-card-applications-national-level-data로 접속하면




다음과 같은 홈페이지를 확인할 수 있다.


다음의 압축파일을 다운로드 한뒤 압축 해제하게 되면



연도별로 이루어진 텍스트 파일을 확인할 수 있으며,

그 중 하나를 확인해보자



아기이름,성별,출생아수 로 이루어진 데이터들을 확인할 수 있다.


그렇다면 연도별로 출생아 수만 추출하기 위해서는


파일을 한줄 씩 읽어 한 줄 읽은 문자열에서 개행문자 '\n'를 제거한 뒤


구분자 ','를 이용해서


한줄의 각 요소를 리스트에 담은 뒤

 

3번째 데이터, 즉 index가 2인 데이터들을 합산하면 될 것이다.