본문 바로가기

Computer Engineering/Data Analysis

(2)
Pandas에서 시간, 날짜 데이터 변환하기 (총 정리) pandas에서 데이터를 다루다보면 시간 데이터를 자주 변환하고 다루게 됩니다. 년 별로, 월 별로, 요일별로 데이터를 분석해야 하기 때문입니다. 항상 구글에서 변환하는 방법을 찾는게 귀찮아서 한 번에 정리해보려고 합니다. 1) unix time -> datetime 으로 변환2) datetime -> 년/월/일 만 추출하고3) datetime -> 요일로 변환4) datetime -> unix time - Pandas 에서 Series의 날짜 데이터를 다루는 방법 정리 Unix time - > date time pandas.to_datetime 메서드 이용. Documentation url: http://pandas.pydata.org/pandas-docs/version/0.20/generated/pa..
캐글 타이타닉 예제를 통해 알아보는 데이터 분석 및 활용 flow 캐글을 통해 입문하는 사람들은 보통 타이타닉의 예제를 통해 입문하는 경우가 많습니다. 최근에 몇 가지 강의에서도 타이타닉 예제를 사용하고 있는 것으로 알고 있습니다. 타이타닉 예제를 통해서 데이터 사이언티스트(Data scientist) 들이 어떤 일을 하는지 데이터 분석에서 어떤 일을 하는지 조금 이해할 수 있게 됐습니다. 간단하게 flow를 정리해봤습니다. 1. 정확하게 문제를 정의해야 합니다. 어떤 데이터로 어떤 문제를 해결하고 싶은지 정의 해야 합니다. 타이타닉 문제를 예로 들자면, 타이타닉에 탑승했던 승객들의 정보를 통해 미래에 어떤 배를 타는 승객들이 배가 침몰했을 때 죽을지 죽지 않을지 예측합니다. 2. 데이터를 processing하여 정리해서 모으는 과정이 필요합니다. 데이터를 분석 할 수..