이 글에서는 파이썬으로 시간/날짜 데이터를 다루겠습니다. 이를 위해 먼저, 데이터프레임을 만들겠습니다.
import pandas as pd
data = [['1990-03-02', 90], ['1991-06-08', 95], \
['1990-11-22',80], ['1991-01-05', 88]]
names = ['철수', '영이', '길동', '미영']
column_names =['생년월일', '점수']
df1 = pd.DataFrame(data, index=names, columns=column_names)
df1
파이썬은 날짜를 문자형으로 다룹니다.
df1.info()
시계열 객체로 변환하기
문자열을 Timestamp로 변환 : to_datetime()함수 사용
df1['생년월일'] = pd.to_datetime(df1['생년월일'])
df1
파이썬은 날짜를 문자형으로 다루기 때문에 type이 달라지는 것을 볼 수 있습니다.
df1.info()
시계열 데이터 활용
날짜 데이터 분리하기 : 연-월-일 정보에서 연,월,일 추출: dt.year, dt.month, dt.day를 사용
df1['년'] = df1['생년월일'].dt.year
df1['월'] = df1['생년월일'].dt.month
df1['일'] = df1['생년월일'].dt.day
df1
날짜를 활용하여 생일이 가장 빠른 사람부터 정렬
df1.sort_values(by='생년월일', ascending=True)
'Python' 카테고리의 다른 글
[Python]ScikitLearn 주요 모듈 정리 (0) | 2024.06.24 |
---|---|
[Pandas]데이터 분석하기 (0) | 2024.06.12 |
[Pandas] 데이터 전처리: 결측치, 치환, 중복 데이터, 자료형 변환 (0) | 2024.06.12 |
[Numpy] 주요 함수 정리 (0) | 2024.06.10 |
[Numpy] 내적 함수 정리 (0) | 2024.06.10 |