Pandas dataframe 메모리 사용량 확인하기

Computer Engineering/Data Engineering

Pandas dataframe 메모리 사용량 확인하기

jordan.bae 2022. 12. 2. 22:23

Pandas의 dataframe 및 각 column의 메모리를 체크하는 방법은 매우 간단합니다.

dataframe 전체 메모리

dataframe.info() 메서드를 이용하면 맨 아래 memory usage가 출력됩니다.

>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 173511 entries, 0 to 173510
Data columns (total 47 columns):
 #   Column                        Non-Null Count   Dtype
---  ------                        --------------   -----
 0   id                            173511 non-null  int64
 1   created_at                    173511 non-null  datetime64[ns]
 2   updated_at                    173511 non-null  datetime64[ns]
 3   deleted_at                    0 non-null       datetime64[ns]
....

dtypes: datetime64[ns](4), float64(6), int64(4), object(33)
memory usage: 62.2+ MB

dataframe column 별 메모리

dataframe.memory_usage()함수를 통해 byte단위로 확인이 가능합니다.

위에 created_at row수가 173,511이고 1388088 byte이니깐 하나의 row에 8byte인 것을 볼 수 있습니다.

>>> df.memory_usage()
Index                               128
id                              1388088
created_at                      1388088
updated_at                      1388088
....

저작자표시 비영리 변경금지 (새창열림)

'Computer Engineering > Data Engineering' 카테고리의 다른 글

Airflow Scheduler 역할 및 성능 개선 정리 (0)	2023.04.14
Airflow Task 우선순위 설정하기(Priority weights) (0)	2023.04.06
Airflow Taskflow로 DAG refactoring하기 (0)	2022.11.14
Pandas NaN이란 그리고 None 차이 (0)	2022.11.13
Airflow Sensor 정리 (feat. S3 Sensor) (0)	2022.07.12

현재글Pandas dataframe 메모리 사용량 확인하기

Jordan Tech Lab

Jordan's Tech Lab. (https://github.com/baidoosik)

남해, #코딩, mysql, airflow, 서버, 코딩, 개발자, 프로그래밍, django, 데이터엔지니어링, 데이터, Python, 파이썬, 알고리즘, 개발, 기본문법, 장고, 워케이션, C#, 남해 워케이션,

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Jordan Tech Lab

Pandas dataframe 메모리 사용량 확인하기

dataframe 전체 메모리

dataframe column 별 메모리

'Computer Engineering > Data Engineering' 카테고리의 다른 글

'Computer Engineering/Data Engineering'의 다른글

티스토리툴바

Pandas dataframe 메모리 사용량 확인하기

dataframe 전체 메모리

dataframe column 별 메모리

'Computer Engineering > Data Engineering' 카테고리의 다른 글

'Computer Engineering/Data Engineering'의 다른글

관련글

티스토리툴바