파이썬 판다스
-
파이썬 판다스(pandas) 데이터 처리 속도 비교python 2020. 12. 19. 19:21
판다스를 사용할때 데이터프레임(dataframe)에 행데이터(row data)를 연속적으로 쌓아나가야 하는 경우가 있다. 매우 많은 행들을 쌓아나가는 작업을 할 때 (Adding a lot of rows to dataframe) 어떻게 하면 속도측면에서 효율적일까? (1) 데이터프레임 생성 후 행데이터를 append로 삽입한다. (2) 데이터프레임 생성 후 행데이터를 concat으로 삽입한다. (3) 데이터프레임 생성 후 행데이터를 loc인덱싱하여 삽입한다. (4) dict 타입으로 행데이터를 append하고 완료 후 데이터프레임을 생성한다. (5) list타입으로 행데이터를 append하고 완료 후 데이터프레임을 생성한다. * 속도측정 결과(in secs) 방식 1000 rows 5000 rows 10..