목록AIB (1)
데이터 놀이터
Section 1 - Sprint 1. Data Preprocessing & EDA
1. EDA (Exploratory Data Analysis) 탐색적 데이터 분석, 말 그래도 데이터 분석을 위해 데이터를 탐색하는 과정이다. 마치 우리가 요리를 하기 전에 재료의 특성, 조리법 등을 알아야 하듯이 데이터 분석을 하기 전에 데이터가 어떤 특성, 분포를 갖고 있는지를 알아보는 중요한 단계다. EDA를 수행하기 위해서 pandas 메서드, Feature Engineering, 통계치 및 시각화를 활용한다 (1) pandas 메서드 먼저 통계치를 이용하는 방법에는 다음과 같은 코드가 있다. 모두 pandas의 메서드이다. df.shape # 행, 열의 수 df.info() # 열 별로 결측치, 데이터타입 등을 종합적으로 파악 가능 df.isnull().sum() # 결측치 수 df.dtypes..
코드스테이츠 AIB 17
2023. 1. 6. 14:47