반응형 Spatial Data2 [Exploratory Data Analysis] 3. Exploratory data analysis (2) 2024.04.21 - [Computer Science/기계학습] - [Exploratory Data Analysis] 3. Exploratory data analysis (1) Content Data Data quality Exploratory data analysis Numerical summary Graphical summary 3.14 Exploring categorical variables 범주형 변수를 탐색할 때, 중심 경향성을 측정하는 한 가지 방법은 '최빈값'을 사용하는 것. 최빈값은 데이터 세트에서 가장 자주 발생하는 값을 의미. 범주형 데이터의 경우, 수치적 요약 통계보다는 표를 사용하여 데이터를 검토하는 것이 더 일반적. 범주형 데이터를 분석할 때 자주 사용되는 표 중 하나는 '교차 .. 2024. 4. 21. [Exploratory Data Analysis] 3. Exploratory data analysis (1) Content Data Data quality Exploratory data analysis Numerical summary Graphical summary 3.1 Exploratory Data Analysis (EDA) 탐색적 데이터 분석(Exploratory Data Analysis, EDA)은 데이터에 대한 일반적인 이해를 얻기 위해 수행하는 과정. 이 과정은 데이터 분석의 초기 단계에서 특히 유용 detect outliers (e.g., assess data quality) 데이터의 질을 평가하고 이상치를 감지. 이를 통해 데이터가 분석에 적합한지 평가. test assumptions 가정을 검증. 예를 들어, 데이터가 정규 분포를 따르는지, 아니면 치우친 분포를 가지는지 확인할 수 있다. ide.. 2024. 4. 21. 이전 1 다음 반응형