반응형
# 라이브러리 및 데이터 불러오기
import pandas as pd
import numpy as np
df = pd.read_csv('../input/titanic/train.csv')
# 간단한 탐색적 데이터 분석 (EDA)
print(df.shape)
print(df.isnull().sum())
df.head()
# IQR 구하기
Q1 = np.percentile( df['컬럼명'],25)
Q3 = np.percentile( df['컬럼명'],75)
print(Q1)
print(Q3)
IQR = Q3 - Q1
print(IQR)
print(Q1 - 1.5 * IQR , Q3 + 1.5 * IQR )
# 이상치 데이터 구하기
outdata1 = df[ df['컬럼명'] < (Q1 - 1.5 * IQR ) ]
outdata2 = df[ df['컬럼명'] > (Q3 + 1.5 * IQR ) ]
print( len( outdata1 ) )
print( len( outdata2 ) )
# 이상치 데이터 에서 여성 수 구하기, 출력하기 print ()
print( sum(outdata2[ 'Sex' ] == 'female' ) )
반응형
'IT,SW,Data,Cloud,코딩' 카테고리의 다른 글
AWS Certified Cloud Practitioner 자격증 공부방법 및 취득후기 - 간단 요약 (0) | 2023.07.16 |
---|---|
AWS Certified Cloud Practitioner 자격증 공부 (0) | 2023.07.14 |
빅데이터분석기사 실기시험 23년 6월 시험부터 단답형 문제 사라짐 (1) | 2023.05.22 |
빅데이터분석기사_캐글_T1-2.Outlier 이상치 소수점 (0) | 2022.10.12 |
파이썬 공부4 (0) | 2022.09.19 |
파이썬 공부3 (0) | 2022.09.13 |
파이썬 공부2 (0) | 2022.08.29 |
파이썬 공부 1 (0) | 2022.08.22 |
댓글