IT,SW,Data,Cloud,코딩
빅데이터분석기사_캐글T1-1_IQR
착실하게
2022. 10. 11. 17:41
반응형
# 라이브러리 및 데이터 불러오기
import pandas as pd
import numpy as np
df = pd.read_csv('../input/titanic/train.csv')
# 간단한 탐색적 데이터 분석 (EDA)
print(df.shape)
print(df.isnull().sum())
df.head()
# IQR 구하기
Q1 = np.percentile( df['컬럼명'],25)
Q3 = np.percentile( df['컬럼명'],75)
print(Q1)
print(Q3)
IQR = Q3 - Q1
print(IQR)
print(Q1 - 1.5 * IQR , Q3 + 1.5 * IQR )
# 이상치 데이터 구하기
outdata1 = df[ df['컬럼명'] < (Q1 - 1.5 * IQR ) ]
outdata2 = df[ df['컬럼명'] > (Q3 + 1.5 * IQR ) ]
print( len( outdata1 ) )
print( len( outdata2 ) )
# 이상치 데이터 에서 여성 수 구하기, 출력하기 print ()
print( sum(outdata2[ 'Sex' ] == 'female' ) )
반응형