본문 바로가기
IT,SW,Data,Cloud,코딩

빅데이터분석기사_캐글T1-1_IQR

by 착실하게 2022. 10. 11.
반응형


# 라이브러리 및 데이터 불러오기

import pandas as pd
import numpy as np
df = pd.read_csv('../input/titanic/train.csv')

# 간단한 탐색적 데이터 분석 (EDA)

print(df.shape)
print(df.isnull().sum())
df.head()

# IQR 구하기

Q1 = np.percentile( df['컬럼명'],25)
Q3 = np.percentile( df['컬럼명'],75)

print(Q1)
print(Q3)

IQR = Q3 - Q1

print(IQR)

print(Q1 - 1.5 * IQR , Q3 + 1.5 * IQR )

# 이상치 데이터 구하기

outdata1 = df[ df['컬럼명'] < (Q1 - 1.5 * IQR )  ]
outdata2 = df[ df['컬럼명'] > (Q3 + 1.5 * IQR )  ]

print( len( outdata1 ) )
print( len( outdata2 ) )

# 이상치 데이터 에서 여성 수 구하기, 출력하기 print ()

print( sum(outdata2[ 'Sex' ] == 'female' ) )




반응형

댓글