반응형
아래의 유투브 강의를 따라 쳐봄
# 데이터 첫번째 행 부터 70% 까지 데이터 추출
# distance 결측값을 중앙값으로 대체
# 결측값 전처리 전후 표준편차 비교
# 전후 결과값 출력
# len, median, np.std
import seaborn as sns #데이터
import pandas as pd
import numpy as np #표준편차
#print(sns.get_dataset_names())
df = sns.load_dataset('planets')
#print(df.head())
#70% 까지 데이터추출
df = df[:int(len(df)*0.7)]
#전후비교 위해서 카피로 뜨고 결측값 전처리함
df2 = df.copy()
df2['distance'] = df2['distance'].fillna(df2['distance'].median())
print('전처리 전: ',np.std(df['distance']))
print('전처리 후: ',np.std(df2['distance']))
# orbital_period 열의 이상치를 IQR 기법으로 제거하여
#이상치들의 합을 계산
#최종결과 출력
import seaborn as sns
sns.get_dataset_names()
df = sns.load_dataset('planets')
#사용자코드
Q25 = df['orbital_period'].quantile(0.25)
Q75 = df['orbital_period'].quantile(0.75)
IQR = Q75 - Q25
min = Q25 - IQR*1.5
max = Q75 + IQR*1.5
df_outliers = df[(df['orbital_period'] <= min) | (max <= df['orbital_period'])]
# | 과 or 은 다름
print(df_outliers['orbital_period'].sum())
반응형
'IT,SW,Data,Cloud,코딩 > Python' 카테고리의 다른 글
2023년6월2일 파이썬공부 - 퇴근후딴짓 님의 유투브 3. 작업형1 예시문제 무작정 따라해보기 - 보면서 따라 쳐 보는 포스팅 (0) | 2023.06.02 |
---|---|
2023년6월2일 파이썬공부 - 데이터사이언스스쿨 3장 넘파이 배열 프로그래밍 3.2 배열의 생성과 변형 :: 코드 따라 쳐보기 (0) | 2023.06.02 |
2023년5월31일 파이썬공부 - 데이터 사이언스 스쿨 파이썬 편 3장 3.1 넘파이 배열 - 내용 따라 치기 (0) | 2023.05.31 |
2023년5월24일 파이썬 공부 - (대구빅데이터활용센터)[빅데이터 분석기사] 빅분기 실기 교육영상 7강 따라쳐보기 (0) | 2023.05.30 |
2023년 5월 21일 파이썬 공부, 인프런 빅데이터 분석기사 시험 실기 강의 4강 공부 (0) | 2023.05.22 |
2023년5월16일 파이썬공부 (1) | 2023.05.16 |
2023년 5월 12일 파이썬 공부 (0) | 2023.05.12 |
파이썬 공부 2023년5월10일 (0) | 2023.05.11 |
댓글