본문 바로가기
반응형

전체 글201

2023년6월5일 파이썬공부 - 퇴근후딴짓님의 인프런 강의 따라치면서 배우기 시리즈 ㅡ 데이터프레임의 하위 자료형. 한 개의 열. 딕셔너리의 key 값이 index가 되고, value값이 값이 된다. 데이터프레임 ㅡ 여러 개의 시리즈가 모여서 데이터 프레임을 형성함. import pandas as pd # data = { # "메뉴":['아메리카노','카페라떼','카페모카', '바닐라라떼', '녹차', '초코라떼', '바닐라콜드브루'], # "가격":[4100, 4600, 4600, 5100, 4100, 5000, 5100], # "할인율":[0.5, 0.1, 0.2, 0.3, 0, 0, 0], # "칼로리":[10, 180, 420, 320, 20, 500, 400], # } # data = pd.DataFrame(data) # data.to_csv('data.csv', ind.. 2023. 6. 5.
2023년06월03일 파이썬공부 text = "안녕하세요" print(text[:2]) #안녕 date = '2023-06-03' print(date[5:7]) #06 list = ["감사","행복","사랑","습관","긍정","변화","성장","공감","희망"] #갯수 print(len(list)) #첫번째값 print(list[0]) #마지막값 print(list[-1]) #처음부터 세번째 값 print(list[:3]) #마지막 앞 단어 print(list[-2]) #행복과 사랑 출력 print(list[1:3]) # enumerate: index, item 순서로 준다. for idx, item in enumerate(list): print(idx,item) for idx, item in enumerate(list): print.. 2023. 6. 3.
2023년6월2일 파이썬공부 - 퇴근후딴짓 님의 유투브 4. 작업형2 예시문제 무작정 따라해보기 - 보면서 따라 쳐 보는 포스팅 https://youtu.be/_GIBVt5-khk #===================================================# # 백화점 고객의 1년간 구매 데이터 # y_train.csv : 고객의 성별 데이터 (학습용), csv 형식의 파일 # gender 1 남성 0 여성 # x_train.csv, x_test.csv : 고객의 상품구매 속성 (학습용 및 평가용), csv 형식의 파일 # 학습용 데이터 y_train.csv, x_train.csv 를 이용하여 성별예측 모형을 만든 후, # 평가용 데이터 x_text.csv 에 적용하여 얻은 고객의 성별예측값 (남자일 확률)을 # 다음과 같은 형식의 csv 파일로 생성하시오. (custid,gender) # 제출한 모델의 성능은 .. 2023. 6. 3.
2023년6월2일 파이썬공부 - 퇴근후딴짓 님의 유투브 3. 작업형1 예시문제 무작정 따라해보기 - 보면서 따라 쳐 보는 포스팅 퇴근후딴짓 님의 유투브 3. 작업형1 예시문제 무작정 따라해보기 유투브 링크 https://youtu.be/E86QFVXPm5Q # mtcars 데이터셋 (data/mtcars.csv)의 qsec 컬럼을 최소최대 척도(Min-Max Scale)로 변환한 후 0.5 보다 큰 값을 가지는 레코드 수를 구하시오. import pandas as pd from sklearn.preprocessing import minmax_scale # 데이터 불러오기 data = pd.read_csv('data/mtcars.csv') # print(data['qsec'].head(3)) # qsec 컬럼을 최소최대 척도(Min-Max Scale)로 변환 # 방법 1) 사이킷런 data['qsec'] = minmax_scale(.. 2023. 6. 2.
2023년6월2일 파이썬공부 - 데이터사이언스스쿨 3장 넘파이 배열 프로그래밍 3.2 배열의 생성과 변형 :: 코드 따라 쳐보기 https://datascienceschool.net/01%20python/03.02%20%EB%B0%B0%EC%97%B4%EC%9D%98%20%EC%83%9D%EC%84%B1%EA%B3%BC%20%EB%B3%80%ED%98%95.html 3.2 배열의 생성과 변형 — 데이터 사이언스 스쿨 .ipynb .pdf to have style consistency --> datascienceschool.net # 3.2 배열의 생성과 변형 import numpy as np # ndarray는 원소가 모두 같은 자료형이어야 한다 x = np.array([1, 2, 3]) print(x.dtype) #int64 print(x[0]+x[1]) #3 x = np.array([1, 2, 3],dtype='str') pr.. 2023. 6. 2.
2023년5월31일 파이썬공부 - 데이터 사이언스 스쿨 파이썬 편 3장 3.1 넘파이 배열 - 내용 따라 치기 https://datascienceschool.net/01%20python/03.01%20%EB%84%98%ED%8C%8C%EC%9D%B4%20%EB%B0%B0%EC%97%B4.html 3.1 넘파이 배열 — 데이터 사이언스 스쿨 .ipynb .pdf to have style consistency --> datascienceschool.net 위 페이지 내용 공부한 내용 #3.1 넘파이 배열 import numpy as np # ar = np.array([0,1,2,3,4,5,6,7]) # print(ar) # print(type(ar)) # data = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] # answer = [] # for di in data: # answer.append(2 * d.. 2023. 5. 31.
2023년5월24일 파이썬 공부 - (대구빅데이터활용센터)[빅데이터 분석기사] 빅분기 실기 교육영상 7강 따라쳐보기 이 유투브 따라 쳐보면서 공부한 내용!! https://youtu.be/WYxfdvukFnY import seaborn as sns import pandas as pd # 1. 데이터 수집 # 데이터를 로드하여 df 변수에 할당 # 종속변수는 species df = sns.load_dataset('penguins') print(df.shape) #(344,7) print(df.head()) # 2. 데이터 결측치 보정 # 연속형 변수 중 결측치가 존재하는 열을 확인 후 missing 리스트에 열 이름을 입력 # for 문으로 각 열별 중앙값을 결측치에 입력 # 성별과 같은 범주형의 경우 비중이 높은 남성으로 결측치 입력 print(df.isna().sum()) # 1) 결측치 제거 print(df['se.. 2023. 5. 30.
2023년 5월 28일까지) 종근당건강 50% 할인 행사 3천원 추가할인 받는 방법 - 락토핏 할인 / 아이클리어 / 프로메가 / 올앳미 콜라겐 / 아임비타 멀티비타민 이뮨샷 할인 종근당에서 어플 론칭 이벤트로 50% 할인 행사 진행 중인데요 50% 할인에 추가로 3천원 더 할인 받는 방법입니다. 3천원 추가할인 받는 방법 !!! 바로 ~~~ 추천인코드 입력하면 둘 다 3천원 추가 할인됩니다. 추천인도, 가입한 사람도 둘다 받을 수 있습니다 추천인코드 필요하신 분은 이 코드를 사용하셔도 됩니다 t3u23ue863 아래의 링크 클릭하면 바로 회원가입하는 페이지로 연결 됩니다 https://ckdhcmall.co.kr/memberJoinMain.do?refCode=t3u23ue863 회원가입 회원가입을 하시고 할인 및 적립금 등 다양한 혜택을 만나보세요! ckdhcmall.co.kr 50% 할인에 추가로 3천원까지 할인 받아서 구매합시다!! 2023. 5. 24.
2023년5월22일 파이썬 공부 - (대구빅데이터활용센터)[빅데이터 분석기사] 빅분기 실기 교육영상 5강, 6강 아래의 유투브 강의를 따라 쳐봄 https://youtu.be/tlVdmMViJuM # 데이터 첫번째 행 부터 70% 까지 데이터 추출 # distance 결측값을 중앙값으로 대체 # 결측값 전처리 전후 표준편차 비교 # 전후 결과값 출력 # len, median, np.std import seaborn as sns #데이터 import pandas as pd import numpy as np #표준편차 #print(sns.get_dataset_names()) df = sns.load_dataset('planets') #print(df.head()) #70% 까지 데이터추출 df = df[:int(len(df)*0.7)] #전후비교 위해서 카피로 뜨고 결측값 전처리함 df2 = df.copy() df2[.. 2023. 5. 22.
반응형