본문 바로가기
반응형

IT,SW,Data,Cloud,코딩96

JAVA와 객체지향프로그래밍 객체지향 프로그래밍이란? 객체지향은 소프트웨어의 모든 구성원이 객체로 구성되며, 객체들의 관계성으로 프로그램이 작동되는 것을 뜻합니다. 한 마디로 말하자면 객체를 사용해서 코드를 짜는 것입니다. 자바, C++, C# 등이 객체지향 언어입니다. 그럼 객체는 무엇일까요? 객체란? 객체는 오브젝트입니다. 객체는 '데이터'와 '기능'을 가지고 있습니다. 다른 말로 표현해보자면 객체는 변수와 함수를 묶어놓은 것입니다. 여기서 말하는 함수란, 어떠한 오퍼레이션을 뜻합니다. 펑션 function 이라고 하기도 하고 메소드 method 라고도 합니다. 자바에서 new 하면 '객체화'됩니다. 예를 들어 Student 클래스로 객체를 생성하는 코드라면, Student s = new Student(); 와 같은 형태일 텐데.. 2021. 5. 31.
Brightics 사용법 /초보자용 꿀팁 Brightics란? www.brightics.ai/kr 를 참고해주세요 이 포스팅은 삼성SDS의 브라이틱스 솔루션을 사용할 때 활용할 수 있는 꿀팁에 대한 내용입니다. 꿀팁 뿐만 아니라 사용하면서 주의해야할 점들도 다루었습니다. 솔루션을 사용하다가 필요한 부분을 참고하시면 됩니다. 초보자용 꿀팁이므로 숙달된 분들에게는 꿀팁이 아닐수도 있습니다 ^^ String Summary - 인풋 데이터의 타입이 String 인 경우에만 Input Column에서 선택가능한 컬럼으로 뜹니다. 예를 들어 Double 로 되어 있는 경우 Select 눌려서 나오는 팝업창에 뜨지 않습니다. Double 같은 타입은 Statistic summary를 사용하면 됩니다. Statistic Summary - 숫자 등 데이터에 대.. 2021. 5. 19.
Logistic Regression, kNN(k-Nearest Neighbor), Naive Bayes *주의* 여기서는 삼성SDS의 브라이틱스를 사용해서 분석하고 해석하는 케이스를 설명하고 있습니다. 로지스틱 회귀분석 일반 선형 회귀가 y = a * x + b 의 형태의 선형 함수 관계라면, 로지스틱 선형회귀는 분석 대상을 0 과 1 또는 yes 와 no 등의 2개 집단으로 분류하는 결과를 만들어주는 회귀식입니다. threshold를 넘어선다면 1이 되고 넘어서지 못한다면 0이 되는 식으로 분석대상을 두 개의 집단으로 나눠줍니다. 브라이틱스의 Logistic Regression Train 함수에는 Inverse of Regularization 값을 세팅하는 부분이 있는데, L1 또는 L2 등의 패널티를 선택했을 때 이러한 패널티를 주는 걸 얼만큼 줄 지에 영향을 주는 부분인데 영향력을 줄이고자 하면 아주.. 2021. 4. 21.
상관분석이란? 상관계수 결과 해석 상관분석과 산점도 상관계수 산출 시, 산점도를 함께 파악해야 합니다. 상관계수의 개념 두 변수의 평균을 기준으로 관측치가 나타내는 공간을 4등분 했을 경우 관측치의 산포도를 뜻합니다. 상관계수가 0이라면 사분면에 고르게 나타나므로 원형과 비슷한 산점도를 보입니다. 상관계수 해석 시의 주의점 상관계수가 크다고 해도 인과관계에 있음을 뜻하지는 않습니다. 상관관계는 같은 방향으로 움직이는 경향이 있다는 것을 뜻할 뿐입니다. 또한, 상관계수는 직선관계만 파악해줍니다. 상관계수가 작다고 해서 두 변수간의 관계가 없는 것은 아닙니다. 예를 들어 2차 함수 U 자 형의 관계에 있는 데이터는 상관계수는 작게 나타날 테지만 두 데이터의 관계는 분명히 존재합니다. 또한 절대값이 1에 가까워도 뚝 떨어져 있는 아웃라이어 1.. 2021. 4. 19.
평균 비교 검정/ Bartlett's Test - One Way ANOVA - Tukey's Range Test ANOVA (분산분석) - 그룹간 평균을 비교하기 위한 방법 평균을 모르면 분산을 계산할 수 없습니다. 평균을 데이터셋에서 빼서 제곱을 하고 더한 후 데이터 갯수로 나눈 것이 분산이기 때문입니다. 아노바는 분산을 이용해서 평균을 추론하는 방법입니다. ANOVA가 필요한 이유는 세 집단 이상의 평균 비교를 위해서 입니다. 연령대의 경우 20대, 30대, 40대, 50대 등과 같이 여러 개의 그룹이 생기므로 ANOVA를 사용해야 합니다. t-test도 2개 이상의 집단에 대해 사용할 수는 있습니다. 성별과 몸무게처럼 남/녀라는 2개의 그룹이 생기는 GENDER라는 범주형 변수와 몸무게라는 1개의 연속형 변수가 있는 데이터의 경우에는 t-test를 사용할 수는 있습니다. 그러나 성별 연령대별 몸무게 평균 비교.. 2021. 4. 19.
추론통계 기초 이해 및 Brightics를 사용한 t-test 결과 해석 추론통계의 기본 귀무가설 Null Hypothesis 관습적이고 보수적인 주장 대립가설 Alternative Hypothesis 적극적으로 입증하려는 주장. 차이가 있음, 관계가 있다 검정통계량 t-value 귀무가설이 참이라는 가정 하에 계산한다. 알려진 확률분포를 따르도록 설계한다. 검정통계량도 통계량의 일종으로 샘플 특징을 담은 것이다. t-value가 커진다는 얘기는 평균보다 멀리 떨어진 꼬리 쪽에 값이 나타난다는 말입니다. 즉 t-value가 클수록 귀무가설을 기각하고 대립가설을 채택할 확률이 높아질 것입니다. p-value 귀무가설이 참일 때 관측자에 의한 검정통계량 추정치보다 극한값을 얻은 확률을 말합니다. 특이함의 정도를 표현하며, 데이터가 특이할수록, 즉 대립가설에 가까울수록 p-valu.. 2021. 4. 19.
반응형