목록전체 글 (137)
now is better than never

2. 탐색적 자료 분석 (2) 3) EDA our data - 문제 이해 Aggregation? Time Series? (시계열 분석) Aggregation + Time Series? - 가설 세우기 이전 달의 total 이 영향을 끼치지 않을까? 작년 12월 달의 total 이 영향을 끼치지 않을까? 거주 국적에 따른 영향? 고객마다 주로 구매하는 품목? -> target 에 어떤 영향? 2011 년 12 월 데이터 = 예측해야 할 test 데이터 -> 2011 년 11 월 구매액 데이터로 target label 을 만들어서 EDA 진행 - 가설 검정 개별 연속형 변수 total : 주문번호가 c 로 시작하면 환불 -> 구매액 - (마이너스) 오른쪽 : 환불을 제외한 total -> 대부분 0 과 20..

오차 역전파 https://wikidocs.net/37406 07-05 역전파(BackPropagation) 이해하기 인공 신경망이 순전파 과정을 진행하여 예측값과 실제값의 오차를 계산하였을 때 어떻게 역전파 과정에서 경사 하강법을 사용하여 가중치를 업데이트하는지 직접 계산을 통해 이해해봅시다.… wikidocs.net https://hsm-edu-math.tistory.com/348 [모듈식 수학2] 2.미분 (18) 함수의 n제곱의 미분, {f(x)^n}' [수학2]-[2.미분]-[①미분]-[(18) 함수의 n제곱의 미분, {f(x)^n}'] 함수의 n제곱의 미분, {f(x)^n}' 미분가능한 함수 f(x)가 있습니다. 이 함수를 n제곱하면 아래와 같습니다. 이 함수를 미분해봅시다. 미분 hsm-ed..

신경망 학습 활성화 함수 입력 데이터에 대해서 신호를 얼마나 세게 보낼지 sigmoid, relu 출력층 함수 앞에 신호들을 받아서 결론 내주는 함수 softmax 오차 함수 오차가 작아지도록 가중치를 갱신하면서 신경망 학습 cross entropy 가중치 = 가중치 - 기울기 기울기 : 미분으로 계산 기울기만큼 경사하강하면서 오차가 가장 적은 가중치를 알아내면서 업데이트 경사하강법 오차가 최소화 되는 지점을 찾아가는 방법 Global Minimum 에 도착하는 것이 목적 SGD momentum Adagrade Adam SGD (Stochastic Gradient Descent) 확률적 경사 하강 GD (Gradient Descent) : 학습데이터를 배치 사이즈만큼 입력하고 가중치 업데이트 SGD : ..

2. 탐색적 자료 분석 (1) 1) EDA (Exploratory Data Analysis) - EDA 데이터를 탐색하고 가설을 세우고 증명하는 과정 다양한 시각을 통해 데이터를 이해하고 특징을 찾아내는 과정 특징들을 시각화, 통계량으로 표현 -> 다각도로 데이터를 이해 데이터의 특징과 문제들을 직관적으로 이해 새로운 아이디어를 만들어내는 과정 모든 정형, 비정형 데이터는 분석에 앞서 EDA 과정 필수적 주어진 문제를 데이터를 통해 해결하기 위해 데이터를 이해하는 과정 -> 문제에 대한 이해와 데이터에 대한 이해를 통해 적절한 전처리, 방법론들을 선택 데이터를 통한 문제를 해결하기 위해 데이터를 이해하고 적절한 방법들을 적용 탐색하고 생각하고 증명하는 과정의 반복 - EDA 과정 Data 에 대한 가설 ..

https://www.boostcourse.org/ai224 쇼핑데이터를 활용한 머신러닝 부스트코스 무료 강의 www.boostcourse.org 1. 정형데이터란? 1) 정형 데이터 - 정형 데이터 엑셀 파일 형식이나 관계형 데이터베이스의 테이블에 담을 수 있는 데이터 행(row) 과 열(column) 로 표현 가능한 데이터 하나의 행 = 하나의 데이터 인스턴스 열 = 데이터 피쳐 많은 부분들이 정형데이터로 기록됨 -> 분야를 막론하고 많은 데이터가 정형 데이터 범용적인 데이터 = 가장 기본적인 데이터 = 필수적인 데이터 - 비정형 데이터 이미지, 비디오, 음성, 자연어 등 정제되지 않은 데이터 하나의 데이터 인스턴스로 표현하기 위해 2차원, 3차원이 필요함 이미지 : 자율주행자동차, 사물인식 음성 :..

오차함수 오차함수에 정답 데이터와 예측 데이터를 넣어서 오차가 어떻게 되는지 확인 정답과 예측값과의 오차 최소화 미니배치 수치미분 오차함수의 기울기를 구해서 가중치를 갱신 오차함수 교차 엔트로피 오차함수 (Cross Entropy Error) : 분류 평균 제곱 오차함수 (Mean Squared Error) : 수치 예측 (회귀) 교차 엔트로피 오차함수 def cross_entropy_error(y, t): delta = 0.0000001 return -np.sum(t * np.log(y + delta)) t : 정답, y : 예측값 delta (아주 작은 값) 을 더하는 이유? y = 0 이면 -∞ 가 되기 때문에 0 에 가깝게 업데이트 # tensorflow cross entropy model = S..