목록Python (52)
now is better than never
5. 시각화 툴 / 통계학 맛보기 5) 파이썬 시각화 툴 (Visualization) - matplotlib pyplot 객체를 사용하여 데이터 표시 pyplot 객체에 그래프를 쌓은 다음 show로 flush 단점 : argument를 kwargs로 받음 -> 고정된 argument가 없어서 문서를 계속 확인해야 함 pyplot 객체 사용시 figure라는 그림판에 그래프가 그려짐 argument color = c linestyle = ls function title : 제목 legend : 범례 xlim/ylim : x/y축 범위 - matplotlib Graph scatter : 산점도 그래프 s : 데이터의 크기 지정 bar : 막대 그래프 histogram : 히스토그램 bins : x 범위의 ..

4) 확률론 맛보기 - 확률론 통계적 기계학습의 기본원리 : 예측이 틀릴 위험(risk)을 최소화하도록 데이터를 학습 회귀분석의 L2-norm : 예측 오차의 분산을 가장 최소화하는 방향으로 학습 유도 분류 문제의 교차엔트로피(cross-entropy) : 모델 예측의 불확실성을 최소화하는 방향으로 학습 유도 -> 이것들을 확률론 기반으로 해석 - 이산확률변수 (discrete) 확률변수는 데이터 공간 X x Y 에 의해 결정되는 것이 아닌 확률변수의 분포 D에 의해 결정됨 확률변수가 가질 수 있는 모든 경우의 수를 고려하여 확률을 더하여 모델링 (급수, 질량함수) P(X = x) : 확률변수가 x 값을 가질 확률 - 연속확률변수 (continuous) 데이터 공간에 정의된 확률변수의 밀도(density..
https://www.boostcourse.org/ai100/joinLectures/233691?isDesc=false 인공지능(AI) 기초 다지기 부스트코스 무료 강의 www.boostcourse.org 1. Machine Learning & PyTorch Basic 1) Tensor Manipulation 1 - Vector, Matrix and Tensor vector : 1차원 (차원이 없으면 scalar) matrix : 2차원 tensor : 3차원 2D Tensor (Typical Simple Setting) |t| = (batch size, dim) (= batch size * dim) (64 * 256) 3D Tensor (Typical Computer Vision) |t| = (batc..
4. Pandas II / 확률론 맛보기 3) Pandas 2 - Groupby = SQL group by split -> apply -> combine 과정을 거쳐서 연산 df.groupby("column1")["column2"].func() df.groupby(["column1-1", "column1-2"])["column2"].func() column1 : 묶음 컬럼 column2 : 연산 적용 컬럼 func : 집계 함수 - Hierarchical Index groupby_df.unstack() group으로 묶여진 데이터를 matrix 형태로 전환 두 개의 column으로 group by (index 두 개) -> untack해서 피쳐 생성 많이 쓰이는 Data Handling 방법 groupb..

2) 딥러닝 학습방법 이해하기 - 신경망 (Neural Network) 선형 모델과 비선형 함수의 결합 데이터를 모아놓은 행렬 X, 행렬을 다른 벡터 공간으로 보내주는 가중치 행렬 W 두 개의 곱으로 선형모델 표현 y절편을 표현한 행렬 b (각 행들이 전부 같은 값, 열 마다는 다를 수도 있음) 데이터가 바뀌면 결과값도 바뀜 출력 벡터의 차원은 d에서 p로 변화 d 개의 변수로 p 개의 선형모델을 만들어 p 개의 잠재변수를 설명하는 모델 W가 각각의 화살표를 의미 - Softmax 연산 선형회귀 -> Regression / 비선형 -> 분류(Classification) 소프트맥스 함수는 모델의 출력을 확률로 해석할 수 있게 변환해 주는 연산 (= 확률벡터로 변환) 분류문제를 풀 때 선형모델과 소프트맥스 ..
https://www.boostcourse.org/ai100/joinLectures/233689 인공지능(AI) 기초 다지기 부스트코스 무료 강의 www.boostcourse.org 3. Pandas I / 딥러닝 학습방법 이해하기 1) pandas 1 - Pandas 구조화된 데이터의 처리를 지원하는 Python 라이브러리 고성능 Array 계산 라이브러리인 Numpy와 통합 인덱싱, 연산 함수, 전처리 함수 등 제공 pandas = numpy wrapper import pandas as pd # 라이브러리 호출 df_data = pd.read_csv(data_url, sep='\s+', header=None) df_data.values # type은 numpy sep='\s+' : seperate는 ..