1. Albumentations란? Image Augmentation를 지원해주는 일종의 라이브러리다. [2]논문에 따르면 torchvision이나, Keras, imgaug보다 Albumentations이 빠른 속도를 지원해준다고 나와있다. 이때 숫자는 낮으면 낮을수록 좋다. [3]에 따르면 Albumentations의 장점은 1. fast, 2. Flexible, 3. Diverse 하다. 2. 설치방법? - 하단의 [1] 출처에 가면 PyPI 및 Conda 환경일때 어떻게 설치하는지 나와있다. 3. 사용방법 @rwightman의 github에서 발췌해왔다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30..
kaggle을 하면서 다양한 evaluation 종류를 정리해보았다. 1. macro F1 score - macro-average F1 score = macro F1 score이라고 줄여서 부른다. - multi-classification Imbalanced Multi-class Classification의 경우 사용된다. - 즉 macro f1 score은 classification에서 각 class가 평균적으로 잘 분류하는지 확인할때 사용한다. cf. micro average f1 score classification에서의 각 class의 사이즈가 다를때, 사용한다. (출처) https://www.kaggle.com/c/liverpool-ion-switching/overview/evaluation h..
- 항상 헷갈려서 정의... 1. 벡터란? - 수학에서는? Vector Space의 원소가 바로 벡터 - 벡터 공간의 종류가 엄청 다양하기 때문에 물리적 직관을 함부로 적용하기 힘듬 - 함수들로 이루어진 벡터공간도 존재하며, 벡터 공간으로 이루어진 벡터 공간도 존재 2. 백터의 내적(vector inner product) - dot product = scalar product - 효율 2.1 속성(property) - Commutative - Distributive over vector addiction - Bilinear - Scalar multiplication - Orthogonal - No cancellation - Product Rule 2.2 Application to the law of co..
1. Pima Indians Diabetes Database 2. logistic 회귀 이용 코드 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.model_selection import tr..
0. pandas로 csv 파일 읽기 1 2 3 4 5 train = pd.read_csv('./train/train.csv') test = pd.read_csv('./test/test.csv') print(train.head(5)) print(test.head(5)) cs 1.1 train , test shape 확인하기 1 2 3 print('We have {} training rows and {} test rows.'.format(train.shape[0], test.shape[0])) print('We have {} training columns and {} test columns.'.format(train.shape[1], test.shape[1])) train.head(2) Colored by..
0 . Predict Future Sales - 캐글 링크 불러오는 중입니다... 1. Data Description - 일일 이력 판매 데이터가 제공됩니다. 작업은 테스트 세트에 대해 모든 상점에서 판매 된 총 제품 수를 예측하는 것입니다. 상점 및 제품 목록은 매달 약간 씩 변경됩니다. 이러한 상황을 처리 할 수있는 강력한 모델을 만드는 것은 어려운 일 중 하나입니다. sales_train.csv - the training set. Daily historical data from January 2013 to October 2015. test.csv - the test set. You need to forecast the sales for these shops and products for Novemb..