티스토리 뷰

0.배치학습 vs 온라인학습

  • 머신러닝 시스템을 분류하는 데 사용하는 다른 기준은 입력 데이터의 스트림(stream)으로부터 점진적으로 학습할 수 있는지의 여부

 

 

 

1. 배치학습? (Batch learning) = 오프라인 학습 

  • 시스템이 점진적으로 학습할 수 없다.
  • 강용한 데이터를 모두 사용해 훈련시켜야 한다.
  • , 학습한 것을 단지 적용만 한다
  • 일반적으로 이 방식은 시간과 자원을 많이 소모하므로 보통 오프라인에서 수행
  • 배치 학습이 새로운 데이터에 대해 학습하려면 전체 데이터를 사용하여 시스템의 새로운 버젼을 처음부터 다시 훈련할 필요가 있다.
  • 주기적으로 데이터셋을 사용해 훈련하는데 몇시간이 소요된다.
  • 장점 : 간단하고 잘 적용
  • 단점 : 전체 데이터 셋을 사용해 훈련하는 데 몇시간이 소요될 수 있다. 또한 전체 데이터셋을 사용하기 때문에 엄청나고 많은 컴퓨터 자원이 필요할 수 있기 때문에 오히려 불편할 수 있다. 이런경우 점진적으로 학습할 수 있는 알고리즘을 사용하는 편이 낫다.

 

 

 

2. 온라인 학습(Online learning)

  • 데이터를 순차적으로 한개씩 또는 미니배치(mini-batch)라 부르는 작은 묶음 단위로 주입하여 시스템을 훈련
  • 매 학습 단계가 빠르고 비용이 적게 들어 시스템은 데이터가 도착하는 대로 즉시 학습할 수 있다.
  • 장점 : 연속적으로 데이터를 받고 빠른 변화에 스스로 적응해야 하는 시스템에 적합
    • -> 컴퓨터 자원이 제한된 경우에 좋은 선택
  • 온라인 학습에서 중요한 파라미터
  • -> 학습률(learning rate) : 변화하는 데이터에 얼마나 빠르게 적응할 것인지가 중요하다.
  • 학습률을 높게하면 시스템이 데이터에 빠르게 적응하지만 예전 데이터를 금방 잊어버린다.
  • 학습률을 낮게 하면 시스템이 관성이 더 커져 더 느리게 학습된다. 하지만 새로운 데이터에 있는 잡음이나 대표성 없는 데이터 포인트에 덜 민감해진다.

 

 

 

 

 

출처 : 핸즈온머신러닝

'인공지능 > 머신러닝' 카테고리의 다른 글

[ML Algorithm] 군집화(clustering)  (0) 2020.01.12
머신러닝 - Feature 생각해보기  (0) 2019.11.28
Anaconda 기본  (0) 2019.10.27
[ML Algorithm] 분류 평가(Evaluation)  (0) 2019.10.16
[Math] 오일러 공식 Euler's Equation  (0) 2019.10.16
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG more
«   2024/11   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
글 보관함