티스토리 뷰
다음 포스팅은 "XAI 설명가능한 인공지능, 인공지능을 해부하다" 책을 읽고 정리한 내용을 포스팅합니다.
0. XAI의 해석가능성
- XAI의 핵심? 해석가능한지?
- 해석가능성 = 왜 해당모델을 신뢰해야하는지, 아니면 하지 말아야하는지, 모델이 왜 특정 결정을 했는지, 어떤 결과가 예상되는지 판단하는 과정
1. 피처 중요도(Feature Importance, Permutation Importance)
- 데이터의 피처가 알고리즘의 정확한 분류에 얼마나 큰 영향을 미치는지 분석하는 기법
- 특정 피처의 값을 임의의 값으로 치환했을 때 원래 데이터보다 예측 에러가 얼마나 더 커지는지 측정
- 즉! 피처 중요도가 피처 각각을 변형하는 방식으로 머신러닝 결과 해석
ex) 한 피처 데이터를 변형했을 때 모델 예측 결과가 크게 달라졌다면 이 피처에 의존해 판단을 내리고 있음
* Permutation Feature Importance
- 2001년 Fisher, Rudin , Dominic제시
--> 모델에 의존하지 않는 측정 기법 제안
- 훈련된 모델 f, 피처 매트릭스 X, 목표 벡터(Target Vector) y, 에러 측정방법(L(y,f))
1. 주어진 모델의 에러를 측정한다.
2. X개의 피처 k개(k=1,...,p) 에 대하여
a. 피처 매트릭스 X를 만든다(이때 피처 k를 매트릭스 X에서 임의의 값으로 변경)
b. 모델 에러 측정
c. permutation 피처 중요도 산정
3. 피처 중요도 FI 를 구한다
참고논문 : https://arxiv.org/pdf/1801.01489.pdf
2. 부분 의존성 플롯(Partial Dependence Plots, PDPs)
- 피처의 수치를 선형적으로 변형하면서 알고리즘 해석 능력이 얼마나 증가하고 감소하는지 관찰하는 방식
- PDP 기법을 사용하면 피처의 값이 변할 때 모델에 미치는 영향을 가시적으로 이해할 수 있음
- PDP는 2001년 프리드만(Friedman) 고안
- 예측결과와 피처가 어떤 관계에 있든 상관도를 그릴 수 있게 설계
3. 유사도 분석(Similarity Measure)
4. 대리 분석(Surrogate Analysis)
- 대리 분석 기법(Surrogate Analysis)란? 엔지니어링에 사용되는 용어
- 대리라는 말뜻에서 알수 있듯이 본래 기능을 흉내내는 간단한 대체제를 만들어서 프로토 타입이 동작하는지 판단하는 모델
- Surrogate Analysis = Approximation model, Response Surface Model = Emulator
- 대리분석법의 장점? Model-agnostic technology = 모델에 대한 지식 없이도 학습할 수 있음
4.1 글로벌 대리 분석(Global Surrogate)
- 전체 학습 데이터를 사용해 블락박스 함수 f를 따라 하는 유사함수 g를 만들고 g를 해석 가능하도록 변조 하는 방법
- 장점1. 유연함 - 다양한 XAI 기법 적용 가능, 대리 분석에 사용하는 머신러닝 기법 구현 쉽고, 설명 간단
- 글로벌 대리 분석 기법은 모델 f를 직접 설명하는게 아니라 간접적으로 설명하기 때문에 g모델의 정확도와 g모델의 해석 방향에 결함이 있을 수 있음
- 전통적인 머신러닝 기법에 적용하기 좋다
4.2 로컬 대리 분석(Local Surrogate)
- 데이터 하나에 대해 블랙박스가 해석하는 과정을 분석하는 기법
- LIME(Local Interpretable Model-agnostic Explanations, 학습기법과 관계없이 모델을 설명할 수 있는 로컬 설명 가능 모델)
'인공지능 > 머신러닝' 카테고리의 다른 글
[ML Algorithm] StratifiedKFold / StratifiedShuffleSplit 차이 (0) | 2020.06.03 |
---|---|
[ML Algorithm] Tree 모델 전체적 개념 및 parameter 정리 (3) | 2020.04.26 |
XAI란? 설명가능한 인공지능 (0) | 2020.04.21 |
머신러닝 - 베이즈 통계학 (0) | 2020.03.17 |
Machine Learning (머신러닝) parameter optimization (0) | 2020.02.20 |