늦깎이 공대생의 인공지능 연구실

[해석할 수 있는 기계학습(1-2)]기계학습 용어 정리 본문

해석할 수 있는 기계학습/1. 소개

[해석할 수 있는 기계학습(1-2)]기계학습 용어 정리

Justin T. 2019. 8. 31. 13:19

 

 기계학습을 이해하기 위해서 주요 용어들을 정리할 필요가 있습니다. 인공지능을 공부하시는 분들이 많아지면서 기계학습의 기초에 대해 자세히 정리된 자료들이 많으므로 여기서는 기계학습의 용어에 대한 정의를 확인해 보는 것으로 하고자 합니다.

 

알고리즘(Algorithm)

 알고리즘은 기계가 특정한 목표를 달성하기 위해 따르는 규칙의 집합을 말합니다. 알고리즘은 입출력 및 입력에서 출력에 이르기까지 필요한 모든 단계를 정의하는 요리법이라 할 수 있겠습니다. 요리법은 재료라는 입력이라 한다면 요리된 음식은 출력으로 비유할 수 있고, 재료를 다듬고 이를 조리하는 각 단계에 대한 설명서를 알고리즘이라 할 수 있겠습니다.

 

기계학습(Machine Learning)

 기계학습은 컴퓨터가 데이터를 통해 학습하여 예측할 수 있도록 하는 일련의 방법을 말합니다. 기계학습은 컴퓨터에 모든 명령어를 명시적으로 부여해야 하는 "일반적인 프로그래밍"에서 컴퓨터에 데이터만 부여하는 방법을 통해 이루어지는 "간접 프로그래밍"으로의 패러다임 전환이라 할 수 있습니다.

 

기계학습 알고리즘(Machine Learning Algorithm)

 학습자(Leraner) 혹은 기계학습 알고리즘은 데이터로부터 기계학습 모델을 배우는데 사용되는 프로그램입니다. 다른 이름으로 "유도기(inducer)"라고도 합니다.

 

기계학습 모델(Machine Learning Model)

 기계학습 모델은 입력을 예측하여 결과를 나타내는 학습된 프로그램이다. 이 모델은 선형 모델이거나 인공신경망에 대한 가중치의 집합이라 할 수 있습니다.

선형 모델(Linear model)과 인공신경망 모델(Artificial Neural Network model)

 모델의 특성에 따라 "예측기(predictor)", "분류기(classifier)" 혹은 "회귀 모델(regression model)"이라고도 칭합니다. 공식에서 학습된 기계학습은 다음과 같은 식으로 나타냅니다.

 식의 위에 ^ 표시는 hat라 하며 예상되는 결과에 대해 주로 표시합니다.

 

 학습자(알고리즘)에 특성 X와 해당 X에 대한 답인 y를 입력하여 학습시키면 Model이 완성됩니다. 이후 해당 모델에 새로운 X를 입력하게 되면 예상되는 결과인 y_predicted 값이 출력됩니다.

 

블랙박스 모델(Black Box Model)

 블랙박스 모델은 동작 원리가 밝혀지지 않은 시스템을 말합니다. 기계학습에서 블랙박스는 인공신경망(Neural Network)와 같은 모델의 매개변수를 보면 이해할 수 없는 모델을 주로 말합니다. 블랙박스와 반대되는 개념으로 화이트박스(White Box)가 있는데 여기서는 해석 가능 모델(Interpretable model)이라 칭하겠습니다. 해석력을 위한 모델불특정법(Model-agnostic methods) 기계학습 모델 또한 해석이 가능하다 하더라도 블랙박스로 취급됩니다.

블랙박스의 모델은 예측값이 나오기까지의 원리를 알기 힘듭니다.

해석가능한 기계학습(Interpretable Machine Learning)

 해석가능한 기계학습은 기계학습 시스템의 행동과 예측을 인간이 이해할 수 있게 하는 방법과 모델을 뜻합니다.

 

데이터셋(Dataset)

 데이터셋은 기계가 학습하는 데이터가 있는 자료의 집합을 의미합니다. 데이터셋에는 특정값 x와 목표값 y로 구성되어 있습니다. 모델을 유도하는 데 사용할 경우 데이터셋을 학습 데이터라고도 부릅니다.

이름과 키로 구성된 데이터셋

 위 그림에서 행(row)는 각 사람의 이름과 해당 사람의 키로 구성되어 있으며 열(column)은 이름과 키로 분류되고 있는 것을 확인하실 수 있습니다.

인스턴스(Instance)

 인스턴스는 데이터셋의 하나의 행(row)입니다. 즉, x값과 y값 하나를 의미합니다. 인스턴스는 (데이터)포인트, 예제, 관측값(observation)이라고도 합니다.

 하나의 인스턴스에는 특성값 x와 목표값 y로 나타냅니다.

 

특성값(Feature)

 특성값은 예측이나 분류에 사용되는 입력값을 의미합니다. 특성값은 데이터넷의 열(column)입니다. 여기서 특성값은 해석 가능한 것으로 가정하는데, 이는 주어진 날짜의 온도나 사람의 키와 같이 그 의미를 쉽게 이해할 수 있다는 것을 말합니다. 특성값의 해석력은 하나의 큰 추정(assumption)입니다. 그러나 특성값의 입력을 이해하기 어렵다면 모델에서 출력되는 결과값이 무엇을 의미하는지 이해하는것은 더욱 어렵게 됩니다.

 데이터셋에서 모든 특성값은 X로 나타내며 하나의 인스턴스에 대한 특성값은 다음과 같은 식으로 나타냅니다.

 모든 인스턴세애 대한 단일 특성의 벡터값은 다음과 같이 나타냅니다.

 그리고 하나의 특성값 j와 인스턴스 i에 대한 값에 대해서는 식을 다음과 같이 나타냅니다.

목표값(Target)

 목표값은 기계가 예측하기 위해 학습하는 정보입니다. 수식으로 보통 y라 부르며 단일 인스턴트에 대해서는 다음과 같은 식으로 표현합니다.

기계학습 작업(Machine Learning Task)

 기계학습 작업은 데이터셋의 특성값과 목표값의 결합을 말합니다. 대상의 유형에 따라 작업은 분류(classification), 회귀(regression), 생존 분석(survival analysis), 군집(clustering), 혹은 특이 검출(outlier detection)로 될 수 있습니다.

 

예측값(Prediction)

 예측값은 주어진 특성값을 기반으로 하는 목표값을 기계학습 모델이 "추측"하는 것을 말합니다. 여기서 모델의 예측값은 수식으로 다음과 같이 표현합니다.

 

참고자료: https://christophm.github.io/interpretable-ml-book/terminology.html

 

1.3 Terminology | Interpretable Machine Learning

Machine learning algorithms usually operate as black boxes and it is unclear how they derived a certain decision. This book is a guide for practitioners to make machine learning decisions interpretable.

christophm.github.io

 

반응형