늦깎이 공대생의 인공지능 연구실

[용어정리]Ground-truth 본문

카테고리 없음

[용어정리]Ground-truth

Justin T. 2020. 2. 25. 16:39

 Ground-truth는 기상학에서 유래된 용어로 어느한 장소에서 수집된 정보를 의미합니다. Ground-truth는 보통 '지상 실측 정보'로 해석되며 인공위성과 같이 지구에서 멀리 떨어져서 지구를 관찰하였을 때 지구의 전체적인 관점을 보는 것에는 넓은 시야를 가질 수 있지만 실제 지면의 구조를 세밀하게 보는 것은 빛이 구름이나 대기를 통과하게 되면서 실제 모습이 왜곡되어 제대로 파악하는 것은 어렵습니다.

 이러한 상황에세 지상 정보를 직접 측정한다면 보다 정확한 정보를 얻을 수 있는 것입니다. 이러한 정보에 인공위성에서 관측된 데이터를 참조하여 사용한다면 좀 더 정확한 데이터를 얻을 수 있습니다.

 

https://www.photonics.com/Articles/NIRS_and_Chemometrics_Offer_Insights_Into/a62575

 

 기계학습의 관점에서 보았을때 Ground-truth는 학습하고자 하는 데이터의 원본 혹은 실제 값을 표현할때 사용됩니다. 이미지에서 객체 감지를 목표로 하는 알고리즘의 예를 봅시다.

 

https://towardsdatascience.com/background-removal-with-deep-learning-c4f2104b3157

 

 위 그림에서 맨 오른쪽에 있는 그림이 Ground-truth에 해당하여 실제 이미지에서 해당 객체의 정보를 나타낸 것입니다. 초록색은 자전거이고 분홍색은 자전거를 모는 사람임을 유츄할 수 있습니다. 왼쪽에 있는 사진들은 사진에서 객체 감지를 한 결과로 Ground-truth 이미지와 완전히 일치하지는 않지만 기계학습으로 학습된 딥러닝 모델에 의해 해당 위치의 물체가 존재함을 확인할 수 있으며 이는 Ground-truth와 비교하였을 때 어느 정도 일치함을 알 수 있습니다.

 다음으로 이미지를 통해 객체 감지(Object detection)를 할 때 경계 상자(Bounding box)로 감지된 객체의 위치를 표현한 사진을 보겠습니다.

 

 

 위 사진은 표지판을 감지하여 이를 경계 상자로 표현한 것으로 파란색 상자가 Ground-truth이고 빨간 상자가 딥러닝 모델이 예측하여 표시한 부분입니다. 객체를 잘 감지한 딥러닝 모델이라면 Ground-truth와 가장 가까운 경계 상자를 표현한 예측값이 좋은 성능을 가진 딥러닝 모델이라고 할 수 있겠습니다.

 그렇다면 어떠한 기준으로 딥러닝 모델이 예측을 잘 했는지를 알 수 있을까요 이를 수치로서 비교하기 위해 IoU(Intersection over Union) 공식을 사용합니다. IoU 공식은 Ground-truth의 경계상자와 예측된 경계상자가 겹치는 부분의 너비에 두 경계상자가 사진에서 차지하는 너비를 나눈 값입니다.

 

 

  위와 같은 식을 적용하면 다음과 같이 딥러닝 모델의 성능을 비교할 수 있게됩니다.

 

 

 이제 기계학습의 관점에서 Ground-truth의 정의를 이해하셨는지요? 위의 예는 비전AI에 한정해서 설명드렸지만 Ground-truth는 데이터의 label값으로 이해하신다면 어떤 의미인지 감이 잡히실 겁니다! 이러한 방식으로 개념을 확실히 이해해 나간다면 딥러닝에 대해 보다 더 쉽게 이해할 수 있는 기반이 될 것입니다.

반응형