늦깎이 공대생의 인공지능 연구실
머신러닝 스타일로 살펴보는 컴퓨터 비전의 진화와 미래(A review on machine learning styles in computer vision) 본문
머신러닝 스타일로 살펴보는 컴퓨터 비전의 진화와 미래(A review on machine learning styles in computer vision)
Justin T. 2025. 7. 4. 13:40오늘날 우리들이 일상에서 흔히 사용하는 얼굴 인식, 의료 영상 진단, 차량 자율주행기술에는 공통적으로 ‘컴퓨터 비전’(Computer Vision, CV) 기술이 활용됩니다. 컴퓨터가 이미지나 영상을 이해하고 판단할 수 있도록 만드는 데 핵심 역할을 하는 것이 바로 머신러닝(Machine Learning) 기술입니다.
이번에 소개해드릴 논문은 기존의 단순한 분류에서 벗어나 머신러닝의 다양한 스타일을 분류하고 비교하며, 그 구조와 적용 사례, 한계점, 미래 방향까지 종합적으로 다루고 있습니다. 비전 AI를 전공하신 분들이라면 한 번 즈음은 이 논문을 읽어보신다면 큰 도움이 될 것입니다.
머신러닝의 역사
머신러닝 기술은 1940년대부터 현재까지 위의 그래프와 꾸준히 발전해왔습니다. 1946년 강화학습(Reinforcement Learning) 개념이 등장하면서 처음으로 기계학습 기반 학습 패러다임이 논의되기 시작하였고, 1970년대에서 1990년대에는 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 메타러닝(Meta Learning), 멀티태스크 러닝(Multitask Learning)등이 연구되었으며, 2000대 이후에는 준지도학습(Self-supervised Learning), 특징 학습(Featured Learning), Zero-Shot, Few-Shot 등 고차원 학습 기술들이 등장하였습니다.
주요 학습 방식
지도학습(Supervised Learning)
- 입력 데이터와 해당 정답(Label)을 함께 주고 모델을 학습
- 대표 알고리즘: SVM, KNN, CNN, Decision Tree 등
- 적용 사례: 의학 이미지 분석, 텍스트 분류, 제품 불량 감지
✅ 장점: 높은 정확도, 직관적 모델링
❌ 단점: 데이터 라벨링 비용이 높고 과적합 가능성 존재
비지도학습(Unsupervised Learning)
- Label이 되지 않은 데이터를 입력으로 군집화나 패턴 인식 수행
- 대표 알고리즘: Clustering, PCA, Association Rule
- 적용 분야: 고객 세분화, 이상탐지, 차원 축소
✅ 장점: 라벨 불필요, 데이터 구조 분석에 적합
❌ 단점: 결과 해석의 어려움, 성능 평가 지표 부족
강화학습(Reinforcement Learning)
- 에이전트가 환경과 상호작용하면서 보상과 벌을 기반으로 학습
- 대표 응용: 게임 에이전트, 자율 주행차, 로봇 제어
- 기술 기반: MDP (Markov Decision Process)
✅ 장점: 순차적 의사결정에 강점
❌ 단점: 학습 속도 느리고 설계 복잡
하이브리드 학습 방식
준지도학습(Semi-Supervised Learning)
- 소량의 레이블이 있는 데이터와 대량의 레이블이 없는 데이터를 함께 활용하여 모델을 학습시키는 방법.
- 실제 산업 현장에서 레이블 데이터가 부족할 때 널리 사용되며, 두 데이터의 정보를 모두 활용해 더 정확한 예측이 가능
- 예: 도시 장면 세분화, 의학 영상 분할 등
특징 학습(Feature Learning)
- 원시 데이터를 머신러닝이나 딥러닝 모델이 이해하기 쉽고, 예측에 적합한 형태의 표현으로 자동 변환하는 과정
- 데이터의 중요한 특성이나 패턴을 사람이 직접 설계하지 않아도 모델이 스스로 추출
- 여러 계층을 통해 점점 더 추상적인 특징을 자동으로 학습하며, 이는 복잡한 데이터(예: 이미지, 음성) 처리에 특히 효과적
로봇 학습(Robot Learning)
- 로봇이 실제 환경에서 경험과 데이터를 통해 새로운 기술과 지식을 습득하고, 행동과 성능을 향상
- 강화학습, 지도학습, 비지도학습 등 다양한 머신러닝 기법이 로봇의 적응과 자율성 향상에 활용
- HRI(Human-Robot Interaction), 작업 자동화, 제조 라인 최적화에 응용
고급 학습 방식
전이 학습(Transfer Learning)
- 기존에 한 작업에서 학습된 모델의 지식이나 가중치를 새로운, 유사한 작업에 적용하는 머신러닝 기법
- 사전 학습(Pre-training)된 모델을 새로운 데이터나 작업에 맞게 미세 조정(Fine-tuning)하여 활용
- 활용: 자연어처리, 영상 인식, 음성 인식
메타러닝(Meta-Learning)
- "학습하는 방법을 학습하는(Learning to Learn)" 인공지능 기술
- 모델이 다양한 작업에서 빠르게 적응하고 일반화할 수 있도록 학습 전략 자체를 익히는 방법
- 전통적 머신러닝이 모델 파라미터를 학습하는 것과 달리, 다양한 과업에 걸쳐 최적의 학습 방법을 스스로 찾아내는 것이 핵심
Few-shot & Zero-shot Learning
- Few-shot Learning: 극소수의 예시(샘플)만으로 새로운 작업이나 클래스를 학습하고 예측하는 기술
- Zero-shot Learning: 학습 데이터 없이, 오직 클래스나 작업에 대한 설명 정보만으로 새로운 작업을 수행하는 방법
- 데이터가 부족한 상황에서 인간처럼 유연하게 새로운 개념을 이해하고 적용하는 인공지능 구현에 활용
연합 학습(Federated Learning)
- 데이터가 각 기기에 분산된 상태에서, 데이터 자체를 중앙 서버로 이동시키지 않고 각 기기에서 모델을 학습한 후, 학습된 결과(모델 파라미터)만을 중앙 서버에 모아 통합하는 분산형 머신러닝 기술
- 개인정보 보호와 통신 효율성을 동시에 확보할 수 있어, 스마트폰·병원 등 데이터 프라이버시가 중요한 분야에서 활용
- 실제 사례: Gboard 키보드 추천, 의료 AI
FUTURE DIRECTIONS: 앞으로 주목할 연구 흐름
논문 마지막 장에서는 머신러닝 스타일이 앞으로 어떻게 발전할 수 있는지를 문제 영역별로 구체적 방향을 아래와 같이 제시합니다.
🔄 데이터 불균형 | 데이터 분포 불균형 완화 및 균형 학습 가능 |
📉 소량/Label 부족 | Label이 부족한 상황에서 일반화된 학습 가능 |
⚖️ 과적합 문제 | 다양한 모델/샘플 기반으로 일반화 성능 향상 |
🙅 인간 개입 최소화 | 자율적인 구조 학습 및 피드백 기반 모델 |
📦 리소스 절감 | 온라인 학습 또는 디바이스 로컬 학습으로 비용 절감 |
🖼️ 불명확 이미지 처리 | 이미지 블러 탐지 및 정확한 인식 지원 |
아래는 주어진 데이터의 특성에 따라 추천되는 학습 방식을 정리한 내용입니다.
결론
이 논문은 단순한 학습 스타일의 소개가 아닌, 실제 적용 구조, 도식화된 학습 흐름, 응용 사례, 한계점, 미래 전망을 종합적으로 정리한 보기 드문 리뷰 논문입니다. 이 논문을 통해 머신러닝 기반 Vision AI모델에 대한 지식을 확장하는 기회가 되시길 바랍니다.
참고자료: https://ieeexplore.ieee.org/abstract/document/9903420
A Review on Machine Learning Styles in Computer Vision—Techniques and Future Directions
Computer applications have considerably shifted from single data processing to machine learning in recent years due to the accessibility and availability of massive volumes of data obtained through the internet and various sources. Machine learning is auto
ieeexplore.ieee.org