늦깎이 공대생의 인공지능 연구실

Notice

Recent Posts

Recent Comments

Link

« 2026/04 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록전체 글 (96)

늦깎이 공대생의 인공지능 연구실

시각 AI를 위한 Active Learning(1) - AI의 공부법과 능동 학습

영상으로 사물을 식별하는 비전 AI 분야는 어느덧 2026년 현재 우리의 삶의 다양한 분야에 녹아들었습니다. 도로 위 복잡한 상황을 읽어내는 자율주행 자동차, 암세포를 판독하는 의료 AI, 그리고 공장에서 제품의 아주 작은 결함까지 잡아내는 AI를 보면 어떻게 이토록 똑똑하게 잡아내는지 궁금하실 겁니다. 사실 이러한 비전 AI의 이면에는 공통적으로 바로 방대한 양의 데이터부터 학습이 이루어진다는 것입니다. 하지만 여기서 우리는 숨겨진 고통과 마주하게 됩니다. 사실 딥러닝 모델의 성능을 결정짓는 '양질의 학습 데이터'를 확보하는 과정은 사실 매우 고통스럽고 비용이 많이 드는 작업이기 때문입니다. 사람 대신 다양한 일을 해주는 생성형 AI챗봇이 건재함에도 비전 AI는 여전히 AI가 대체하기 힘든 부분들..

AI기술설명 2026. 4. 4. 15:12

[논문프리뷰]word2vec은 정확히 무엇을 학습하는가?

word2vec은 정확히 무엇을, 그리고 어떻게 학습할까요? 이 질문에 답하는 것은 규모는 작지만 흥미로운 언어 모델링 작업 내에서 표현 학습(Representation Learning)을 이해하는 것과 같습니다. word2vec이 현대 언어 모델의 잘 알려진 선구자임에도 불구하고, 수년 동안 연구자들에게는 그 학습 과정을 설명할 정량적이고 예측 가능한 이론이 부족했습니다.이 논문을 통해 마침내 그러한 이론을 제시합니다. 학습 문제가 '가중치 없는 최소 제곱 행렬 분해(unweighted least-squares matrix factorization)'로 귀결되는 현실적이고 실용적인 체계가 존재함을 증명했습니다. 또한 경사 흐름 역학(gradient flow dynamics)을 폐쇄형(closed for..

BAIR 2026. 3. 1. 15:48

[용어 정리]유니그램 확률(Unigram Probability)

인공지능이 우리가 쓰는 말을 어떻게 이해하고 숫자로 계산하는지, 그 가장 기초가 되는 개념인 '유니그램 확률(Unigram Probability)'에 대해 알아보려고 합니다. 이름은 거창하지만, 알고 보면 아주 단순한 원리랍니다. 유니그램(Unigram)이란 무엇인가유니그램이란 다음과 같은 의미를 가집니다.Uni (하나의) + Gram (글자/단어) 즉, 문장에서 단어를 딱 하나씩만 떼어서 보는 것을 말합니다. 예를 들어 "오늘 날씨가 정말 좋다"라는 문장이 있다면, 유니그램 방식으로는 [오늘], [날씨가], [정말], [좋다] 이렇게 네 개의 조각으로 나누어 생각하는 것이죠. 유니그램 확률: "단어 주머니에서 제비뽑기"유니그램 확률은 쉽게 말해 "전체 단어들 중에서 특정 단어가 나타날 확률"입니다. 이..

AI용어정리 2026. 2. 1. 00:46

[논문프리뷰] 전신 기반 에고센트릭 비디오 예측 (Whole-Body Conditioned Egocentric Video Prediction)

이 논문은 PEVA(Predict Ego-centric Video from human Actions)라는 모델을 훈련하여, 전신(whole-body) 동작을 조건으로 하는 에고센트릭(1인칭 시점) 비디오 예측을 수행했습니다. PEVA는 신체 관절의 계층 구조로 구조화된 운동학적(kinematic) 포즈 궤적을 조건으로 받아, 인간의 물리적 행동이 1인칭 시점에서 환경을 어떻게 변화시키는지를 시뮬레이션하도록 학습합니다. 이 논문은 실제 에고센트릭 비디오와 신체 포즈 캡처가 쌍으로 이루어진 대규모 데이터셋인 Nymeria를 사용하여, 자기회귀적 조건부 디퓨전 트랜스포머(autoregressive conditional diffusion transformer)를 훈련했습니다. 또한 점점 더 어려워지는 과제들로 ..

BAIR 2026. 1. 12. 02:11

AI가 세상을 바라보는 방법(3) - 더 멀리, 더 촘촘히 보는 법: DenseASPP

- 이 포스팅은 GPT5의 초안을 바탕으로 작성한 글임을 밝힙니다. 앞선 두 편에서 우리는 인공지능이 이미지를 이해하는 방식이 어떻게 발전해 왔는지를 살펴봤습니다. 픽셀 하나만 보던 단계에서 시작해, 주변 정보를 함께 고려하고, 더 멀리 떨어진 문맥(context)까지 활용하는 방향으로 점점 확장되어 왔습니다. 이번 포스팅에서는 그 흐름의 한 지점에서 등장한 구조인 DenseASPP를 통해, “문맥을 본다”는 말이 실제로 어떤 구조적 의미를 가지는지를 정리하며 이 시리즈를 마무리해 보려 합니다.자율주행 장면에서 Semantic Segmentation의 한계 DenseASPP 논문은 처음부터 이 문제를 매우 구체적으로 설정합니다. 이 연구가 다루는 대상은 일반적인 영상이 아니라, 자율주행 환경의 도로 ..

AI기술설명 2025. 12. 26. 00:06

[용어 정리]Modeling Power

딥러닝 전체의 관점에서 'Modeling Power'는 모델이 복잡한 데이터의 패턴, 관계, 구조를 학습하고 표현할 수 있는 능력을 의미합니다. 간단히 말해, "이 모델이 얼마나 잘 데이터를 이해하고 예측할 수 있는가"라는 질문에 답하는 개념입니다. 딥러닝의 핵심이 되는 개념으로, 모델의 설계, 구조, 학습 과정 등 다양한 요소와 깊이 연관됩니다. Modeling Power의 핵심 구성 요소(1) 표현력 (Expressiveness) 표현력이란, 주어진 데이터 분포를 얼마나 정확하고 복잡하게 표현할 수 있는가를 나타냅니다.예를 들어, CNN(Convolutional Neural Network)은 이미지의 스파이럴(공간적) 구조를 자연스럽게 학습하여 높은 표현력을 가집니다. 그리고 Transformer는 ..

AI용어정리 2025. 11. 2. 02:15

AI가 세상을 바라보는 방법(2) - 크고 작은 물체를 동시에 보는 방법, ASPP(Atrous Spatial Pyramid Pooling)

- 이 포스팅은 GPT5의 초안을 바탕으로 작성한 글임을 밝힙니다. 지난 포스팅에서는 AI가 어떻게 이미지를 인식할 수 있는지 CNN에서부터 시작해서 각종 비전 AI 기술에 대해 종합적으로 설명을 드렸습니다. 이번 포스팅에서는 대표적인 CNN기반 AI모델 중 하나인 Deeplab 시리즈에서 처음으로 도입된 ASPP(Atrous Spatial Pyramid Pooling)의 등장 배경 및 특징에 대해 설명드리도록 하겠습니다. 멀티스케일 문제: 작은 것도, 큰 것도 동시에 보는 게 왜 어려울까? 우리 인간이 위의 사진을 보았을 때, 가까이에 있는 작은 표시판과, 중간 거리에 있는 자동차, 멀리 있는 큰 건물 등 각각 크기가 다른 여러 물체를 한 번에 구분할 수 있습니다. 하지만 AI가 위 이미지를 볼 ..

AI기술설명 2025. 10. 3. 21:07

AI가 세상을 바라보는 방법(1) - 작은 눈으로 큰 그림을 보다(CNN부터 DenseNet까지 Vision AI기술의 발전과정)

- 이 포스팅은 GPT5의 초안을 바탕으로 작성한 글임을 밝힙니다.대학원을 졸업한 후 회사생활을 해오면서 나의 일상에 자신과 굳게 약속하였던 것 중 하나는 학업을 그만두더라도 AI의 트랜드를 놓지지 않기 위해 새로운 논문들을 읽으며 살아가자는 것이었습니다. 비록 학생때처럼 논문 읽기에만 몰입하는 것은 어렵겠지만, 학자로서의 감을 잃지 않겠다는 본인의 의지만큼은 계속 가지고 싶었습니다. 그러나 여전히 논문을 온전히 이해하는 것은 결코 쉽지 않은 일입니다. 이는 비단 지금도 대학원 생활을 하고 계시는 분들께서는 항상 느끼시리라 생각이 듭니다. 매번 논문 읽기에 고통스러운 나날을 보내왔던 저에게 ChatGPT는 망망대해만 같았던 논문의 바닷속에서 저를 묵묵히 이끌어가는 나침반 같은 존재 같았습니다. 단순한 질..

AI기술설명 2025. 9. 2. 00:07

이전 Prev 1 2 3 4 ··· 12 Next 다음

목록전체 글 (96)

늦깎이 공대생의 인공지능 연구실

티스토리툴바