수리과학, 물리학, 화학, 생명과학 분야와 이들을 기반으로 한 융&복합 분야
미래 산업 경쟁력 강화의 근간이 되는 소재 및 ICT 분야
과제 & 연구자
큰 꿈을 향한 무한탐구의 연구열정,
삼성미래기술육성사업이 응원하며 함께 하겠습니다.
기계학습과 인공지능의 비약적인 발전은 사회 전반의 패러다임을 바꾸며, 특히 관측 가능한 요소 간 상관관계를 탐구하는 예측 영역에서 탁월한 성과를 보여 왔습니다. 그러나 합리적인 의사결정을 위해서는 단순한 예측만으로는 충분하지 않습니다. 의료, 정책, 경제, 사회 시스템 등 대부분의 현실적 문제는 단순히 “무엇이 일어날까”가 아니라 “무엇을 하면 원하는 결과를 얻을 수 있을까”라는 질문을 다루기 때문입니다. 이러한 질문은 인과 학습의 영역에 속합니다. 인과 추론은 단순한 상관관계를 넘어 개입과 결과 간 구조적 관계를 밝히고, 관측되지 않은 반사실적(counterfactual) 상황을 추정함으로써 올바른 의사결정의 방향을 제시합니다. 따라서 인공지능의 진정한 진보는 더 정교한 예측을 넘어, 그 예측의 원인을 이해하고 조작할 수 있는 능력을 확보하는 데 있습니다.
그러나 현재의 표준적인 인공지능, 특히 파운데이션 모형(Foundation Model)은 인과 학습 측면에서 여전히 취약합니다. 대부분의 모형이 상관관계 패턴에 기반해 작동하기 때문에, 인과적 메커니즘의 이해가 요구되는 영역에서는 신뢰성이 현저히 저하됩니다. 겉보기에는 그럴듯하지만 사실과 다른 결과를 내는 환각(hallucination) 현상이나, 데이터 분포가 변하는 환경에서는 성능이 급격히 저하되는 분포 외 일반화의 실패 또한 같은 맥락에서 설명될 수 있습니다. 더불어 과거에 축적된 관측 데이터만으로는 새로운 개입이나 변화하는 상태를 충분히 설명하기 어렵다는 근본적 제약이 있습니다. 따라서 현대 인공지능이 진정한 지능으로 도약하기 위해서는 상관관계 기반의 사실중심 예측을 넘어, 인과적 사고와 학습으로의 전환이 필수적입니다.
데이터를 통한 인과 학습은 어떻게 구현될 수 있을까요. 인과 관계는 개입(intervention)에 의해 유도되는 복수의 반사실적 분포에서 정의되는 함수들을 대조함으로써 식별됩니다. 그러나 일반적으로 학습에 사용하는 관측 가능한 분포와 달리, 반사실적 분포에서는 표본을 직접 추출할 수 없다는 근본적 제약이 존재합니다. 이를 극복하는 가장 기초적이자 표준적인 접근은 무작위 실험(randomized experiment)입니다. 다만 무작위성의 위배, 윤리적 제약, 비용·시간 등 현실적 제약으로 인해 완전한 실험이 불가능한 경우가 적지 않습니다. 이러한 상황에서는 대규모 관측 데이터를 활용하여 통계적 보정 절차를 수행합니다. 그럼에도 불구하고 데이터 구조의 복잡성과 추정 대상 인과 효과의 정교함이 커질수록, 현대 인과 학습에는 여전히 해결해야 할 기술적 과제가 다수 남아 있습니다.
본 연구는 위 한계를 근본적으로 해결하기 위해, 각 반사실적 분포 자체를 정밀하게 추정하는 새로운 방법론과 이론을 제시합니다. 구체적으로, 최신 생성형 모형의 표현력을 준모수 효율 이론과 결합하여 반사실적 분포를 직접 학습함으로써, 고차원 데이터에서도 빠른 수렴 속도와 유효한 통계적 추론을 동시에 달성하도록 설계합니다. 이 접근은 관측 불가능한 반사실적 세계에 대한 근거 기반 추정을 가능하게 하여, 기존 상관관계 중심 학습의 구조적 한계를 체계적으로 보완할 뿐 아니라, 사실 기반 기계학습과 인과 학습 간 간극을 근본적으로 메우는 시도로 해석될 수 있습니다.
아울러 이러한 기반 위에, 파운데이션 모형의 핵심 모듈인 사전학습(pre-training)과 문맥 내 학습(in-context learning)에 반사실적 추론 능력을 부여하는 통합 이론을 확립합니다. 이를 통해 반사실적 학습 이론과 반사실적 생성형 인공지능 등 핵심 구성요소가 파생되며, 갑작스런 분포 변화나 관측 공백 영역에도 강건한 추정을 제공합니다. 결과적으로 보편적 기계학습의 적용 범위와 일반화 효율이 크게 확장되어, 맞춤형 신약 개발, 최적 복지정책 설계, 새로운 과학적 발견, 개인 맞춤형 헬스케어 등에서 비용 효율성과 속도를 크게 개선할 수 있습니다. 더 나아가 사실 기반의 공정하고 비편향적인 의사결정을 지원함으로써, 인간의 합리적 추론을 보조하는 실질적 범용 인공지능(AGI)으로 한 걸음 더 다가가는 기반을 마련합니다. 이는 향후 인공지능이 인간의 의사결정과 과학적 발견을 실질적으로 뒷받침하는 길을 여는데 있어 중대한 전환점이라 믿어 의심치 않습니다.

기계학습과 인공지능의 비약적인 발전은 사회 전반의 패러다임을 바꾸며, 특히 관측 가능한 요소 간 상관관계를 탐구하는 예측 영역에서 탁월한 성과를 보여 왔습니다. 그러나 합리적인 의사결정을 위해서는 단순한 예측만으로는 충분하지 않습니다. 의료, 정책, 경제, 사회 시스템 등 대부분의 현실적 문제는 단순히 “무엇이 일어날까”가 아니라 “무엇을 하면 원하는 결과를 얻을 수 있을까”라는 질문을 다루기 때문입니다. 이러한 질문은 인과 학습의 영역에 속합니다. 인과 추론은 단순한 상관관계를 넘어 개입과 결과 간 구조적 관계를 밝히고, 관측되지 않은 반사실적(counterfactual) 상황을 추정함으로써 올바른 의사결정의 방향을 제시합니다. 따라서 인공지능의 진정한 진보는 더 정교한 예측을 넘어, 그 예측의 원인을 이해하고 조작할 수 있는 능력을 확보하는 데 있습