과제 & 연구자 | 삼성미래기술
메인메뉴 바로가기 본문영역 바로가기 푸터영역 바로가기

과제 & 연구자

과제 & 연구자

큰 꿈을 향한 무한탐구의 연구열정,
삼성미래기술육성사업이 응원하며 함께 하겠습니다.

20-2_황보제민(KAIST)_580x448.jpg

황보제민 교수

소속기관 KAIST(한국과학기술원) 기계공학과

선정연도 2020년

연구실 홈페이지

강화학습을 이용한 통합된 보행 로봇 제어와 경로 탐색 체계 개발

보행 로봇은 다리를 이용해서 복잡한 지형을 지나갈 수 있다는 큰 장점을 가지고 있다. 따라서 미래에는 보행 로봇들이 많은 분야에서 사람 대신 위험한 임무를 수행할 것이라 기대된다. 하지만 이를 실현하기 위해서는 보행 로봇에 적합한 제어와 경로 계획 알고리즘이 필수적이다.

 

현존하는 대부분의 알고리즘들은 간단한 모델과 짧은 경로에서만 사용 가능하며, 비효율적인 탐색 패러다임으로 확장성이 떨어진다. 이를 개선하기 위해 본 과제는 강화학습을 도입한다. 강화학습은 모델을 이용하는 기본 알고리즘과는 달리 경험을 통해 통계적으로 판단을 내릴 수 있는 방법이다. 이를 이용하여 필요 없는 계산을 줄이고 다양한 모델에서 사용이 가능한 범용적 제어 탐색 체계를 구축하고자 한다.

 

또한, 학습에 필요한 시뮬레이션 환경 개발 연구도 병행되고 있다. 흙, 모래, 잔디 등 다양한 지형을 시뮬레이션에서 구현하여 학습된 제어기를 더 강건하게 만드는 연구가 진행 중이다. 동역학적 정확성을 높이면서 효율적인 계산 알고리즘을 도입하여 강화학습에 적합하게 만드는 것이 이 연구의 특징이다. 이 연구를 통해 산악 지역에서도 신뢰도 높은 보행 로봇 제어기를 개발할 것이다.

 

하지만 이러한 시뮬레이션 환경은 그 정확성에 한계가 분명하다. 따라서 본 과제에서는 이를 보완할 수 있는 학습 기법도 개발하고 있다. 실제 환경에서 얻은 데이터를 이용하여 시뮬레이션 환경의 정확성을 높이 augmented simulation기법을 주로 연구한다. 이를 이용하여 시뮬레이션과 현실의 차이를 적응할 수 있는 보행 제어 방법을 개발할 것이다.

보행 로봇은 다리를 이용해서 복잡한 지형을 지나갈 수 있다는 큰 장점을 가지고 있다. 따라서 미래에는 보행 로봇들이 많은 분야에서 사람 대신 위험한 임무를 수행할 것이라 기대된다. 하지만 이를 실현하기 위해서는 보행 로봇에 적합한 제어와 경로 계획 알고리즘이 필수적이다.   현존하는 대부분의 알고리즘들은 간단한 모델과 짧은 경로에서만 사용 가능하며, 비효율적인 탐색 패러다임으로 확장성이 떨어진다. 이를 개선하기 위해 본 과제는 강화학습을 도입한다. 강화학습은 모델을 이용하는 기본 알고리즘과는 달리 경험을 통해 통계적으로 판단을 내릴 수 있는 방법이다. 이를 이용하여 필요 없는 계산을 줄이고 다양한 모델에서 사용이 가능한 범용적 제어 탐색 체계를 구축하고자 한다.   또한, 학습에 필요한 시뮬레이션 환경 개발 연구도 병행되고 있다. 흙, 모래, 잔디 등 다양

더보기
관련 뉴스 게시물이 없습니다.