2020년 4월 28일

스트림스 게임으로 시작하는 강화학습 [1]
최적화

스트림스 게임으로 시작하는 강화학습 [1]

이주행
2016년 3월 딥마인드의 알파고가 이세돌 9단과의 5번기를 4대 1로 승리하는 믿을 수 없는 사건이 벌어졌다.[2] 바둑만큼은 인공지능의 도전을 받지 않을 마지막 성역 같은 곳이라고 생각했었는데 완전히 허를 찔린 기분이었다. 그때 알파고가 사용한 방법은 ‘강화학습’에 딥러닝을 접목한 ‘심층강화학습’이라는, 당시에는 내가 전혀 관심을 갖고 있지 않던 기법이었다. 과거에는 엄두도 못 내던 엄청난 크기와 복잡도의 바둑 문제를 해결해버린 이 외계인 같은 알고리즘 앞에서, 내가 동경하던 ‘우아한 수학적 알고리즘’의 시대는 종말을 맞이한 것인가 하는 막연한 두려움이 앞섰다. 당장은 새로운 공부거리가 계속 늘어가는 것에 대한 부담도 커졌다. “이 새로운 함수 작성법들을 언제 다 배우고 마스터하지?”
Read more
HORIZON은 고등과학원이 발간하는 과학전문 웹진으로 최신 과학의 뛰어난 성과들을 전달하고자 합니다.
기존의 미디어에서 전달하지 않은 깊이와 학술적인 논문에서 펼치지 못하는 범위의 영역을 탐사해 보고자 합니다.
02455 서울특별시 동대문구 회기로 85 | Tel. 02-958-3711 | horizon@kias.re.kr