LLM(Large Language Model) to LWM(Large World Model)?

주간동아. LLM 넘어 LWM 시대 온다: 현실과 디지털 경계 초월… 메타버스도 부활 신호. 2025.03.04.

지난 2년간 챗GPT가 생성형 인공지능(AI) 시장을 주도한 기술의 근원은 거대언어모델(Large Language Model·LLM)이었다. 인간 언어를 학습한 AI가 언어로 답을 내놓는 것. 이제는 LLM을 넘어 거대세계모델(Large World Model·LWM) 시대가 오고 있다.

젠슨 황 엔비디아 최고경영자(CEO)는 1월 CES(국제전자제품박람회) 2025에서 “로봇의 챗GPT 모멘트(변곡점)가 온다”며 물리 AI(Physical AI)를 차세대 AI의 발전 방향으로 제시했다. 그리고 이를 위한 플랫폼 코스모스(Cosmos)를 발표했다.

엔비디아는 3D(3차원) 시뮬레이션에 기반한 디지털 트윈 플랫폼 옴니버스(Omniverse)를 갖고 있다. 디지털 트윈은 현실과 같은 가상공간을 만드는 것으로, 시뮬레이션을 통해 결과를 미리 예측할 수 있다. 여기에 코스모스가 더해지면서 옴니버스로 구현한 가상공간에 정교한 디지털 트윈이 가능해졌다. 현실에서의 물리적 상호작용이 가상 세계에서도 구현되는 것이다. 또 휴머노이드 로봇에 탑재되는 소형 컴퓨터 ‘젯슨 토르(Jetson Thor)’가 출시되면 로봇이 현실 속 수많은 환경 변화를 인식하고 인간의 명령까지 이해할 수 있는 새로운 세계가 열린다. 황 CEO의 말대로 AI가 또 한 번의 거대한 기술적 변곡점을 맞이하고 있는 것이다.

엔비디아 외에도 구글과 지멘스 역시 물리 법칙을 이해하는 AI를 개발하고 있다. 구글은 현실 세계를 시뮬레이션해 AI가 스스로 학습하고 문제를 해결하는 LWM을 지향한다. 구글 자회사 딥마인드가 지난해 12월 출시한 지니2(Genie2)는 텍스트와 이미지를 기반 삼아 실시간으로 상호작용이 가능한 3D 가상 세계를 생성할 수 있다. 가령 “숲속을 걷는 귀여운 로봇”이라는 텍스트와 로봇 이미지를 입력하면 로봇이 숲을 걸어 다니는 3D 장면을 실시간으로 만들어낸다. 사용자는 키보드와 마우스를 통해 이 3D 환경을 탐색하고 상호작용할 수 있다. 이 기술을 응용하면 현실감 있는 가상 세계를 구축할 수 있을뿐더러, 자율주행이나 로봇 시뮬레이션 분야에서도 활용할 수 있다.

— 이하 생략 —

바로: LWM은 분명히 이상향이다. 그런데 근 시일내로 연구실이 아닌 현장에서의 적용은 어렵지 않을까 생각한다. 하지만 일부 제한적인 환경에서의 적용만으로도 충분한 가치가 있으리라 생각한다. 다만… 인문학의 입장에서는 인간 모델을 만들어야 하는데… 최소한 수 만 단위의 멀티 에이젼트가 LWM에서 행위를 할 수 있어야 하는데…. 먼산…

Leave a Comment