RAG 2.0? : GLM(Grounded Language Model)

AI타임즈: “기존 RAG는 짜깁기”…’RAG 2.0′ 적용한 최고 사실 확인 모델 등장

Contextual AI

인공지능(AI) 스타트업 컨텍스추얼 AI(contextual AI)가 검색 증강 생성(RAG)을 재정리한 ‘RAG 2.0’ 기술을 기반으로 환각을 최소화하는 새로운 대형언어모델(LLM)을 출시했다. RAG 기술의 창시자가 직접 제작한 이 모델은 벤치마크에서 구글과 앤트로픽, 오픈AI 등의 사실 정확도를 능가했다.

컨텍스추얼 AI는 4일(현지시간) 업계에서 가장 높은 사실 정확도를 제공하는 ‘근거(groundedness) 기반’ 언어모델을 공개했다. 이름도 ‘GLM(Grounded Language Model)’이라고 붙였다. 

GLM은 명시적으로 제공된 정보로만 AI 응답을 제공하는 근거 개념을 핵심 원칙으로 삼고 있다. 이를 위해, 컨텍스추얼은 기존의 RAG 시스템의 한계를 뛰어넘는 새로운 접근법인 RAG 2.0을 도입했다고 밝혔다.

RAG 2.0은 시스템의 모든 요소를 하나로 통합해 최적화한다고 밝혔다. 정보 검색과 처리가 하나의 통합 시스템 내에서 이뤄지도록 사전 학습과 미세조정을 진행한다. 이를 통해 언어 모델과 검색 모델(retriever)을 동시에 학습, 성능을 극대화한다는 설명이다.

또 RAG 2.0은 스마트한 검색을 가능하게 하는 ‘혼합 검색기(mixture-of-retrievers)’ 기능을 사용한다. 이 기술은 질문을 받고 먼저 가장 적절한 검색 방법을 계획한 후, 그 전략에 따라 정보를 찾아낸다. 이는 최신 AI 모델의 사고방식과 비슷하다.

여기에 세계 최고 수준의 ‘재 순위 모델(re-ranker)’과 함께 작동, 검색된 정보 중 가장 중요한 내용을 선별하고 우선순위를 매겨 GLM에 전달하기 전에 정확도를 높인다고 덧붙였다.

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks(2020)

Leave a Comment