AI 에이전트 요약서 by Google
구글에서 2024년 9월에 AI Agent에 백서가 나왔습니다. Julia Wiesinger, Patrick Marlow and Vladimir Vuskovic 이 작성한 내용을 바탕으로 요약했습니다.
사람과 같이 생성형 AI 모델은 정보에 실시간으로 접속하거나 액션을 제시할 수 있도록 훈련이 가능하며, 이를 위해서는 외부 툴에 대한 접근과 작업을 스스로 수행할 수 있는 능력이 필요하다고 합니다.
- 특정 정보를 찾기 위해서 데이터베이스에서 추출하거나
- 구매이력을 보고 맞춤형 쇼핑 리스트를 추천
할 수 있습니다.
에이전트는 사고, 로직, 그리고 외부 정보에 대한 접속이 결합되어서 독립형으로 사용되던 생성형 인공지능의 범위를 확대합니다.

에이전트란
- LLM 모델이 에이전트 프로세스의 두뇌와 같은 역할
- ReAct, Chain-of-Thought, Tree-of-Thoughts 들의 로직 프레임워크를 사용하여 사고
- Tools란 에이전트가 외부의 데이터와 서비스를 접근하는 역할
- 예를 들어, API를 접근가능함
- Orhestration Layer란 주기적으로 에이전트의 프로레스를 제어하는 역할
- 일종의 워크플로우 개념
- 에이전트와 모델의 차이점

에이전트가 작동하는 방법
- 정보를 모으고
- 내부 사고(Reasoning)를 하고
- 액션을 실행
ReAct: 생성형 모델을 위한 프롬프트 엔지니어링 프레임워크
Chain of Thought (CoT): 중간 스텝을 통해서 사고를 도와주는 프롬프트 엔지니어링 프레임워크
Tree-of-thoughts (IoT): 전략적 미리보기나 탐색에 적합한 프롬프트 엔지니어링 프레임워크
Tools
Extension
에이전트와 액션 실행을 위한 API중간에 역할로, API 종류나 유형에 따라서 Built-in-Extension이 생길 수 있음
Functions
개발자 시각에서 Extension을 코드 모듈로 구현하는 개념으로 에이전트와 분리되고 실제 연결되는 애플케이션에 의존됨
Data stores
외부의 업데이트되는 정보를 활용하도록 하는 기능으로 주로 벡터 데이터베이스로 구현됨. 가장 알려진 모델은 RAG(Retrieval Augmented Generation)로 구현하는 방식임.
Tools 요약

모델의 성능 향상방법
- In-context learning : ReAct 프레임워크 등을 활용하여 에이전트가 실행되는 특정 조건들을 정의
- Retrieval based in context learning: RAG를 활용하여 모델의 성능을 향상 시키는 테크닉
- Fine-tuning based learning: 특정 케이스에 맞는 대량 데이터셋을 활용하는 케이스에 적합
요약
복잡한 에이전트 아키텍처를 구축하는 것은 반복적인 접근 방식이 필요하며, 특정 비즈니스 사례와 조직적 요구 사항에 맞는실험과 개선이 핵심입니다. 이러한 아키텍처를 뒷받침하는 생성형 모델의 특성으로 인해 동일한 에이전트는 존재하지 않음. 그러나 각 구성 요소의 강점을 잘 활용하면 언어 모델의 역량을 확장하고 실질적인 가치를 창출하는 에이전트 프로그램을 만들 수 있음
기업 운영을 위한 비지니스 자동화
아웃코드 소개, 기업 활용 사례, 전문가 상담까지 한번에 신청