[kakao enterprise|Tech&] 자율 AI 에이전트, ChatGPT 다음의 메가트렌드?

nana0n 2026. 5. 9. 02:34

2026. 5. 9. 02:34

Autonomous AI Agent(자율 AI 에이전트)

자율 AI 에이전트란? GPT-4와 같이 AI 모델의 외부 툴에 대한 접근을 허용하는 제품 및 서비스를 의미

-브라우저, AI 모델, 스토리지, 컴퓨팅 엔진 등과 같은 외부 툴을 활용하게 함으로써 모델이 사람의 개입없이 완전한 자율성을 가지고 태스크를 수행하는 것을 목적으로 함

<주요 기능>

ChatGPT와 Auto-GPT는 동일한 AI 모델(GPT-3.5, GPT-4)를 기반으로 하지만, 아래와 같이 크게 2가지 기능을 중심으로 차별된다.

1. 외부 툴을 활용하는 기능

우선적으로 자율 AI 에이전트는 외부 툴(검색, 메모리, TTS, 생성형 AI 모델)을 활용하여 프롬프트에 대한 결과값을 내놓는 반면, ChatGPT는 그렇지 못한다.

거짓 정보를 마치 옳은 것과 같이 제시하는 할루시네이션의 위험도 줄고, 조금 더 다양한 도구를 사용할 수 있어 복잡한 태스크 수행이 가능하다.

뿐만 아니라 보다 메모리 접근을 통해 장기 기억 능력이 향상되어 내용을 보존하여 태스크 처리 능력이 향상되기도 한다.

2. Autonomous Iteration(자율 반복 기능)

기존에 ChatGPT에는 명확하게 목적과 목적을 달성하기 위한 instruction 사항을 명시해줘야 했음.

Auto-GPT는 AI 에이전트가 목표에 달성할 때까지 사용자의 프롬프트 입력 없이 하위 태스크를 설계, 검토 및 실행하는 과정을 반복.

셀프 프롬프팅(스스로 프롬프트를 주입하는 과정)을 반복 가능

<자율 AI 에이전트를 위한 좋은 프롬프트?>

자율 AI 에이전트에게 초반에 입력하는 프롬프트, 그리고 실행 중인 에이전트에게 피드백을 줄 때 아래와 같은 사항을 참고하여 테스트 해보면 에이전트가 더 효과적으로 작동한다.

1. 프롬프트 안에 간결하고 명확하게 목표 서술

자율 AI 에이전트는 목표를 명확하고 간결하게 해주어 스스로 문제를 해결하기 위한 공간을 남겨두는 것이 효과적이었음

2. 적합한 외부 툴, 레퍼런스를 지정하여 선택의 폭 좁혀주기

에이전트들은 실시간으로 외부 검색, 서비스 등을 활용하여 결과물을 내놓음.

테스트 결과, AI 에이전트 선택의 폭이 너무 넓기 때문에 번거롭더라도 목표에 적합하게 툴들을 미리 지정하여 선택의 폭을 좁혀주는 것이 효과적임.

자율 AI 에이전트 트렌드의 발단, Auto-GPT

Significant-Gravitas 라는 스타트업에서 LangChain 라이브버리를 활용하여 개발한 오픈소스 파이썬 애플리케이션으로 OpenAI의 텍스트 생성 모델 GPT-3.5, GPT-4 모델이 다양한 외부 소프트웨어, 서비스와 소통하여 사용자 인풋 없이도 스스로 자율적으로 반복을 거쳐 목표에 도달하는 것이 특징이다.

Auto-GPT는 개발자 커뮤니티에서 AGI(Aritificial General Intelligence)의 초기 버전이다 라는 평을 받으며 출시 이후 현재까지 많이 회자되고 있다.

오늘 날 자율 AI 에이전트 트렌드가 떠오르게 된 발단이라고 볼 수 있다.

<Auto-GPT 프레임워크>

백엔드에서는 태스크 생성, 태스크 우선 순위 선정, 태스크 수행이라는 3개의 주요 워크로드를 담당하는 에이전트들(GPT-4 기반)으로 구성되어 있다.

1. Goal Initialization: 사용자가 목표 입력, 태스크 대기 목록을 지나 Task Creation Agent에 전달

2. Memory Querying: 목표를 받은 Task Creation Agent가 메모리에 지금까지 완료된 태스크가 있는지 확인

3. Task Generation: 전달받은 목표와 이제까지 완료된 태스크 목록을 기반으로 새로운 태스크 목록을 생성하여 Task Queue에 전달

4. Task Prioritization: Task Prioritization Agent가 목표와 마지막으로 수행된 태스크를 기반으로 태스크의 우선 순위를 배정하고,

목록을 정리하여 다시 Task Queue에 전달하고,

사용자에게 전달하여 정리된 태스크 목록을 계횓개로 실행한 것에 대한 승인 요청

승인 요청을 받으면 Task Queue로 보낸 후 Task Execution Agent에게 실행 요청

처음 목표를 입력하면 사용자는 화면에 AI가 스스로 이름, 역할, 그리고 하위 목표, 실행 계획을 설계하여 사용자의 허락 및 피드백을 구하는 것을 확인 가능함
이후에 한 사이클이 끝날 때마다 새롭게 정리된 태스크 목록 및 실행 계획을 받아보고, 이를 4가지 방법으로 승인하여 계획을 행동으로 옮길 수 있음: 수동 승인(y), n번 자동으로 승인(y-N), AI 셀프 피드백 및 승인(s), 중지(n)

5. Task Execution: Task Queue에서 Task Prioritization Agent가 새롭게 정리해준 태스크 목록을 Task Execution Agent에게 보내면, 해당 에이전트가 우선 순위가 가장 높은 태스크를 처리

6. Storage: AI가 수행한 태스크 목록, 결과값, 수행한 태스크에 대한 피드백을 벡터 데이터베이스에 저장

7. Autonomous Iteration: 1번에서 6번까지 최초 사이클이 한번 돌았다면, 이후에는 AI 에이전트가 1번에서 사용자가 입력한 목표에 도달할 때까지 2~6번을 자율적으로 반복

Auto-GPT 플러그인

0.3.1 버전 업데이트가 진행되며 연동 가능한 플러그인 옵션이 대거 추가되었다.

Auto-GPT가 지원하는 플러그인은 크게 first party, third party plugin 으로 나뉘며,

first party의 경우 Auto-GPT v0 3.1와 함께 설치가 진행되면 반면, third party plugin은 개별적으로 설치를 진행해야 한다.

추가적으로 사용자들은 플러그인 레포지토리 및 템플릿을 복제하여 커스텀 플러그인을 만들고 공유할 수 있다고 한다.

자율 AI 에이전트의 서비스화

별도 설치 없이 Auto-GPT의 기능을 사용해볼 수 있게 이를 서비스화하여 출시하는 사례가 꾸준히 증가하고 있다.

Agent GPT(Beta)

Auto-GPT를 브라우저를 통해 설치 없이 사용해볼 수 있도록 한 사례.

하단 이름과 목표 입력을 통해 나만의 AI 에이전트가 상위 목표 달성을 위한 하위 태스크를 자율적으로 생성하고, 하나씩 처리하기 시작한다.

God Mode

현시점 가장 많은 주목을 받고 있는 자율 AI 에이전트 서비스 중 하나이다.

기존 Auto-GPT는 개발자가 아니면 익숙하지 않은, 비주류의 터미널 인터페이스를 기본으로 한다.

God Mode는 이와 같은 문제점을 AgentGPT와 유사하게 인식하여 Auto-GPT를 브라우저에서 실행할 수 있도록 한 서비스이다.

현재 AI 에이전트 비즈니스 오토메이션을 위한 Godmode V2 대기 명단을 받고 있다.

BabyAGI UI

Auto-GPT와 비슷한 시기에 출시된 오픈소스 파이썬 스크립트이다.

OpenAI의 언어 모델, Chroma와 Weaviate와 같은 벡터 데이터베이스를 활용하여 사용자가 설정한 목표를 달성하기 위한 태스크를 생성하고, 우선순위를 매겨 처리한다.

Cognosys

Search mode를 활성화하면 GPT-4를 사용하게 되고,

중간 대화 창에 이름과 목표를 지정해주면 목표 달성을 위한 태스크를 자율적으로 계획하고 하나씩 우선 순위대로 실행하기 시작한다.

한국어로 결과값을 요청한 것에 어려움을 겪은 타 서비스들의 AI 에이전트와는 다르게 문제 없이 요청한 목표에 원할하게 다다랐다.

Do Anything Machine(Waitlist)

사용자가 태스크를 리스트업하면 GPT4기반 에이전트를 생성하여 해당 태스크들을 수행해주는 서비스.

해당 서비스는 생산성에 초점이 맞추어져 있는 툴로, 사용자가 태스크를 추가할 때마다 GPT-4 에이전트가 생성되어 주어진 태스크를 수행한다.

Aomni

리서치에 특화된 자율 AI 에이전트.

실시간 인터넷 브라우징을 통해 찾은 정보를 기반으로 텍스트를 생성하여 실제 사람이 리서치하는 것과 같은 프로세스와 유사하게 목표에 도달한다.

서비스의 기본 토큰 사용량을 달성한 이후 새로운 리서치를 요청하려면 Pro 플랜으로 업그레이드가 필요하다.

Nexus GPT

세계 최초 AI 프리랜서 플랫폼.

해당 사이트는 실제 사람 프리랜서 대신에 각기 다른 role을 가지고 있는 AI 에이전트들을 마켓플레이스에서 확인해볼 수 있다.

사용자가 자신의 목적에 맞는 AI 에이전트를 보다 빠르고 쉽게 활용할 수 있도록 AI 에이전트를 사전에 템플릿화한 것이 특징이다.

자율 AI 에이전트의 다양화

<멀티 에이전트>

GPTeam

다수의 자율 AI 에이전트를 동시에 실행하는 신규 실험성 프로젝트가 공개됨.

스탠포드의 Generative Agents 논문에서 영감을 받아 개발하였으며, 다수의 에이전트가 동시 다발적으로 작동하는 것이 특징이다.

Auto-GPT와 유사하게 터미널에서 작동하는 자율 AI 에이전트 파이썬 스크립트로 다수의 에이전트가 서로 소통하며 하나의 목표를 위해 각기 다른 태스크를 맡아 협업하는 것을 구현함.

해당 프로젝트는 사용자의 선택에 따라 OpenAI의 GPT-4를 활용하거나 구글이 투자하여 OpenAI의 대항마로 기대 받고 있는 스타트업 Anthropic의 Claude 를 기반 모델로 사용할 수도 있다.

<멀티모달 에이전트>

Hugging Face Transformers Agent

AI 모델 호스팅 플랫폼 허깅페이스가 최근에 출시한 툴로,

Transformer와 Diffusion 모델 위에 2가지 유형의 NLP API를 올려서 허깅페이스에 호스팅된 모델 중 10만개가 넘는 오픈소스 모델들을 활용하여 멀티모달 태스크 처리가 가능한 것이 특징이다.

사용자가 선택한 거대 언어 모델을 중심으로 다양한 Transformer, Diffusion 모델이 붙는다.

자동으로 많은 툴 중에 가장 적합한 툴을 선택하여 태스크 처리 가능하다.

HfAgent: inference endpoint를 사용하여 허깅페이스에 호스팅된 오픈소스 모델을 AI 에이전트로서 무료로 사용 가능하다. 허깅페이스에서 원하는 모델을 조회한 후, 우측에 'inference API' 활성화 여부를 확인한 후 코드를 수정하여 오픈소스 에이전트를 선택하여 가져올 수 있다.
OpenAiAgent: OpenAI 폐쇄형 모델을 가져와서 AI 에이전트로 사용할 수 있는 옵션이다. OpenAI의 Paid Plan에 등록되어 있어야 하며, API Key를 등록한 후 사용량 만큼의 비용을 지불해야 한다.
Single execution API(agent.run): AI 에이전트가 자동으로 태스크를 처리하기 위해 요구되는 툴을 선택하고 해당 툴들을 적절하게 실행하는 접근법을 택한다. 단일 instruction으로 하나 또는 다수의 태스크를 한번에 처리할 수 있으나, 태스크가 복잡할수록 실패 확률이 높아진다.
Chat-based execution API(agent.chat): 채팅 기반의 접근법, 단일 instruction이 아닌 다수의 instruction을 제공하였을 때 state를 유지한다. 대화 기억 기능을 통해 single execution API보다 연속성 있고 복잡한 태스크에 적합한 instruction에 적합한 접근법이다.

ChatGPT Plugin(Beta), Web Browsing(Beta)

최근 OpenAI가 ChatGPT Plugin 베타 버전을 대기명단에 올라간 사용자들을 대상으로 출시했다.

기본적으로 제공되고 있는 Plugin 외에도 사용자가 직접 플러그인을 만들어 지정 서드파티 앱의 API를 호출할 수도 있다.

ChatGPT가 베타 버전 이후 더 나아가 향후 보다 적은 사람의 개입으로 Auto-GPT와 같이 AI 에이전트가 스스로 생각하며 계획하고 실행에 옮기는 자율 AI 에이전트로 발전해나아갈 것인지 지켜볼 필요가 있다.

'4학년 > 기술블로그' 카테고리의 다른 글

[260518] [금융보안원] 내부업무망 SaaS 망분리 예외 적용에 따른 보안 해설서 (0)	2026.05.24
[260511] [kakaotech] 잃어버린 리포트를 찾아서: 카카오 메시징 시스템의 경쟁 조건 문제와 안티 패턴 제거 과정 (0)	2026.05.17
[260406] [엔키화이트햇] 공시가 '보안 성적표'가 되는 시대: 2027 정보보호 공시 확대의 시사점과 대응 (0)	2026.04.08
[260405] [우아한 기술블로그] 5년 동안 못 푼 배민 다국어 숙제, AI와 함께 한 달 만에 끝내기 (0)	2026.04.03
[260329][Theori] Xint로 구축한 안전한헬스케어 보안 (0)	2026.03.29

nana0n 님의 블로그

[kakao enterprise|Tech&] 자율 AI 에이전트, ChatGPT 다음의 메가트렌드?

'4학년 > 기술블로그' 카테고리의 다른 글

+ Recent posts

티스토리툴바