분류 전체보기

556개의 글

LangGraph Reflection - 자기평가로 답변을 개선하는 루프 설계

Reflection은 에이전트가 스스로 결과를 평가·비판한 뒤 피드백을 상태(state)에 기록하고, 필요하면 수정 루프로 되돌아가 답을 개선하는 설계 패턴이다. 보통 “작성 노드(답 생성) → 리플렉션 노드(자기평가) → 라우팅(조건부 엣지)” 구조로 만들고, 반복 횟수 제한(max_iters)을 둬 무한 루프를 막는다.이번 글에서는1) Reflection 개념2) 랭체인 + OpenAI로 “가사 생성/평가/수정”3) LangGraph로 Reflection 루프 구현4) Reflexion(논문 아이디어) + 웹검색 툴 결합까지 한 번에 정리한다.원문 흐름은 랭그래프 Reflection 기반으로 재구성했다.1. ReflectionReflection의 핵심은 간단하다.초안 생성자기 평가(잘된 점/아쉬운 점..

2026.03.24

현재/AI Agent

LangGraph로 챗봇 만들기 - Tool Calling Agent, Tavily, ToolNode, create_react_agent

Tool Calling Agent는 자신이 가진 지식만 사용하는 것이 아니라, 필요하면 외부 도구(API, 웹 검색, DB, 코드 실행기 등)를 호출해 문제를 해결하는 에이전트다. 쉽게 말해, “대화만 하는 AI”가 아니라 필요할 때 검색/계산/조회 같은 도구를 직접 쓰는 AI가 된다.이번 글에서는 (1) Tavily로 웹 검색 도구를 붙이고, (2) LangChain에서 도구 바인딩을 하고, (3) LangGraph에서 ToolNode로 “LLM의 tool_calls를 실제 실행”까지 연결해 웹 검색 챗봇을 만드는 흐름을 정리한다. 원문 흐름은 랭그래프를 이용한 간단한 챗봇을 바탕으로 재구성했다.1. Tool Calling Agent란?Tool Calling Agent는 다음 순서로 움직인다.1) 사용..

2026.03.24

현재/AI Agent

LangGraph 기초 문법 - State 업데이트, add_messages, invoke·stream, 조건·반복

LangGraph는 LangChain 생태계에서 에이전트나 RAG 시스템을 그래프(노드/엣지) 로 설계하고 실행할 수 있게 해주는 오케스트레이션 프레임워크다. 직선형 파이프라인만 만드는 게 아니라 분기(conditional), 반복(loop), 병렬(parallel), 스트리밍(stream) 같은 흐름을 “구조로” 표현할 수 있다는 점이 핵심이다.이번 글은 LangGraph를 처음 볼 때 가장 헷갈리는 기초 문법을 한 번에 정리한다. 특히 State 업데이트, 메시지 누적 리듀서(add_messages), invoke/ainvoke/stream/astream, 그리고 조건 분기/반복까지 “코드가 어디에서 어떻게 이어지는지” 기준으로 정리해본다. 원문 흐름은 랭그래프 기초 문법을 바탕으로 재구성했다.1. ..

2026.03.20

현재/AI Agent

AI Agent - RAG·MCP·LangGraph로 보는 에이전트 워크플로우

AI Agent는 환경으로부터 정보를 지각(Perception)하고, 주어진 목표를 달성하기 위해 의사결정(Decision Making)을 거쳐 적절한 행동(Action)을 수행하는 지능형 주체다. 단순히 입력에 반응하는 프로그램과 달리, 에이전트는 데이터와 경험을 바탕으로 학습하며 상황에 맞게 적응한다.최근에는 텍스트·이미지·음성 등을 동시에 다루는 멀티모달 모델, 외부 지식을 검색해 활용하는 RAG, 그리고 도구·서비스·DB와 연결해 실행 능력을 확장하는 MCP 같은 기술이 결합되면서 “말만 잘하는 모델”에서 “일을 하는 시스템”으로 빠르게 진화하고 있다. (원문 흐름은 AI Agent 내용을 바탕으로 정리했다.)1. AI Agent 한 줄 정의AI Agent = “상황을 보고(지각) → 판단하고(의..

플오그래밍

분류 전체보기

LangGraph Reflection - 자기평가로 답변을 개선하는 루프 설계

LangGraph로 챗봇 만들기 - Tool Calling Agent, Tavily, ToolNode, create_react_agent

LangGraph 기초 문법 - State 업데이트, add_messages, invoke·stream, 조건·반복

AI Agent - RAG·MCP·LangGraph로 보는 에이전트 워크플로우

PPO - Proximal Policy Optimization 정책 업데이트 안정화

A2C - Advantage Actor-Critic 동기식 병렬 학습

A3C - Asynchronous Advantage Actor-Critic

Policy 기반 에이전트 - REINFORCE, Actor-Critic, TD Actor-Critic

Q-learning과 DQN - Q값 업데이트, Gym·CartPole 실습

Deep RL - 함수 근사, 신경망, 가치 기반·정책 기반 강화학습

Monte Carlo와 TD Learning - GridWorld로 비교하는 모델 프리 가치 학습

벨만 기대 방정식 - 술취한 사람 예제로 이해하는 가치 함수와 값 반복

LangGraph Reflection - 자기평가로 답변을 개선하는 루프 설계

LangGraph로 챗봇 만들기 - Tool Calling Agent, Tavily, ToolNode, create_react_agent

LangGraph 기초 문법 - State 업데이트, add_messages, invoke·stream, 조건·반복

AI Agent - RAG·MCP·LangGraph로 보는 에이전트 워크플로우

PPO - Proximal Policy Optimization 정책 업데이트 안정화

A2C - Advantage Actor-Critic 동기식 병렬 학습

A3C - Asynchronous Advantage Actor-Critic

Policy 기반 에이전트 - REINFORCE, Actor-Critic, TD Actor-Critic

Q-learning과 DQN - Q값 업데이트, Gym·CartPole 실습

Deep RL - 함수 근사, 신경망, 가치 기반·정책 기반 강화학습

Monte Carlo와 TD Learning - GridWorld로 비교하는 모델 프리 가치 학습

벨만 기대 방정식 - 술취한 사람 예제로 이해하는 가치 함수와 값 반복

티스토리툴바