QANDA AX

Context Engineering이란? AI 에이전트의 성능을 좌우하는 핵심

프롬프트를 넘어, AI가 올바른 맥락 안에서 일하게 만드는 6가지 레이어

"프롬프트 잘 쓰면 된다"는 환상이 깨지는 순간

2025년 6월, Shopify CEO Toby Lutke가 X(구 Twitter)에 짧은 글을 올렸습니다. "Context Engineering이라는 용어가 Prompt Engineering보다 핵심 역량을 더 잘 설명한다"는 내용이었습니다. 이 한 문장이 AI 커뮤니티 전체에 파문을 일으켰습니다. Shopify는 당시 내부 개발 워크플로우의 상당 부분을 AI 에이전트에 위임하고 있었고, Lutke는 그 과정에서 프롬프트 하나를 잘 쓰는 것이 아니라 모델이 접근할 수 있는 전체 맥락을 설계하는 것이 진짜 차이를 만든다는 사실을 체감한 것입니다.

I really like the term 'context engineering' over prompt engineering. It describes the core skill better: the art of providing all the context for the task to be plausibly solvable by the LLM.

Toby Lutke, Shopify CEO

프롬프트 엔지니어링은 "어떻게 질문하면 좋은 답이 나올까?"에 집중합니다. 그러나 실무에서 AI의 성능을 결정짓는 것은 질문의 문구가 아닙니다. 모델이 작업을 수행하는 시점에 어떤 정보를 볼 수 있는가 — 이것이 전부입니다. Context Engineering은 바로 이 "볼 수 있는 것"을 체계적으로 설계하는 기술입니다.

Context Engineering의 6가지 레이어

Context Engineering은 단일 기법이 아닙니다. AI 모델이 작업을 수행할 때 필요한 맥락을 6가지 레이어로 나누어 체계적으로 관리하는 프레임워크입니다. 각 레이어는 독립적으로 작동하면서도 상위 레이어의 효과를 극대화합니다.

Layer 6: Evaluation자기 검증 · 출력 품질 보장Layer 5: Compression컨텍스트 압축 · 윈도우 효율화Layer 4: Memory단기 + 장기 기억 · 세션 간 연속성Layer 3: Tool Connection (MCP)외부 도구 연결 · 실시간 데이터 접근Layer 2: Dynamic Retrieval (RAG)실시간 검색 · 최신 정보 주입Layer 1: Static Context시스템 프롬프트 · CLAUDE.md · 규칙 정의복잡도 증가

Context Engineering의 6-Layer 스택: 아래에서 위로, 기초부터 고급 레이어까지 쌓아 올린다

6가지 레이어 상세 해부

Layer 1: Static Context — 시스템 프롬프트, CLAUDE.md, AGENTS.md
모든 세션에 동일하게 적용되는 고정 지침입니다. 프로젝트의 코딩 컨벤션, 아키텍처 원칙, 응답 포맷 규칙 등을 한 번 정의하면 이후 모든 AI 상호작용에 자동으로 반영됩니다. Anthropic의 CLAUDE.md, OpenAI의 Custom Instructions가 대표적인 구현체입니다.
Before: 매번 지침을 반복 입력After: CLAUDE.md 한 번 작성, 모든 세션에 자동 적용
Layer 2: Dynamic Retrieval — RAG (검색 증강 생성)
모델의 학습 데이터에는 한계가 있습니다. RAG는 질문이 들어올 때 관련 문서를 실시간으로 검색하여 컨텍스트 윈도우에 주입합니다. 사내 위키, 제품 문서, 최신 정책 등 학습 시점 이후의 정보를 AI가 참조할 수 있게 만드는 핵심 레이어입니다.
Before: 6개월 전 학습 데이터로 답변After: 실시간 사내 DB 검색 후 최신 정보 제공
Layer 3: Tool Connection — MCP (Model Context Protocol)
AI 모델이 외부 시스템과 직접 상호작용할 수 있게 연결하는 레이어입니다. Anthropic이 2024년 공개한 MCP(Model Context Protocol)는 이 레이어의 표준 프로토콜로 자리잡았습니다. Jira에서 티켓을 조회하고, Slack에 메시지를 보내고, 데이터베이스를 쿼리하는 것이 모두 이 레이어에서 일어납니다. QANDA AX는 7개 도메인에 걸쳐 60+ AI Skills를 MCP 기반으로 운영하며, 도메인별 MCP 서버를 분리하여 컨텍스트 윈도우 효율을 극대화하고 있습니다.
Before: 수동으로 데이터 복사·붙여넣기After: AI가 Jira, Slack, DB에 직접 접근
Layer 4: Memory — 단기 기억 + 장기 기억
대화 세션이 끝나면 AI는 모든 맥락을 잊습니다. Memory 레이어는 이 문제를 해결합니다. 단기 기억(현재 대화의 핵심 요약)과 장기 기억(이전 세션의 결정사항, 사용자 선호도)을 결합하여 AI가 연속적인 작업 맥락을 유지할 수 있게 합니다.
Before: 새 세션마다 맥락 처음부터After: 이전 작업 상태 자동 복원
Layer 5: Compression — 컨텍스트 압축
컨텍스트 윈도우는 유한합니다. 대화가 길어지면 초기 지침이 밀려나고, 모델의 성능이 떨어집니다. Compression 레이어는 불필요한 정보를 제거하고 핵심만 요약하여 윈도우를 효율적으로 사용합니다. 연구에 따르면 지능적 컨텍스트 압축 기법으로 메모리를 26-54% 절감하면서도 정확도 95% 이상을 유지할 수 있습니다.
Before: 대화가 길어지면 초기 지침 망각After: 핵심만 요약·압축하여 윈도우 효율화
Layer 6: Evaluation — 자기 검증
AI의 출력을 사람이 매번 검증하는 것은 확장 가능하지 않습니다. Evaluation 레이어는 모델 스스로가 출력의 정확성, 일관성, 완전성을 검증하고 필요시 수정하는 메커니즘입니다. Agentic 워크플로우에서 특히 핵심적인 역할을 합니다.
Before: 오류를 사용자가 발견After: 에이전트가 출력을 자체 검증 후 수정

Context Engineering 실행 체크리스트

6가지 레이어를 실무에 적용하려면 구체적인 실행 항목이 필요합니다. 아래 체크리스트는 각 레이어별로 즉시 시작할 수 있는 액션 아이템입니다.

Context Engineering은 Harness Engineering의 핵심 레이어입니다. AI를 단순 도구가 아닌 "일하는 시스템"으로 전환하려면, 모델이 올바른 맥락 안에서 올바른 도구로 올바른 작업을 수행하도록 전체 파이프라인을 설계해야 합니다.

조직 차원의 AI 인프라 구축이 필요하다면, QANDA AX의 AI Integration 서비스를 통해 6가지 레이어를 기업 환경에 맞게 구현할 수 있습니다.

Context Engineering의 효과를 어떻게 측정하는가

프레임워크를 도입했다면 성과를 측정해야 합니다. Context Engineering의 효과는 세 가지 핵심 지표로 추적합니다.

Task Completion Rate
작업 완료율

AI에게 맡긴 작업 중 사람의 추가 개입 없이 완료된 비율. Layer 1-3이 직접적으로 영향을 미칩니다.

Hallucination Rate
환각 발생률

AI가 사실과 다른 정보를 생성한 비율. Layer 2(RAG)와 Layer 6(Evaluation)이 핵심 방어선입니다.

Token Efficiency
토큰 효율성

동일한 작업을 수행하는 데 소비된 토큰 수. Layer 5(Compression)가 직접 최적화합니다.

프롬프트 엔지니어링은 Layer 1(Static Context)의 일부입니다. 프롬프트는 중요하지만, 그것만으로는 기업 수준의 AI 성능을 달성할 수 없습니다. 6개 레이어 전체를 팀이 이해하고 적용하려면 체계적인 역량 강화가 필요합니다.

자주 묻는 질문

Context Engineering과 프롬프트 엔지니어링의 차이는 무엇인가요?

프롬프트 엔지니어링은 '무엇을 물을지'에 집중합니다. Context Engineering은 '모델이 무엇을 볼 수 있게 할지' 전체를 설계합니다. 프롬프트는 Context Engineering의 6개 레이어 중 하나(Static Context)에 해당합니다.

비개발자도 Context Engineering을 할 수 있나요?

Layer 1(Static Context)과 Layer 4(Memory)는 비개발자도 바로 적용할 수 있습니다. CLAUDE.md 작성, 프롬프트 템플릿 설계가 대표적입니다. Layer 2-3(RAG, MCP)은 개발 역량이 필요합니다.

어떤 레이어부터 시작하면 좋을까요?

Layer 1(Static Context)부터 시작하세요. 프로젝트 규칙과 컨벤션을 CLAUDE.md에 정리하는 것만으로도 AI 출력 품질이 눈에 띄게 개선됩니다. 그 다음 Layer 3(MCP)로 도구를 연결하면 실무 적용이 가능해집니다.

Context Engineering, 어디서부터 시작해야 할지 고민이신가요?

QANDA AX는 기업 맞춤 AI 인프라 설계를 지원합니다.

무료 상담 신청하기