본문 바로가기
IT산책

ChatGPT의 LLM만으로는 부족하다? RAG가 필요한 이유

by 분당아재 2025. 5. 21.
반응형

🔍 LLM 시대의 핵심 기술, RAG가 뭐길래 이렇게 중요할까?

요즘 ChatGPT를 비롯한 다양한 생성형 AI(LLM)의 전성시대입니다. 

ChatGPT가 시작했으나 지금은 Gemini, Grok 3, Copilot 등 많은 생성형 AI가 나름의 장점을 어필하면서

고객을 끌어들이고 있습니다. 

 

https://moneytree.tistory.com/1457

 

ChatGPT, Gemini 등 생성형 AI서비스 장단점과 비용 비교 분석

수많은 AI 서비스, 어떤 걸 써야 할까? 장단점과 비용 비교!요즘 ChatGPT를 시작으로 Claude, Gemini, Perplexity, Microsoft Copilot 등 다양한 생성형 AI 서비스들이 쏟아지고 있습니다.엑스(X, 트위터)에서도 Gro

www.bundangaje.kr

 

이런 생성형 AI는 LLM 방식으로 동작합니다. 

LLM은 Large Language Model(대규모 언어 모델)의 줄임말입니다.
간단히 말해, LLM은 엄청나게 많은 텍스트 데이터를 학습해서 사람의 언어를 이해하고, 생성하고, 번역하는 등의 작업을 수행할 수 있는 인공지능 모델입니다. 

마치 어마어마한 양의 책과 글을 읽고 자란 똑똑한 친구라고 생각하시면 됩니다.

 

그런데 이런 모델들이 실전에서 더 똑똑하게 작동하게 만드는 핵심 기술이 하나 있습니다.
바로 RAG, 즉 Retrieval-Augmented Generation입니다.

이름은 낯설 수 있지만, 이미 우리가 자주 보는 AI 챗봇이나 검색 AI 대부분은 RAG 기술을 기반으로 작동합니다.

 

ChatGPTBing AI, 네이버 하이퍼클로바 같은 생성형 AI(LLM)사용하다 보면 종종 이런 문구가 볼 수 있습니다. 
검색 중입니다...”, 또는 실시간 정보 검색 중...”


바로 순간이 RAG(Retrieval-Augmented Generation)라는 기술이 작동하고 있는 것입니다.

단순히 모델이 알고 있는 지식으로 답하는 것이 아니라,
실시간으로 외부 정보를 검색해서, 결과를 바탕으로 정확하고 신뢰도 높은 답변을 만들어주는 것이죠.

 

즉, LLM부족한 부분—특히 최신 정보나 상세 문서대한 이해를—보완해주는 비밀 병기바로 RAG입니다.

LLM이 가진 한계부터 이해해보자

대형 언어모델(LLM)은 인터넷에서 수많은 텍스트 데이터를 학습해서 만들어졌습니다.
하지만 이런 LLM도 치명적인 한계가 있습니다.

  1. 최신 정보가 없다 (예: 2023년 이후의 지식은 모름)
  2. 사실 확인이 안 된다 (거짓 정보를 그럴듯하게 말할 수 있음)
  3. 긴 문서를 다 기억하지 못한다 (입력 제한이 있음)

이런 문제들 때문에 실제 업무나 비즈니스에서 LLM을 그대로 쓰기에는 위험 요소가 많습니다.

이때 필요한 것이 바로 RAG!

'RAG(Retrieval-Augmented Generation)'는 말 그대로,
외부에서 정보를 검색(Retrieval)해서 생성(Generation)에 활용하는 방식”입니다.

 

예를 들어,

  • 내가 "2024년 KLPGA 우승자 리스트 알려줘"라고 묻는다면,
  • 일반 LLM은 학습 시점 이후의 정보를 모르기 때문에 답을 하지 못합니다. 

하지만 RAG는 이렇게 합니다.

  1. 벡터 DB나 웹에서 관련 문서를 검색
  2. 찾아온 문서의 핵심 내용을 요약
  3. 요약된 내용을 바탕으로 정확한 답변 생성

즉, LLM이 잘 모르는 내용도 외부 자료를 검색해 보강해주는 방식입니다.

 

RAG 흐름도

RAG의 구조는 이렇게 생겼어요

간단한 RAG 구조는 다음과 같습니다:

[질문 입력] → [벡터 검색기] → [관련 문서 추출] → [LLM 응답 생성]
  • 💬 유저 질문: "전기차 보조금 최신 기준 알려줘"
  • 🔎 검색기: 전기차 보조금 관련 PDF, 뉴스, 문서 등 검색
  • 📄 문서 정리: 중요한 정보 요약
  • 🤖 LLM 응답 생성: "2025년 기준, 서울시는 전기차에 최대 800만원을 지원합니다..."

 

 

LLM은 대규모 언어모델입니다.

그러다보니 국내 인공지능 기업에서는 ChatGPT처럼 모든 분야의 지식을 구축할 수 없습니다.

그래서, 우리나라 IT 기업들은 sLLM이라는 용어로 소규모 언어모델(지식)을 구축하고

이를 고객사에 서비스하는 식으로 사업을 하고 있습니다.

이때도 마찬가지로 기업이 해당 분야의 지식을 다 구축하지 못하기 때문에 RAG 기술을 함께 구축합니다. 

  • 사내 매뉴얼, 계약서, 법률 자료 검색 기반 상담
  • 의학 논문 기반 진단 서포트
  • 최신 뉴스 요약 서비스
  • 전자상거래 FAQ 자동응답
  • 기술문서 기반 고객지원 봇

이런 류의 사업을 할 때 sLLM을 구축하고 부족한 내용을 RAG로 해결하는 식입니다. 

 

LLM은 확실히 강력합니다. 하지만 무조건 믿기에는 위험한 것도 사실입니다. 
RAG는 그 LLM에 실용성과 신뢰도를 더해주는 핵심 기술입니다.

 

바램이 있다면 우리나라에도 강력한 LLM을 가진 ChatGPT 같은 서비스가 등장했으면 하는 것입니다.

외국의, 외부의 지식을 가져다가 LLM을 흉내내고 여기에 RAG(검색)을 붙여서

인공지능 서비스인 것처럼 보이게 하는 것이 아니라 진짜 LLM을요.

 

이런 날이 오길 기대해 봅니다. 

좋은 하루 보내세요.

반응형