토큰, 청크, 벡터 DB, RAG

LLM이 텍스트를 내부적으로 처리하는 최소 단위
단순히 "단어"가 아니라, 문자, 부분 단어, 공백, 문장 부호 등도 포함
예시
- "Hello, world!" → ["Hello", ",", " world", "!"] (공백도 포함됨)
- "책상" → ["책", "상"] (단어가 조각날 수도 있음)

LLM을 학습하거나 추론할 때, 긴 텍스트를 일정한 크기로 나눈 블록
한 번에 처리할 수 있는 문장의 길이를 제한하기 위해 사용됨
하나의 청크는 여러 개의 토큰으로 구성됨
예시
- "Hello, world! This is ChatGPT. Nice to meet you!" →
  - 청크1: "Hello, world! This is ChatGPT."
  - 청크2: "Nice to meet you!"
- 만약 한 청크당 10개 토큰으로 제한하면, 문장을 쪼개서 여러 청크로 나눔
보통 벡터 데이터베이스나 RAG(Retrieval-Augmented Generation) 시스템에서 긴 문서를 작은 단위로 나눌 때 사용해.
RAG에서 검색 효율을 높일 때 사용된다

벡터 데이터베이스는 고차원 벡터(숫자로 표현된 데이터)를 저장하고 빠르게 검색하는 데이터베이스이다.

일반적인 관계형 데이터베이스(RDB)는 테이블과 행, 열을 기반으로 데이터를 저장하지만, 벡터 DB는 이미지, 텍스트, 오디오 등의 데이터를 숫자 벡터로 변환하여 저장하고, 이를 기반으로 유사한 데이터를 빠르게 찾는 데 최적화되어 있다.

*RAG(Retrieval-Augmented Generation)**는 LLM(대형 언어 모델) + 정보 검색(Retrieval) 을 조합한 방식

즉, LLM이 외부 데이터베이스(특히 벡터 DB)에서 필요한 정보를 검색한 후, 이를 기반으로 응답을 생성하는 방법을 의미

벡터 DB를 활용한 RAG 애플리케이션은 데이터 검색과 LLM 응답을 결합하여 더 정확하고 최신 정보를 제공하는 것이 핵심이다.

다음 포스트에서는 실제로 벡터 DB기반 RAG를 구축한 애플리케이션을 제작해보겠다.

네이버 뉴스 RAG 실습(1) - WebBaseLoader (0)	2025.04.09
Fine-tuning 개념 및 장단점 (0)	2025.03.27
프로필 사진 지브리 스튜디오 스타일로 변경 (0)	2025.03.24
생성형 AI 및 Prompt Engineering (1)	2025.03.21
딥러닝 아키텍처 개념, CNN, RNN, LSTM, Transformer 등등... (0)	2025.03.17

붉은범의개발일기