본문 바로가기

Careers/AI Project

(2)
RAG이란, RAG 성능 강화를 위한 몇가지 방법들 (이론편) RAG 이란RAG(Retrieved Augmentation Generator)는 자연어 처리 분야에서 사용되는 모델 아키텍처입니다. RAG는 대규모 언어 모델을 기반으로 하며, 검색 및 생성을 결합하여 질문 응답 시스템에서 사용됩니다.Retrieved(검색된): 이 부분은 검색된 정보를 나타냅니다. 보통 정보 검색 시스템이나 검색 엔진을 사용하여 주어진 질문과 관련된 문서를 검색합니다.Augmentation(보강): 검색된 정보를 사용하여 생성 모델을 보강합니다. 이는 생성 모델이 훈련된 데이터 이외의 외부 정보를 활용하여 보다 정확하고 다양한 답변을 생성할 수 있도록 도와줍니다.Generator(생성기): 마지막으로, 생성기는 보강된 정보를 바탕으로 실제로 답변을 생성하는 역할을 합니다. 대규모 언어 ..
LLM을 활용한 Stream Chatbot 아키텍쳐 아키텍처의 주요 구성 요소대규모 언어 모델을 활용한 스트림 챗봇 아키텍처를 설계하는 데에는 몇 가지 요소가 있습니다. 아래는 간단한 아키텍처의 개요입니다:1. 데이터 파이프라인: 먼저, 스트림 챗봇은 대규모 언어 모델을 훈련시키기 위한 데이터를 수집하고 전처리해야 합니다. 이 데이터는 배치 타입 혹은 스트리밍 플랫폼에서 수집될 수 있으며, 텍스트 데이터의 형식으로 전처리되어야 합니다.2. 대규모 언어 모델 훈련: 전처리된 데이터를 사용하여 대규모 언어 모델을 훈련합니다. 이를 위해 GPU나 TPU와 같은 고성능 컴퓨팅 자원이 필요할 수 있습니다.3. 인퍼런스 서버 구축: 훈련된 언어 모델을 활용하여 인퍼런스 서버를 구축합니다. 이 서버는 실시간으로 사용자의 입력을 처리하고 모델에 전달하여 응답을 생성합니..