rtx 4070 ti2 NVIDIA DIGITS 기반 RAG 모델 학습 가능 여부 분석 최적 모델 구성 및 추천 (RAG 접근법) RAG(Retrieval-Augmented Generation) 방식은 대용량 언어모델이 모든 지식을 기억해야 하는 한계를 극복하기 위해 외부 지식을 조회하여 활용하는 QA 방법입니다 . 사용자가 질문하면 검색 모델이 질문을 임베딩으로 변환한 뒤 지식 내에서 관련 문서를 찾아주고, 생성 모델(예: 시퀀스-투-시퀀스 언어모델)이 그 문서 내용을 바탕으로 답변을 생성합니다 . 이를 위해 우선 연령대별 건강정보, 1일 영양소 권장량, 건강식품 함유 성분 등의 도메인 데이터를 수집하여 텍스트 조각들로 분할 및 임베딩해야 합니다 . 이렇게 구축한 벡터 DB(임베딩 인덱스)에 대해 질의 임베딩과 문서 임베딩 간 유사도 검색을 수행하는 것이 핵심입니다.추천 모델 아키텍처로는.. 2025. 2. 22. [deepseek #설치] lm studio 에 설치하기 Windows 11 Pro 환경에서 LM Studio를 활용하여 DeepSeek-R1 모델을 설치하고 실행하는 방법을 안내해 드리겠습니다. 또한, Qwen과 Llama 모델 중 어떤 것을 선택할지에 대한 가이드와 Ollama와 LM Studio의 차이점 및 각 장단점을 비교해 드리겠습니다.시스템 사양운영 체제: Windows 11 ProCPU: Intel i7 13세대 2.10GHzRAM: 128GBGPU: NVIDIA RTX 4070 Ti (22GB VRAM)목차LM Studio 설치 링크DeepSeek-R1 모델 선택 - Qwen? Llama?설치 방법테스트 방법웹 연결 방법Ollama와 LM Studio 차이점 및 각 장단점LM Studio 설치 링크LM Studio는 로컬 환경에서 대규모 언어 모.. 2025. 2. 2. 이전 1 다음 반응형