본문 바로가기

Programming/AI&ML36

[정보] ADK 샘플 에이전트 모음 Google에서 제공하는 공식 ADK 샘플 저장소에는 다양한 용도의 에이전트들이 포함되어 있습니다. 이 샘플들은 대화형 봇부터 복잡한 멀티 에이전트 워크플로우까지 다양한 시나리오를 다룹니다. 🔹 주요 샘플 에이전트 목록 llm-auditor: 대형 언어 모델(LLM)의 응답을 평가하고 감사하는 에이전트입니다.data-cleaner: 데이터 정제 및 전처리를 자동화하는 에이전트입니다.multi-agent-orchestrator: 여러 에이전트를 조율하여 복잡한 작업을 수행하는 오케스트레이터 에이전트입니다.human-in-the-loop: 인간의 피드백을 통합하여 에이전트의 결정을 개선하는 에이전트입니다. 각 에이전트는 자체 디렉터리와 README.md 파일을 포함하고 있어, 설정 및 실행 방법을 자세히 .. 2025. 4. 18.
[요약] 구글 프롬프트 엔지니어링 백서 요약: 실전 팁과 테크닉 구글에서 프롬프트 엔지니이링 백서를 얼마 전 출간?했습니다. 관련된 내용을 간략하게 요약해 보겠습니다.소개대규모 언어 모델(LLM)을 다룰 때, 우리가 제공하는 **프롬프트(prompt)**는 모델의 입력이 됩니다. 프롬프트는 누구나 작성할 수 있지만, 효과적인 프롬프트를 만드는 일은 간단하지 않습니다. 왜냐하면 프롬프트의 단어 선택, 문체와 톤, 구조, 맥락 뿐만 아니라 사용하는 모델 종류와 설정까지 여러 요소가 결과에 영향을 미치기 때문입니다 . 따라서 좋은 프롬프트를 만들려면 반복적인 실험과 개선이 필요합니다. 제대로 설계되지 않은 프롬프트는 모호하고 부정확한 응답을 낳아, 모델이 유의미한 출력을 내기 어렵게 만들 수 있습니다 .이 글에서는 구글의 2025년 프롬프트 엔지니어링 백서에 기반하여, 일.. 2025. 4. 16.
[가이드] github A2A 오픈소스 실행 및 예상 결과 확인 방법 아래는 google/A2A GitHub 저장소의 실행 방법과 실행 결과를 분석한 내용입니다. A2A는 에이전트 간 통신 및 상호운용성을 위한 프로토콜 명세와 참고 구현을 제공하는 프로젝트로, 단일 실행 파일이 아니라 여러 샘플(예제)과 데모를 통해 전체 시스템의 동작 방식을 보여주고 있습니다. 1. 실행 방법1.1. 리포지토리 클론 및 샘플 준비리포지토리 클론: 먼저, 해당 저장소를 로컬로 클론합니다.git clone https://github.com/google/A2A.gitcd A2A샘플 디렉터리 확인: 저장소 내의 samples 폴더에는 Python, JavaScript, CLI 등 다양한 예제 구현이 포함되어 있습니다. 문서에서는 특히 Python 기반의 클라이언트/서버 샘플을 추천하고 있습니다... 2025. 4. 15.
[분석] MCP vs Fast-Agent vs Agent2Agent: 원격 멀티 에이전트 심층 비교 멀티 에이전트 AI 시스템이 부상함에 따라, MCP (Model Context Protocol), Fast-Agent, Agent2Agent (A2A) 세 가지 툴/프로토콜이 주목받고 있습니다. 각 툴은 서로 다른 측면에서 에이전트 간 협업과 통합을 돕는데, 모두 개방형 표준을 지향한다는 공통점이 있습니다. Anthropic이 개발한 MCP는 LLM과 외부 도구·데이터를 연결하는 표준 프로토콜로, 모델과 외부 시스템 간의 안전한 양방향 연결을 가능케 합니다 . Fast-Agent는 MCP 생태계를 기반으로 한 파이썬 에이전트 프레임워크로, 간결한 선언형 문법으로 에이전트와 워크플로를 구축할 수 있고 Anthropic 및 OpenAI 등 다양한 모델의 멀티모달 입력을 지원합니다 . 한편 Google이 20.. 2025. 4. 14.
[동향] Google의 Agent2Agent (A2A) 프로토콜 발표 얼마전 구글에서 발표한 A2A가  또 이슈가 되고 있습니다. 관련해서 정리해 봤습니다.Google의 Agent2Agent (A2A) 프로토콜 개요**Agent2Agent(A2A)**는 Google이 2025년 4월에 발표한 새로운 오픈 프로토콜로서, 서로 다른 AI 에이전트들 간의 상호 운용성(interoperability)을 향상시키기 위한 개방형 표준입니다 (Welcome to Google Cloud Next '25 | Google Cloud Blog). 간단히 말해, 다양한 프레임워크나 벤더에서 개발된 에이전트들이 공통 언어로 통신하여 협력할 수 있도록 해주는 규약입니다. 이 프로토콜을 통해 에이전트들은 서로 정보를 안전하게 교환하고 작업을 **조율(coordinate)**하여, 기업 내 여러 애플.. 2025. 4. 11.
[현황] 멀티에이전트 최고봉? fast-agent 프레임워크 다음은 최근 등장한 fast-agent 에 대한 내용을 정리해 보았습니다.1. 프레임워크 개요fast-agent는 복잡한 AI 에이전트와 워크플로우(작업 흐름)를 손쉽게 정의하고 테스트할 수 있게 해주는 오픈소스 AI 에이전트 프레임워크입니다 (GitHub - evalstate/fast-agent: Define, Prompt and Test MCP enabled Agents and Workflows) (FastAgent: The new framework for AI agent development presented - ai-rockstars.com). 2025년 3월에 공개된 이 프레임워크(evalstate/fast-agent)는 기존 lastmile-ai/mcp-agent 프로젝트를 포크하여 발전시킨 .. 2025. 4. 8.
[동향] 개발의 새로운 물결, 바이브 코딩 – 정의부터 실전까지 세상이 빠르게 바뀌고 있습니다. 다수의 사람들은 AI가 모든 것을 다 해줄 것 처럼 말하면서 강의를 개설하고 전파하고 있지만, 제가 볼때는 아직까지는 새로운 도전에 대한 진입장벽을 낮춰 준 것이지, 모든 것을 다해주진 않습니다."AI가 전체적인 개발을 해준다고? 헐~" 바이브 코딩을 설명할때 들은 것입니다. 초보 기술자 수준에서, 파일을 몇십개 인 경우에 대해서 등등.. 조건이 아직 붙어야 합니다. 그럼에도 불구하고 알면서도 몰랐던 바이브 코딩을 정리해 봤습니다. 다수의 현업개발자 분들은 이미 하시고 계실 수도 있습니다. 바이브 코딩이란? 정의와 주요 특징바이브 코딩(Vibe Coding)은 인공지능(AI)과 개발자가 협업하여 코드를 작성하는 새로운 프로그래밍 방식입니다 (인공지능이 만드는 바이브 코딩(.. 2025. 3. 26.
[서비스] AI 검색 사이트 oo.ai 서비스 출시 얼마전 oo.ai 라는 서비스가 오픈되었다고 들었습니다. 검색속도가 빠릅니다. 결과 노출시간, 참고 페이지 숫자가 빠르게 올라갑니다. 그러더니 결과가 예쁘게 나옵니다. 더군다나 한글로 된 서비스입니다. oo.ai는 누가 만들었는지, 무슨 목표로 서비스를 하는 건지 확인해 봤습니다.1. 개발자 및 창립자 정보oo.ai는 대한민국 스타트업 오픈리서치(OpenResearch)가 개발한 차세대 AI 검색 서비스입니다. 오픈리서치는 2024년 7월 카카오브레인 전 대표 김일두 씨가 창립한 AI 검색 기술/서비스 기업으로, 설립 직후 LB인베스트먼트, 미래에셋벤처투자·캐피탈, 본엔젤스 등으로부터 100억 원 규모의 시드 투자를 유치하며 주목을 받았습니다 (카카오 출신 김일두, AI 검색 플랫폼 ‘오오에이아이’ 출시.. 2025. 3. 19.
[RAG] 건강정보 pdf 를 학습하여 RAG 서비스를 구현 준비와 절차 구축 기반 조건 및 서비스 내용건강/영양 정보 PDF(수십 페이지)를 기반으로 1일 추천 영양정보 및 영양별 건강정보를 제공하는 RAG 기반 웹서비스를 구축업데이트 주기는 1회성이고 비주기로 약간 추가 가능적합한 기술 스택과 배포 환경을 추천RAG 모델을 운영할 cafe24 호스팅 서버 스펙대안으로 PC에서 운영할 경우의 가능성도 함께 고려.웹서비스 구성프론트엔드영양정보를 제공하는 웹 애플리케이션의 프론트엔드는 SPA(Single Page Application) 프레임워크를 사용하는 것이 적합합니다. React나 Vue.js와 같은 프레임워크가 대표적이며, 풍부한 생태계와 컴포넌트 재사용성을 제공하기 때문에 대화형 UI 구현에 유리합니다. 특히 React는 전 세계적으로 널리 사용되는 프론트엔드 라이브러.. 2025. 3. 19.
제2의 DeepSeek, Manus AI 초대코드 받기 최근 공개된 deepseek 가 저가 비용으로 구현해서 화제가 되었지만, 중국이 중국해서, 개인정보를 많이 빼간다는 말에 온라인 서비스가 한국을 포함해서 차단된 곳이 많아졌습니다. 아직 deepseek의 여운이 가시기도 전에 또다른 녀석이 등장했습니다. AI를 따라가다 가랭이 찢어집니다.Manus AI 개요Manus AI는 사용자의 지시(프롬프트)를 실제 행동과 결과물로 이어주는 범용 자율 AI 에이전트 플랫폼입니다 (Manus AI). 기존 챗봇처럼 단순 대화형 답변을 하는 것이 아니라, 다양한 작업을 스스로 계획·실행하여 완성된 결과물을 제공하는 점이 특징입니다 (초대장이 천만 원에 거래되는 AI 에이전트가 있다?). 예를 들어, 여행 일정을 짜달라는 요청에 단순 문장 답변 대신 일정표, 로맨틱한 장.. 2025. 3. 15.
[동향] 인간 뇌세포 기반 생물학적 컴퓨터 연구 오늘 지인으로 부터 한 사이트의 링크를 받았습니다. 세계 최초 인간 뇌 세포 기반 "생물학적 컴퓨터" 상용화 | GeekNewsCortical Labs의 CL1, 생물학적 AI 시대 개막호주 Cortical Labs가 인간 뇌 세포와 실리콘 하드웨어를 결합한 세계 최초 "생물학적 컴퓨터(CL1)" 를 공식 출시.기존 AI보다 더 역동적, 지속 가능하며 에너지news.hada.io뇌세포를 이용한 생물학적 컴퓨터? 누군가는 머리에 구멍을 뚫어 장비를 심는다는데, 이건 또 먼가 싶은 마음에 무슨 내용인지 알아보았습니다.연구의 배경과 목적현대의 전자식 컴퓨터와 인공지능 기술은 급격한 발전을 이루었지만, 물리적 한계에 가까워지고 있습니다. 초고속 연산을 위해 막대한 전력을 소모해야 하는 등의 문제가 대두되며 더 .. 2025. 3. 7.
[동향] BMW 공장 인간형 로봇 도입 사례 영향 분석 얼마전 BMW 공장에서 인간형 로봇을 도입하여 일부 라인을 3개월 정도 운영한 사례의 동영상을 공개했습니다. 궁금하기도 하고 해서 관련 기사들을 아래와 같은 기준으로 정리해 보았습니다.생산성 향상 여부: 인간형 로봇이 기존 생산 프로세스에서 어떤 성과를 냈는지 분석합니다.인력 감축 또는 재배치 영향: 기존 직원들의 역할 변화와 고용에 미친 영향을 확인합니다.비용 절감 효과: 로봇 도입으로 인한 운영 비용 변화와 경제적 이점이 있었는지 조사합니다.기술적 도전 과제: 로봇 운영 중 겪은 기술적 문제나 개선이 필요한 부분을 살펴봅니다.노조 및 노동자의 반응: 노동조합 및 직원들이 어떻게 반응했는지 관련 정보를 확인합니다. 생산성 향상 여부(美 BMW 공장서 근무하는 휴머노이드 로봇, 작업 속도 '4배' 빨라졌.. 2025. 3. 5.
NVIDIA Jetson AGX Orin vs. NVIDIA Project DIGITS: AI 학습 성능 비교 요새 NVIDIA가 그래픽 카드 외에도 혹할만한 제품들을 내놓고 있습니다.NVIDIA Jetson AGX Orin은 로보틱스와 엣지 컴퓨팅용 고성능 임베디드 AI 모듈(개발 키트 포함)이고, NVIDIA Project DIGITS는 Grace CPU와 Blackwell GPU가 결합된 초소형 퍼스널 AI 슈퍼컴퓨터입니다. 두 제품 모두 AI 모델 **학습(training)**에 활용될 수 있지만, 용도와 성능에서 큰 차이가 있습니다. 아래 비교 표에서는 가격, 성능, 활용도 측면에서 Jetson AGX Orin과 Project DIGITS를 정리하고 각 항목별 5점 만점 평가를 제시합니다.Jetson AGX Orin 개발 키트 – 앰페어(Ampere) 아키텍처 GPU와 12코어 ARM CPU를 통합한 엣.. 2025. 3. 4.
NVIDIA DIGITS 기반 RAG 모델 학습 가능 여부 분석 최적 모델 구성 및 추천 (RAG 접근법) RAG(Retrieval-Augmented Generation) 방식은 대용량 언어모델이 모든 지식을 기억해야 하는 한계를 극복하기 위해 외부 지식을 조회하여 활용하는 QA 방법입니다 . 사용자가 질문하면 검색 모델이 질문을 임베딩으로 변환한 뒤 지식 내에서 관련 문서를 찾아주고, 생성 모델(예: 시퀀스-투-시퀀스 언어모델)이 그 문서 내용을 바탕으로 답변을 생성합니다 . 이를 위해 우선 연령대별 건강정보, 1일 영양소 권장량, 건강식품 함유 성분 등의 도메인 데이터를 수집하여 텍스트 조각들로 분할 및 임베딩해야 합니다 . 이렇게 구축한 벡터 DB(임베딩 인덱스)에 대해 질의 임베딩과 문서 임베딩 간 유사도 검색을 수행하는 것이 핵심입니다.추천 모델 아키텍처로는.. 2025. 2. 22.
NVIDIA DIGITS와 대형 언어 모델(LLM) 학습에 대한 평가 보고서 1. NVIDIA DIGITS 최신 버전 및 LLM 학습 적합성 DIGITS 개요: NVIDIA DIGITS는 Deep Learning GPU Training System으로, 주로 이미지 분류, 세그멘테이션, 객체 탐지 등 컴퓨터 비전 딥러닝 작업을 간편하게 수행하기 위해 개발된 소프트웨어입니다 . 최신 공식 버전은 DIGITS 6.1.1로 2018년에 출시되었으며 , 이후로는 신규 기능 업데이트가 중단된 상태입니다 (NVIDIA는 더 이상 DIGITS를 지원하거나 버그 수정하지 않고 있음) . DIGITS 6 버전에서는 Caffe, Torch(Lua Torch), 그리고 TensorFlow 백엔드를 지원하며, GAN 예제나 텍스트 분류 같은 기능도 일부 추가되었습니다 . 그러나 기본적으로 DIGITS.. 2025. 2. 22.
[HW #준비] DeepSeek r1 설치용 맥미니/스튜디오 클러스터 구성비교 최근 정부에서 DeepSeek 온라인 서비스 접속을 막았습니다. 이유는 사용자의 정보를 과하게 수집해 간다는 이유입니다. 그런 위험한 서비스를 사용하는 것은... 이미 중국 사이트라 찝찝했지만... 무조건 반대일 수 밖에 없습니다. 그렇다고 deepseek 가 문제인 것은 아닙니다. 로컬에 설치해서 사용하면 어떨까? 독립 머신으로 로컬 설치는 성능상 여전히 문제가 있습니다.다음은 DeepSeek R1(671B 원본 모델)을 로컬에서 구동하기 위한 클러스터 구성 방안을 맥미니 클러스터와 맥스튜디오 클러스터로 나눠 비교·정리한 내용입니다. 1. 클러스터 구성 스펙 및 필요 대수A. 맥미니 클러스터 • 개별 스펙:– 모델: M4 Pro 기반, 64GB 통합 메모리, 1TB SSD • 필요 대수:– 전체 671.. 2025. 2. 21.
[동향] 일론 머스크의 xAI Grok 3 발표: 성능, 기능 및 미래 전략 종합 요약 아래는 어제(2월 17일/18일 현지시간) 일론 머스크가 이끄는 xAI가 발표한 Grok 3의 주요 내용 정리입니다.1. 발표 배경 및 개요 • 발표 채널: xAI는 X(구 트위터)를 통해 라이브 스트리밍으로 Grok 3를 공개했습니다. • 주요 주장: Grok 3는 “지구상에서 가장 똑똑한 AI”로 소개되며, 기존 경쟁 모델들을 능가하는 성능을 자랑한다고 발표되었습니다. 2. 성능 및 기술적 우위 • 벤치마크 결과:• 수학, 과학, 코딩 등 다양한 영역에서 Google Gemini, DeepSeek V3, Anthropic Claude, OpenAI GPT-4o 등 경쟁 모델을 앞선다고 주장합니다.• 초기 버전(코드명 ‘초콜릿’)은 벤치마크에서 1400점이라는 기록적인 성과를 기록했으며, 점수는 계속 .. 2025. 2. 19.
Hugging Face 모델 분야별 분석 및 추천 Hugging Face 허브에는 다양한 자연어 처리(NLP) 모델들이 공개되어 있으며, 용도에 따라 특화된 모델들이 존재합니다. 여기서는 사용 목적별로 대표적인 모델들을 분류하고, 각 분야에서 최고 성능을 보이는 모델들의 특징을 비교한 뒤, RTX 4070 Ti 환경에서 실행 가능성과 파인튜닝 용이성을 고려하여 추천 모델을 선정하였습니다. 마지막으로 분야별 추천 모델과 해당 모델의 강점이 발휘되는 사용 사례를 정리합니다. 1. 일반 자연어 처리 (언어 이해 및 생성) 언어 이해를 위한 대표 모델로는 BERT 계열(예: BERT, RoBERTa, DeBERTa)과 같은 Transformer 인코더 모델들이 있습니다. 이들은 문장의 의미 파악, 분류, 개체 인식 등의 이해 중심 작업에 뛰어납니다. 특히 마이.. 2025. 2. 18.
[참고] LLM 로컬 설치, 관리 및 Chat UI 지원 앱 정리 로컬 PC나 맥등에 LLM 모델을 쉽게 설치하고 ChatGPT 같은 Chat UI를 제공하는 설치형 프로그램을 정리해보겠습니다.1. LLM 모델 관리 및 Chat UI 제공 앱이 카테고리의 프로그램은 쉽게 LLM 모델을 다운로드하고 실행할 수 있도록 도와주며, 대부분 로컬에서 ChatGPT 스타일의 UI를 제공합니다.프로그램명주요 기능지원 모델실행 방식LM StudioGUI 기반 모델 다운로드 및 실행, 로컬 챗봇 UI 제공LLaMA, Mistral, Gemma 등Windows, macOS, LinuxLLaMA.cpp GUI (Llamafile)초경량 LLaMA 모델 실행, GUI 지원LLaMA, MistralWindows, macOS, LinuxlstyWeb UI 제공, 서버 모드 지원LLaMA, Mi.. 2025. 2. 6.
[deepseek #준비] deepseek-r1, qwen 모델 종류 분석 및 추천가이드 deepseek에서 r1이 나오고 llama, qwen이 있고, 1.4B, 7B... 70B 까지 먼가 너무 많습니다. 이걸 모두 한번 정리해 봅니다.모델 구조 개요DeepSeek-R1은 크게 세 가지 아키텍처 기반으로 구성되어 있습니다:DeepSeek-LLM (기본 아키텍처)Qwen 기반 버전LLaMA 기반 버전모델 크기별 특징1.4B 모델가장 작은 크기의 모델기본적인 대화와 간단한 태스크 수행리소스 요구사항이 매우 낮음추론 속도가 매우 빠름7B 모델일반적인 대화와 기본적인 코딩 태스크 가능적절한 성능과 리소스 효율성의 균형대부분의 일상적인 용도에 적합14B 모델복잡한 추론과 전문적인 태스크 수행 가능코드 생성 능력이 현저히 향상다양한 도메인의 지식 보유32B 모델고급 추론과 복잡한 문제 해결 능력전문.. 2025. 2. 3.
[deepseek #설치] lm studio 에 설치하기 Windows 11 Pro 환경에서 LM Studio를 활용하여 DeepSeek-R1 모델을 설치하고 실행하는 방법을 안내해 드리겠습니다. 또한, Qwen과 Llama 모델 중 어떤 것을 선택할지에 대한 가이드와 Ollama와 LM Studio의 차이점 및 각 장단점을 비교해 드리겠습니다.시스템 사양운영 체제: Windows 11 ProCPU: Intel i7 13세대 2.10GHzRAM: 128GBGPU: NVIDIA RTX 4070 Ti (22GB VRAM)목차LM Studio 설치 링크DeepSeek-R1 모델 선택 - Qwen? Llama?설치 방법테스트 방법웹 연결 방법Ollama와 LM Studio 차이점 및 각 장단점LM Studio 설치 링크LM Studio는 로컬 환경에서 대규모 언어 모.. 2025. 2. 2.
반응형