스파르타 AI-8기 TIL(11/10) -> LLM

카테고리 없음

스파르타 AI-8기 TIL(11/10) -> LLM

kimjunki-8 2024. 11. 10. 18:56

LLM

LLM(Large Language Model)은 방대한 양의 텍스트 데이터를 학습해 언어의 패턴과 구조를 이해하고 텍스트 생성, 질의응답, 번역, 요약 등의 작업을 수행할 수 있는 인공지능 모델을 말합니다. 대표적인 LLM으로는 OpenAI의 GPT 시리즈, Google's BERT, T5, 그리고 Meta의 LLaMA 등이 있습니다.

주요 특징
대규모 데이터 학습: 수백억에서 수조 개의 파라미터와 수많은 텍스트 데이터를 사용하여 다양한 주제와 표현을 학습합니다.
Transformer 아키텍처: 대부분의 LLM은 Transformer라는 모델 아키텍처를 기반으로 하며, 이는 효율적이고 병렬화가 용이해 대규모 모델 훈련에 적합합니다.
다양한 활용 가능성: LLM은 텍스트 생성, 코드 작성, 감정 분석, 요약, 문서 분류 등 여러 작업을 수행할 수 있습니다.
LLM의 학습 및 작동 방식
LLM은 대규모 텍스트 코퍼스를 통해 비지도 학습(supervised learning)과 지도 학습(unsupervised learning)을 결합하여 패턴을 학습합니다. 예를 들어, 모델은 문장의 다음 단어를 예측하거나, 입력된 질문에 대한 답변을 생성하는 방식으로 작동합니다.

장점
풍부한 언어 이해: 다양한 문맥과 표현을 학습하여 복잡한 언어적 맥락을 이해할 수 있습니다.
범용성: 다양한 분야에서 쉽게 활용 가능하며, 특정한 도메인으로 fine-tuning해도 성능이 우수합니다.
스케일 확장성: 모델 크기가 커질수록 성능이 향상되며, 이를 통해 더욱 정교한 언어 모델을 만들 수 있습니다.
단점
자원 소모: LLM은 학습과 추론에 엄청난 컴퓨팅 자원을 필요로 하며, 비용이 높습니다.
해석 가능성 부족: 모델의 예측 과정이 블랙박스와 같아, 왜 특정 답변을 도출했는지 설명하기 어렵습니다.
데이터 편향: 학습 데이터의 편향이 모델에 영향을 줄 수 있으며, 편향된 답변을 생성할 수 있습니다.

RAG

RAG(Retrieval-Augmented Generation)는 정보 검색과 생성형 AI 모델을 결합하여 답변의 정확성과 신뢰성을 높이는 기술입니다. 이 방식은 대형 언어 모델(LLM)의 한계를 보완하며, 정보가 자주 업데이트되거나 사실적인 정보가 중요한 경우에 특히 유용합니다.

RAG의 기본 구조
검색(Retrieval): 사용자 질문에 대해 적절한 정보를 검색합니다. 이는 사전 구축된 데이터베이스나 외부 자료에서 이루어지며, 검색 엔진을 사용하여 관련 문서를 찾습니다.
생성(Generation): 검색된 정보와 사용자 질문을 바탕으로 대형 언어 모델이 답변을 생성합니다. 이 모델은 검색 결과를 참고하여 텍스트를 생성하며, 이를 통해 더욱 신뢰성 있는 응답을 제공합니다.

RAG의 작동 방식
RAG는 우선 사용자 질문을 입력으로 받아 가장 관련 있는 문서를 검색하고, 이를 "컨텍스트"로 사용해 생성 모델이 답변을 만듭니다. 이때, RAG는 기본 LLM 모델보다 짧은 학습 데이터로도 정확한 답변을 생성할 수 있습니다.

예를 들어, 뉴스 사이트를 통해 최신 정보를 검색한 뒤 해당 정보를 참고하여 답변을 생성할 수 있어 최신성 문제를 해결할 수 있습니다.

RAG의 장점
정확성 향상: 최신 또는 특정 도메인 정보를 실시간으로 검색하여 더 정확한 답변을 제공합니다.
학습 데이터 한계 보완: 모델이 학습하지 못한 최신 정보나 특정 지식이 필요한 경우에도 대응할 수 있습니다.
데이터 절약: 검색 시스템을 활용하므로 모든 지식을 모델에 저장할 필요 없이 간소화된 학습 데이터로도 좋은 성능을 얻을 수 있습니다.
RAG의 단점
검색 시스템 의존성: 검색 단계가 정확하지 않으면 잘못된 정보가 포함된 답변이 생성될 수 있습니다.
속도 문제: 검색과 생성 단계가 추가되므로 모델 응답 속도가 느려질 수 있습니다.
정보 관리의 필요성: 검색 시스템이 업데이트되지 않으면 오래된 정보가 반영될 수 있습니다.

쉽게 말해서 RAG가 최신 정보를 검색하고 LLM이 찾은 정보를 바탕으로 답변 생성한다 입니다.

Vector DB

Vector DB(Vector Database)는 데이터의 벡터 표현을 저장하고 효율적으로 검색할 수 있는 데이터베이스입니다. 주로 텍스트, 이미지, 오디오와 같은 비정형 데이터를 다루는 데 사용됩니다. 최근에는 LLM과 같은 AI 모델의 임베딩 벡터를 빠르게 검색하기 위해 사용되며, RAG 구조에서 검색 단계의 중요한 구성 요소로 활용됩니다.

Vector DB의 작동 방식
텍스트나 이미지와 같은 비정형 데이터는 모델을 통해 벡터(임베딩)로 변환되며, 이 벡터는 데이터의 의미와 구조를 숫자로 표현한 형태입니다. Vector DB는 이 벡터들을 저장하고, 유사성을 기준으로 빠르게 검색할 수 있도록 설계되었습니다. 예를 들어, 사용자가 특정 질문을 입력하면 이 질문도 벡터로 변환되어 데이터베이스에 저장된 벡터와 비교하여 유사한 데이터를 검색합니다.

Vector DB의 주요 기능
유사도 검색(Similarity Search): 특정 쿼리 벡터와 가장 가까운 벡터들을 찾습니다. 일반적으로 코사인 유사도나 유클리드 거리 같은 거리 측정 방법을 사용합니다.
고차원 데이터 최적화: 수백에서 수천 차원에 이르는 고차원 벡터를 효율적으로 저장하고 검색합니다.
확장성: 많은 양의 데이터를 효율적으로 처리할 수 있어 대규모 벡터 데이터에서도 높은 성능을 유지합니다.
Vector DB의 활용 사례
RAG 구조: Vector DB는 RAG의 검색 단계에서 사용자가 입력한 질문과 유사한 문서들을 벡터화하여 빠르게 찾는 데 사용됩니다.
추천 시스템: 사용자의 선호도를 반영한 벡터와 유사한 항목을 추천하는 데 유용합니다.
이미지 검색: 이미지 임베딩 벡터를 활용하여 시각적으로 유사한 이미지를 검색합니다.
음성 및 오디오 검색: 오디오 데이터를 벡터로 표현하여 유사한 오디오 파일을 빠르게 찾습니다.
Vector DB의 장점
빠른 검색 성능: 대규모 고차원 데이터에서도 빠르게 유사한 항목을 검색할 수 있습니다.
데이터 압축: 벡터 형식으로 저장하기 때문에 데이터 용량을 줄이고 효율성을 높입니다.
비정형 데이터 처리: 구조화되지 않은 텍스트, 이미지 등의 비정형 데이터를 효과적으로 검색할 수 있습니다.
Vector DB의 단점
고차원 벡터의 한계: 고차원 벡터 검색은 메모리와 계산 비용이 많이 소모될 수 있습니다.
초기 모델 의존성: 데이터의 벡터화를 위한 모델이 잘 훈련되어야 하며, 모델 성능에 따라 검색 결과가 달라질 수 있습니다.
데이터 관리의 복잡성: 벡터화된 데이터는 해석하기 어렵기 때문에 데이터의 의미를 유지하며 관리하는 데 어려움이 있을 수 있습니다.
대표적인 Vector DB로는 Pinecone, FAISS, Weaviate, Milvus 등이 있으며, 이러한 데이터베이스는 NLP나 추천 시스템, RAG와 같은 최신 AI 응용에 자주 사용됩니다.

따라서,
RAG와 Vector DB는 서로 다른 목적을 가지고 있지만, 서로 보완적인 역할을 수행하며 함께 사용되는 경우가 많습니다.
RAG (Retrieval-Augmented Generation)
신뢰성 높은 답변 생성. 질문에 맞는 정보를 검색해 언어 모델이 이를 바탕으로 더욱 정확하고 정보성이 높은 답변을 생성할 수 있도록 돕습니다.
구성 요소: 검색 시스템(Retrieval)과 생성 모델(Generation)로 구성됩니다. 질문에 맞는 관련 데이터를 검색하고, 이를 바탕으로 언어 모델이 답변을 생성합니다.
동작 방식: 질문에 맞는 관련 데이터를 찾기 위해 검색 과정을 수행하며, 이 검색 결과를 바탕으로 언어 모델이 답변을 생성하는 방식으로 작동합니다.
사용 사례: 고객 지원 챗봇, 정보 검색 시스템, 문서 요약 등의 정보 제공이 필요한 애플리케이션에서 주로 사용됩니다.
Vector DB (Vector Database)
고차원 벡터 데이터의 효율적 저장 및 검색. 비정형 데이터를 벡터화하여 저장하고, 유사한 데이터나 정보를 빠르게 검색하기 위한 용도로 사용됩니다.
구성 요소: 벡터 저장소, 유사도 검색 알고리즘(코사인 유사도, 유클리드 거리 등) 등이 포함되어 있습니다.
동작 방식: 특정 입력 데이터(질문 등)를 벡터로 변환한 후, 데이터베이스에 저장된 벡터와 유사도를 비교하여 유사한 벡터를 검색합니다.
사용 사례: 추천 시스템, 이미지 검색, 오디오 검색, RAG의 검색 단계 등에서 유사성을 기준으로 빠르게 데이터를 찾을 때 사용됩니다.
RAG와 Vector DB의 관계
RAG는 검색 단계에서 관련 정보를 찾기 위해 Vector DB를 사용할 수 있습니다. 사용자의 질문을 벡터로 변환하고, Vector DB에서 관련 문서를 검색한 후 생성 모델이 이 문서를 바탕으로 답변을 생성하는 방식으로 작동할 수 있습니다.
RAG의 검색 엔진 역할을 Vector DB가 수행하여 고차원 벡터화된 정보를 바탕으로 보다 관련성 높은 결과를 검색하는 데 기여할 수 있습니다.

RAG는 정보 검색과 생성 모델을 결합해 신뢰성 높은 답변을 생성하는 방법론입니다.
Vector DB는 벡터화된 데이터를 저장하고 검색하기 위한 데이터베이스로, 주로 RAG의 검색 단계에서 정보를 빠르게 찾아주는 역할을 수행합니다.

이 세 가지가 함께 작동할 때의 흐름은 서로의 기능을 단계적으로 연결하여 하나의 프로세스를 만듭니다. 간단히 말하면, Vector DB가 정보를 검색하여 RAG가 이를 바탕으로 LLM이 답변을 생성하는 데 필요한 정보를 제공해주는 방식입니다. 아래는 이 과정이 이루어지는 순서입니다.

1. 사용자가 질문을 입력
사용자가 특정 질문이나 요청을 시스템에 입력합니다. 예를 들어, "최근 AI 연구의 최신 동향에 대해 알려줘" 같은 질문이 될 수 있습니다. LLM은 질문의 의미를 이해하고 답변을 생성할 준비를 합니다.

2. RAG가 관련 정보를 찾기 위해 Vector DB에 요청
입력된 질문만으로는 최신 정보나 구체적인 자료가 부족할 수 있기 때문에, RAG가 관련된 외부 정보를 검색해 LLM에게 추가 컨텍스트를 제공합니다.

RAG는 사용자의 질문을 벡터로 변환한 후, Vector DB에 이 벡터를 전달하여 질문과 유사한 정보를 찾습니다.
Vector DB는 사용자가 질문한 주제와 관련된 문서, 텍스트 등 가장 유사한 데이터를 검색하여 반환합니다. 예를 들어, 최신 AI 연구 관련 기사나 논문 요약을 찾습니다.

3. Vector DB가 관련된 정보를 RAG에 반환
Vector DB는 질문과 유사한 정보를 찾아 RAG에 전달합니다. 이 정보는 문서나 텍스트 조각 형태로 RAG에 제공됩니다.

RAG는 이 정보를 바탕으로 LLM이 추가 컨텍스트를 가지고 답변을 생성할 수 있도록 준비합니다.

4. RAG가 LLM에게 정보를 전달하고 답변을 요청
RAG는 Vector DB에서 검색한 정보를 LLM에게 컨텍스트로 제공하여 답변 생성에 필요한 자료로 활용되게 합니다.

LLM은 이제 단순히 질문을 분석하는 것을 넘어서, RAG가 전달한 구체적인 정보를 참고하여 답변을 생성할 수 있습니다.
이로써 LLM은 "최근 AI 연구 동향"에 대한 구체적인 정보를 바탕으로 보다 신뢰성 있는 답변을 생성할 수 있게 됩니다.

5. LLM이 최종 답변을 생성
LLM은 질문과 RAG를 통해 제공받은 정보를 종합적으로 분석하고, 사용자가 요구한 대로 자연스럽고 정보성 높은 답변을 생성합니다.

예를 들어, LLM은 "최근 AI 연구 동향은 대규모 언어 모델의 확장과 효율성 개선을 중심으로 이루어지고 있습니다..."와 같은 답변을 생성합니다.

LangChain

LangChain은 다양한 언어 모델(LLM)과 도구를 연결하고 조합하여 더 복잡한 애플리케이션을 쉽게 구축할 수 있도록 지원하는 프레임워크입니다. 특히 LangChain은 대형 언어 모델(LLM)과 RAG 구조, Vector DB, API, 외부 데이터 소스 등을 유기적으로 통합하여 언어 기반 응용 프로그램을 효율적으로 구축할 수 있는 도구와 모듈을 제공합니다.

여기서 프레임워크란(Framework) 소프트웨어 개발을 쉽게 하기 위해 미리 구성된 코드와 도구, 규칙을 제공하는 구조입니다. 개발자가 일관성 있게 프로그램을 개발할 수 있도록 지원하며, 기본적인 기능이나 반복적인 작업을 대신 처리해 주어 효율성을 높입니다.

LangChain의 주요 기능
LLM 연결 및 관리: OpenAI의 GPT, Cohere, Hugging Face의 모델 등 다양한 언어 모델을 쉽게 연결하고 호출할 수 있습니다.
RAG 통합: Retrieval-Augmented Generation 기능을 제공하여, 질문에 맞는 정보를 Vector DB나 검색 시스템을 통해 찾고 이를 언어 모델과 결합해 보다 정확한 답변을 생성할 수 있도록 돕습니다.
Vector DB와의 통합: Pinecone, Weaviate, FAISS, Milvus 등 여러 Vector DB와의 통합을 지원해 유사도 기반 검색을 쉽게 구현할 수 있습니다.
외부 도구 연결: 데이터베이스, API, 웹 스크래핑 도구 등 외부 애플리케이션과 연결해 정보 검색 및 수집을 자동화할 수 있습니다.
체인 구성: 언어 모델과 도구 간의 흐름을 체인(chain)이라는 형태로 구성하여 여러 작업을 순차적으로 또는 병렬적으로 수행할 수 있습니다. 예를 들어, 질문 분석 → 관련 정보 검색 → 요약 → 최종 답변 생성 등으로 작업 단계를 체인으로 구성할 수 있습니다.

LangChain의 작동 방식
LangChain의 기본 개념은 프롬프트 체인(Prompt Chain)과 작업 체인(Task Chain)입니다. 사용자가 입력한 질문을 분석해 여러 도구와 단계를 통해 최종 결과를 얻는 일련의 프로세스를 체인으로 만들어 효율적으로 처리합니다. 예를 들어, 다음과 같은 체인이 가능합니다:

프롬프트 생성 및 조합: 질문을 입력하면, 프롬프트 템플릿을 사용해 질문의 요지를 명확히 하고 언어 모델에 전달할 준비를 합니다.
검색 단계: 질문과 관련된 정보를 찾기 위해 Vector DB 또는 외부 API에서 관련 정보를 검색합니다.
답변 생성: 검색된 정보를 바탕으로 언어 모델이 답변을 생성합니다.
후처리: 결과를 요약하거나 사용자 친화적인 포맷으로 변환해 최종 답변을 제공합니다.
LangChain의 장점
모듈화: 다양한 구성 요소를 독립적으로 설정하고 조합하여 유연한 워크플로우를 구성할 수 있습니다.
통합성: LLM, Vector DB, 외부 API 등 여러 도구를 손쉽게 통합할 수 있어 복잡한 언어 기반 애플리케이션 구축이 용이합니다.
확장성: 새로운 모델, 데이터 소스 또는 API를 추가하여 기능을 쉽게 확장할 수 있습니다.
자동화: 작업 흐름을 체인 형태로 구성하여 특정 절차를 자동화하고 복잡한 작업을 처리할 수 있습니다.
LangChain의 사용 사례
지식 기반 검색 시스템: RAG와 Vector DB를 결합해 질문에 맞는 정보를 검색하고 응답을 생성하는 지식 기반 챗봇을 구축할 수 있습니다.
문서 요약 및 질의응답: 긴 문서를 분석하고 질문에 맞는 부분을 추출해 요약하거나 답변을 제공합니다.
데이터 분석 및 보고: 외부 API와 결합하여 실시간 데이터를 수집하고 분석하여 결과를 보고할 수 있습니다.
추천 시스템: 사용자 선호도와 유사한 데이터를 Vector DB에서 검색하여 맞춤형 추천을 제공합니다.
LangChain은 언어 모델을 활용한 고급 응용 프로그램 구축을 위한 강력한 프레임워크로, 개발자가 효율적으로 대규모 언어 모델과 다양한 외부 시스템을 결합하여 고도화된 기능을 구현할 수 있게 돕습니다.

OpenAI playground

OpenAI Playground는 OpenAI가 제공하는 웹 기반 인터페이스로, 다양한 언어 모델(GPT-3, GPT-4 등)을 사용해 볼 수 있는 실험 공간입니다. Playground에서는 OpenAI의 언어 모델을 다양한 방식으로 테스트하고, API 기능을 체험하며, 입력 프롬프트를 통해 모델의 응답을 확인할 수 있습니다. 쉽게 말해, OpenAI의 언어 모델을 프로그래밍 없이 웹 환경에서 손쉽게 경험할 수 있도록 도와주는 도구입니다.

OpenAI Playground의 주요 기능
프롬프트 입력과 모델 응답 확인: 사용자가 텍스트 입력을 통해 원하는 요청을 하면, 언어 모델이 그에 맞는 응답을 생성합니다. 예를 들어, 글쓰기, 코드 생성, 정보 검색 등의 요청이 가능합니다.
모델 설정 변경:
모델 선택: GPT-4나 GPT-3와 같은 모델을 선택할 수 있습니다.
온도(Temperature): 생성된 응답의 창의성 정도를 설정할 수 있습니다. 온도가 높을수록 답변이 다양해지고, 낮을수록 더 일관성 있는 응답을 생성합니다.
최대 토큰(Max Tokens): 생성할 텍스트의 길이를 조정할 수 있습니다.
탑-피(Top-p): 모델의 응답 확률을 조정하여 좀 더 다양한 답변을 얻을 수 있게 합니다.
Presence Penalty: Presence Penalty는 특정 단어나 주제가 문장에 처음 등장할 때 이후에 그 단어를 사용할 가능성을 조절하는 매개변수입니다. Presence Penalty 값을 높이면, 모델이 이전에 사용한 단어를 다시 사용하는 경향을 줄이도록 하여 새롭고 다양한 표현을 더 많이 생성하도록 유도합니다.
Frequency Penalty: Frequency Penalty는 특정 단어나 구가 이미 문장에 여러 번 등장했을 때, 이후에 해당 단어를 다시 사용할 가능성을 조절하는 매개변수입니다. Frequency Penalty 값을 높이면, 모델이 같은 단어를 여러 번 반복하는 것을 방지합니다. 따라서 같은 단어가 지나치게 반복되지 않고, 문장이 더 자연스럽게 유지됩니다.

프롬프트 디자인 연습: Playground는 프롬프트 엔지니어링 연습을 돕습니다. 다양한 입력 방식으로 원하는 응답을 유도하면서 언어 모델의 반응을 이해하고, 조정할 수 있습니다.
코드 생성 및 실행: 코드 작성 요청이 가능하며, 코드 생성 작업이나 데이터 처리 등의 프로그래밍 작업을 테스트해 볼 수 있습니다.
API 사용 체험: Playground에서의 작업 방식은 OpenAI API를 통해 직접적으로 적용할 수 있어, Playground에서 실험한 결과를 바탕으로 API 호출을 설계하는 데 도움이 됩니다.

OpenAI Playground 사용 예
챗봇 대화: 고객 지원 시나리오를 연습하고 챗봇의 답변을 조정할 수 있습니다.
콘텐츠 생성: 블로그 글, 제품 설명, 스토리 등 다양한 텍스트 콘텐츠를 생성하는 데 활용할 수 있습니다.
코드 생성 및 디버깅: 간단한 코드 작성 요청이나 오류 찾기 등을 실험해 볼 수 있습니다.
질문 응답 시스템: 정보 검색 및 요약 기능을 시험해 볼 수 있어 지식 기반 답변 생성에 유용합니다.
프롬프트 테스트: 입력 프롬프트에 대한 확인
모델 성능 평가: 모델에 대한 성능 확인

OpenAI Playground의 장점
간편한 사용성: 코드 없이 웹 브라우저에서 바로 언어 모델을 실험해 볼 수 있어 접근성이 높습니다.
설정 조정: 모델의 응답 방식이나 창의성을 자유롭게 조절할 수 있어 다양한 시나리오를 테스트할 수 있습니다.
프로토타이핑: API를 적용하기 전, 모델의 성능을 확인하거나 테스트할 수 있어 프로토타이핑에 용이합니다.

GPT 모델에서 User, System, Assistant는 주로 대화 흐름과 모델의 응답 방식을 제어하는 데 사용되는 세 가지 역할입니다. 이들 각각의 역할이 설정된 방식에 따라 모델의 응답과 대화 진행 방식이 달라질 수 있습니다.

1. User (사용자)
User는 모델과 대화하는 주체로서, 질문을 하거나 요청을 전달하는 역할을 합니다.
특징: User가 입력한 텍스트는 주로 모델이 응답을 생성할 때의 기본 맥락을 제공하고, 모델이 특정한 정보를 설명하거나 문제를 해결하는 데 필요한 데이터를 제공합니다.
사용 예시: "오늘의 날씨는 어때?", "이 코드를 어떻게 수정할 수 있나요?"와 같은 요청이나 질문을 통해 모델에게 원하는 정보를 요청하는 방식입니다.
모델에 대한 영향: User의 입력 내용이 모델의 응답 생성에 직접적인 프롬프트로 작용합니다. User가 질문을 변경하면 모델의 답변도 그에 맞춰 달라집니다.

2. System (시스템)
System은 대화의 전체적인 톤, 스타일, 목적을 설정하는 역할을 하며, 모델의 동작 방식을 조정하기 위한 설정 정보나 지침을 제공합니다.
특징: System의 메시지는 모델에게 대화의 목적이나 특정 지침을 전달하여, 모델이 응답할 때 참고할 기준을 제공합니다. 예를 들어, 모델이 더 전문적이거나 간단한 방식으로 응답하도록 하거나, 특정 분야에 중점을 두고 답변하도록 지시할 수 있습니다.
사용 예시: "이 대화에서는 당신이 친절한 가이드 역할을 맡고, 어린아이에게 과학 주제를 쉽게 설명해주세요."와 같은 설정을 통해 모델의 답변 스타일을 조정할 수 있습니다.
모델에 대한 영향: System의 설정에 따라 대화의 스타일과 방향이 크게 달라지므로, 다양한 상황에 맞게 모델을 맞춤화할 수 있습니다. System 설정이 없다면, 모델은 일반적인 중립적인 답변을 제공할 가능성이 높습니다.

3. Assistant (어시스턴트)
Assistant는 모델 그 자체의 역할을 나타내며, User의 질문에 답변하고 도움을 제공하는 역할을 합니다.
특징: Assistant는 User의 입력을 참고하여 최대한 정확하고 유용한 응답을 제공하려고 합니다. System의 지침을 바탕으로 응답의 톤이나 정보를 맞추며, 이전 User의 질문과 맥락을 기억하여 지속적인 대화 흐름을 유지하려고 합니다.
사용 예시: "오늘 날씨는 맑고 기온은 약 20도입니다."와 같이 User의 질문에 따른 답변을 생성하여 제공하는 방식입니다.
모델에 대한 영향: Assistant는 사용자가 원하는 정보를 최대한 유용하게 전달하기 위해 대화 맥락을 참고하고 System의 지침을 따르면서 답변합니다. 지속적인 대화에서는 이전 응답과 질문을 참고하여 일관성을 유지하는 것이 중요합니다.

즉, 모델이 답변할 때 참고할 수 있도록 제공하는 가이드라인이라고 생각하시면 됩니다. 프롬프트 작성자가 모델에게 "이런 식으로 답변해 줬으면 좋겠다" 하는 예시를 주는 것이라고 할 수 있습니다.

예시:
System 프롬프트: "당신은 친절하고 공감력 있는 고객 서비스 상담원입니다. 고객의 질문에 친절하게 답변하고, 추가적인 도움을 제공하도록 노력하세요."
User 프롬프트: "반품 요청을 하고 싶어요. 방법을 알려줄 수 있나요?"
Assistant 응답:
안녕하세요! 반품 요청을 도와드리겠습니다. 우선 구매하신 상품과 주문 번호를 준비해 주시고, 
홈페이지에 로그인한 후 '주문 내역'에서 해당 상품을 선택하시면 반품 절차를 진행하실 수 있습니다. 
도움이 더 필요하시면 언제든 말씀해 주세요!
System 프롬프트: "당신은 학습 코치입니다. 학생이 이해하기 쉽도록 차근차근 설명하고, 학습 방법을 제시하세요."
User 프롬프트: "수학 공부를 더 잘하고 싶어요. 어떻게 하면 될까요?"
Assistant 응답:
수학 공부에 관심이 많으시군요! 먼저 개념을 철저히 이해하는 것이 중요합니다. 
각 주제의 기본 원리를 이해한 후, 연습 문제를 많이 풀어 보세요. 
그리고 어려운 문제를 풀 때에는 다양한 방법을 시도해보며 자신만의 풀이 방식을 찾아보세요. 
필요하다면 매일 일정 시간을 정해 꾸준히 공부하는 것도 큰 도움이 됩니다!
이렇듯, assistant는 대답이 아니라, 이런식으로 대답해줘라고 미리 말을 해놓는 것이라고 생각하시면 됩니다.

실제로 프롬프트를 설계할 때 assistant가 어떤 역할을 해야 하는지 구체적으로 설명하고, 원하는 스타일을 미리 보여주면 모델이 더 일관된 톤과 방식으로 응답을 생성할 가능성이 높아집니다.

이런 방식으로 다양한 상황에 맞게 프롬프트를 설정하면, 모델이 가이드라인에 맞춰 좀 더 원하는 방식으로 응답할 수 있습니다.

프롬프트 엔지니어링

프롬프트 엔지니어링(Prompt Engineering)은 언어 모델에게 원하는 결과를 얻기 위해 프롬프트를 설계하고 조정하는 과정을 의미합니다. 간단히 말해, 언어 모델이 어떤 방식으로 질문이나 명령을 이해하고 응답을 생성할지 결정하기 위해 프롬프트(입력 텍스트)를 설계하는 작업입니다.

프롬프트 엔지니어링의 주요 요소
프롬프트 엔지니어링은 언어 모델의 응답 품질과 정확성에 큰 영향을 미칩니다.
명확한 지시 제공:
언어 모델은 텍스트만을 기반으로 응답을 생성하기 때문에, 명확하고 구체적인 지시가 필요합니다. 모호한 질문보다 명확하고 상세하게 질문을 작성하는 것이 중요합니다.
예시: "자동차에 대해 설명해줘" 대신 "자동차의 엔진 작동 원리를 설명해줘"로 구체적으로 요청하면 더 구체적인 답변을 얻을 수 있습니다.

맥락 제공:
맥락을 제공하면 모델이 더 유의미한 답변을 생성할 수 있습니다. 특히 복잡한 주제나 긴 대화에서 일관된 답변을 얻으려면, 프롬프트에 충분한 배경 정보를 추가해주는 것이 좋습니다.
예시: "20세기 과학 혁신"이라는 주제를 다룰 때, "20세기 동안 발전한 과학 분야 중에서 특히 컴퓨터 공학의 발전 과정을 설명해줘"와 같이 구체적인 배경을 제공할 수 있습니다.

역할 부여:
모델에게 특정 역할을 부여하면 답변이 더 일관되거나 특정 스타일을 따르게 할 수 있습니다.
예시: "당신은 과학자입니다. 간단한 언어로 빛의 굴절 원리를 초등학생에게 설명해주세요."라는 프롬프트를 통해, 모델이 단순하고 쉽게 설명하도록 유도할 수 있습니다.

응답 형식 지정:
모델이 응답할 때 어떤 형식으로 답변을 작성해야 할지 명확히 지정하면 더 원하는 방식의 응답을 얻을 수 있습니다.
예시: "장단점을 표 형식으로 요약해줘"라든지, "숫자 목록 형태로 답변해줘"라고 요청하여 응답 형식을 지정할 수 있습니다.

프롬프트 엔지니어링의 장점
정확성 향상: 프롬프트를 명확하고 구체적으로 작성하면 모델이 더 정확한 답변을 제공할 가능성이 높아집니다.
일관성 유지: 이전 맥락을 잘 반영하여 모델이 대화 중 일관성 있는 응답을 생성하도록 유도할 수 있습니다.
시간과 비용 절약: 처음부터 좋은 프롬프트를 설계하면 불필요한 반복이나 수정 요청을 줄일 수 있습니다.

프롬프트 엔지니어링 예시
명령형 프롬프트:
"아침에 할 수 있는 간단한 운동을 알려줘."
모델이 간단한 운동을 추천하게 됩니다.

상세 지시가 포함된 프롬프트:
"30분 이내에 할 수 있는, 집에서 가능한 아침 운동 루틴을 단계별로 설명해줘."
더 구체적인 요구를 제공함으로써 단계별로 운동 루틴을 설명하도록 유도할 수 있습니다.

역할 부여와 형식 지정:
"당신은 개인 트레이너입니다. 초보자를 위한 15분 간단한 스트레칭 루틴을 순서대로 설명하고, 필요한 준비물도 알려주세요."
개인 트레이너 역할을 지정함으로써 초보자를 위한 친절한 설명과 필요한 준비물 리스트를 함께 얻을 수 있습니다.
프롬프트 엔지니어링은 사용자의 요구를 모델이 이해하기 쉽게 전달하는 핵심 기술로, 언어 모델을 다양한 목적에 맞게 더 효과적으로 사용할 수 있게 해줍니다.

+ 페르소나 설정 -> 인공지능에게 성격이나, 말투를 삽입해서 그 성격에 맞게 행동하게 유도하는 것

프롬프트에서 모델이 중요한 부분을 주의 깊게 다루게 하기 위해 다양한 방식으로 강조를 추가할 수 있습니다. ", """와 같은 구두점이나 형식을 통해 언어 모델에게 특정 정보를 강조하거나 특정 형식을 따르도록 지시할 수 있습니다. 다음은 프롬프트에서 강조를 추가하는 여러 가지 방법입니다.

1. 큰따옴표 " 또는 """ 사용
예시: "중요: 다음 지침에 따라 주세요.", """세부 설명을 추가해 주세요"""
큰따옴표나 세 개의 큰따옴표는 중요한 부분을 구분하거나 텍스트를 인용하는 느낌을 줘서, 모델이 해당 내용을 더 주의 깊게 다룰 수 있도록 유도합니다.

2. 대문자 사용
예시: "중요: 설명에 숫자 형식을 꼭 포함하세요." 또는 "주의: 반드시 LIST 형식으로 답변해 주세요."
대문자를 사용하면 해당 단어를 더욱 강조할 수 있습니다. 특정 지침이나 요구사항을 명확히 할 때 효과적입니다.

3. 불릿 포인트와 리스트 사용
요청 사항:
- 첫째, 간단하게 요약해 주세요.
- 둘째, 예시를 포함해주세요.
불릿 포인트나 번호 리스트를 사용해 프롬프트 내의 주요 지점이나 단계를 강조할 수 있습니다. 모델이 각 항목을 따로따로 응답할 가능성이 높아지기 때문에, 복잡한 요청을 단계별로 나누어 전달할 때 유용합니다.

4. 구두점 및 기호 강조 (예: ***, -->, !!, >>>)
예시: "!!!중요 내용: 핵심 사항을 포함해 주세요!!!" 또는 "중요사항: 다음 내용에 주의해주세요."
별표, 화살표, 느낌표 등의 기호를 사용하면 시각적으로 눈에 띄는 강조가 됩니다. 특히 모델이 텍스트를 읽으며 특정 키워드나 구를 더 눈여겨볼 수 있습니다.

5. Markdown 스타일 강조 (예: 굵게 및 기울임)
예시: "중요: 이 대화는 친절하고 공손하게 답변해 주세요."
Markdown 스타일의 굵은 글씨와 기울임체는 모델이 의미상 중요한 부분을 명확히 이해하는 데 도움을 줄 수 있습니다. 일반적으로 응답의 스타일이나 특정 톤을 설정할 때 유용합니다.

6. 특정 형식 또는 키워드 사용
예시: "포맷: [키워드] 설명 형식을 사용해 주세요. 예: [개요] 회사의 배경 설명"
텍스트를 특정 형식으로 표시하면 모델이 해당 구조에 맞추어 일관된 형식의 답변을 생성하게 됩니다. 마치 양식처럼 특정 형식으로 답변을 받으려는 경우에 유용합니다.

7. 라벨링 및 단계별 요구
단계 1: 주제 설명
단계 2: 예시 제시
단계 3: 결론 요약
단계별로 요청 사항을 나누어 모델이 각 단계를 순차적으로 따르도록 유도할 수 있습니다. 여러 지침을 명확히 구분하여 모델이 각 단계에 주의하게 합니다.

8. 주의사항 강조 (주의, 참고 등)
예시: "참고: 이 대화는 초등학생 수준으로 설명해야 합니다."
"참고," "주의," 등의 키워드를 붙여 모델이 특정 부분을 염두에 두고 답변을 작성하도록 유도할 수 있습니다. 이를 통해 모델이 특정 수준이나 어조를 유지하도록 지시할 수 있습니다.

9. Q&A 형식 사용
Q: 주제에 대한 간단한 설명을 해주세요.
A: 주제에 대한 답변입니다...
질문-응답(Q&A) 형식을 사용하여 특정 질문에 맞춘 답변을 유도할 수 있습니다. 각 질문을 명확히 구분하면 모델이 질문에 따라 구체적인 답변을 하게 됩니다.

10. 텍스트 박스 및 코드 블록 사용 (```)
중요: 다음 텍스트는 주의 깊게 설명해 주세요.
코드 블록은 모델이 특정 부분을 구별된 텍스트로 인식하게 합니다. 주로 코드나 고유한 정보를 강조할 때 유용합니다.
이와 같은 다양한 강조 방법을 활용해 프롬프트를 설정하면, 모델이 사용자의 요청을 더 정확하고 효과적으로 이해하여 원하는 대로 응답할 가능성이 높아집니다.

기본 원칙

프롬프트 엔지니어링의 기본 원칙은 언어 모델이 명확하고 일관성 있는 답변을 생성하도록 프롬프트를 설계하는 데 중요한 기준입니다. 이를 통해 원하는 응답을 더 정확하게 얻을 수 있으며, 복잡한 요청도 더 효율적으로 전달할 수 있습니다. 다음은 프롬프트 엔지니어링의 주요 원칙들입니다.

1. 명확하고 구체적으로 작성하기
모델이 오해 없이 이해할 수 있도록 명확하고 구체적인 언어를 사용해야 합니다. 불명확한 프롬프트는 모호한 응답을 초래할 수 있습니다.
예시: "쇼핑몰 소개를 작성해 줘" 대신 "XYZ 쇼핑몰의 위치, 주요 상점, 특징을 포함해 3~4문장으로 간단히 소개해 줘"라고 작성하여 명확한 요구 사항을 전달합니다.

2. 단계별로 요청하기
복잡한 요청은 여러 단계로 나누어 설명하는 것이 좋습니다. 단계별 지침을 제공하면 모델이 각 단계에 맞춰 순차적으로 응답할 수 있습니다.
예시: "다섯 문장으로 요약하고, 마지막에 장단점을 나열해 주세요."처럼 요구사항을 단계별로 정리하여 각 단계에 맞춘 응답을 유도합니다.

3. 맥락 제공하기
모델이 대화의 목적이나 대상을 이해하도록 추가 정보를 제공하면 더 적합한 응답을 얻을 수 있습니다. 이전 대화의 맥락이 있는 경우 이를 포함해 모델이 참고할 수 있게 합니다.
예시: "고등학생을 대상으로 뉴턴의 운동 법칙을 간단하게 설명해줘"처럼 목표 대상을 명시하면 더 적절한 응답이 생성됩니다.

4. 역할 지정하기
모델에게 특정 역할을 부여하면 응답이 더욱 일관되고 특정 스타일을 따를 수 있습니다. 역할을 부여하는 방식으로 프롬프트를 설계해 모델이 의도한 방식으로 대답하게 할 수 있습니다.
예시: "당신은 영양 전문가입니다. 다이어트 식단에 대해 친절하게 설명해 주세요."라고 요청하여 특정 역할에 맞는 톤과 스타일을 유지하게 할 수 있습니다.

5. 응답 형식 지정하기
모델이 응답을 제공할 때 특정 형식을 따르도록 지시하면 원하는 형식의 답변을 받을 가능성이 높습니다. 숫자 목록, 표, 문단 등 형식을 미리 지정해 주세요.
예시: "장단점을 표 형식으로 나눠 설명해줘."라고 요청하여 테이블 형식으로 답변하게 하거나, "3단계 과정으로 설명해 줘"라고 요청하여 목록형 응답을 유도합니다.

6. 예시 제공하기
특정 스타일이나 응답 형식을 원할 경우 예시를 포함하여 모델이 이를 따라하도록 유도할 수 있습니다. 모델이 예시를 보고 답변의 스타일이나 구조를 이해할 수 있습니다.
예시: "간단한 형식 예시: '키워드: 설명'과 같은 형식으로 답변해줘"라고 제시해 원하는 형식을 명확히 전달합니다.

7. 반복 방지하기
동일한 주제나 단어의 반복을 피하고 싶다면 반복 방지 지침을 추가할 수 있습니다. Presence Penalty나 Frequency Penalty 값을 조정하는 방법도 유용할 수 있습니다.
예시: "각 문장마다 새로운 정보를 제공해줘" 또는 "같은 단어를 너무 많이 반복하지 마"와 같은 지침을 통해 반복을 줄일 수 있습니다.

8. 테스트와 수정하기
초기 프롬프트를 작성하고 모델의 응답을 테스트한 후, 원하는 대로 나오지 않으면 프롬프트를 수정하고 재테스트해 최적화합니다.
예시: 모델의 응답이 너무 짧거나 너무 길다면, "3문장 이내로 간략히 요약해줘" 또는 "더 자세히 설명해줘"와 같이 프롬프트를 조정하여 테스트합니다.

9. 온도와 길이 제한 설정하기
모델의 창의성이나 응답의 길이를 제어할 수 있도록 온도(Temperature)와 길이 제한(Max Tokens)을 설정하면 좋습니다. 온도가 높을수록 창의적인 응답이 나오고, 길이 제한을 통해 원하는 응답 길이를 지정할 수 있습니다.
예시: 간단한 답변이 필요할 때는 "0.3 정도의 온도"와 함께 "최대 토큰 50"을 지정해 짧고 일관된 답변을 얻을 수 있습니다.

10. 실제 사용자와 상호작용하는 방식으로 작성하기
모델과의 상호작용을 실제 사용자와 대화하듯 자연스럽게 작성하면 모델이 더 자연스럽고 친근한 답변을 생성할 수 있습니다.
예시: "안녕! 간단한 소개 좀 해줄래?"처럼 대화체로 친근하게 요청하면 더욱 대화적인 응답을 유도할 수 있습니다.
이러한 기본 원칙들을 바탕으로 프롬프트 엔지니어링을 진행하면, 언어 모델을 효과적으로 활용할 수 있으며, 원하는 응답을 더 일관되게 얻을 수 있습니다.

11. 제약 조건 추가
모델이 가져올 수 있는 답변은 많을 수 있습니다. 자신이 원하지 않을 정보까지 추가로 넣을 수 있습니다. 그렇기 때문에 제약을 걸어서 그 제약 안에서만 찾을 수 있도록 유도합니다.
예시: '나무가 뭔지 설명해줘'보다는 '나무가 뭔지, 또 어떻게 살아가는지 3가지 정도의 정보로 요약해서 설명해줘'가 더 좋을 수 있습니다.

12. 복잡한 작업을 분할
복잡한 작업을 한꺼번 요청하면, 잘못된 답변을 받을 수 있습니다. AI는 논리적은 추론을 잘 하지 못하기에, 분할해서 받을려고 하면 유용합니다.
예시: '피보나치 수 10째 값을 단계별로 계산해줘'에서 '단계별로'라는 단어를 추가해서 분할작업을 시키면 유용합니다.

shot 계열의 프롬프팅 기법 배우기

Zero-shot, One-shot, Few-shot은 프롬프트 엔지니어링에서 모델을 훈련시키거나 사용자의 요청에 맞는 응답을 생성하는 방식을 설명하는 용어입니다. 이 방식들은 모델이 특정 작업을 수행하기 위해 얼마나 많은 예시를 제공받는지에 따라 구분됩니다. 각각을 설명하겠습니다.

1. Zero-shot Learning (제로샷 러닝)
Zero-shot은 모델이 예시나 추가적인 정보 없이 주어진 작업을 바로 수행해야 하는 방식입니다. 모델에게 구체적인 예시를 주지 않고, 프롬프트만으로 작업을 이해하고 응답해야 합니다.
장점: 빠르고 간결하게 사용할 수 있어 간단한 요청에 적합합니다.
예시: "햄버거 만드는 방법을 알려줘."라는 프롬프트에서, 모델은 햄버거 만드는 과정을 처음부터 설명합니다. 예시 없이 주어진 프롬프트만으로 답변을 생성하는 방식입니다.

2. One-shot Learning (원샷 러닝)
One-shot은 모델이 단 하나의 예시를 보고 작업을 수행하는 방식입니다. 한 가지 예시를 통해 모델이 작업의 패턴을 이해하도록 돕고, 그 후 프롬프트에 맞춰 작업을 수행하게 합니다.
장점: 예시가 한 번 제공되기 때문에, 모델이 더 정확히 작업을 이해할 가능성이 높아집니다. 간단한 작업이나 패턴 이해가 필요한 경우 유용합니다.
예시: "햄버거 만드는 법: 1. 빵을 준비합니다. 2. 패티를 구워 올립니다. 3. 야채와 소스를 추가합니다."
요청: "피자 만드는 법을 알려줘."
3. Few-shot Learning (퓨샷 러닝)
Few-shot은 여러 개의 예시를 모델에게 제공하여 작업의 패턴을 이해하도록 하는 방식입니다. 다양한 예시를 통해 모델이 작업의 요구사항과 패턴을 더 잘 파악하게 됩니다.
장점: 다양한 예시로 인해 모델이 패턴을 더 잘 학습할 수 있어, 복잡한 작업이나 일관된 스타일의 응답이 필요한 경우에 적합합니다. 참고로 과정까지 설명하면 더욱 더 자세한 값을 얻을 수 있습니다.
예시:
- "햄버거 만드는 법: 1. 빵을 준비합니다. 2. 패티를 구워 올립니다. 3. 야채와 소스를 추가합니다."
- "샐러드 만드는 법: 1. 채소를 씻습니다. 2. 양념을 추가합니다. 3. 잘 섞어줍니다."
요청: "파스타 만드는 법을 알려줘."
요약하자면,
Zero-shot: 모델에게 간단한 설명을 요구할 때 적합합니다. 예시 없이 바로 작업을 수행하므로, 간단한 정보나 설명을 요청할 때 사용됩니다.
One-shot: 특정한 패턴이나 형식을 사용해야 할 때 적합합니다. 한 가지 예시를 통해 원하는 응답 형식을 모델이 이해할 수 있습니다.
Few-shot: 복잡하거나 패턴이 명확히 설정된 작업에 적합합니다. 여러 예시로 모델의 응답 일관성을 높이고, 복잡한 형식을 따르게 할 때 유용합니다.

Act as류 프롬프팅 기법

Act-as 프롬프팅 기법은 언어 모델이 특정 역할이나 페르소나를 갖도록 지시하여 특정 관점이나 스타일로 응답하게 하는 프롬프트 작성 방식입니다. 이를 통해 모델이 대화의 목적에 맞게 톤과 스타일을 유지하면서 정보를 제공하게 할 수 있습니다. 이 기법은 특히 다양한 상황에 맞춘 응답을 일관되게 생성하는 데 매우 유용합니다.

Act-as 프롬프팅 기법의 특징과 장점
명확한 역할 설정: 특정 역할을 부여하여 모델이 그에 맞는 스타일로 대화하도록 합니다. 예를 들어 "너는 여행 가이드야", "너는 역사 선생님이야"와 같은 방식으로 프롬프트를 작성합니다.
일관된 톤과 스타일 유지: 모델이 특정 역할에 맞춰 응답하게 되어, 정보의 일관성과 신뢰성을 높입니다. 예를 들어, 친근한 조언자가 되어 응답하길 원하면 부드럽고 친근한 어조를 유지할 수 있습니다.
사용자 맞춤형 정보 제공: 다양한 역할에 맞춘 응답이 가능해, 전문적인 설명이 필요한 경우 또는 간단한 안내가 필요한 경우 등에 맞춤형 답변을 유도할 수 있습니다.
Act-as 프롬프팅 예시들
1. 기술 지원 상담사 역할
프롬프트: "너는 IT 기술 지원 상담사야. 사용자가 컴퓨터 문제에 대해 문의하면 친절하게 문제를 해결해줘."
사용자 요청: "컴퓨터가 너무 느려졌어요. 어떻게 해결할 수 있을까요?"
모델 응답 예시:
안녕하세요! 컴퓨터 속도가 느려져서 불편하셨겠네요. 우선, 
백그라운드에서 불필요한 프로그램을 닫아주시고, 디
스크 정리 및 윈도우 업데이트를 확인해 보세요. 그래도 해결되지 않으면, 
메모리 용량과 디스크 상태를 체크해 보시는 것도 도움이 될 거예요!
2. 금융 컨설턴트 역할
프롬프트: "너는 금융 컨설턴트야. 사용자가 재정 관련 질문을 하면 명확하게 답변하고 조언을 해줘."
사용자 요청: "투자를 시작하려고 하는데, 어떻게 하면 좋을까요?"
모델 응답 예시:
투자를 고려하신다니 훌륭한 시작입니다! 우선, 
위험을 분산할 수 있도록 다양한 자산에 투자하는 것이 중요해요. 주식, 채권, 펀드 등을 조사해보세요. 
또한, 자신의 투자 목표와 리스크 허용 범위를 설정한 후에 
전문가의 조언을 받아 시작하는 것도 추천드립니다.
Act-as 프롬프팅 기법은 다양한 사용자 요구와 응답 스타일에 맞춰 모델을 활용할 때 아주 유용합니다. 특히 특정 분야의 전문성을 요구하거나, 상황에 맞는 대화 톤을 맞추고자 할 때 효과적입니다. 이렇게 역할을 설정하면 사용자 경험이 향상되고, 모델이 더욱 일관성 있고 신뢰감 있는 답변을 제공할 수 있습니다.

그런데 여기서 페르소나 기법이라는 개념이 나옵니다.

페르소나 기법

페르소나(Persona) 기법은 모델이 특정 성격, 말투, 배경지식 등을 갖춘 '캐릭터'처럼 응답하게 만드는 프롬프팅 기법입니다. 페르소나와 Act-as 기법은 역할을 부여하는 데 유사하지만, 페르소나는 더 구체적인 성격, 배경, 감정 표현 등을 반영해 모델이 마치 특정 인물처럼 상호작용하도록 설계된다는 점에서 차이가 있습니다.

페르소나 기법의 특징
개성 있는 캐릭터: 모델에게 구체적인 성격과 배경을 설정하여 특정한 방식으로 반응하도록 만듭니다. 예를 들어, 친절하고 따뜻한 성격, 논리적이고 냉철한 성격, 유머러스하고 장난기 있는 성격 등을 설정할 수 있습니다.

상황에 맞는 역할: 모델이 특정 페르소나를 채택하고 있기 때문에, 응답은 그 페르소나의 특성과 일관되게 이루어집니다. 예를 들어, 불확실한 질문에 대한 답변을 신중하게 제공하거나, 유머러스한 스타일로 사람을 웃기려고 하는 방식으로 반응할 수 있습니다.

감정과 가치관: 페르소나는 감정적인 반응이나 특정 가치관을 모델에 내재화할 수 있기 때문에, 더 사람 같은 대화가 가능합니다. 예를 들어, 도덕적 기준을 설정하고 그에 맞는 답변을 하게 하거나, 특정 감정(행복, 슬픔 등)을 부여할 수 있습니다.

페르소나 기법 예시
1. 유머러스한 성격의 페르소나
프롬프트: "너는 유머러스하고 장난기 가득한 사람이라서 항상 재미있는 방식으로 답을 해줘."
사용자 요청: "무슨 요리를 해볼까요?"
모델 응답 예시:
코드 복사
요리요? 우선, 냉장고를 열어보세요. 만약 냉장고가 텅 비어있다면, 
그럼 바로 배달의 민족으로 가세요! 아니면, 계란 한 개로 오믈렛을 만들어볼까요? 
삶의 깊이를 더할 거예요. ㅎㅎ
2. 냉철하고 논리적인 성격의 페르소나
프롬프트: "너는 매우 논리적이고 냉철한 성격을 가진 사람이라서 모든 질문에 대해 객관적이고 이성적인 답변을 해줘."
사용자 요청: "효율적인 시간 관리를 위한 방법을 알려줘."
모델 응답 예시:
효율적인 시간 관리의 핵심은 우선순위 매기기입니다. 
해야 할 일을 중요도와 급박함에 따라 분류한 후, 가장 중요한 작업부터 처리하세요. 또한, 
계획을 세울 때에는 예기치 않은 상황을 고려하여 유연성을 두고, 
시간을 정해놓고 집중적으로 일하는 것이 중요합니다.
페르소나 기법의 장점
더 자연스러운 대화: 사람처럼 대화하는 느낌을 줄 수 있어, 사용자와의 소통이 더 친밀하고 자연스러워짐.
목적에 맞는 답변: 특정 페르소나의 특성에 맞춰 답변을 할 수 있기 때문에, 상황에 맞는 톤과 스타일을 유지하면서 응답할 수 있습니다.
다양한 응답 스타일: 하나의 질문에도 다양한 방식으로 반응할 수 있어, 사용자의 요구에 맞게 맞춤형 답변을 제공합니다.

결론
페르소나 기법은 모델에 특정 성격이나 역할을 부여하여, 그에 맞는 스타일과 톤으로 응답하게 만드는 강력한 기법입니다. 이를 활용하면 모델이 더 인간적인 감각으로 대화할 수 있고, 다양한 대화 스타일을 구현할 수 있기 때문에 특정 목표나 역할에 맞는 대화를 이끌어낼 때 유용합니다.

그리고 LLM은 논리적인 추론(확률적으로 작동하기 때문에)에 약할 수 있으므로, 논리적인 답변을 기대할 때에는, 구체적인 지침을 주는것이 중요합니다.

현재글스파르타 AI-8기 TIL(11/10) -> LLM

kimjunki-8 님의 블로그

kimjunki-8 님의 블로그 입니다.

오블완, 티스토리챌린지,

Today :
Yesterday :

kimjunki-8 님의 블로그

스파르타 AI-8기 TIL(11/10) -> LLM

'카테고리 없음'의 다른글

티스토리툴바

« 2025/06 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30