스파르타 AI-8기 TIL(11/7) - 파인튜닝 하는법

카테고리 없음

스파르타 AI-8기 TIL(11/7) - 파인튜닝 하는법

kimjunki-8 2024. 11. 8. 00:36

사전 학습

사전 학습(Pre-training)은 기계 학습, 특히 자연어 처리(NLP)와 같은 분야에서 사용되는 개념으로, 모델이 특정 작업을 수행하기 전에 대량의 데이터에서 일반적인 패턴과 지식을 학습하는 과정을 의미합니다.

데이터 수집: 모델이 사전 학습을 위해 사용할 대량의 데이터 세트를 수집합니다. 이 데이터는 텍스트, 이미지, 오디오 등 다양한 형식일 수 있습니다.
일반적인 패턴 학습: 모델은 수집한 데이터를 기반으로 일반적인 패턴, 구조, 언어 규칙 등을 학습합니다. 이 단계에서는 특정 작업에 대한 정보가 포함되어 있지 않지만, 모델은 언어의 일반적인 구조와 의미를 이해하게 됩니다.
미세 조정(Fine-tuning): 사전 학습이 완료된 후, 모델은 특정 작업(예: 감정 분석, 질문 답변 등)에 대해 미세 조정 과정을 거칩니다. 이 과정에서는 더 작은 데이터 세트를 사용하여 특정 작업에 맞게 모델을 조정합니다.

BERT(Bidirectional Encoder Representations from Transformers) 모델의 사전 학습 단계에서는 두 가지 주요 작업이 수행됩니다.

마스크드 언어 모델링(Masked Language Modeling, MLM): 이 작업에서는 입력 문장 내의 단어 중 일부를 무작위로 선택해 마스킹(예: [MASK] 토큰으로 대체)합니다. 모델의 목표는 마스킹된 단어를 예측하는 것입니다. 예를 들어, "나는 [MASK]를 좋아한다."라는 문장이 주어졌을 때, 모델은 "사과"와 같은 적절한 단어를 예측해야 합니다.이 방법은 모델이 문맥을 이해하고 단어 간의 관계를 학습하는 데 도움을 줍니다.

다음 문장 예측(Next Sentence Prediction, NSP): 이 작업에서는 두 개의 문장이 주어지고, 모델이 두 번째 문장이 첫 번째 문장의 다음 문장인지 여부를 예측합니다.예를 들어, 첫 번째 문장이 "나는 사과를 좋아한다."이고 두 번째 문장이 "사과는 맛있다."라면, 모델은 두 번째 문장이 첫 번째 문장의 다음 문장인지 아니면 무관한 문장인지를 판단해야 합니다.이 과정은 문장 간의 관계를 이해하고, 문맥을 파악하는 데 중요한 역할을 합니다.

생성형 AI

생성형 AI는 입력된 데이터나 정보를 기반으로 새로운 콘텐츠를 생성하는 인공지능 기술을 말합니다.

성형 AI는 보통 대규모 언어 모델(LLM)이나 생성적 적대 신경망(GAN) 같은 구조를 활용하여 학습합니다. 대표적인 생성형 AI의 응용 분야로는 다음과 같은 것들이 있습니다:
텍스트 생성: 챗봇, 기사 작성, 스토리텔링 등
이미지 생성: 이미지 생성 및 편집, 예술 작품 제작, 광고 및 마케팅 자료 제작 등
음악 및 오디오 생성: 작곡, 음성 변조, 오디오 편집 등
비디오 생성: 짧은 동영상, 애니메이션, 가상 캐릭터 생성 등

생성형 AI의 장점
창의성 및 생산성 향상: 생성형 AI는 글쓰기, 디자인, 음악, 프로그래밍 코드 작성 등 다양한 창작 작업을 빠르게 지원합니다. 사람의 개입을 최소화하고도 다채로운 결과물을 만들어내므로 창작과 생산성을 크게 높일 수 있습니다.
개인화된 콘텐츠 제공: 생성형 AI는 개인의 선호나 요청에 맞추어 맞춤형 콘텐츠를 생성할 수 있습니다. 예를 들어, 개인의 취향에 맞춘 음악, 추천 영화 줄거리, 맞춤형 마케팅 메시지 등을 만들 수 있습니다.
비용 절감: 콘텐츠를 제작하거나 정보를 수집하는 데 드는 시간과 인력을 절감할 수 있습니다. 예를 들어, 광고 카피, 기본 디자인 작업 등을 자동화함으로써 많은 비용을 절약할 수 있습니다.
접근성 향상: 다양한 언어로 자동 번역되거나 요약된 콘텐츠를 제공함으로써 언어의 장벽을 낮추고 더 많은 사용자에게 정보 접근을 가능하게 합니다.

생성형 AI의 단점
신뢰성 및 정확성 문제: 생성형 AI는 종종 부정확하거나 왜곡된 정보를 생성하기도 합니다. 사실 확인이 부족하거나, 학습된 데이터의 편향으로 인해 편향된 결과물을 내놓기도 합니다. 특히 의료, 법률, 금융 등의 분야에서는 위험한 결과로 이어질 수 있습니다.

데이터 편향 및 모델 편향: AI 모델이 학습한 데이터에 따라 결과물에 편향이 발생할 수 있습니다. 이는 코드 품질이나 스타일의 일관성을 해치며, 개발자가 원하지 않는 코드나 결과를 내놓을 가능성도 있습니다. 이 문제는 특히 민감한 시스템이나 애플리케이션 개발에서 큰 단점이 될 수 있습니다.

고성능 컴퓨팅 자원 소모: 생성형 AI 모델은 훈련 및 추론에 많은 컴퓨팅 자원을 필요로 합니다. 따라서 모델을 개발하고 운영하는 비용이 높을 수 있으며, 특히 실시간으로 생성형 AI를 사용하는 경우 서버 비용이 크게 증가할 수 있습니다.

랜덤성(Randomness)과 조건성(Conditioning)

생성형 AI에서 랜덤성(Randomness)과 조건성(Conditioning)은 콘텐츠 생성 방식에 큰 영향을 미치는 두 가지 중요한 요소입니다. 각 요소는 생성 결과물의 다양성과 품질을 조절하는 데 중요한 역할을 합니다.

랜덤성 (Randomness)
랜덤성은 AI 모델이 생성하는 콘텐츠의 불확실성이나 변동성을 의미합니다. 모델은 특정 입력에 대해 무작위 요소를 포함하여 다양한 결과를 생성할 수 있습니다.

랜덤성은 같은 입력에 대해 매번 다른 출력을 생성하도록 하여, AI가 생성하는 결과가 보다 다양하고 창의적이도록 합니다. 예를 들어, 동일한 프롬프트로도 다양한 스타일의 문장을 생성하거나, 여러 버전의 이미지 혹은 음악을 만들 수 있습니다.

대부분의 생성형 AI 모델에서는 랜덤성을 조절할 수 있는 온도(temperature)나 탑-k 샘플링 등의 파라미터가 있습니다.

온도(temperature): 값이 높을수록 출력이 더 다양해지며 창의적이지만 예측하기 어려운 결과를 생성할 수 있습니다. 반대로 온도가 낮으면 더 보수적이고 예측 가능한 결과가 생성됩니다.
탑-k 샘플링: 상위 K개의 예측 중에서 무작위로 선택하도록 하여, 필요에 따라 선택할 수 있는 옵션을 제한함으로써 랜덤성을 조절합니다.
장점과 단점: 랜덤성이 높으면 창의적이고 예측 불가능한 결과를 얻을 수 있지만, 일관성이 떨어지거나 요구한 조건을 충족하지 않을 위험이 있습니다. 반면, 랜덤성을 낮추면 일관된 결과를 얻을 수 있으나 창의성이 제한될 수 있습니다.

조건성 (Conditioning)
조건성은 AI 모델이 특정 조건이나 지시 사항에 따라 결과를 생성하는 능력을 의미합니다. 모델은 주어진 조건을 바탕으로 예상되는 특정한 출력을 생성하게 됩니다.

조건성은 사용자가 원하는 결과물에 맞추어 AI가 보다 정확하고 구체적인 결과를 생성할 수 있도록 합니다. 예를 들어, "고양이를 배경으로 하여 밤하늘을 배경으로 한 사진"이라는 조건을 주면 모델이 이 지시에 맞춘 이미지를 생성하게 됩니다.

조건성을 주기 위해 프롬프트 엔지니어링을 통해 상세히 설명하거나, 특정 모델 파라미터를 조절하여 원하는 결과물의 특성을 지정할 수 있습니다. 또한, 조건부 모델링을 통해 모델이 다양한 조건을 해석하고 이에 맞춘 결과물을 생성하게 할 수도 있습니다.

조건성을 잘 설정하면 모델이 매우 구체적이고 목적에 맞는 출력을 생성할 수 있습니다. 하지만, 조건이 너무 구체적이거나 많을 경우 모델이 창의력을 발휘하기 어려워지거나, 조건을 모두 만족하지 못하는 결과가 나올 수도 있습니다.

랜덤성과 조건성은 각각 창의성과 구체성 간의 균형을 조절하는 중요한 도구입니다. 개발자는 두 요소를 적절히 조절하여 목적에 맞는 결과를 얻어야 하며, AI 모델의 출력을 최적화하기 위해 이를 유연하게 사용할 수 있어야 합니다.

현재글스파르타 AI-8기 TIL(11/7) - 파인튜닝 하는법

kimjunki-8 님의 블로그

kimjunki-8 님의 블로그 입니다.

티스토리챌린지, 오블완,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

kimjunki-8 님의 블로그

스파르타 AI-8기 TIL(11/7) - 파인튜닝 하는법

'카테고리 없음'의 다른글

티스토리툴바