LLM 이란?
- 대형 언어 모델(LLM)은 대규모 데이터 세트에서 학습하여 자연어 처리 및 생성 능력을 갖춘 모델로, 최근 다양한 분야에서 혁신적인 성과를 보여주고 있다. 최근 발표된 대표적인 LLM으로는 OpenAI의 GPT-4[4]와 같은 모델이 있으며, 이들은 수십억 개의 매개변수를 사용하여 복잡한 언어 패턴을 이해하고 생성할 수 있다.
- LLM은 언어의 문법과 의미를 이해하고, 텍스트의 맥락을 파악하여 자연스럽고 유창한 문장을 생성할 수 있다
(출처: 생성형 대형 언어 모델(LLM) 활용 영상의 날씨 조건 자동 인식 및 분류 방법)
****LLM의 성능을 최적화 하는 방법
- 2.1 LLM (대규모 언어 모델)
- LLM은 엄청나게 많은 데이터를 공부한 똑똑한 인공지능입니다. 이 모델은 수백만 개의 작은 규칙(파라미터)들을 바탕으로 작동하며, 자연어(사람이 사용하는 언어)를 이해하고 새로운 글을 쓸 수 있는 능력을 가지고 있어요. 이 모델은 텍스트를 생성하거나 번역하고, 요약하거나, 질문에 답하는 등 다양한 일들을 할 수 있어요.
- 2.2 프롬프트 엔지니어링 (Prompting Engineering)
- 프롬프트 엔지니어링은 LLM이 더 좋은 답변을 할 수 있도록, 질문을 똑똑하게 다듬는 방법이에요. 마치 친구에게 질문할 때 더 잘 이해하도록 설명을 잘하는 것과 비슷하죠. 이 기술을 사용하면 LLM이 더 정확하고 유용한 답변을 만들어낼 수 있어요. 아래는 그 방법 중 몇 가지를 소개해요.
- 2.2.1 CoT (연쇄적 사고 유도)
- CoT는 복잡한 문제를 단계적으로 해결하도록 LLM에게 요구하는 방법이에요. 예를 들어, 수학 문제를 푼다고 할 때, 한 번에 답을 내는 대신 문제를 푸는 과정 하나하나를 거치게 하는 거죠. 이러면 LLM이 더 정확한 답을 내기 쉬워져요.
- 2.2.2 생성된 지식 활용 (Generated Knowledge Prompting)
- 이 방법은 LLM이 이미 알고 있는 지식을 더 잘 활용하게 만드는 방법이에요. LLM이 질문에 대한 답변을 주기 전에, 관련된 추가적인 정보를 먼저 생성하게 해서, 더 깊이 있고 풍부한 답을 얻을 수 있게 도와줘요.
- 2.2.3 RAG (정보 검색 기반 생성)
- RAG는 LLM이 답을 만들기 전에, 외부의 문서나 데이터베이스에서 필요한 정보를 먼저 검색하도록 하는 방법이에요. 이렇게 하면 답변이 더 정확해지고, 질문과 더욱 잘 맞는 정보를 제공할 수 있게 돼요. 예를 들어, 최신 뉴스에 대해 질문하면, 모델이 최신 정보를 찾아와서 답변을 해주는 거예요.