<aside> 💡 매주 토요일 10:30~ 12:30 온라인 (discord)
매주 AI 관련 정보(논문, 기술, 컨퍼런스 등) 공유
Prompt/LLM 팁, 이슈 및 해결방안 정리
Prompt/LLM 관련 논문 정리
Dataset
- 없다면 LLM으로 생성
Supervised Fine-Tuning (SFT)
- 경량화, PEFT
Evaluation
- positive/negative answer labeling
- GT는 LLM의 답변
Reinforcement Learning (RL)
- PPO, DPO, KTO, …