안녕하세요! 오랜만에 LLM 컨텐츠를 주제로 돌아왔습니다🤗
LLM 관련 기술을 학습하고, 여러 프로젝트를 수행하면서 문득 한 가지 생각이 들더군요.
‘상품에 대한 설명을 참고하여 가격을 어느 정도 정확하게 예측을 할 수 있을까?’
기존에는, 상품의 카테고리 / 크기 / 제조사 등 다양한 범주형 변수를 수치화하여 전통적인 머신러닝 모델을 통해 가격을 예측하는 경우가 많았습니다 (물론, 평점과 같은 연속형 변수도 포함하여 사용할 수 있습니다).
상품 가격과 관련성이 높은 피처들을 많이 수집하고 정교하게 피처링을 하면, 간단한 모델로도 파괴적인 성능을 보여줄 수 있을 것입니다.
하지만, 제 경험 상 한정된 정보와 품질이 떨어지는 데이터를 마주하게 될 확률이 상당히 높았습니다.
그래서, 사전에 학습된 LLM 모델을 이용하여 가격을 예측하는 방법을 떠올리게 되었습니다.
만약, 해당 방법론이 working 하다면, 기존 방식보다 상대적으로 feature engineering에 소요되는 시간을 줄일 수도 있습니다.
또한, 모델의 input이 텍스트이므로, 전통적인 머신러닝 모델보다 유연하게 데이터를 입력 받을 수 있습니다.
자, 그럼 실제로 제가 생각한 방법이 적합한 것인지 한 번 모험을 떠나봅시다~!
저의 모험 여정은 총 네 개의 스텝에 걸쳐서 공유 드릴 예정입니다😄