TO-DO
- [x] 강의 5강 까지 듣기
- [ ] 스페셜 미션 1
- [x] 심화챗봇구현
- 피어세션 진행할 것
- [x] 실습 코드 의문점 or 강의 의문점
- [x] KLUE 대회 및 대화 요약 대회 Base 코드 확인
TMI - 좋아하는 음식 & 맛집
- 강민님: 맥시코 음식을 사랑하는 남자 (타코맛집: 서울 신사동 - 코레아노
- 동현님: 소울푸드-돼지국밥 (내장국밥맛집: 울산 - 대밭골돼지국밥)
- 상욱님: 수퍼파파스 (먹는걸 즐기지 않음, 캡슐이 발명되길 기다리시는 워커홀릭)
- 준혁님: 가리지 않는 남자 (콩국수 - 시청 진주회관)
- 종혁님: 혀에서 사르르 녹는 고기 (차돌삼합 + 삼겹살 - 진대감(역삼점))
- 경현님: 고기 두툼 + 부드러운 돈까쓰 (가츠오/등심까쓰 - 서초)
- 효석님: 인생조합(목포-태평식당) - 청국장 + 삼겹살 (리애 - 돈까쓰)
Peer-session
- DAYCON base line 확인
- 전처리 필요 (뉴스 관련된 전처리 - 이메일 제거, 참조문구제거 등)
- 모델
- 인코더: 임베딩 layer + 3중 LSTM
- 디코더: 임베딩 layer + 단일 LSTM
- input으로 attention output concat한 것을 사용
- pytorch - hugging face 기반으로 다시 짜기
- 스페셜미션 1
- 실습 - 챗봇구현
- QA pair 데이터 셋에서 가장 유사한 Question을 찾고, 그 Question에 맞는 Answer를 답으로 출력
- get_cls_token(text)
- CLS 토큰을 활용해 task를 수행하기 때문에 활용도가 높을 것
- Chatbot QA data
- 하나의 질문에 모든 쿼리와 유사도를 비교해야 되기 때문에 굉장히 오래 걸린다. (약 30분) → 서비스하기는 불가능
- 모든 Question의 임베딩 벡터를 미리 저장해두면 시간 Save 가능 → 비교는 약 1초정도 소요
- 답변도 애매
- argsort를 이용해 top-5 확인
- 후보들이 사람이 보기에는 유사도가 매우 적음
- 유사도 기반 챗봇은 사용할 이유가 없음
- 추가적으로 라벨을 주면 성능이 개선될 여지가 있어 보임
- 대회코드 실험 결과 공유
- 로스 조합하는 법 - 경현님꺼 git branch 참조
- Custom Loss 활용
- Trainer class 상속받아서, compute_loss 정의
Question