0. 강의 소개
추출기반으로 기계독해 문제에 접근한다는 것의 의미를 이해하고, 실제 추출기반 기계독해를 어떻게 풀 수 있을지에 대해 배워볼 예정입니다. 학습 전 준비해야할 단계와 모델 학습 단계, 그리고 추출기반으로 얻어낸 답을 원하는 텍스트의 형태로 변형하는 방법에 대해 공부하겠습니다.
[학습 목표]
- 추출기반으로 기계독해 접근하기
- Hugging Face와 BERT
- BERT를 기계독해에 fine-tune 해보기
1. Extraction-based MRC
1-1. Extraction-based MRC의 정의
- 질문(question)의 답변(answer)이 항상 주어진 지문(context)내에 span으로 존재
- e.g. SQuAD, KorQuAD, NewsQA, Natural Questions, etc.
- 사용은 통일된 폼으로 정리되어있고 다운로드도 간편한 허깅페이스 datasets를 사용한다. (https://huggingface.co/datasets)
1-2. Extraction-based MRC의 평가방법
- EM : 정확히 일치해야함 , F1 : 부분점수 가능
1-3. Extraction-based MRC Overview
