DKT는 Deep Knowledge Tracing의 약자로 우리의 "지식 상태"를 추적하는 딥러닝 방법론이다. DKT는 우리가 특정 과목을 얼마만큼 이해하고 있는지를 측정해 준다. 더하여 이런 이해도를 활용해 아직 풀지 않은 미래의 문제에 대해 맞을지 틀릴지 예측이 가능하다.
이런 DKT를 활용하면 우리는 학생 개개인에게 특정 과목의 이해도와 취약한 부분을 극복하기 위해 어떤 문제들을 풀면 좋을지 추천이 가능해진다. DKT는 맞춤화된 교육을 제공하기 위해 아주 중요한 역할을 맡게 된다.
이번 프로젝트에서는 i-Scream 데이터셋을 이용해 DKT model을 구축했다. 우리는 각 학생이 푼 문제 리스트와 정답 여부가 담긴 데이터를 받아 최종 문제를 맞출지 틀릴지 예측하였다.
박우석 : EDA 및 Feature 생성, Cross-Validation 테스트 및 LightGBM 모델링
전병웅 : EDA , Feature Engineering, CatBoost 및 Transformer 모델링
김선도 : EDA 및 Feature Engineering
노태엽 : EDA, LightGCN 및 GraphSAGE 모델링, Hyper Parameter Tuning
나인혁 : EDA , Feature Engineering, K-Fold Cross Validation 테스트, LightGCN 및 Transformer 모델링
Feature Engineering을 진행하기 전 각자 EDA를 진행하며 정답률과 관련 있는 feature를 탐색했다.
문제 풀이 시간에 따른 정답률을 확인해본 결과 0~6초 사이에 문제를 푼 유저의 정답률이 0.2로 가장 낮게 기록 됐고 문제 풀이 시간이 10초 이상인 유저의 정답률은 0.7로 나타났다. 이를 통해 문제를 너무 빨리 푼 유저는 문제가 쉬워서 빨리 풀었다기보단 어려워서 찍었다고 판단할 수 있다.