본문 바로가기

Dev/AI 인공지능

[RecSys] AutoEncoder 기반의 추천 모델 | AE (AutoRec) | CDAE (Collaborative DAE)

솔버(Solver) 2023. 4. 7. 12:32

728x90

01. Autoencoder란?

오토인코더(AE) : 입력 데이터를 출력으로 복원하는 비지도 학습 모델
디노이징 오토인코더(DAE) : 입력 데이터에 노이즈를 추가하여 학습하는 모델! 노이즈를 추가함으로써 보다 강건한(robust) 모델이 학습 → 성능 향상

02. AutoRec

배경 및 아이디어

MF는 linear, low-order interaction을 통해서 represenation
AutoRec은 Rating Vector을 입력과 출력으로 사용하여 Encoder & Decoder 적용 → AE 기반으로 activation func을 사용해서 더 복잡한 상호작용 표현 가능

모델 구조

아이템에 대한 임베딩

아이템과 유저 중, 한 번에 하나에 대해서만 임베딩 진행

아이템 i의 rating vector $r^{(i)}$ 준비 — 유저들의 아이템 i에 대한 평점 벡터임
인코더 가중치 행렬 $V$가 곱해져서 Dense Representation으로 변환
다시 디코더 가중치 행렬 $W$가 곱해져서 Sparse한 m차원 vector로 돌아옴

수식으로 보는 모델과 학습 과정

rating과 reconstructed rating (rating prediction)의 RMSE를 최소화하도록 학습
단, 관측된 데이터에 대해서만 파라미터 업데이트

성능 및 실험 결과

기존 RBM, MF 등의 모델보다 좋은 성능을 보임
Hidden Unit이 많아질 수록 RMSE 감소

03. CDAE (Collaboratvie DAE)

배경 및 아이디어

AutoRec: Rating Prediction 모델
CDAE: Ranking을 통해서 유저에게 Top-N추천 제공
→ rating이 아닌 preference(0 or 1)을 학습

모델 구조

DAE를 사용하여 확률적으로 drop-out 혹은 델타가 곱해진 노이즈된 인풋을 사용 ($y_u$는 한명의 유저 u에 대해서 모든 아이템에 대한 평점임)
개별 유저에 대한 특징은 $V_u$라는 파라미터가 학습하여 TopN 추천에 활용
인코더에서 노이즈 인풋값을 사용하여 latent vector인 $z_u$ 생성
디코더에서 $z_u$을 사용하여 다시 reconstruction

성능 및 실험 결과

인기도 기반 모델, Item based CF, MF, BPR 등의 다른 모델에 비해 높은 MAP와 recall을 보임

728x90

'Dev > AI 인공지능' 카테고리의 다른 글

[AI Basic] 활성화 함수(Activation Function) \| 시그모이드(Sigmoid) \| Tanh \| ReLU \| Leaky ReLU \| ELU (0)	2023.08.14
[RecSys] DKT(Deep Knowledge Tracing) \| Confusion Matrix \| precision \| recall \| AUC \| AOC (0)	2023.05.05
[RecSys] MLP 기반의 추천 모델 \| NCF (Neural Collaborative Filtering) \| DNN for Youtube Recommendation (0)	2023.04.07
[RecSys] Item2Vec \| Word2Vec \| CBOW \| Skip-Gram \| SGNS \| Embedding \| Word Embedding (0)	2023.04.06
[RecSys] Model-based Collaborative Filtering \| KNN \| SVD \| MF \| Matrix Factorization \| ALS (0)	2023.04.02

티스토리툴바