본문 바로가기

728x90
반응형

Dev

[RecSys] Model-based Collaborative Filtering | KNN | SVD | MF | Matrix Factorization | ALS 모델 기반 협업 필터링 (Model-based Collaborative Filtering) Parametric Machine Learning을 사용하여, 데이터에 내재한 패턴을 이용해 추천하는 CF 기법 데이터 정보가 파라미터의 형태로 모델에 압축됨 파라미터 → 데이터의 패턴을 표현 → 최적화로 업데이트 Model-based CF의 장점 모델 학습 및 서빙: 학습된 모델이 압축된 상태로 저장 → 이미 학습된 모델로 추천하기 때문에 서빙 속도가 빠름 Sparsity & Scalability 문제 개선: sparse 한 데이터에서도 좋은 성능을 보임 + 데이터가 늘어나도 좋은 추천 성능을 보임 Overfitting 방지: 전체 데이터의 패턴을 학습하도록 작동 → 특정 주변 이웃에게 크게 영향받지 않음 Lim.. 더보기
[RecSys] 협업 필터링 | Collaborative Filtering | User-based CF | Item-based CF | deviation 협업 필터링 (CF, Collaborative Filtering) 많은 유저들로부터 얻은 기호 정보를 이용해 유저의 관심사를 자동으로 예측하는 방법 (Collborative: 집단적 협업, 다수의 의견 활용) → 많은 유저/ 아이템 데이터가 축적될수록 추천이 정확해질 것이라 가정 협업 필터링의 목적과 원리 주어진 데이터를 활용해 user-item 행렬을 생성 유사도 기준을 정하고, 유저 혹은 아이템 간의 유사도 계산 (user-based vs item-based) 주어진 평점과 유사도를 활용하여, 행렬의 비어있는 값(평점)을 예측 협업 필터링의 분류에 따른 모델 CF 분류 Neighboorhood CF (Memory-based CF) Model-based CF 대표 모델 User-based Item-ba.. 더보기
[RecSys] 컨텐츠 기반 추천 | Content-based Recommendation | TF-IDF | Term Frequency - Inverse Documnet Frequency | 코사인 유사도 | Cosine Similarity 컨텐츠 기반 추천 (Content-based Recommendation) 특정 유저가 과거에 선호한 아이템과 비슷한 아이템을 해당 유저에게 추천해준다! 장점 유저에게 추천을 할 때 다른 유저의 데이터가 필요하지 않음 새로운 아이템 혹은 인기도가 낮은 아이템을 추천할 수 있음 추천 아이템에 대한 설명이 가능함: 왜 이런 추천결과가 나왔는가에 대해서 합리적이고 타당한 근거를 찾을 수 있음 단점 아이템의 적합한 특징을 찾는 것이 어려움 한 분야나 장르의 추천 결과만 계속해서 나올수도 있음 (Overspecializatino) 다른 유저의 데이터를 활용할 수 없음 어떻게 아이템의 특징을 알아낼까? Item Profile: 추천 대상이 되는 아이템을 식별하고 특징이 되는 속성을 구성하는 것 → 다양하게 구성한 속.. 더보기
[RecSys] 연관 분석 | Association Analysis | 장바구니 분석 | 서열 분석 | support | confidence | lift 연관 분석(Association Rule Analysis, Association Rule Minig) 주어진 거래(Transaction) 데이터에 대해서, 하나의 상품이 등장했을 때 다른 상품이 같이 등장하는 규칙을 찾는 알고리즘 장바구니 분석 혹은 서열 분석이라고 하기도 함 빈발 집합(Frequent Itemset)에 대한 이해 k-Itemset: k개의 item으로 이루어진 itemset (k≥1) Support Count: 전체 거래 데이터에서 itemset이 등장하는 횟수 Support (Ratio): itemset이 전체 거래 데이터에서 등장하는 비율 Frequent Itemset: 엔지니어가 지정한 min support 값 이상의 itemset 연관 규칙의 기본 척도 frequent items.. 더보기
[RecSys] 인기도 기반 추천 시스템 | Hacker News Formula | Reddit Formula | Steam Rating Formula | Movie Rating 가장 단순한 형태의 추천 시스템, 인기도 기반 추천 시스템! 인기도 기반 추천 시스템: 가장 인기있는 아이템을 추천 인기도의 척도: 조회수, 평균 평점, 리뷰 개수, 좋아요/싫어요 수 등 조회수가 가장 많은 아이템을 추천 (Most Popular) Hacker News Formula: 아이템이 오래될 수록 감점하는 방식 시간이 지날수록 age, pageviews 증가 ages는 gravity를 지수로 가지고 있기 때문에, page가 상승하는 속도보다 age가 커지는 속도가 더 큼 아이템이 오래된 정도에 따라서 score가 크게 작아짐 gravity는 주로 1.8 값을 사용 Reddit Formual: 최근 아이템에 가산점을 주는 방식 첫 번째 항은 인기도(popularity)를 보여줌 두 번째 항은 아이.. 더보기
[RecSys] 추천 시스템이란 | 추천 시스템 평가 지표 | Precision@K | Recall@K | MAP@K | NDCG@K 검색과 추천의 차이 유저의 검색(Search): 사용자의 의도가 담긴 Query를 사용하여 데이터를 당겨옴 (Pull) 시스템의 추천 (Recommendation): 사용자의 취향을 분석한 데이터를 기반으로 상품을 추천 (Push) 추천 시스템에서 사용하는 정보 유저 관련 정보: 유저 프로파일링 → 식별자, 데모그래픽 정보, 행동 정보 아이템 관련 정보: 아이템 프로파일링 → 아이템 식별자, 아이템 고유 정보 유저 — 아이템 상호작용 정보: 유저가 아이템과 상호작용한 log → 추천 시스템을 학습하는 Feedback Data로 역할을 수행 Explicit Feedback Data: 명시적 피드백 데이터 — 평점, 좋아요 여부 등 Implicit Feedbakc Data: 암시적 피드백 데이터 — 클릭, .. 더보기
[Git&GitHub] Git & GitHub 관련 개념 총정리 Git이란? 여러 사람이 함께 개발을 할 때, 수정된 내역을 공유하고 버전을 관리하며 개발의 효율성을 높이기 위한 도구! 즉, 소프트웨어 버전 관리 시스템(VCS, Version Control System)이라고 할 수 있음 단, 작은 단위의 개발보다는 매우 크고 복잡한 프로젝트를 개발할 때 더 유용함 Git server와 Git Client Git server (클라이언트에게 코드를 받아 모아놓는 곳) Github.com Gitlab Git Bucket 등등 다양한 서비스가 있음 Git client (개인/지역 컴퓨터의 로컬 개발환경) git command line Interface (CLI): 명령어를 입력해서 git을 이용할 수 있도록 해주는 rjt VSC Git: VSC 내에 내장되어있는 Git .. 더보기
[git] vscode에서 커밋 시 COMMIT_EDITMSG 열릴 때 : 해결 방법 [문제 상황] vscode에서 git 익스텐션을 이용해 commit을 하려고, 커맨드 팔레트 단축키를 통해 'git commit을 날렸는데, COMMIT_EDITMSG 페이지가 뜨면서, 커밋이 제대로 되지 않고, 소스패널이 무한동작하면서 대기중인 상황.. 그래서 해결방법을 찾아보았습니다 해결방법 한 줄 요약: vscode에서 useEditorAsCommitInput 세팅값 끄기 위 문제가 발생한 이유: (아마도 commit 메세지를 길게 쓸 수 있도록 하기 위해) 커밋 메세지를 별도의 에디팅 페이지를 열어서 작성할 수 있도록 하기 위한 것으로 보임 만약 vscode에서 의도한 업데이트대로 사용하려면, COMMIT_EDITMST 파일의 맨 위에 줄에 커밋 메시지를 쓰고, 오른쪽 위의 체크표시를 누르면 커밋.. 더보기

728x90
반응형