hanburger-background
econovation

DEV
HACKATHON
SERVICE
AI COMPETITION
AI COMPETITION
OTTO(Kaggle)에서 주최한 추천시스템 대회를 한 한기동안 진행했습니다.
IDEA
추천 시스템에는 크게 컨텐츠 기반 필터링, 협업 필터링, 하이브리드 3가지로 나누어 볼 수 있습니다. 그중 저희 팀은 대회 측에서 제공받은 Implicit Data를 효율적으로 운용할 수 있는 협업 필터링을 사용하였습니다.
협업 필터링은 비슷한 취향을 갖은 사용자가 좋아한 아이템을 사용자에게 추천하는 방법입니다. 협업 필터링은 "나와 비슷한 취향을 갖은 사람은 나와 비슷한 평가를 내릴거야. 나는 아직 구매하지 않았지만 다른 사람이 구매한 상품을 나도 갖고 싶을거야!" 라는 가정에서 시작합니다
Implicit Data란 사용자가 간접적으로 표현된 선호도, 취향을 나타내는 데이터(예를 들어, 사용자 행동 로그 데이터, 검색 기록, 클릭 기록, 방문 페이지, 구매 내역)를 의미합니다.
SKILLS
개굴팀은 프로젝트를 진행하면서 크게 2가지의 기술을 사용했습니다.
첫번째는 recommand system에서 사용되는 rerank, co-visitation, baseline 등에 대한 것입니다.
개굴팀은 이러한 기술을 이용하여 코드를 만들었고 pandas, cudf, polars등의 파이썬 라이브러리를 이용하여 방대한 데이터의 처리를 하였습니다.
이렇게 만들어진 데이터는 제출되어서 각각이 0.45~0.57의 정확도를 보였습니다.
두번째는 성능 향상에 항상 큰 도움을 주는 model ensemble입니다.
ensemble이란 여러 모델로 만들어진 각각의 데이터를 합쳐서 더 좋은 결과의 데이터를 얻는 방법입니다.
ensemble을 통해 만들어진 데이터는 제출되어서 0.578의 정확도를 얻는 쾌거를 얻기도 하였습니다.
개굴
김건형, 이규민, 이도연
[object Object]