[AI Tech] 네이버 부스트 캠프 14주차 회고

14주차 리마인드

주간 회고

강의는 지난주에 전부 수강했기 때문에 따로 들을 강의는 없었다.
이번주는 팀원들과 최종 프로젝트 주제관련해서 이야기를 많이 나누었다. 최종프로젝트 관련해서 나를 비롯한 팀원들의 고민이 여간 적지않았다.
부캠에서 가장 기억에 남을 프로젝트이기 때문에 다들 잘하고 싶은 마음이 큰 것 같다. 지난주부터 브레인스토밍으로 팀원들끼리 아이디어를 정리해서 피어세션때 이야기를 나누는 식으로 진행했었다.
많은 주제가 나왔지만, 가장 큰 문제는 데이터였다. 팀원분이 여러 기업에 데이터 관련 문의도 드려봤는데 좀처럼 쉽게 데이터를 얻을 수 없었다. 특히 우리 팀은 컨텐츠기반추천보다는 유저와 아이템의 상호작용 정보를 활용해서 협업필터링추천을 하고 싶어하는 의견이 많아서 더더욱 이러한 기업의 데이터를 얻기를 희망했다. 물론 아직 현재 진행형으로 진행중이며 다음주 안에는 최종프로젝트 주제가 결정될 것 같다.


Movie Recommendation 대회가 시작된지 1주정도 지났다. 이력서쓰랴 강의들으랴 최종프로젝트 주제 정하랴 대회에 신경쓸 겨를이 없었다.
일단 우리팀 페이스에 맞춰서 미션 코드에 대한 분석부터 진행했다. 내가 분석을 맡은 코드는 Bert4Rec으로 추천시스템에 NLP에서 유명한 Bert모델을 적용한 모델이다. 논문을 살짝 보니깐 Bert4Rec을 잘 이해하려면 SASRec 즉, Self-Attention 을 추천시스템에 도입한 추천시스템을 먼저 이해할 필요가 있었다. 이에 따라 SASRec부터 논문리뷰를 진행하고 미션코드와 함께 논문을 대조해가며 코드리뷰를 진행했다. 사실 SASRec까지는 무난했다. 문제는 Bert4Rec이였다 ㅎㅎ.
Bert4Rec에서는 단방향으로만 보는 SASRec의 구조에 대해, 실제 추천에서 아이템 시퀀스의 순서가 항상 정해셔있지 않으며, 아이템과 유저는 항상 바뀌기 때문에 양방향으로 볼 필요학 있다고 언급한다. 솔직히 유저가 아이템을 본 순서 흐름대로 데이터를 보는게 더 옳은것 아닌가? 역순으로 봐서 의미가 있는것인가? 의문이 들었다. 근데 코드를 살펴보면 Cloze task나 gelu를 적용하는 건 보이는데 양방향으로 레이어를 잇는 부분은 못봐서 이게 맞는건가? 의문이 들었다 ㅎㅎ. 해당부분에 대한 궁금증은 이번 연휴때 NLP쪽 강의를 도강해서 해소해야겠다 ㅎㅎ

개인 회고

이것저것 신경쓸게 많아서 대회에 신경을 많이 못쓴것 같다. 심지어 지난주 금요일날 밤늦게 술집에서 축구보고 왔는데 A형 독감이 걸려버려서 몇일 동안 아파서 집중을 못했다. 독감이 이렇게 아플줄 몰랐다. 생각보다 많이 아팠다….
이번 대회 데이터를 열어봤는데 여러 데이터가 있어서 이걸 어떻게 EDA해서 활용할지 고민이 많다. 이번 연휴때 이부분도 고민을 해봐야겠다.

Categories:

Updated:

Leave a comment