過去一週我寫了5篇,介紹了今年3月Kaggle上蝦皮的商品分類競賽。
- Part 1: 競賽介紹、Baseline Model
- Part 2: 大規模機器學習 GPU加速 RAPIDS
- Part 3: 超強Baseline — ArcFace
- Part 4: 如何對每個模型挑選出好的閾值(Threshold)
- Part 5: 第一名密技 Iterative Neighborhood Blending
很推薦入門機器學習,但是卻不知道怎麼加入Kaggle,或是沒有實務經驗的人參考上面五篇來了解這個競賽。
這篇我順便整理一些我覺得值得參考的資源,讓想要深入的朋友可以深入。
值得參考的前排名次
- 第一名: From Embeddings to Matches
- 第二名: matching prediction by GAT & LGB、code
- 第三名: Triplet loss, Boosting, Clustering
- 第七名: Query Expansion
- 第18名: You really don’t need big models
- 目前有release的全部solution
Model 使用
ArcFace
- Unsupervised Baseline ArcFace
- Pytorch Metric Learning Pipeline : Only Images
- Pytorch Densenet ArcFace + Validation [Training]
BERT
工具
RAPIDS
Weight & Bias
競賽技巧
Cross Validaiton
Image Preprocessing
如果喜歡這篇文章可以幫我多拍手幾次XD,或是對於哪個類型文章有興趣都可以在留言區跟我講~ 後續會以中難度的ML/DS/AI知識為主,以及AI/HCI研究相關知識