Nieuws
Hoe ver kan klassieke NLP gaan? Van Bag-of-Words tot Stacking voor Spooky Author Identification
Een klassiek NLP-experiment op Kaggle's Spooky Author Identification-taak vergeleek methoden van Vowpal Wabbit tot een gestapelde ensemble. De beste klassieke pijplijn bereikte 0.8687 nauwkeurigheid en 0.3504 log loss op een holdout-set, en 0.30414 privaat log loss op Kaggle. Het artikel benadrukt dat zorgvuldig gekozen sparse-tekstkenmerken effectief kunnen zijn voor auteursherkenning.