Nieuws

Hoe ver kan klassieke NLP gaan? Van Bag-of-Words tot Stacking voor Spooky Author Identification

Een klassiek NLP-experiment op Kaggle's Spooky Author Identification-taak vergeleek methoden van Vowpal Wabbit tot een gestapelde ensemble. De beste klassieke pijplijn bereikte 0.8687 nauwkeurigheid en 0.3504 log loss op een holdout-set, en 0.30414 privaat log loss op Kaggle. Het artikel benadrukt dat zorgvuldig gekozen sparse-tekstkenmerken effectief kunnen zijn voor auteursherkenning.

Bron: Towards Data Science

Originele taal: [en-US]

Lees hier het originele artikel