Nieuws
AI helpt logistieke systemen om te blijven functioneren in onzekerheid
Multi-Agent Reinforcement Learning (MARL) wordt gebruikt om logistieke processen te optimaliseren, met name in omgevingen met hoge onzekerheid. De kern van de aanpak ligt in het ontwikkelen van schaalvrije agenten die zich kunnen aanpassen aan veranderende omstandigheden. Dit wordt gerealiseerd door een hybride architectuur die RL (Reinforcement Learning) en LP (Linear Programming) combineert. De RL-component beheert strategische beslissingen, terwijl LP de uitvoering van specifieke pakketbeheeropdrachten uitvoert. Daarnaast worden observaties geschaald om een abstracte, taak-onafhankelijke representatie te creëren, waardoor agenten gemakkelijk kunnen worden overgezet naar nieuwe taken. De methode wordt getoond in een logistiek scenario waarin het systeem zich aanpast aan plotselinge veranderingen zoals extreme weersomstandigheden of stijgende tarieven. De aanpak wordt ondersteund door een specifieke trainingsschema waarbij slechts één agent per episode wordt getraind, terwijl de resterende agenten in inferentie-modus werken.