Nieuws
De waarheid die je extractor nooit vermeldde
Een extractiesysteem dat feiten correct uit een document haalt, kan nog steeds onveilig zijn als het document zelf incomplete informatie bevat. Dit artikel beschrijft een pijplijn die gebruikmaakt van een open-source semantische bibliotheek, publieke biomedische corpora en autoriteiten zoals RxNorm en openFDA om niet alleen te controleren of een feit klopt met de bron, maar ook of de bron iets belangrijks heeft weggelaten. De taalmodellen stellen feiten voor, maar externe autoriteiten hebben het laatste woord, waardoor omissies van bijvoorbeeld contra-indicaties worden opgespoord.