1 post
LLM's overschatten hun eigen correctheid met 20-60%. Confidence scoring lost dat probleem niet op — het maakt het zichtbaar. Voor fiscalisten is die zichtbaarheid het verschil tussen een onderzoekstool en een gokmachine.