29 aprile 2026
Costruire un “LLM Judge” di base per le tue eval: regole oggettive + valutazioni soggettive
Quando inizi a valutare output generati da modelli, alcune verifiche sono semplici (schema JSON, vincoli hard), altre sono inevitabilmente qualitative (tono, brand fit, tossicità). In questo articolo vediamo come strutturare un giudice automatico “ibrido”: prima regole oggettive con Zod e utility functions, poi un LLM configurato come giudice con rubric rigorosa. L’obiettivo è ottenere risultati ripetibili, economici da far girare spesso, e soprattutto azionabili: PASS/FAIL con motivazione.