Panoramica#
Sviluppato come tesi di Bachelor all’ETH di Zurigo (Voto: 5.75 / 6.00), questo progetto è uno strumento interattivo di debugging visuale che consente a esperti di dominio di ispezionare e correggere l’estrazione automatica di dati strutturati da PDF di accordi di libero scambio.
Cosa fa#
Lo strumento elabora documenti di accordi di libero scambio ed estrae dati strutturati come regole di origine e concessioni tariffarie. Gli esperti di dominio possono poi ispezionare visivamente i risultati dell’estrazione e fornire correzioni tramite un’interfaccia intuitiva, creando un ciclo di feedback iterativo che migliora la precisione.
Componenti principali#
- Pipeline di parsing documentale per PDF di accordi di libero scambio
- Estrazione di informazioni tramite modelli di machine learning
- Interfaccia React per debugging visuale interattivo e feedback degli esperti
Strumenti utilizzati#
Python, React, TypeScript