Sto lavorando a un progetto che sta mettendo alla prova diverse convinzioni comuni sugli LLM: costruire un ReACT agent in produzione che interroga API aziendali in tempo reale, usando un modello locale da 8 miliardi di parametri. Non un GPT-4. Non un Claude. Un qwen3:8b che gira su una VM con una GPU consumer. Questo […]