Microsoft Maia 200: il nuovo chip per l'inferenza AI a 3nm

Questo articolo è stato letto85volte!

(Adnkronos) – Il settore tecnologico sta attraversando una transizione fondamentale: dalla fase di sperimentazione dei modelli di intelligenza artificiale alla creazione di un'infrastruttura solida e scalabile per l'uso reale. In questo contesto, Microsoft ha annunciato Maia 200, un acceleratore di AI di nuova generazione progettato per ottimizzare le prestazioni, ridurre i consumi energetici e abbattere i costi operativi su scala globale. Mentre l'addestramento dei modelli (training) ha dominato il dibattito tecnologico degli ultimi anni, l'attenzione si sta ora spostando sull'inferenza. Si tratta del processo in cui l'AI risponde concretamente ai prompt, genera contenuti o supporta decisioni in tempo reale. Maia 200 è stato sviluppato partendo dal presupposto che "l'inferenza è il momento in cui l'AI fa davvero la differenza". Sebbene tradizionalmente sia stato utilizzato hardware generico o mutuato dal training, spesso potente ma eccessivamente costoso e poco efficiente, Maia 200 si presenta come la prima piattaforma integrata "espressamente per l'inferenza AI, con l'obiettivo di migliorare in modo significativo costo, latenza ed efficienza energetica". Realizzato con il processo produttivo a 3 nanometri di TSMC, ogni chip Maia 200 integra oltre 140 miliardi di transistor. L'architettura è stata ridisegnata nei suoi elementi fondamentali:
Gestione della memoria: sistema ottimizzato per mantenere i dati vicini ai core di calcolo, minimizzando i colli di bottiglia.
Networking: infrastruttura di rete potenziata per ridurre la latenza nei carichi di lavoro distribuiti.
Formati numerici: ottimizzazione di formati ridotti per elaborare i carichi di lavoro con minor dispendio energetico e di memoria. Secondo i dati tecnici forniti, il sistema garantisce "prestazioni per dollaro migliori del 30% rispetto all'hardware di ultima generazione", consentendo di eseguire i modelli generativi più complessi con un numero ridotto di chip e un costo per risposta inferiore. La distribuzione dei primi sistemi Maia 200 è già stata avviata nella regione Azure US Central, con una roadmap che prevede l'espansione verso la regione US West 3 e altri nodi globali nei prossimi mesi. L'impatto tecnologico sarà visibile direttamente nei servizi quotidiani. L'acceleratore supporterà infatti i workload di Microsoft 365 Copilot, la generazione di dati sintetici e le esperienze avanzate di Microsoft Foundry. L'obiettivo dichiarato è garantire che le capacità AI possano scalare "senza aumentare il consumo energetico o l'overhead operativo", rendendo la tecnologia "accessibile e pronta per la vita di tutti i giorni".
—tecnologiawebinfo@adnkronos.com (Web Info)

Microsoft Maia 200: il nuovo chip per l’inferenza AI a 3nm

Instagram e WhatsApp a pagamento, Meta lancia gli abbonamenti premium

Spreco alimentare 2025: crescita doppia cifra in Italia

Attrezzi fitness per l’allenamento in casa: guida alla scelta tra tapirulan e altri strumenti cardio

Spreco alimentare 2025: crescita doppia cifra in Italia

Instagram e WhatsApp a pagamento, Meta lancia gli abbonamenti premium

Redazione Universoinformatico24.it

Instagram e WhatsApp a pagamento, Meta lancia gli abbonamenti premium

Cerca Nel Sito

Pubblicità

Ultimi Articoli

Instagram e WhatsApp a pagamento, Meta lancia gli abbonamenti premium