PaLM-E di Google è un cervello robotico generalista che prende comandi vocali senza alcun limite. Un gruppo di ricercatori di intelligenza artificiale di Google e dell’Università Tecnica di Berlino ha presentato PaLM-E, un modello di linguaggio visivo (VLM) multimodale con 562 miliardi di parametri che integra visione e linguaggio per il controllo robotico. Affermano che è il più grande VLM mai sviluppato e che può svolgere una varietà di compiti senza bisogno di alcuna programmazione. Interessante il video dimostrativo.