ByteDance, la compagnia cinese che possiede TikTok, ha sviluppato tre avanzati modelli di AI per la generazione di contenuti multimediali: Goku, Goku + e OmniHuman-1
I tre tool, sviluppati anche grazie a un enorme dataset di video e immagini, si differenziano per le funzioni a cui sono destinati.
Goku, riporta la pagina di ByteDance, è un framework di creazione video basato su intelligenza artificiale di ultima generazione ed è progettato per generare video di alta qualità, fluidi e realistici in tempo reale, grazie alle sue tecniche di deep learning.
La sua architettura multimodale può integrare più fonti di input, comprese immagini, video e audio, per generare output umani completamente sintetizzati e idonei a creare avatar virtuali, animazioni ad uso marketing o per l’intrattenimento.
Goku + è una famiglia di modelli basati su Goku, studiata per il mercato pubblicitario, con la capacità di trasformare il testo in video umani iperrealistici e accattivanti, della durata superiore ai 20 secondi.
OmniHuman-1, framework AI di recente lancio, è un modello multimodale di generazione di video estremamente realistici di esseri umani, a partire da una singola immagine, testo, o altri input multimediali.
Il tool si distingue anche nel mantenere le proporzioni corporee, la sincronicità e la naturalezza dei movimenti.