Eine gemeinnützige Forschungsinitiative, die die Grenzen der künstlichen Intelligenz vorantreibt. Wir konzentrieren uns auf omni-modale KI-Systeme, effiziente Architekturen und synthetische Daten im großen Maßstab.
Entwicklung großer Sprachmodelle, die Text, Bilder, Audio und Video mit nahezu Null-Latenz verstehen und generieren.
Entwicklung von Systemen, die mehrere gleichzeitige Ströme von Audio-, Video- und Dateneingaben ohne Turn-Taking-Einschränkungen verarbeiten.
Erstellung großer synthetischer Datensätze, die auf faktischem Wissen über Sprachen, Dokumente und Langkontext-Szenarien basieren.
Skalierung effizienter Aufmerksamkeitsmechanismen auf 1M+ Tokens für ganztägiges Aufgabengedächtnis und In-Context-Lernen.