Xiaomi kompaniýasy robototehnika pudagy üçin niýetlenen, açyk kodly ilkinji iri göwrümli modelini — Xiaomi-Robotics-0 ulgamyny tanyşdyrdy. 4,7 milliard parametrli bu ulgam robotlary hakyky durmuş şertlerinde akylly dolandyrmak üçin täze mümkinçilikleri açýar. Model döwrebap VLA (Vision-Language-Action) ýörelgesi esasynda gurlup, ol daşky gurşawy hakyky wagtda seljermek, berilýän tekstli buýruklaryň manysyna düşünmek we fiziki işleri takyk ýerine ýetirmek ýaly üç sany esasy funksiýany birleşdirýär. Xiaomi-niň hünärmenleri bu tehnologiýany robotlaryň "fiziki aňynyň" düýp binýady diýip häsiýetlendirýärler. Ulgamyň özeni bolan Mixture-of-Transformers arhitekturasy wezipeleri iki sany ýöriteleşdirilen bloga bölýär: Wizual-dil modeli: Bu blok görkezmeleri seljerýär we robotyň giňişlikde ugur tapmagyna jogap berýär. Action Expert (Hereket eksperti): Bu bölek robota diňe bir sany hereketi däl-de, tutuş hereketler toplumyny öwredýär. Bu bolsa işleriň has akgynly we takyk bolmagyny üpjün edýär. Robotics-0 modeli dürli halkara synaglarynda (LIBERO, CALVIN, SimplerEnv) ýokary netijeleri görkezdi. Iki elli robot platformasynda geçirilen synaglarda ulgam elýaglyklary eplemek; kubikleri (bloklary) manipulýasiýa etmek we tertiplemek; çylşyrymly fiziki meseleleri çözmek ýaly işleri özbaşdak ýerine ýetirmegi başardy. Ulgamda gijikmeleri minimuma düşürmek üçin asinhron çykyş we hereketleri durnuklaşdyrmak mehanizmleri ulanylýar. Bu bolsa robotyň hereketlerini has "janly", durnukly we ynamly edýär.