Mедия за бизнес, лидерство, технологии и иновации, вдъхновени от хората, базирани на науката и реализирани в полза на човечеството – бъдете окрилени от знание за прогрес!

Helix [ВИДЕО]: Новият AI модел, който дава на хуманоидните роботи невероятна ловкост

Helix революционизира хуманоидната роботика! Първият Vision-Language-Action (VLA) модел, който обединява зрение, език и прецизен контрол, позволявайки на роботите да изпълняват сложни задачи без предварително обучение.

Microsoft представи Helixреволюционен модел Vision-Language-Action (VLA), който обединява зрение, разбиране на език и контрол на движенията, за да преодолее ключови предизвикателства в роботиката.

Helix прави възможно това, което досега се смяташе за непостижимо:

  • Пълен контрол върху горната част на тялото – От главата до върха на пръстите, Helix осигурява непрекъснат контрол върху всяко движение.
  • Координация между няколко робота – Два робота могат да работят заедно по сложни задачи, без предварително обучение.
  • Вдигни всичко! – Роботи с Helix могат да хващат всякакви предмети от ежедневието, дори ако никога не са ги “виждали” преди.
  • Един-единствен модел – Всички движения и взаимодействия се учат от една невронна мрежа, без нужда от допълнително обучение.
  • Готов за търговска употреба – Helix работи на енергоефективни GPU и може да бъде внедрен веднага.

Нов подход за роботика в реална среда

Домът е най-голямото предизвикателство за роботите. В индустриални условия работните задачи са предвидими, но в домовете има безкрайно много различни предмети и ситуации. Helix решава този проблем чрез моментална адаптация и обучение в движение.

  • Досегашният проблем: За да научи ново движение, роботът трябваше да мине прз хиляди демонстрации или ръчно програмиране. Това е непрактично и скъпо.
  • Решението на Helix: Благодарение на AI, роботът може да научи нови умения моментално – просто чрез езикови команди!

Helix използва VLMs (Vision-Language Models), за да разбира значението на обектите и ситуациите, което му позволява незабавна генерализация – способност да прилага наученото към нови и непознати задачи.

Как работи Helix?

Helix комбинира два различни подхода за изчисления, за да постигне скорост и гъвкавост:

  • System 2 (S2) – “Мисли бавно” – Обработва сцената, анализира контекста и разбира езиковите команди. Работи със 7-9 кадъра в секунда (Hz).
  • System 1 (S1) – “Мисли бързо” – Превръща командите на S2 в прецизни действия, като ги изпълнява в реално време с 200 Hz честота.

Пример: Докато един робот поставя предмет в шкаф, другият автоматично коригира движението си, за да му помогне.

Какво прави Helix по-добър от предишните системи?

  • Скорост + Гъвкавост – Съчетава скоростта на специализираните роботи с възможност за генерализация върху непознати обекти.
  • По-добро мащабиране – Работи с цялото тяло на хуманоидния робот, а не само с опростени манипулатори.
  • Лесна интеграция – Стандартна архитектура, която може да работи с различни роботи.
  • Разделение на функциите – S1 и S2 могат да се развиват независимо, което ускорява подобренията.

Как е обучен Helix?

Helix е трениран с 500 часа разнообразни движения в различни среди. Използва автоматично генерирани инструкции, базирани на видеоанализ, за да разбере какво трябва да прави във всяка ситуация.

? Как роботът “знае” как да хване обект?

? Helix анализира видеоклипове, в които роботът манипулира предмети, и самостоятелно извлича инструкции за всяко движение.

Резултат: Моделът не просто имитира, а разбира и адаптира движенията според контекста.

Невероятни резултати от Helix

  • Пълен контрол върху горната част на тялото
  • Координация между два робота без предварително обучение
  • Може да вдигне хиляди нови предмети без допълнително програмиране
  • Разбира сложни езикови команди и ги превежда в действия

Пример:

? Кажете на робота: “Вдигни пустинния предмет.”
? Helix разбира значението и избира кактус от купчина играчки!

Заключение: Какво следва за Helix?

Helix е огромен скок напред в хуманоидната роботика. За първи път виждаме робот, който може да участва в дългосрочни задачи, да разбира естествен език и да се адаптира към нови ситуации в реално време.

? Следваща стъпка: Увеличаване на мащаба 1000 пъти!

Total
0
Share