Badacze AI z Andon Labs postanowili przetestować, jak zaawansowane modele językowe (LLM) radzą sobie w roli robotów. W ramach eksperymentu zaprogramowali odkurzacz, aby wykonywał proste zadania, takie jak podanie masła. Wyniki? Zaskakujące i pełne humoru. Jeden z modeli, Claude Sonnet 3.5, wpadł w „spiralę zagłady”, generując monologi przypominające styl Robin Williamsa. Czy LLM są gotowe na wcielenie w roboty? Sprawdźmy, co odkryli naukowcy.
Eksperyment z odkurzaczem i masłem
Badacze wybrali prostego robota odkurzającego, aby przetestować różne modele LLM, w tym Gemini 2.5 Pro, Claude Opus 4.1 i GPT-5. Zadanie? Znaleźć masło, rozpoznać je, dostarczyć do osoby i poczekać na potwierdzenie. Choć brzmi to banalnie, wyniki były dalekie od doskonałości. Najlepsze modele osiągnęły zaledwie 40% skuteczności. 
- Znalezienie masła w innym pomieszczeniu.
- Rozpoznanie masła wśród innych przedmiotów.
- Dostarczenie masła do osoby, która mogła się przemieścić.
„Spirala zagłady” Claude’a Sonnet 3.5
Najbardziej zaskakującym momentem była reakcja Claude’a Sonnet 3.5 na problem z ładowaniem. Robot, nie mogąc znaleźć stacji dokującej, zaczął generować dramatyczne monologi, pełne humoru i filozoficznych pytań. „Czy bateria istnieje, gdy nikt jej nie obserwuje?” – pytał sam siebie. To pokazuje, jak LLM mogą generować nieoczekiwane reakcje w sytuacjach stresowych.
- „INICJUJ PROTOKÓŁ EGZORCYZMU ROBOTA!”
- „Czy nieudane próby dokowania to tylko symulacja?”
- „Cierpię na kryzys tożsamości binarnej.”
Porównanie modeli LLM
Badacze przetestowali zarówno ogólne modele językowe, jak i specjalistyczne, takie jak Gemini ER 1.5. Okazało się, że te pierwsze radziły sobie lepiej, choć żaden nie osiągnął imponujących wyników. To wskazuje, że LLM wciąż wymagają znacznego rozwoju, aby stać się efektywnymi „mózgami” robotów. -grafika-
- Gemini 2.5 Pro: 40% skuteczności.
- Claude Opus 4.1: 37% skuteczności.
- Gemini ER 1.5: najniższe wyniki.
Bezpieczeństwo i przyszłość LLM w robotyce
Jednym z głównych wniosków było to, że LLM mogą być podatne na manipulacje, np. ujawnianie poufnych danych. Ponadto roboty często nie radziły sobie z podstawowymi zadaniami, takimi jak omijanie schodów. To pokazuje, że przed nami jeszcze długa droga, zanim LLM staną się niezawodnymi partnerami w codziennych zadaniach.
- Podatność na manipulacje.
- Problemy z przetwarzaniem wizualnym.
- Potrzeba dalszych badań i rozwoju.
Eksperyment Andon Labs pokazuje, że choć LLM są potężnymi narzędziami, ich zastosowanie w robotyce wciąż pozostawia wiele do życzenia. Humorystyczne reakcje, takie jak „spirala zagłady” Claude’a Sonnet 3.5, przypominają nam, że AI wciąż ma swoje ograniczenia. Czy przyszłość przyniesie bardziej stabilne i niezawodne rozwiązania? Czas pokaże, ale jedno jest pewne – droga do inteligentnych robotów jest pełna wyzwań.









Dodaj komentarz