SHARE
Cyber Life

Google DeepMind mengumumkan kemajuan baru dalam bidang robotika dan model bahasa visual (VLMs). Divisi penelitian kecerdasan buatan (AI) dari raksasa teknologi ini telah bekerja dengan model visual canggih untuk mengembangkan kemampuan baru pada robot. Dalam studi terbaru, DeepMind menyoroti bahwa dengan menggunakan Gemini 1.5 Pro dan jendela konteks panjangnya, divisi ini berhasil menciptakan terobosan dalam navigasi dan pemahaman dunia nyata oleh robot-robotnya. Awal tahun ini, Nvidia juga memperkenalkan teknologi AI baru yang mendukung kemampuan canggih pada robot humanoid.

Dalam sebuah postingan di X, Google DeepMind mengungkapkan bahwa mereka telah melatih robot-robotnya menggunakan jendela konteks 2 juta token dari Gemini 1.5 Pro. Jendela konteks dapat dipahami sebagai jendela pengetahuan yang terlihat oleh model AI, yang digunakan untuk memproses informasi seputar topik yang ditanyakan.

DeepMind memanfaatkan jendela konteks panjang ini untuk melatih robot-robotnya di lingkungan dunia nyata. Divisi ini bertujuan untuk melihat apakah robot dapat mengingat detail suatu lingkungan dan membantu pengguna ketika diminta informasi tentang lingkungan tersebut dengan istilah kontekstual atau tidak jelas. Dalam sebuah video yang dibagikan di Instagram, divisi AI ini menunjukkan bahwa sebuah robot dapat membimbing seorang pengguna ke papan tulis ketika diminta tempat untuk menggambar.

“Ditenagai oleh panjang konteks 1 juta token dari 1.5 Pro, robot kami dapat menggunakan instruksi manusia, tur video, dan penalaran nalar umum untuk berhasil menemukan jalan di sekitar suatu ruang,” ujar Google DeepMind dalam sebuah postingan.

Dalam sebuah studi yang dipublikasikan di arXiv, DeepMind menjelaskan teknologi di balik terobosan ini. Selain Gemini, mereka juga menggunakan model Robotic Transformer 2 (RT-2) mereka sendiri. Ini adalah model vision-language-action (VLA) yang belajar dari data web dan robotika.

LAINNYA DARI MASTEKNO
Cyber Life
YouTube Siap Tantang OpenAI Sora, Hadirkan Shorts AI Pakai Wajah Kreator

YouTube mengungkapkan rencana besar untuk platform dan para kreatornya pada 2026 dengan memperdalam integrasi kecerdasan...

Games
Petualangan Baru Dimulai! Sekuel Super Mario Movie Meluncur April Mendatang

Ada kabar baik bagi para penggemar si tukang ledeng ikonik asal Jepang. Nintendo dan Illumination...

Handphone
Qualcomm Akan Hadirkan Kecepatan Desktop pada Smartphone

Industri semikonduktor global tengah bersiap menyaksikan lompatan teknis yang mungkin akan mengubah wajah perangkat genggam...

Hardware
Chipset NVIDIA N1 Muncul di Jejak Digital Lenovo, Pertanda Apa?

Jejak digital jarang sekali bisa benar-benar dihapus, terutama di dunia perangkat keras PC yang kompetitif....

Electronic & Acc
Sony LinkBuds Clip Resmi Meluncur dengan Desain Open-Ear dan Baterai hingga 9 Jam

Sony resmi meluncurkan LinkBuds Clip di sejumlah negara Amerika Utara, menghadirkan true wireless earbuds dengan...

Electronic & Acc
Tren Open-Ear, Realme Perkenalkan Buds Clip dengan Teknologi NextBass

Pasar audio personal tengah mengalami pergeseran paradigma. Jika selama bertahun-tahun pasar didominasi oleh desain in-ear...

Electronic & Acc
Apple Dikabarkan Kembangkan Wearable AI Pin, Siap Tantang Kegagalan Humane

Apple dikabarkan tengah mengembangkan perangkat wearable berbentuk AI pin, sebuah langkah ambisius untuk memasuki pasar...

Electronic & Acc
XREAL Gugat Viture, Sengketa Paten Smart Glasses Masuk Jalur Hukum

Produsen kacamata pintar XREAL resmi mengajukan gugatan hukum terhadap rivalnya, Viture, atas dugaan pelanggaran paten....

Cyber Life
Rayakan 25 Tahun Wikipedia! Meta dan Microsoft sebagai Mitra AI

Dalam rangka merayakan ulang tahun Wikipedia yang ke-25, Wikimedia selaku organisasi induk mengumumkan kemitraan strategis...