SHARE
Cyber Life

Google DeepMind mengumumkan kemajuan baru dalam bidang robotika dan model bahasa visual (VLMs). Divisi penelitian kecerdasan buatan (AI) dari raksasa teknologi ini telah bekerja dengan model visual canggih untuk mengembangkan kemampuan baru pada robot. Dalam studi terbaru, DeepMind menyoroti bahwa dengan menggunakan Gemini 1.5 Pro dan jendela konteks panjangnya, divisi ini berhasil menciptakan terobosan dalam navigasi dan pemahaman dunia nyata oleh robot-robotnya. Awal tahun ini, Nvidia juga memperkenalkan teknologi AI baru yang mendukung kemampuan canggih pada robot humanoid.

Dalam sebuah postingan di X, Google DeepMind mengungkapkan bahwa mereka telah melatih robot-robotnya menggunakan jendela konteks 2 juta token dari Gemini 1.5 Pro. Jendela konteks dapat dipahami sebagai jendela pengetahuan yang terlihat oleh model AI, yang digunakan untuk memproses informasi seputar topik yang ditanyakan.

DeepMind memanfaatkan jendela konteks panjang ini untuk melatih robot-robotnya di lingkungan dunia nyata. Divisi ini bertujuan untuk melihat apakah robot dapat mengingat detail suatu lingkungan dan membantu pengguna ketika diminta informasi tentang lingkungan tersebut dengan istilah kontekstual atau tidak jelas. Dalam sebuah video yang dibagikan di Instagram, divisi AI ini menunjukkan bahwa sebuah robot dapat membimbing seorang pengguna ke papan tulis ketika diminta tempat untuk menggambar.

“Ditenagai oleh panjang konteks 1 juta token dari 1.5 Pro, robot kami dapat menggunakan instruksi manusia, tur video, dan penalaran nalar umum untuk berhasil menemukan jalan di sekitar suatu ruang,” ujar Google DeepMind dalam sebuah postingan.

Dalam sebuah studi yang dipublikasikan di arXiv, DeepMind menjelaskan teknologi di balik terobosan ini. Selain Gemini, mereka juga menggunakan model Robotic Transformer 2 (RT-2) mereka sendiri. Ini adalah model vision-language-action (VLA) yang belajar dari data web dan robotika.

LAINNYA DARI MASTEKNO
Cyber Life
Google AI Plus Resmi Diperluas Secara Global, Jadi Paket Gemini Berbayar Paling Terjangkau

Google resmi memperluas ketersediaan paket langganan kecerdasan buatan paling terjangkaunya, Google AI Plus, ke pasar...

Electronic & Acc
Menuju Masa Depan AR, Snap Jadikan Bisnis Kacamata Entitas Terpisah

Snap resmi memisahkan bisnis kacamata augmented reality miliknya menjadi entitas terpisah dengan mendirikan Specs Inc....

Games
Scott Pilgrim EX Meluncur ke PC dan Konsol pada 3 Maret

Kabar gembira bagi penggemar game beat-‘em-up kooperatif dan semesta Scott Pilgrim, karena Scott Pilgrim EX...

Software
Apple Creator Studio Resmi Hadir dengan Harga $13 per Bulan

Apple semakin memperkuat bisnis layanannya dengan meluncurkan Apple Creator Studio, sebuah paket langganan yang menyatukan...

Electronic & Acc
Casio x Ghost in the Shell, Jam DW-5600 Edisi Ikonik dari Anime 1995 Rilis!

Casio baru saja mengumumkan kolaborasi terbarunya bersama anime ikonik yang berpengaruh dalam kebudayaan pop culture...

Handphone
Siasat Baru Google Hadapi ‘Jambret Digital’, Dari Kunci Otomatis hingga AI Pendeteksi Copet

Kehilangan smartphone di jalanan kini bukan lagi soal urusan kehilangan perangkat keras senilai jutaan rupiah....

Laptop
ASUS Perbarui Vivobook Pro Dengan Intel Panther Lake

Asus baru saja melakukan penyegaran di lini Vivobook Pro 14 dan 16 Intel Edition di...

Games
Highguard Tembus Hampir 100 Ribu Pemain Bersamaan di Steam Saat Perilisan

Highguard, game multiplayer shooter free-to-play terbaru dari Wildlight Entertainment, mencatat pencapaian besar dengan hampir 100.000...

Cyber Life
Yahoo Tambahkan AI Generatif ke Mesin Pencarian Lewat Yahoo Scout

Yahoo resmi menghadirkan fitur baru berbasis kecerdasan buatan generatif ke mesin pencariannya melalui peluncuran “answer...