SHARE
Cyber Life

Google DeepMind mengumumkan kemajuan baru dalam bidang robotika dan model bahasa visual (VLMs). Divisi penelitian kecerdasan buatan (AI) dari raksasa teknologi ini telah bekerja dengan model visual canggih untuk mengembangkan kemampuan baru pada robot. Dalam studi terbaru, DeepMind menyoroti bahwa dengan menggunakan Gemini 1.5 Pro dan jendela konteks panjangnya, divisi ini berhasil menciptakan terobosan dalam navigasi dan pemahaman dunia nyata oleh robot-robotnya. Awal tahun ini, Nvidia juga memperkenalkan teknologi AI baru yang mendukung kemampuan canggih pada robot humanoid.

Dalam sebuah postingan di X, Google DeepMind mengungkapkan bahwa mereka telah melatih robot-robotnya menggunakan jendela konteks 2 juta token dari Gemini 1.5 Pro. Jendela konteks dapat dipahami sebagai jendela pengetahuan yang terlihat oleh model AI, yang digunakan untuk memproses informasi seputar topik yang ditanyakan.

DeepMind memanfaatkan jendela konteks panjang ini untuk melatih robot-robotnya di lingkungan dunia nyata. Divisi ini bertujuan untuk melihat apakah robot dapat mengingat detail suatu lingkungan dan membantu pengguna ketika diminta informasi tentang lingkungan tersebut dengan istilah kontekstual atau tidak jelas. Dalam sebuah video yang dibagikan di Instagram, divisi AI ini menunjukkan bahwa sebuah robot dapat membimbing seorang pengguna ke papan tulis ketika diminta tempat untuk menggambar.

“Ditenagai oleh panjang konteks 1 juta token dari 1.5 Pro, robot kami dapat menggunakan instruksi manusia, tur video, dan penalaran nalar umum untuk berhasil menemukan jalan di sekitar suatu ruang,” ujar Google DeepMind dalam sebuah postingan.

Dalam sebuah studi yang dipublikasikan di arXiv, DeepMind menjelaskan teknologi di balik terobosan ini. Selain Gemini, mereka juga menggunakan model Robotic Transformer 2 (RT-2) mereka sendiri. Ini adalah model vision-language-action (VLA) yang belajar dari data web dan robotika.

LAINNYA DARI MASTEKNO
Electronic & Acc
Apple Siap Luncurkan Smart Home Hub Pertamanya Akhir Tahun Ini

Setelah lama menjadi bahan spekulasi, Apple akhirnya dikabarkan akan merilis smart home hub pertamanya pada...

Games
Legenda Bangkit Lagi! Dragon Quest 1 & 2 HD-2D Remake Siap Dirilis 30 Oktober di Semua Platform

Square Enix kembali menghadirkan nostalgia untuk para penggemar JRPG klasik dengan merilis Dragon Quest 1...

Cyber Life
Texas Siap Batasi Media Sosial untuk Anak di Bawah 18th! Prioritaskan Keselamatan Digital

Negara bagian Texas tengah bersiap menjadi wilayah Amerika Serikat berikutnya yang memberlakukan pembatasan ketat terhadap...

Software
Bluesky Buka Pendaftaran Verifikasi Akun, Kini Siapa Saja Bisa Ajukan Centang Biru

Bluesky resmi membuka program verifikasi untuk publik, memungkinkan pengguna mengajukan permohonan centang biru meskipun standar...

Software
Tak Perlu Lagi Klik Manual, Gemini di Gmail Kini Otomatis Rangkum Email Panjang!

Kabar gembira bagi pengguna Gmail yang kerap kewalahan dengan tumpukan email panjang. Asisten kecerdasan buatan...

Software
WhatsApp Resmi Hadir di iPad! Dukung Stage Manager dan Fitur Multitasking iPadOS

Setelah bertahun-tahun dinantikan, WhatsApp versi iPad akhirnya resmi diluncurkan, menjawab salah satu permintaan terbesar dari...

Handphone
Google Dilaporkan Beralih Ke TSMC Untuk Chipset Pixel Selanjutnya

Dalam waktu dekat Google dilaporkan akan meresmikan smartphone flagship terbarunya, Pixel 10. Laporan terbaru menyebut...

Hardware
Xeon 6 Meluncur, Ketika Intel dan NVIDIA Berkolaborasi untuk AI Super Cepat

Intel baru saja mengumumkan gebrakan baru di kancah kecerdasan buatan dengan merilis tiga prosesor Xeon...

Software
Bukan Sekadar AI! Apple Siap Rombak Total Tampilan iOS, iPadOS, hingga macOS dengan Solarium

Apple siap meluncurkan pembaruan perangkat lunak paling revolusioner dalam lebih dari satu dekade. Kabarnya, seluruh...