SHARE
Cyber Life

Meskipun Apple bukan salah satu pemain utama dalam permainan kecerdasan buatan saat ini, tetapi model kecerdasan buatan open source baru perusahaan untuk pengeditan gambar menunjukkan apa yang mampu mereka kontribusikan pada ruang tersebut. Model yang disebut MLLM-Guided Image Editing (MGIE), yang menggunakan model bahasa besar multimodal (MLLM) untuk menafsirkan perintah berbasis teks saat memanipulasi gambar. Dengan kata lain, alat ini memiliki kemampuan untuk mengedit foto berdasarkan teks yang dimasukkan pengguna. Meskipun bukan alat pertama yang dapat melakukannya, “instruksi manusia terkadang terlalu singkat bagi metode saat ini untuk menangkap dan mengikuti,” tulis kertas proyek tersebut.

Perusahaan mengembangkan MGIE dengan para peneliti dari University of California, Santa Barbara. MLLM memiliki kekuatan untuk mengubah perintah teks yang sederhana atau ambigu menjadi instruksi yang lebih rinci dan jelas yang dapat diikuti oleh editor foto itu sendiri.

Selain membuat perubahan besar pada gambar, MGIE juga dapat memotong, mengubah ukuran, dan memutar foto, serta meningkatkan kecerahan, kontras, dan keseimbangan warnanya, semua melalui perintah teks. Ini juga dapat mengedit area tertentu dari foto dan dapat, misalnya, memodifikasi rambut, mata, dan pakaian seseorang di dalamnya, atau menghapus elemen-elemen di latar belakang.

Seperti yang dicatat oleh VentureBeat, Apple merilis model melalui GitHub, tetapi mereka yang tertarik juga dapat mencoba demo yang saat ini di-hosting di Hugging Face Spaces. Apple belum mengumumkan apakah mereka berencana untuk menggunakan apa yang dipelajari dari proyek ini menjadi sebuah alat atau fitur yang dapat mereka masukkan ke dalam salah satu produk mereka.

LAINNYA DARI MASTEKNO
Games
Stellar Blade Hadirkan DLC Nier: Automata, Mode Foto, dan Fitur Baru dalam Update Bulan Ini

Stellar Blade akan semakin menunjukkan inspirasi besar yang diambilnya. Game action-adventure hack-and-slash ini siap mendapatkan...

Software
Signal Hadirkan Beberapa Fitur, di antaranya Tautan Panggilan, Tombol Raise Hand, Reaksi Emoji, dan Peningkatan Lainnya

Signal kini hadir dengan pembaruan terbaru yang memperkenalkan berbagai fitur baru untuk meningkatkan pengalaman pengguna...

Cyber Life
Google Rilis Alat AI Eksperimental ‘Learn About’ dengan Gaya Edukasi Interaktif

Google baru saja merilis alat kecerdasan buatan (AI) eksperimental baru bernama Learn About, yang dirancang...

Cyber Life
Grok-2 dari xAI Mungkin Segera Tersedia Gratis di X

Elon Musk meluncurkan chatbot AI Grok dari xAI pada akhir 2023, namun hingga kini aksesnya...

Software
ChatGPT Desktop Kini Tersedia untuk Semua Pengguna, Tambahkan Fitur Baru

OpenAI terus memperluas aksesibilitas dan fungsionalitas ChatGPT Desktop. Setelah awalnya hanya tersedia untuk pengguna berlangganan...

Handphone
Vivo X200 Series Segera Meluncur di Malaysia

Pabrikan asal China, Vivo baru saja konfirmasikan perilisan smartphone terbarunya, X200 Series di Malaysia pada...

Electronic & Acc
Fiio JM21: DAP Kompak dengan Kualitas Audio Tinggi

Bagi para audiophile dan pencinta musik yang menginginkan kualitas suara resolusi tinggi dalam perangkat portabel,...

Hardware
Fujifilm sedang Mengembangkan Kamera Sinema Medium Format 102MP

Fujifilm secara mengejutkan mengumumkan bahwa mereka tengah mengembangkan kamera sinema medium format dengan resolusi 102...

Games
God of War Ragnarok untuk PS5 Akhirnya Membiarkan Kratos Menyelesaikan Teka-Teki dengan Tenang

Para penggemar Ghost of Sparta kini bisa bernapas lega, karena akhirnya Kratos bisa berpikir dengan...