SHARE
Cyber Life

Wikipedia tengah menghadapi tantangan besar dari kehadiran bot scraper, crawler otomatis yang secara masif mengambil konten teks dan multimedia dari ensiklopedia daring ini untuk melatih model kecerdasan buatan (AI) generatif. Aktivitas tersebut tak hanya membebani server Wikimedia Foundation, tetapi juga menyebabkan peningkatan biaya operasional dan menurunnya kecepatan akses bagi pengguna manusia.

 

Sebagai solusi proaktif, Wikimedia Foundation kini menyediakan dataset resmi yang bisa digunakan secara bebas oleh pengembang AI, dengan harapan dapat mengurangi ketergantungan bot terhadap situs Wikipedia langsung. Langkah ini dilakukan melalui kolaborasi dengan Kaggle, platform data science milik Google, yang kini menawarkan versi beta dari dataset terstruktur berbahasa Inggris dan Prancis.

 

Menurut keterangan dari Wikimedia Enterprise, dataset ini mencakup berbagai elemen penting seperti abstrak artikel, deskripsi singkat, data berbentuk infobox (key-value), tautan gambar, serta struktur artikel yang sudah dipisah dengan jelas. Namun, elemen non-prosa seperti referensi atau cuplikan video tidak disertakan, sehingga aspek atribusi bisa menjadi sedikit kabur.

 

Meski begitu, semua konten dalam dataset ini tetap tersedia secara bebas dibawah lisensi terbuka seperti Creative Commons dan domain publik, karena seluruh informasinya bersumber langsung dari Wikipedia. Dengan menyediakan akses yang lebih efisien dan ramah pengembang, Wikimedia berharap para pelatih model AI akan beralih menggunakan dataset resmi ini ketimbang terus mengandalkan scraping situs secara langsung, yang hanya akan memperburuk beban infrastruktur.

 

Langkah ini menjadi contoh konkret bagaimana penyedia konten publik beradaptasi menghadapi lonjakan kebutuhan data di era AI, sekaligus menjaga integritas dan performa platform bagi jutaan pengguna global.

LAINNYA DARI MASTEKNO
Handphone
Vivo X200s Resmi Diluncurkan, Usung MediaTek Dimensity 9400+ dan Baterai Jumbo 6.200mAh

Vivo kembali meramaikan pasar flagship dengan peluncuran Vivo X200s di Tiongkok, bersamaan dengan Vivo X200...

Electronic & Acc
Vivo Watch 5 Resmi Meluncur, Smartwatch dengan Layar AMOLED dan Daya Tahan Baterai hingga 22 Hari

Vivo kembali memperluas ekosistem perangkat pintarnya dengan meluncurkan Vivo Watch 5 di Tiongkok, bersamaan dengan...

Cyber Life
Upaya Halus Usir Bot Scraper! Wikipedia Tawarkan Dataset Resmi untuk Latih AI

Wikipedia tengah menghadapi tantangan besar dari kehadiran bot scraper, crawler otomatis yang secara masif mengambil...

Games
Resmi Dirilis Lebih Awal untuk Semua Pemain! Tempest Rising, Game Strategi Real-Time Bergaya Klasik

Tempest Rising, game strategi real-time yang disebut sebagai penerus spiritual dari Command & Conquer, kini...

Software
Instagram Hadirkan Fitur “Blend” untuk Gabungkan Rekomendasi Reels dengan Teman

Instagram kembali menghadirkan inovasi menarik dengan meluncurkan fitur baru bernama “Blend”, yang memungkinkan pengguna menggabungkan...

Games
EA Bawa Teknologi LiDAR ke F1 25, Ciptakan Visual Detail Seakurat Dunia Nyata

Codemasters kembali menghadirkan seri terbaru dari franchise Formula 1 dengan F1 25 yang akan dirilis...

Cyber Life
Google Hentikan Penggunaan Domain Spesifik Negara untuk Layanan Pencarian

Google secara resmi mengumumkan bahwa mereka akan menghentikan penggunaan domain tingkat atas dengan kode negara...

Cyber Life
Lebih dari Sekadar Chatbot! Grok Tambahkan Fitur Memori di Resp

xAI resmi meluncurkan fitur terbaru untuk chatbot AI miliknya, Grok, berupa fitur memori yang dirancang...

Games
Ekspansi Star Wars Outlaws: A Pirate’s Fortune Meluncur Mei Ini! Versi Nintendo Switch 2 Dirilis September

Ubisoft resmi mengumumkan tanggal rilis ekspansi terbaru untuk game Star Wars Outlaws, berjudul A Pirate’s...