SHARE
Cyber Life

Wikipedia tengah menghadapi tantangan besar dari kehadiran bot scraper, crawler otomatis yang secara masif mengambil konten teks dan multimedia dari ensiklopedia daring ini untuk melatih model kecerdasan buatan (AI) generatif. Aktivitas tersebut tak hanya membebani server Wikimedia Foundation, tetapi juga menyebabkan peningkatan biaya operasional dan menurunnya kecepatan akses bagi pengguna manusia.

 

Sebagai solusi proaktif, Wikimedia Foundation kini menyediakan dataset resmi yang bisa digunakan secara bebas oleh pengembang AI, dengan harapan dapat mengurangi ketergantungan bot terhadap situs Wikipedia langsung. Langkah ini dilakukan melalui kolaborasi dengan Kaggle, platform data science milik Google, yang kini menawarkan versi beta dari dataset terstruktur berbahasa Inggris dan Prancis.

 

Menurut keterangan dari Wikimedia Enterprise, dataset ini mencakup berbagai elemen penting seperti abstrak artikel, deskripsi singkat, data berbentuk infobox (key-value), tautan gambar, serta struktur artikel yang sudah dipisah dengan jelas. Namun, elemen non-prosa seperti referensi atau cuplikan video tidak disertakan, sehingga aspek atribusi bisa menjadi sedikit kabur.

 

Meski begitu, semua konten dalam dataset ini tetap tersedia secara bebas dibawah lisensi terbuka seperti Creative Commons dan domain publik, karena seluruh informasinya bersumber langsung dari Wikipedia. Dengan menyediakan akses yang lebih efisien dan ramah pengembang, Wikimedia berharap para pelatih model AI akan beralih menggunakan dataset resmi ini ketimbang terus mengandalkan scraping situs secara langsung, yang hanya akan memperburuk beban infrastruktur.

 

Langkah ini menjadi contoh konkret bagaimana penyedia konten publik beradaptasi menghadapi lonjakan kebutuhan data di era AI, sekaligus menjaga integritas dan performa platform bagi jutaan pengguna global.

LAINNYA DARI MASTEKNO
Games
Final Fantasy XVI Tiba-Tiba Hadir di Xbox Series X/S, Kini Tersedia untuk Penggemar RPG

Para gamer Xbox akhirnya bisa memainkan Final Fantasy XVI di konsol Series X/S tanpa harus...

Games
Hollow Knight: Silksong Siap Rilis Sebelum Libur Akhir Tahun 2025, Tidak Terikat dengan Peluncuran Xbox Ally

Hollow Knight: Silksong, sekuel yang sangat dinantikan dari Hollow Knight (2017), akhirnya dipastikan akan dirilis...

Handphone
Bocoran Panas: Samsung Bakal Rilis Foldable Next-Gen di Event Besar Juli!

Spekulasi kembali menyelimuti dunia teknologi dengan kabar acara Unpacked Samsung yang sangat dinanti. New York...

Cyber Life
AI Kuasai Meta! Meta Akan Gantikan Mayoritas Tim Reviewer Manusia dengan AI untuk Penilaian Risiko Produk

Meta dikabarkan akan segera mengandalkan kecerdasan buatan (AI) untuk menangani sebagian besar proses penilaian risiko...

Handphone
Vivo Y19s Pro Resmi Dirilis, Baterai Jumbo 6.000mAh, Kamera 50MP, dan Sertifikasi Ketahanan Ekstra

Vivo kembali memperkuat lini ponsel entry-level dengan meluncurkan Vivo Y19s Pro di sejumlah pasar global....

Games
Stranger Than Heaven, Game Terbaru dari Studio Like a Dragon

Ryu Ga Gotoku Studio, kreator di balik seri *Like a Dragon* yang mendunia, akhirnya mengumumkan...

Electronic & Acc
Apple Siap Luncurkan Smart Home Hub Pertamanya Akhir Tahun Ini

Setelah lama menjadi bahan spekulasi, Apple akhirnya dikabarkan akan merilis smart home hub pertamanya pada...

Games
Legenda Bangkit Lagi! Dragon Quest 1 & 2 HD-2D Remake Siap Dirilis 30 Oktober di Semua Platform

Square Enix kembali menghadirkan nostalgia untuk para penggemar JRPG klasik dengan merilis Dragon Quest 1...

Cyber Life
Texas Siap Batasi Media Sosial untuk Anak di Bawah 18th! Prioritaskan Keselamatan Digital

Negara bagian Texas tengah bersiap menjadi wilayah Amerika Serikat berikutnya yang memberlakukan pembatasan ketat terhadap...