Mistral Large 2: Model AI Open Source Baru Diluncurkan, Diklaim Sejajar dengan Meta Llama 3.1 405B

Eveline

Mistral merilis generasi terbaru dari model kecerdasan buatan (AI) open source unggulannya, Mistral Large 2. Perusahaan mengklaim model AI ini menawarkan peningkatan signifikan dalam pembuatan kode, matematika, dan penalaran. Selain itu, model ini mendukung beberapa bahasa baru serta kemampuan panggilan fungsi yang canggih. Meskipun berukuran sepertiga dari model AI Meta Llama 3.1 405B yang baru diluncurkan, model bahasa besar (LLM) unggulan Mistral ini dikatakan memiliki performa yang setara. Mistral Large 2 hanya tersedia untuk penelitian dan penggunaan non-komersial.

Perusahaan mengumumkan model AI ini dalam sebuah postingan newsroom. Mistral Large 2 hadir dengan jendela konteks 1.28.000 token, yang serupa dengan penawaran AI terbaru dari Meta. Selain itu, model AI unggulan Mistral mendukung beberapa bahasa baru termasuk Arab, Cina, Prancis, Jerman, Hindi, Italia, Jepang, Korea, Portugis, Rusia, dan Spanyol. Selain itu, model ini juga dapat menghasilkan kode dalam lebih dari 80 bahasa pemrograman.

Model AI baru Mistral memiliki ukuran 123 miliar parameter, dan dapat berjalan pada satu node. Perusahaan mengatakan ada tiga fokus utama untuk meningkatkan model Large 2. Pertama adalah pembuatan kode, di mana LLM dilatih pada volume besar data pemrograman. Kedua, untuk meningkatkan kemampuan penalaran dan meminimalkan kejadian halusinasi, perusahaan AI ini menyempurnakan model agar lebih berhati-hati dalam merespons. Terakhir, model AI ini dilatih untuk mengakui ketika tidak dapat menemukan solusi atau tidak memiliki informasi yang cukup untuk memberikan jawaban yang meyakinkan.

Meskipun berukuran sepertiga dari Llama 3.1 405B, perusahaan mengklaim bahwa LLM-nya lebih unggul. Berdasarkan pengujian benchmark internal, Mistral mengatakan model AI-nya tampil lebih baik dalam pembuatan kode dan performa matematika. Perusahaan ini juga mengklaim lebih unggul dari GPT-4o dalam pembuatan kode Java.