Model AI LG EXAONE lebih unggul dari Llama 3.0 buatan Meta

LG AI Research telah mengumumkan peluncuran model kecerdasan buatan (AI) sumber terbuka pertama Korea Selatan EXAONE 3.0.

LG AI Research telah mengumumkan peluncuran model kecerdasan buatan (AI) sumber terbuka pertama Korea Selatan EXAONE 3.0. Hal ini menjadikan Korea Selatan memasuki bidang AI global yang didominasi oleh raksasa teknologi Amerika dan perusahaan-perusahaan baru di Tiongkok dan Timur Tengah. Perlu dicatat, saat ini model ini hanya mendukung dua bahasa – Inggris dan Korea.

Dilansir dari Gizmochina (13/8), EXAONE 3.0 adalah model sumber terbuka (open source), yang kabarnya didasarkan pada arsitektur Transformer khusus Decoder. Model ini memiliki 7,8B parameter dan 8T data pelatihan (token).

“Di antara jajaran model bahasa EXAONE 3.0 yang dibuat untuk berbagai keperluan, model penyesuaian instruksi 7.8B sedang di-open source terlebih dahulu sehingga dapat digunakan untuk penelitian,” kata LG.

Perusahaan tersebut berharap bahwa rilis model ini akan membantu peneliti AI baik di dalam negeri maupun di luar negeri melakukan penelitian yang lebih bermakna dan membantu ekosistem AI bergerak selangkah lebih maju.

Menurut pengujian perusahaan, kemampuan bahasa Inggris model tersebut telah mencapai “tingkat teratas di dunia”. Skor rata-rata kasus penggunaan nyata dilaporkan berada di peringkat pertama, melampaui sejumlah model seperti Llama 3.0. Dalam hal perhitungan matematika dan coding, EXAONE 3.0 juga berada di peringkat pertama dalam skor rata-rata dan memiliki kemampuan penalaran yang kuat.

Belum lagi, EXAONE 3.0 menduduki peringkat pertama dalam skor rata-rata untuk kasus penggunaan aktual dan benchmark tunggal di Korea Selatan. Model ini diklaim dapat mengurangi waktu inferensi hingga 56%, penggunaan memori hingga 35%, dan biaya pengoperasian hingga 72% dibandingkan dengan model generasi sebelumnya.

Model terbaru ini dilaporkan telah dilatih pada 60 juta kasus data profesional yang terkait dengan paten, kode, matematika, dan kimia. Perusahaan berencana untuk memperluas data pelatihan menjadi 100 juta kasus di berbagai bidang pada akhir tahun.

Untuk mengurangi konsumsi daya dalam mengoperasikan model AI, LG AI Research berfokus pada penelitian teknologi pengoptimalan dan membuat model menjadi ringan, yang mana mereka berhasil dan mengurangi ukuran model hingga 97% sekaligus meningkatkan kinerja dibandingkan dengan EXAONE 1.0.

Source link