Yazılım şirketi VNGRS, sıfırdan Türkçe için eğitilen ilk büyük dil modeli olan Kumru LLM’nin tanıtımını yaptı. 7.4 milyar parametreye sahip olduğu bilinen bu model, sadece Türkçe için önceden eğitilerek oluşturuldu. Kumru’nun ana kullanım alanları belge işleme, özetleme ve kurumsal soru-cevap sistemleri olarak açıklandı.
İLK YERLİ YAPAY ZEKA KUMRU TANITILDI
VNGRS, gelen taleplere göre farklı sektörlere özel modeller de eğitmeyi planlamakta. Kumru LLM, sıfırdan eğitilmiş, hafif ve kurum içi konuşlandırılabilir bir yapay zeka olarak ifade edilmekte. Söz konusu model, Türkçe için eğitilmiş olsa da İngilizceyi ve kodlamayı da bilmekte.
Modelin ön eğitim sürecinin 45 gün sürdüğü ifade edildi. Modelin bilgi kesim tarihinin ise Mart 2024 olduğu açıklandı.
Yine Kumru'nun 8.192 tokenlik bağlam uzunluğuna sahip olduğu ve bunun da yaklaşık 20 A4 sayfasına denk gelen bir metni tek seferde işleyebileceği anlamına geldiği söylendi.
Kumru’nun açık kaynaklı daha küçük bir versiyonunun da mevcut olduğu açıklandı. Kumru-2B, aynı mimariyi 2 milyar parametreyle sunmakta ve sadece 4.8 GB bellekle çalışabilmekte. Söz konusu sürüm, mobil cihazlarda dahi kullanılabiliyor ve Hugging Face üzerinden erişime açıldı.
Modelin Türkçe performansının da iddialı olduğu ifade edildi.
Kumru’nun tokenizasyon sisteminin de özel olarak Türkçe için hazırlandığı bilinmekte. Ayrıca model, metinleri yüzde 38 ila yüzde 98 daha az token kullanarak temsil edebilmekte. Yani daha uzun metinleri daha hızlı ve düşük maliyet ile birlikte işleyebilmekte.
DEMO SÜRÜMÜ ERİŞİME AÇILDI
Kumru’nun herkese açık olan demo sürümü ise "Kumru.ai" adresi üzerinden internette erişime açıldı.