Tomorrow

Nvidia ve Mistral AI’dan Yeni Yapay Zeka Modeli: Mistral-NeMo

Nvidia ve Mistral AI’dan Yeni Yapay Zeka Modeli: Mistral-NeMo

Dünyanın en değerli şirketlerinden biri olmayı başaran Nvidia, Avrupa’nın yapay zeka yıldızı Mistral AI ile güçlerini birleştirerek yeni yapay zeka modeli Mistral-NeMo’yu tanıttı. Bu yeni model, 12 milyar parametre ve 128 bin token’lık geniş bir bağlam penceresi ile dikkat çekiyor. Mistral-NeMo’nun, doğrudan iş bilgisayarlarında çalışması hedefleniyor ve güçlü yapay zeka yetenekleriyle öne çıkıyor.

Nvidia’nın paylaştığı bilgilere göre, model, NVIDIA NeMo’nun bir parçası olan Megatron-LM kullanılarak geliştirildi ve NVIDIA AI mimarisinden oluşan DGX Cloud üzerinde 3.072 H100 80GB Tensor Core GPU ile eğitildi. Nvidia Uygulamalı Derin Öğrenme Araştırmaları Başkan Yardımcısı Ryan Catanzaro, modelin Apache 2.0 lisansı altında piyasaya sürüleceğini belirtti. Nvidia’nın Mistral ile ortaklığı, daha kompakt ancak güçlü bir modelin ortaya çıkmasını sağladı. Catanzaro, Mistral-NeMo’nun pek çok kişinin evinde bulunan RTX GPU’larda çalışabileceğini ifade etti.

Küresel ve Çok Dilli Uygulamalar İçin Güçlü Performans

Mistral-NeMo, küresel ve çok dilli uygulamalar için tasarlanmış olup, özellikle İngilizce, Fransızca, Almanca, İspanyolca, İtalyanca, Portekizce, Çince, Japonca, Korece, Arapça ve Hintçe dillerinde güçlü performans sergiliyor. Model, 100’den fazla dil üzerinde eğitilmiş Tiktoken tabanlı yeni bir tokenizer olan Tekken’i kullanıyor. Tekken, önceki Mistral modellerinde kullanılan SentencePiece tokenizer’a kıyasla doğal dil metinlerini ve kaynak kodunu daha verimli bir şekilde sıkıştırıyor. Ayrıca, Tekken, Llama 3 tokenizer ile karşılaştırıldığında tüm dillerin yaklaşık yüzde 85’i için metin sıkıştırmada daha yetkin.

Mistral-NeMo’nun piyasaya sürülmesi, yapay zeka ve derin öğrenme alanında önemli bir adım olarak değerlendiriliyor. Nvidia ve Mistral AI’ın iş birliği, kompakt ancak güçlü yapay zeka modellerinin geliştirilmesinde yeni bir dönemin habercisi olabilir. Bu yeni modelin, hem profesyonel hem de bireysel kullanıcılar için geniş bir yelpazede uygulama bulması bekleniyor.

Bu yazıyı paylaş: