Apple, yakın vakitte tanıttığı Apple Intelligence özelliklerini geliştirirken NVIDIA’nın donanım hızlandırıcılarını kullanmadığını açıkladı. Bunun yerine, Apple Intelligence yapay zeka Temel Lisan Modellerinin (AFM) eğitim datalarını işlemek için Google TPU’larına (Tensor Sürece Üniteleri) güvendi. İşte detaylar…
Apple, yapay zeka modelleri için NVIDIA’nın GPU’larını kullanmayacak, bunun yerine Google TPU’larına güveniyor
Apple’ın resmi araştırma makalesine nazaran, Google TPUv4 ve TPUv5 çiplerini kullanan sistemler, Apple Temel Modellerinin (AFM) oluşturulmasında değerli bir rol oynadı. AFM-server ve AFM-on-device modelleri, çevrimiçi ve çevrimdışı Apple Intelligence özelliklerini desteklemek için tasarlandı.
Yani Apple, AFM-server modelini 8,192 TPUv4 çipi kullanarak eğitti. Ön eğitim üç kademede gerçekleştirildi: 6.3T token ile başlandı, akabinde 1T token ile devam edildi ve son olarak 100B token ile bağlam uzatma yapıldı.
Apple, AFM’lerini eğitmek için Applebot web tarayıcısından toplanan datalar, çeşitli lisanslı “yüksek kaliteli” bilgi setleri, dikkatle seçilmiş kodlar, matematik ve kamuya açık bilgi setlerinden yararlandığını belirtti. AFM-on-device modeli ise 2,048 TPUv5p çip kullanılarak eğitildi ve AFM-server modelinden türetilmiş 3 milyar parametreli bir model.
Apple’ın kendi testlerine nazaran, AFM-server ve AFM-on-device, talimat izleme, araç kullanımı ve yazma üzere kıyaslamalarda eksiksiz performans gösteriyor. Apple’ın bu ayrıntılı araştırma makalesi,
Apple, yapay zeka oyununa geç katılmış olabilir, fakat bu adımlarla etkileyici bir performans sergilemeyi hedefliyor. Pekala siz ne düşünüyorsunuz? Görüşlerinizi ve fikirlerinizi aşağıdaki yorumlar kısmında paylaşmayı unutmayın.
Yeni jenerasyon güvenlik: Polis baskınlarında kullanılan robot köpekler
Veri politikasındaki amaçlarla sınırlı ve mevzuata uygun şekilde çerez konumlandırmaktayız. Detaylar için veri politikamızı inceleyebilirsiniz.