Günümüzde kullandığımı Microsoft Copilot, OpenAI ChatGPT veya Google Gemini gibi yapay zeka araçları ve bunlara destek veren modeller, devasa kapasitelere sahip bulutlarda barındırılıyor. Bu modeller milyarlar, hatta trilyonlarca parametrelere sahipler ve doğal olarak bu halleriyle akıllı telefonlar veya bilgisayarlarda çalışmaları mümkün değil. Microsoft ise piyasadaki en büyük dil modelleriyle benzer bir performans sunabilen küçük boyutlu Phi-3 Mini modelini tanıttı.
Microsoft Phi-3 Mini rakiplere meydan okuyor
Microsoft’un üzerinde çalıştığı üç kompakt yapay zeka dil modelinden birisi olan Phi-3 Mini, 3,8milyar parametrelik ağırlığa sahip. Microsoft, bu aileyi yakında Phi-3 Small (7 milyar parametre) ve Phi-3 Medium (14 milyar) ile tamamlamayı hedefliyor. Microsoft, Phi-3 Mini’nin küçük olmakla birlikte kendi boyutunun 10 katı büyüklüğündeki diğer devasa modeller kadar güçlü olduğunu belirtiyor.
Microsoft tarafından paylaşılan ve üstteki görselde görebileceğiniz rakamlara göre Phi-3 Mini’nin, ChatGPT’ye güç veren 175+ milyar parametreli GPT-3.5, Mistral’in Mixtral 8x7B modeli ve Anthropic’in Claude 3 Sonnet modeli ile rekabet edebildiği görülüyor. Unutmayın, Phi-3 Mini, akıllı telefonlar gibi cihaz üzerinde çalışan, bulut bağlantısı gerektirmeyen bir AI modeli.
Genellikle daha “zeki” yapay zeka modelleri için daha fazla parametreye gerek duyuluyor. Yapay zekadaki parametreler, modelin eğitim sırasında öğrendiği değişkenlerdir. Bunlar, modelin tahminlerde bulunmak veya kararlar almak için kullandığı iç değişkenlerdir. Daha fazla parametre genellikle sorgularınızın daha akıllıca anlaşılması anlamına gelir. Bununla birlikte hesaplama talepleri de paralel olarak artar.
Öte yandan Microsoft’un araştırmacıları, eğitim verilerinin kendisini iyileştirerek Phi-3 Mini’de şaşırtıcı sonuçlar elde ettiklerini belirtiyor. Günümüzün devasa AI modelleri, internetteki ve kütüphanelerindeki “her şey” ilet eğitiliyor. Bu veri kümesinin içerisinde yararlı şeyler kadar yararsız şeyler de olabiliyor. Microsoft ise Phi-3 Mini’yi yüksek kaliteli web içeriği ve önceki Phi modellerinden geliştirilen sentetik olarak oluşturulmuş materyalden oluşan son derece seçkin bir veri kümesiyle eğitti. Bu da modelin performansının, boyutuna göre güçlü olmasını sağladı. Kısaca nicelikten ziyade niteliğe odaklanıldı.
Bu arada model ayrıca bir seferde 4.000 token‘a kadar bağlamı işleyebiliyor ve 128k token‘lık özel bir versiyonu da mevcut. Microsoft bu modeli Azure, Hugging Face ve Ollama’da açık kaynak olarak kullanıma sundu. Firma, Phi-3 Small (7B parametreleri) ve Phi-3 Medium’u (14B parametreleri) da yakında piyasaya sürmeyi planlıyor.
Çin’de bulunan ve robot üreten fabrikanın basına yansıyan görüntüleri şoke etti. Fabrikada, insanın yüz ifadelerini ve duygularını taklit edebilen gerçekçi insansı robotlar geliştiriliyor.
Otomobil tutkunları için elektrikli araçlar dünyasında heyecan verici bir gelişme yaşanıyor. Lucid Motors, yeni modeli Lucid Gravity ile SUV segmentinde çığır açmaya hazırlanıyor. İlk test sürüşünü gerçekleştiren yeni model araçla ilgili detaylar …
Apple, Mart ayında WWDC 2024 etkinliğinin tarihini duyurmuştu, şimdi daha fazla detay paylaştı. iOS 18, iPadOS 18, macOS 15, tvOS 18, watchOS 11 ve visionOS 2 ile gelecek yeniliklerin duyurulacağı etkinliğin ne zaman başlayacağı resmi olarak …