DeepSeek, tek GPU ile çalışabilen yeni modelini tanıttı

DeepSeek, Yeni Yapay Zeka Modeli DeepSeek-R1-0528-Qwen3-8B’yi Tanıttı

Çinli yapay zeka laboratuvarı DeepSeek, daha az kaynak kullanarak yüksek performans sağlayan yeni modeli DeepSeek-R1-0528-Qwen3-8B’yi duyurdu. Bu model, sadece tek bir GPU üzerinde çalışabiliyor ve diğer modellere kıyasla önemli avantajlar sunuyor.

DeepSeek’in yeni modeli, temelini Alibaba’nın Mayıs 2025’te tanıttığı Qwen3-8B modelinden almıştır. Laboratuvar, büyük R1 modelinden elde ettiği verilerle bu küçük versiyonu eğitmeyi başardı. Bu yöntemle geliştirilen model, Google’ın Gemini 2.5 Flash modelini içeren zorlu matematik testlerinden biri olan AIME 2025’te başarılı oldu. Ayrıca Microsoft’un Phi 4 Reasoning Plus modeline, HMMT sınavında da oldukça yakın bir performans sergiledi.

Küçük yapay zeka modelleri genellikle sınırlı becerilere sahip olsa da, DeepSeek-R1-0528-Qwen3-8B’nin dikkat çekici yanı düşük donanım gereksinimidir. NodeShift’in verilerine göre, bu model 40 ila 80 GB RAM’e sahip tek bir Nvidia H100 GPU ile çalışabiliyor. Oysa tam boyutlu R1 modeli, yaklaşık 12 adet 80 GB’lık GPU gerektiriyor.

Model, MIT lisansı ile ticari kullanıma sunulmuştur ve Hugging Face ve LM Studio gibi platformlardan erişilebilir durumdadır. Bu yapay zeka modeli, akademik ve endüstriyel alanda kullanım için tasarlanmıştır.

Related Posts

Ubisoft resmen açıkladı: Assassin’s Creed Shadows, Dead by Daylight evreniyle buluştu

Ubisoft, korku türünün sevilen oyunu Dead by Daylight’ı Assassin’s Creed Shadows ile bir araya getirdi. Behaviour Interactive ile yapılan bu işbirliğiyle Harima bölgesinde geçen karanlık bir yan görev oyunculara sunuldu. Görev, köy sakinlerinin …

Windows’ta bir devir kapanmak üzere: Denetim Masası’ndan bir kilit ayar daha taşınıyor!

Windows yaptığı değişiklikler ile birlikte kullanıcılara daha kolay bir işletim sistemi sunmayı hedefliyor.

Twitter’da (X) mesajlar açılmıyor! 23 Mayıs X çöktü mü?

23 Mayıs 2025 tarihinde, Twitter (X) kullanıcıları mesajlarına erişimde zorluk yaşamaya başladı. Kullanıcılar, platformda mesajların açılmadığını ve gönderi yükleme sorunlarıyla karşılaştıklarını bildiriyor. Peki, 23 Mayıs’ta X çöktü mü?

Xiaomi akıllı telefon işlemcisi Xring O1’i tanıttı

Xiaomi’nin bir süredir kendi akıllı telefon işlemcisini geliştirdiği söyleniyordu. Şirket, yeni Xring O1 olarak adlandırdığı işlemcisini tanıttı.

Apple, hâlâ kullanılan iki telefon modelini “eski ve klasik ürünler” listesine aldı!

Apple, hâlâ kullanılan iki telefon modelini “eski ve klasik ürünler” listesine aldı!

Şifreler otomatik olarak değiştirilecek

Google, kullanıcı güvenliğini artırmayı amaçlayan yeni bir özellik sunuyor. Bu yenilik, özellikle zayıf ve ele geçirilmiş şifreler konusunda kullanıcıların güvenliğini sağlamayı hedefliyor.