DeepSeek, tek GPU ile çalışabilen yeni modelini tanıttı

DeepSeek, Yeni Yapay Zeka Modeli DeepSeek-R1-0528-Qwen3-8B’yi Tanıttı

Çinli yapay zeka laboratuvarı DeepSeek, daha az kaynak kullanarak yüksek performans sağlayan yeni modeli DeepSeek-R1-0528-Qwen3-8B’yi duyurdu. Bu model, sadece tek bir GPU üzerinde çalışabiliyor ve diğer modellere kıyasla önemli avantajlar sunuyor.

DeepSeek’in yeni modeli, temelini Alibaba’nın Mayıs 2025’te tanıttığı Qwen3-8B modelinden almıştır. Laboratuvar, büyük R1 modelinden elde ettiği verilerle bu küçük versiyonu eğitmeyi başardı. Bu yöntemle geliştirilen model, Google’ın Gemini 2.5 Flash modelini içeren zorlu matematik testlerinden biri olan AIME 2025’te başarılı oldu. Ayrıca Microsoft’un Phi 4 Reasoning Plus modeline, HMMT sınavında da oldukça yakın bir performans sergiledi.

Küçük yapay zeka modelleri genellikle sınırlı becerilere sahip olsa da, DeepSeek-R1-0528-Qwen3-8B’nin dikkat çekici yanı düşük donanım gereksinimidir. NodeShift’in verilerine göre, bu model 40 ila 80 GB RAM’e sahip tek bir Nvidia H100 GPU ile çalışabiliyor. Oysa tam boyutlu R1 modeli, yaklaşık 12 adet 80 GB’lık GPU gerektiriyor.

Model, MIT lisansı ile ticari kullanıma sunulmuştur ve Hugging Face ve LM Studio gibi platformlardan erişilebilir durumdadır. Bu yapay zeka modeli, akademik ve endüstriyel alanda kullanım için tasarlanmıştır.

Related Posts

KRAFTON, 2025’in ilk yarısında yaklaşık 44,89 milyar TL gelir elde etti

KRAFTON, 2025’in ilk yarısında hem gelirini hem de işletme karını artırarak güçlü bir performans sergiledi. Şirketin büyüme stratejileri dikkat çekiyor.

Google NotebookLM görsel sunumlar hazırlıyor

Google, yapay zekâ destekli araştırma ve not alma platformu NotebookLM’ye entegre ettiği yeni Video Overviews özelliğini resmen duyurdu. Şirket, bu özelliğin ilk olarak Mayıs ayında düzenlenen Google I/O etkinliğinde tanıtıldığını hatırlattı. Yeni …

Modern simya: Nükleer füzyon şirketi, cıvadan altın üretecek

Bir nükleer füzyon girişimi, bilgisayar simülasyonları gerçekleştirerek, füzyon aracılığıyla cıvadan altın üretmenin mümkün olduğunu tespit etti.

Elektrikli karavanla açık dünyaya açıl: Outbound PS5 yolunda

Sürdürülebilirlik ve keşif odaklı cozyvival oyunu Outbound, yakında PlayStation 5’e geliyor. Elektrikli karavanla açık dünyayı keşfedin, kaynak toplayın ve köpek dostunuzla maceraya atılın!

Elon Musk ‘Yeter artık’ dedi! Tesla’yı satılması için kampanyaya boğdu

Elon Musk’ın CEO’su olduğu Tesla, satış grafiğinin düşmesinin ardından yeni kampanyalarla piyasadi yerini yükseltmeyi hedefliyor. Bu doğrultuda şirket A’dan Z’ye birçok kampanya paylaştı.

Perplexity CEO’su “6 ay içinde yok olacak” meslekleri açıkladı

Yükselen yapay zeka firması Perplexity’nin CEO’su Aravind Srinivas yaklaşık 6 ay içinde yapay zeka tarafından otomasyona uğrayacağını düşündüğü meslekleri açıkladı.