Alibaba, hibrit yapay zeka modeli ailesi Qwen3 yarışa dahil oldu

Alibaba, hibrit yapay zeka modeli ailesi Qwen3 yarışa dahil oldu
Çin’in teknoloji devi Alibaba, yapay zeka alanında ses getiren yeni modeli Qwen3’ü tanıttı. Şirketin “hibrit” yapıda tanımladığı bu yeni yapay zeka ailesi, hem Amerika merkezli dev rakipler OpenAI ve Google’ın modellerine baş tutuyor hem de açık kaynak yaklaşımıyla dikkat çekiyor.

Devlere baş tutuyor

Qwen3 ailesi, parametre sayısı 600 milyondan 235 milyara kadar değişen çok sayıda modelden oluşuyor. Parametre sayısı, bir yapay zeka modelinin sorun çözme yeteneğini direkt etkileyen değerli bir metrik olarak kabul ediliyor. Alibaba’nın açıklamasına nazaran, en büyük modellerinden biri olan Qwen-3-235B-A22B, OpenAI’ın o3-mini ve Google’ın Gemini 2.5 Pro modellerini makul kıyaslamalarda geride bırakmayı başardı. Qwen3 modellerinin hiçbiri OpenAI’nin o3 ve o4-mini üzere en üst seviye yeni modellerden daha üstün görünmüyor, fakat tekrar de güçlü performans sergiliyorlar.

Ancak bu en güçlü model şimdi kamuya açık değil. Bunun yerine Qwen3-32B üzere daha küçük fakat yeniden de etkileyici performans sergileyen modeller Hugging Face ve GitHub üzerinden indirilebiliyor. Qwen3 modelleri ayrıyeten Fireworks AI ve Hyperbolic üzere bulut servis sağlayıcılar üzerinden de erişime açık durumda.

Hibrit yaklaşımı benimsiyor

Qwen3 modellerinin en dikkat cazip özelliklerinden biri “hibrit” yapısı. Bu yapı, modelin karmaşık meseleler karşısında düşünme süreci uygulamasına, kolay sorulara ise süratli yanıt vermesine imkan tanıyor; kısaca model, gerektiğinde düşünüyor. Kullanıcılar, modelin ne kadar “düşüneceğine” karar verebiliyor. Alibaba mühendisleri bu esnekliği “düşünme bütçesinin kontrolü” olarak tanımlıyor. Bu tip tahlilleri yakın geçmişte görmeye başladı.

Buna ek olarak birtakım Qwen3 modelleri, “uzmanlar karışımı” (Mixture of Experts – MoE) mimarisiyle çalışıyor. Bu formül, süreçleri alt vazifelere ayırarak uzman alt modellerin her birine dağıtıyor; böylelikle karar alma süreci tek bir merkeze bağlı kalmadan daha verimli ilerliyor.

119 lisan ve 36 trilyon token

Alibaba, Qwen3’ün 119 dili desteklediğini ve yaklaşık 36 trilyon token (Tokenler, bir modelin işlediği ham bilgi bitleridir; 1 milyon token yaklaşık 750.000 söze eşdeğerdir) ile eğitildiğini belirtiyor. Eğitim bilgileri ortasında ders kitapları, soru-cevap çiftleri, yazılım kodları ve yapay zeka tarafından üretilmiş bilgi kümeleri yer alıyor. Bu geniş bilgi tabanı sayesinde Qwen3, sadece genel bilgi sorularında değil, matematik ve yazılım testlerinde de güçlü sonuçlar veriyor. Örneğin LiveCodeBench üzere yazılım kıyaslamalarında OpenAI’ın o1 modelinin önüne geçmeyi başarıyor. Alibaba, Qwen3’ün araç çağırma yeteneklerinin yanı sıra talimatları takip etme ve muhakkak bilgi formatlarını kopyalama konusunda da “üstün” olduğunu söylüyor.

Related Articles