Microsoft’tan çoklu model hamlesi: Researcher’daki Critique, OpenAI ve Anthropic modellerini aynı iş akışında buluşturuyor

Microsoft, Microsoft 365 Copilot içindeki Researcher aracına eklediği yeni Critique özelliğiyle, tek bir yapay zekâ modeline dayanan araştırma yaklaşımının dışına çıkıyor. Yeni sistemde bir model ilk taslağı üretirken, ikinci model bu taslağı denetleyip geliştiriyor. Şirketin anlattığı yapıya göre burada OpenAI ve Anthropic ekosistemlerinden gelen modeller aynı araştırma sürecinde ardışık biçimde görev alabiliyor.
Critique’in çalışma mantığı klasik “tek model her şeyi yapsın” anlayışından farklı. Microsoft’un açıklamasına göre ilk model planlama yapıyor, bilgi topluyor ve ilk raporu oluşturuyor; ikinci model ise bu metni gözden geçirip eksikleri kapatıyor, iddiaları daha sağlam kaynaklarla destekliyor ve raporun sunum kalitesini yükseltiyor. Şirket, bu yaklaşımın akademik ve profesyonel araştırma süreçlerine daha yakın bir yapı sunduğunu söylüyor.
Microsoft’un öne çıkardığı nokta yalnızca “iki model kullanılıyor” olması değil. Asıl vurgu, üretim ile değerlendirme aşamalarının ayrılması. Şirkete göre bu sayede sistem; olgusal doğruluk, analitik kapsam ve sunum kalitesi tarafında daha güçlü sonuçlar verebiliyor. Critique ayrıca Researcher içinde varsayılan deneyim olarak konumlanıyor; kullanıcı model seçicide “Auto” seçtiğinde bu yapı devreye giriyor.
Performans tarafında Microsoft, yeni mimariyi DRACO adlı derin araştırma kıyaslamasıyla test ettiğini belirtiyor. Şirketin paylaştığı verilere göre Critique, 10 farklı alandaki 100 karmaşık araştırma görevi üzerinden ölçülen toplam skorda 7 puanlık artış sağladı ve bunun Perplexity Deep Research sonucuna göre yüzde 13,88 daha yüksek olduğunu savunuyor. Aynı açıklamada, en büyük artışın analiz derinliği ve kapsamı tarafında görüldüğü, ardından sunum kalitesi ve olgusal doğruluğun geldiği aktarılıyor. Bu sonuçlar dikkat çekici olsa da, ölçümün Microsoft tarafından raporlandığını not etmek gerekiyor.
Microsoft bu güncellemede yalnızca Critique’i sunmuş değil. Şirket ayrıca Council adını verdiği ikinci bir seçenek de ekledi. Council modunda Anthropic ve OpenAI modelleri bu kez sırayla değil, yan yana çalışıyor; her biri kendi bağımsız raporunu hazırlıyor. Ardından ayrı bir “judge” model, iki rapor arasındaki ortak noktaları, ayrışan yorumları ve her modelin getirdiği özgün katkıları özetleyen bir değerlendirme oluşturuyor.
Bu özelliklerin tamamı şu an için genel Copilot deneyiminin standart parçası olarak değil, Microsoft’un erken erişim kanalı olan Frontier programı üzerinden sunuluyor. Microsoft, Critique ve Council’ın bugün itibarıyla Frontier içinde geniş erişime açıldığını belirtiyor. Bu da şirketin çoklu model yaklaşımını artık yalnızca konsept düzeyinde değil, gerçek kullanıcı senaryolarında test etmeye başladığını gösteriyor.
İlk değerlendirme
Microsoft’un Critique hamlesi, yapay zekâ yarışında “en güçlü tek model” söyleminden “en iyi iş bölümü yapan sistem” anlayışına geçişin işareti olabilir. Burada amaç, tek bir modelin her işi üstlenmesi değil; bir modelin üretip diğerinin sorguladığı daha kontrollü bir araştırma zinciri kurmak. Eğer şirketin paylaştığı sonuçlar pratik kullanımda da karşılık bulursa, Researcher yalnızca daha uzun rapor yazan bir araç olmaktan çıkıp, kurumsal araştırma süreçlerinde daha güvenilir bir yardımcıya dönüşebilir.


