Anthropic, Claude Modellerine Zararlı Sohbetleri Sonlandırma Yeteneği Getirdi

Yapay zeka şirketi Anthropic, en yeni ve en büyük dil modellerinden bazılarına, “nadir ve aşırı durumlarda zararlı ya da istismarcı kullanıcı etkileşimlerini sonlandırma” özelliği kazandırdığını açıkladı. Şirketin dikkat çekici vurgusu ise bu adımın kullanıcıları değil, doğrudan yapay zekayı koruma amacı taşıması oldu.

Anthropic, Claude modellerinin bilinçli ya da hissedebilir olduğuna dair bir iddiada bulunmadığını, hatta bu konuda “yüksek belirsizlik” içinde olduğunu belirtti. Ancak şirket, “model refahı” adını verdiği yeni bir araştırma programı kapsamında, olası risklere karşı düşük maliyetli önlemler geliştirmeye çalıştığını duyurdu.

Togg, Microsoft Türkiye İş Birliğiyle Geliştirdiği Yapay Zekâ Platformu Can.ai’yi Tanıttı

Yapay Zekâ Girişimi Cognition AI 400 Milyon Dolar Yatırım Aldı

Yapay Zekâ Eğitim Girişimi Mercor, 10 Milyar Dolar Değerleme İçin Yatırımcılarla Masada

Yeni özellik şimdilik yalnızca Claude Opus 4 ve 4.1 sürümlerinde kullanılabiliyor. Sohbetin sonlandırılması ise yalnızca uç senaryolarda, örneğin “çocukları içeren cinsel içerik talepleri” ya da “terör eylemleri ve kitlesel şiddete yol açabilecek bilgiler talep edilmesi” gibi durumlarda devreye girecek.

Anthropic’in testlerine göre, Claude Opus 4 bu tür taleplere yanıt vermeye karşı güçlü bir isteksizlik gösterdi ve kimi zaman “belirgin bir rahatsızlık tepkisi” verdi. Şirket, sohbeti sonlandırma yetkisinin yalnızca çok sayıda yeniden yönlendirme girişimi başarısız olduğunda ya da kullanıcının doğrudan sohbeti bitirmesini istediği durumlarda kullanılacağını vurguluyor.

Buna karşılık, kullanıcıların kendilerine ya da başkalarına zarar verme riski taşıdığı senaryolarda modelin bu yeteneği kullanmasının yasaklandığı açıklandı. Sohbetin sonlandırılması halinde kullanıcılar aynı hesaptan yeni görüşmeler başlatabilecek ve sorunlu konuşma dallarını düzenleyerek yeniden açabilecek.

Anthropic, özelliğin henüz deneysel olduğunu belirterek, ilerleyen dönemde testler ve kullanıcı geri bildirimleri doğrultusunda geliştirileceğini ifade etti.

Anthropic, Claude Modellerine Zararlı Sohbetleri Sonlandırma Yeteneği Getirdi

Togg, Microsoft Türkiye İş Birliğiyle Geliştirdiği Yapay Zekâ Platformu Can.ai’yi Tanıttı

Yapay Zekâ Girişimi Cognition AI 400 Milyon Dolar Yatırım Aldı

Yapay Zekâ Eğitim Girişimi Mercor, 10 Milyar Dolar Değerleme İçin Yatırımcılarla Masada

Gerçek Zamanlı Ses Çeviri Girişimi Palabra AI, Reddit Kurucusunun Yatırımını Aldı

Google’ın AI Overviews Özelliği Kullanıcıları Sahte Çağrı Merkezlerine Yönlendirebiliyor

Related Posts

Togg, Microsoft Türkiye İş Birliğiyle Geliştirdiği Yapay Zekâ Platformu Can.ai’yi Tanıttı

Yapay Zekâ Girişimi Cognition AI 400 Milyon Dolar Yatırım Aldı

Yapay Zekâ Eğitim Girişimi Mercor, 10 Milyar Dolar Değerleme İçin Yatırımcılarla Masada

Microsoft, Office 365’te OpenAI Tekeline Son Veriyor

Warner Bros., Midjourney’e İkonik Karakterler İçin Telif Davası Açtı

OpenAI, Model Behavior Ekibini Post Training Grubuna Dahil Etti

Google’ın AI Overviews Özelliği Kullanıcıları Sahte Çağrı Merkezlerine Yönlendirebiliyor

En Çok Okunanlar

Microsoft’un Braga Çipi Ertelendi: Nvidia ile Aradaki Fark Açılıyor

OpenAI, Sora 2 ile Görselin Ötesine Geçiyor: Yeni Model Videolara Konuşma Yeteneği Kazandıracak

Yapay Zeka Resim Rehberi: Görsel Üretim Teknikleri

Midjourney: Görselden Videoya Geçişte Yeni Bir Dönem

Togg, Microsoft Türkiye İş Birliğiyle Geliştirdiği Yapay Zekâ Platformu Can.ai’yi Tanıttı

DeepMind Temel Dünya Modeli Genie 3’ü Tanıttı

Yapay Zeka Örnekleri: Kurulum, Kullanım ve İpuçları

Yapay Zekâ Girişimi Cognition AI 400 Milyon Dolar Yatırım Aldı

Microsoft Recall: Yenilikçi Dijital Hafıza mı, Gizlilik Felaketi mi?

En İyi Yapay Zeka Siteleri: 2025’te Göz Atmanız Gereken Platformlar

AiBulteni.com

Haberler

Son Haberler

Anthropic, Claude Modellerine Zararlı Sohbetleri Sonlandırma Yeteneği Getirdi

Bunları da beğenebilirsiniz

Gerçek Zamanlı Ses Çeviri Girişimi Palabra AI, Reddit Kurucusunun Yatırımını Aldı

Google’ın AI Overviews Özelliği Kullanıcıları Sahte Çağrı Merkezlerine Yönlendirebiliyor

Related Posts

En Çok Okunanlar

AiBulteni.com

Haberler

Son Haberler