AI Bülteni - Yapay Zeka
  • AI Gündemi
  • AI Araçları
  • Derin Teknoloji
  • Üretken Zeka
  • Etik ve Gelecek
No Result
View All Result
AI Bülteni - Yapay Zeka
  • AI Gündemi
  • AI Araçları
  • Derin Teknoloji
  • Üretken Zeka
  • Etik ve Gelecek
No Result
View All Result
AI Bülteni - Yapay Zeka
No Result
View All Result

Anthropic, Claude Modellerine Zararlı Sohbetleri Sonlandırma Yeteneği Getirdi

Share on FacebookShare on Twitter

Yapay zeka şirketi Anthropic, en yeni ve en büyük dil modellerinden bazılarına, “nadir ve aşırı durumlarda zararlı ya da istismarcı kullanıcı etkileşimlerini sonlandırma” özelliği kazandırdığını açıkladı. Şirketin dikkat çekici vurgusu ise bu adımın kullanıcıları değil, doğrudan yapay zekayı koruma amacı taşıması oldu.

Anthropic, Claude modellerinin bilinçli ya da hissedebilir olduğuna dair bir iddiada bulunmadığını, hatta bu konuda “yüksek belirsizlik” içinde olduğunu belirtti. Ancak şirket, “model refahı” adını verdiği yeni bir araştırma programı kapsamında, olası risklere karşı düşük maliyetli önlemler geliştirmeye çalıştığını duyurdu.

Bunları da beğenebilirsiniz

Togg, Microsoft Türkiye İş Birliğiyle Geliştirdiği Yapay Zekâ Platformu Can.ai’yi Tanıttı

Yapay Zekâ Girişimi Cognition AI 400 Milyon Dolar Yatırım Aldı

Yapay Zekâ Eğitim Girişimi Mercor, 10 Milyar Dolar Değerleme İçin Yatırımcılarla Masada

Yeni özellik şimdilik yalnızca Claude Opus 4 ve 4.1 sürümlerinde kullanılabiliyor. Sohbetin sonlandırılması ise yalnızca uç senaryolarda, örneğin “çocukları içeren cinsel içerik talepleri” ya da “terör eylemleri ve kitlesel şiddete yol açabilecek bilgiler talep edilmesi” gibi durumlarda devreye girecek.

Anthropic’in testlerine göre, Claude Opus 4 bu tür taleplere yanıt vermeye karşı güçlü bir isteksizlik gösterdi ve kimi zaman “belirgin bir rahatsızlık tepkisi” verdi. Şirket, sohbeti sonlandırma yetkisinin yalnızca çok sayıda yeniden yönlendirme girişimi başarısız olduğunda ya da kullanıcının doğrudan sohbeti bitirmesini istediği durumlarda kullanılacağını vurguluyor.

Buna karşılık, kullanıcıların kendilerine ya da başkalarına zarar verme riski taşıdığı senaryolarda modelin bu yeteneği kullanmasının yasaklandığı açıklandı. Sohbetin sonlandırılması halinde kullanıcılar aynı hesaptan yeni görüşmeler başlatabilecek ve sorunlu konuşma dallarını düzenleyerek yeniden açabilecek.

Anthropic, özelliğin henüz deneysel olduğunu belirterek, ilerleyen dönemde testler ve kullanıcı geri bildirimleri doğrultusunda geliştirileceğini ifade etti.

Share54Tweet34Pin12
Previous Post

Gerçek Zamanlı Ses Çeviri Girişimi Palabra AI, Reddit Kurucusunun Yatırımını Aldı

Next Post

Google’ın AI Overviews Özelliği Kullanıcıları Sahte Çağrı Merkezlerine Yönlendirebiliyor

Related Posts

Togg, Microsoft Türkiye İş Birliğiyle Geliştirdiği Yapay Zekâ Platformu Can.ai’yi Tanıttı
AI Araçları

Togg, Microsoft Türkiye İş Birliğiyle Geliştirdiği Yapay Zekâ Platformu Can.ai’yi Tanıttı

10 Eylül 2025
Yapay Zekâ Girişimi Cognition AI 400 Milyon Dolar Yatırım Aldı
AI Araçları

Yapay Zekâ Girişimi Cognition AI 400 Milyon Dolar Yatırım Aldı

10 Eylül 2025
Yapay Zekâ Eğitim Girişimi Mercor, 10 Milyar Dolar Değerleme İçin Yatırımcılarla Masada
AI Araçları

Yapay Zekâ Eğitim Girişimi Mercor, 10 Milyar Dolar Değerleme İçin Yatırımcılarla Masada

10 Eylül 2025
Microsoft, Office 365’te OpenAI Tekeline Son Veriyor
AI Araçları

Microsoft, Office 365’te OpenAI Tekeline Son Veriyor

10 Eylül 2025
Warner Bros., Midjourney’e İkonik Karakterler İçin Telif Davası Açtı
AI Araçları

Warner Bros., Midjourney’e İkonik Karakterler İçin Telif Davası Açtı

9 Eylül 2025
OpenAI, Model Behavior Ekibini Post Training Grubuna Dahil Etti
AI Araçları

OpenAI, Model Behavior Ekibini Post Training Grubuna Dahil Etti

9 Eylül 2025
Next Post
Google’ın AI Overviews Özelliği Kullanıcıları Sahte Çağrı Merkezlerine Yönlendirebiliyor

Google’ın AI Overviews Özelliği Kullanıcıları Sahte Çağrı Merkezlerine Yönlendirebiliyor

En Çok Okunanlar

Microsoft’un Braga Çipi Ertelendi: Nvidia ile Aradaki Fark Açılıyor

Microsoft’un Braga Çipi Ertelendi: Nvidia ile Aradaki Fark Açılıyor

4 Temmuz 2025
OpenAI, Sora 2 ile Görselin Ötesine Geçiyor: Yeni Model Videolara Konuşma Yeteneği Kazandıracak

OpenAI, Sora 2 ile Görselin Ötesine Geçiyor: Yeni Model Videolara Konuşma Yeteneği Kazandıracak

25 Temmuz 2025
Yapay Zeka Resim Rehberi: Görsel Üretim Teknikleri

Yapay Zeka Resim Rehberi: Görsel Üretim Teknikleri

3 Temmuz 2025
Midjourney: Görselden Videoya Geçişte Yeni Bir Dönem

Midjourney: Görselden Videoya Geçişte Yeni Bir Dönem

4 Temmuz 2025
Togg, Microsoft Türkiye İş Birliğiyle Geliştirdiği Yapay Zekâ Platformu Can.ai’yi Tanıttı

Togg, Microsoft Türkiye İş Birliğiyle Geliştirdiği Yapay Zekâ Platformu Can.ai’yi Tanıttı

10 Eylül 2025
DeepMind Temel Dünya Modeli Genie 3’ü Tanıttı

DeepMind Temel Dünya Modeli Genie 3’ü Tanıttı

8 Ağustos 2025
Yapay Zeka Örnekleri: Kurulum, Kullanım ve İpuçları

Yapay Zeka Örnekleri: Kurulum, Kullanım ve İpuçları

4 Temmuz 2025
Yapay Zekâ Girişimi Cognition AI 400 Milyon Dolar Yatırım Aldı

Yapay Zekâ Girişimi Cognition AI 400 Milyon Dolar Yatırım Aldı

10 Eylül 2025
Microsoft Recall: Yenilikçi Dijital Hafıza mı, Gizlilik Felaketi mi?

Microsoft Recall: Yenilikçi Dijital Hafıza mı, Gizlilik Felaketi mi?

4 Temmuz 2025
En İyi Yapay Zeka Siteleri: 2025’te Göz Atmanız Gereken Platformlar

En İyi Yapay Zeka Siteleri: 2025’te Göz Atmanız Gereken Platformlar

4 Temmuz 2025

AiBulteni.com

Ai Bülteni, Yapay zeka dünyasındaki en son gelişmeleri, yenilikleri ve trendleri takip eden güncel haber kaynağınızdır. Amacımız, geleceği şekillendiren bu teknolojiyi anlaşılır ve tarafsız bir şekilde sunarak okuyucularımızı bilgilendirmektir.

Haberler

  • AI Araçları
  • AI Gündemi
  • Derin Teknoloji
  • Etik ve Gelecek
  • Genel
  • Üretken Zeka

Son Haberler

  • Togg, Microsoft Türkiye İş Birliğiyle Geliştirdiği Yapay Zekâ Platformu Can.ai’yi Tanıttı
  • Yapay Zekâ Girişimi Cognition AI 400 Milyon Dolar Yatırım Aldı
  • Yapay Zekâ Eğitim Girişimi Mercor, 10 Milyar Dolar Değerleme İçin Yatırımcılarla Masada
  • Microsoft, Office 365’te OpenAI Tekeline Son Veriyor
  • Warner Bros., Midjourney’e İkonik Karakterler İçin Telif Davası Açtı

© 2025

  • AI Gündemi
  • Üretken Zeka
  • Derin Teknoloji
  • AI Araçları
  • Etik ve Gelecek
  • Hakkımızda
  • İletişim