Çinli teknoloji devi Tencent, yapay zeka çeviri alanında Google Translate’i geride bırakan Hunyuan-MT adlı açık kaynaklı yeni bir dil modeli serisini duyurdu. Dört farklı modelden oluşan bu seri, yapay zeka çeviri kıyaslamalarında gösterdiği üstün performansla dikkat çekiyor.
Tencent’in WMT25 adlı bir çeviri ölçütü kullanarak yaptığı karşılaştırmalarda, Hunyuan-MT serisi 31 dil çiftinden 30’unda Google Translate’den daha iyi performans gösterdi. Hatta bazı durumlarda, yüzde 65’e varan oranda daha yüksek puanlar alarak büyük bir fark yarattı. Şirket, modellerin GPT-4.1 ve Claude 4 Sonnet gibi popüler rakiplerini de çoğu dil çiftinde geride bıraktığını belirtiyor.
Hunyuan-MT serisinin iki amiral gemisi modeli, Hunyuan-MT-7B ve Hunyuan-MT-Chimera-7B, her biri 7 milyar parametreye sahip. Seri ayrıca, daha düşük bellek kullanımı için optimize edilmiş, ancak çıktı kalitesinden ödün veren iki sıkıştırılmış algoritma versiyonunu da içeriyor.
Modeller, aralarında Çince, İngilizce, Japonca, Çekçe, İzlandaca gibi hem yaygın hem de daha az bilinen 33 dilde iki yönlü çeviriyi destekliyor. Tencent, özellikle Çince ile Kazakça, Uygurca, Moğolca ve Tibetçe gibi Çin’deki azınlık dilleri arasındaki çeviriye odaklanmış durumda.
Modeller, ilk olarak dört farklı veri seti kullanılarak eğitildi. Bu eğitim süreci, Hunyuan-MT’ye sadece çeviri yetenekleri kazandırmakla kalmayıp, aynı zamanda genel bilgi düzeyini de önemli ölçüde artırdı. Hunyuan-MT, MMLU-Pro genel bilgi ölçütünde Llama-3-8B-Base modelini bile geride bırakmayı başardı.
Serinin bir diğer öne çıkan modeli olan Hunyuan-MT-Chimera-7B, ensemble öğrenme adı verilen benzersiz bir yaklaşım kullanıyor. Bu yöntemde, birden fazla sinir ağı bir arada çalışıyor ve bir komuta birden fazla yanıt üretiyor. Ardından, bu yanıtlar tek bir yüksek kaliteli cevapta birleştiriliyor. Bu yaklaşım, modelin çeviri kalitesini daha da artırıyor.
Hunyuan-MT serisinin açık kaynak olarak yayınlanması, yapay zeka çeviri teknolojilerinin daha da yaygınlaşmasına ve bu alandaki inovasyonun hızlanmasına katkı sağlayacak gibi görünüyor.

















