Google yapay zeka modeline devrim gibi özellikler kattığını duyurdu. Google Çeviri uygulamasına gelen "canlı konuşma" özelliği iletişimde inanılmaz bir engelin aşılmasını sağlarken, yeni Gemini 2.5 Flash ve Pro modelleri yapay zeka seslendirmesini insan benzeri seviyeye yükseltti.
DOĞAL SESLİ ÇEVİRİYE GEÇİŞ
Google AI'nın resmi X hesabından yapılan paylaşıma göre; Gemini modelleri artık insan sesindeki nüansları yakalamaktan, karmaşık diyalogları yönetmeye kadar pek çok alanda yetenek kazandı. Milyonlarca kullanıcının hayatını kolaylaştıracak Gemini’nin canlı konuşmadan konuşmaya (speech-to-speech) çeviri yeteneği, Google Çeviri (Translate) uygulamasına geliyor. Bu özellik sayesinde uygulama, sadece kelimeleri çevirmekle kalmayacak; insan konuşmasındaki tonlamaları, vurguları yakalayarak gerçek zamanlı ve doğal bir sesli çeviri deneyimi sunacak.
İÇERİK ÜRETİCİLERİNİ DE DÜŞÜNDÜ
İçerik üreticileri için sunulan Gemini 2.5 Flash ve 2.5 Pro Text-to-Speech önizleme modelleri ise sesin üzgün, heyecanlı veya fısıltı halinde olması gibi stil isteklerine uyacak. Bağlama göre konuşma hızını otomatik ayarlayan, nefes paylarını hesaplayan akıllı tempo özelliği eklendi. Çoklu konuşmacı senaryolarında, her karakterin ses tonunun tutarlı kalması sağlanacak. Son olarak da Gemini 2.5 Flash Native Audio modeli, sadece metni okumakla yetinmeyecek karmaşık iş akışlarını yönetebilecek, kullanıcının yönlendirmelerini daha iyi anlayarak daha akıcı sohbetler yapacak.





