Şirketin geliştirdiği yeni nesil sesli yapay zekâ modelleri artık sadece konuşmaları anlamıyor; aynı zamanda çeviri yapabiliyor, konuşmaları yazıya dökebiliyor ve kullanıcıyla sohbet ederken çeşitli görevleri yerine getirebiliyor.
Son yıllarda ChatGPT benzeri sistemler daha çok yazılı komutlarla kullanılıyordu. Ancak teknoloji devleri artık gerçek zamanlı sesli iletişime odaklanıyor. Yeni dönemde yapay zekâ asistanları yalnızca “komut alan sistemler” olmaktan çıkıp adeta dijital yardımcıya dönüşüyor.
Konuşurken Aynı Anda İşlem Yapabiliyor
Tanıtılan en dikkat çekici modelin adı “GPT-Realtime-2” oldu. OpenAI’a göre bu sistem, kullanıcıyla doğal bir şekilde konuşurken aynı anda işlem gerçekleştirebiliyor. Örneğin kullanıcı bir toplantı ayarlamak istediğinde yapay zekâ takvimi kontrol edip uygun saatleri bulabiliyor. İnternette araştırma yapabiliyor ya da şirket içi sistemlerle bağlantı kurabiliyor.
Üstelik bunu yaparken kullanıcıyla konuşmaya devam ediyor. Yani “Takviminizi kontrol ediyorum” veya “Bu bilgiyi şimdi araştırıyorum” gibi geri dönüşler vererek gerçek bir asistan hissi oluşturuyor.
Şirketin verdiği bilgilere göre sistem artık çok daha uzun konuşmaları da unutmeden takip edebiliyor. Özellikle müşteri hizmetleri, çağrı merkezleri ve dijital destek alanında büyük değişim yaratabileceği konuşuluyor.
Gerçek Zamanlı Çeviri Dönemi
OpenAI’ın duyurduğu bir diğer model ise “GPT-Realtime-Translate” oldu. Bu sistem konuşulan dili anlık olarak başka dillere çevirebiliyor.
Aktarılan bilgilere göre model 70’ten fazla dili anlayabiliyor ve bunları eş zamanlı şekilde farklı dillere çevirebiliyor. Özellikle turizm, müşteri hizmetleri ve uluslararası toplantılar için büyük kolaylık sağlaması bekleniyor.
Örneğin bir Türk kullanıcı Türkçe konuşurken karşı taraftaki kişi konuşmayı İngilizce olarak duyabiliyor. Yapay zekâ bunu anlık şekilde gerçekleştiriyor.
Uzmanlara göre bu teknoloji ilerleyen dönemde canlı çevirmen ihtiyacını bazı alanlarda azaltabilir.
Konuşmaları Anında Yazıya Dökecek
Şirketin tanıttığı üçüncü sistem ise “GPT-Realtime-Whisper” oldu. Bu model kullanıcı konuşurken sesi anında yazıya dönüştürebiliyor.
Özellikle:
- toplantı notları,
- canlı yayın altyazıları,
- çağrı merkezi kayıtları,
- röportaj çözümleri,
- ders kayıtları
gibi alanlarda büyük kolaylık sağlaması bekleniyor.
Özellikle gazeteciler, içerik üreticileri ve öğrenciler için bu tarz sistemlerin ciddi zaman kazandırabileceği belirtiliyor.
Google ile Rekabet Kızışıyor
OpenAI’ın yeni hamlesi teknoloji dünyasında büyük yankı uyandırırken gözler şimdi Google Gemini tarafına çevrildi. Çünkü Google da “Gemini Live” isimli benzer bir sesli yapay zekâ sistemi üzerinde çalışıyor.
İki şirket arasındaki fark ise yaklaşımda ortaya çıkıyor. Google daha çok hızlı yanıt ve çoklu dil desteğine odaklanırken, OpenAI’ın daha doğal sohbet deneyimi geliştirmeye çalıştığı belirtiliyor.
Uzmanlara göre önümüzdeki birkaç yıl içinde yapay zekâ asistanları telefon kullanım alışkanlıklarını tamamen değiştirebilir. Klavye yerine konuşarak işlem yapmak günlük hayatın sıradan bir parçası haline gelebilir.




