Google, internet tarayıcısını insan gibi kullanabilen yeni yapay zekası Gemini 2.5 Computer Use modelini tanıttı. Bu yeni teknoloji, tıklama yapmak, sayfaları kaydırmak ve metin girmek gibi görevleri kullanıcıymış gibi yerine getirebiliyor. Yani, artık yapay zekanın tarayıcıda sıradan bir insan gibi işlem yapması mümkün hâle geldi.
Gemini 2.5 Nasıl Çalışıyor?
Yeni model, görsel algılama ve mantıksal çıkarım yeteneklerini kullanarak verilen komutları analiz ediyor ve adım adım uyguluyor. Örneğin bir web formunu doldurabiliyor veya bir internet sitesinde belirli bir işlemi tamamlayabiliyor. Google, bunun özellikle API erişimi olmayan sitelerde ve kullanıcı arayüzü testlerinde büyük kolaylık sağlayacağını belirtiyor.

Google Rakiplerinden Üstün Mü?
Google, Gemini 2.5’in benchmark testlerinde rakiplerinden daha iyi performans gösterdiğini vurguluyor. Hatırlarsanız, OpenAI’nın yeni ChatGPT Agent sistemi de kullanıcı adına karmaşık görevleri tamamlayabiliyor. Benzer şekilde, Anthropic şirketi de geçen yıl Claude modelinin “computer use” yeteneğini tanıtmıştı.
Önceki Deneyimler ve Project Mariner
Gemini’nin bu yetenekleri, daha önce Google’ın “AI Mode” ve Project Mariner isimli deneysel tarayıcı projesinde test edilmişti. Mariner, örneğin bir alışveriş listesine göre sepete ürün ekleme gibi görevleri kendi başına gerçekleştirebilen bir sistem olarak dikkat çekmişti.

Şu An Neler Yapabiliyor?
Şu anda Gemini 2.5 yalnızca web tarayıcısında işlem yapabiliyor, yani bilgisayarın tüm sistemini kontrol edemiyor. Desteklediği işlemler arasında tarayıcı açmak, metin yazmak, sürükle-bırak işlemleri yapmak ve sayfalarda gezinmek gibi 13 farklı görev bulunuyor.
Türkiye’de Kullanım ve Demo İmkanı
Gemini 2.5, Google AI Studio ve Vertex AI platformları üzerinden geliştiriciler için sunuluyor. Ayrıca Browserbase üzerinde herkese açık bir demo sürümü de bulunuyor. Böylece isteyen herkes yapay zekanın tarayıcıyı nasıl kullanabildiğini deneyimleyebiliyor.
Google Gemini 2.5 ile yapay zekanın interneti insan gibi kullanabilmesi bir adım daha ileriye taşındı. Bu teknoloji, özellikle API bağlantısı olmayan web sitelerinde karmaşık görevleri otomatik olarak gerçekleştirmek isteyen geliştiriciler için oldukça faydalı olacak.




