
Dil ve Yapay Zeka – David Adger
Dilbilimci David Adger, Facebook’un sohbet botları deneyi üzerine, yapay zekanın insan dillerini anlaması ve konuşmasının tarihçesini ve insanlar ile bilgisayarların dil kullanımındaki farklar hakkında bir konuşma yapmıştır.
Birkaç yıl önce bir grup insan Facebook üzerinde birkaç sohbet botu geliştirdi ve onları birbirleriyle konuşturdular. Ardından sohbet botları, konuşma şekillerini geliştirmeye başladı ve bu, gerçekten çok tuhaf hale gelmeye başladı: Botlar konuşmaya İngilizce kelimelerle başladılar, ancak dilbilgisi zamanla değişti ve sohbet botları gerçekten İngilizce cümleler kullanmamaya başladı. Bu noktada geliştiriciler, araştırmacılar ve Facebook, “Bu da nedir, bu hiç İngilizce gibi görünmüyor” dedi. Ancak ilginç bir şekilde, sohbet botları hâlâ araştırmacıların istediklerini yapabiliyorlardı.
Araştırmacıların istedikleri şey, bir sohbet botunun bir insanla müzakere yapabilmesini sağlamaktı. Bunun için zilyon denilebilecek kadar çok insanı, “Ben üç top istiyorum, sen iki kutu istiyorsun” minvalinde saçma bir şey hakkında birbirleriyle müzakere etmeleri için bir araya getirdiler ve ihtiyaçlarını karşılıklı olarak bir konuşma yoluyla nasıl tatmin edeceklerini bulmalarını istediler. Sonra tüm bu verileri kaydettiler ve bu verilerle sohbet botlarını beslediler. Ardından sohbet botlarını birbirleriyle konuşturmaya başladılar.
Sohbet botlarının planı, müzakereleri kazanmak, en iyi müzakereleri yapmaktı. Dediğim gibi, ne olduysa sohbet botları biraz çılgınlaştı ve araştırmacılar, “Bu gerçekten hiç İngilizce gibi görünmüyor” dedi. Bunun üzerine programları kapattılar. O zamanlar basında oldukça eğlenceli bir olay olarak yer aldı çünkü basın çılgına döndü. Düşünün: “Yapay zekalar dünyayı ele geçirecek, şimdiden kendi dillerini yaratabiliyorlar” gibi şeyler deniliyordu. Aslında tam olarak öyle olmuyordu. Evet, bir anlamda kendi iletişim yöntemlerini yaratıyorlardı, ancak araştırmacıların endişeli olduğu şey sohbet botlarının dünyayı ele geçireceği değildi; asıl endişeleri, sohbet botlarından İngilizce’yi geliştimeye devam etmelerini istememiş olmalarıydı. Sadece müzakere stratejilerini kazanmalarını istemişlerdi. Sonra bunu yeniden düzenlediler ve sohbet botlarının tekrar İngilizce konuşmasını sağladılar.
Ancak bu çok ilginç bir deneydi çünkü iki ilginç soruyu gündeme getirdi: Birincisi, yapay zekalar dil konusunda o kadar iyileşirse ve birbirleriyle dil kullanarak iletişim kurabilir hale gelirse biz ne oluruz? Benim de cevaplamaya çalıştığım soru buydu.
Alexa veya Siri gibi yapay zekaların bizim kadar iyi olabileceği söylenebilir mi? Dahası, aynı yapacakları söylenebilir mi? Dili insanlar gibi mi kullanacaklar?
Vereceğim cevap şudur ki, bize göre oldukça yetenekli olabilirler. Hatta daha iyi olabilirler (ne açıdan baktığınıza bağlı olarak) ancak bu dil kullanım işini oldukça farklı bir şekilde yapacaklardır. Yapay zekaların dil ile nasıl uğraştığına bakarsak, bunun gerçekten başladığı 70’li yıllara kadar gideriz. Yapay zeka mühendisleri, insanlarla bilgisayarın Star Trek’teki gibi konuşabilmesini sağlayıp sağlayamayacaklarını gerçekten merak ediyorlardı. Ardından insanlar sistemler inşa etmeye başladılar. En ünlü olanlardan biri tuhaf bir adı olan SHRDLU idi. Terry Winograd tarafından geliştirilen bu sistem, farklı boyutlarda renkli bloklardan oluşan bir dünyaya sahipti. Program dünyayı biliyor ve siz de programa şunu diyebiliyordunuz: “Mavi bloğu kırmızı bloğun üzerine koy” ve ardından sistem “Mavi bloğu kırmızı bloğun üzerine koydum” diyecekti ve işler böyle ilerleyecekti.
Winograd, SHRDLU gibi bir sistem çalıştırmak için İngilizce dilbilgisine dair bildiklerini alıp bilgisayar tabanlı kurallara dönüştürdü ve sonra bu kuralları çeşitli kelimelerin anlamlarıyla ve kelimelerin bu küçük dünyada nasıl bir araya geldiğiyle bağladı. Bu bilgileri kullanarak programı oluşturdu. Aslında oldukça inanılmaz bir çalışmaydı. Programı çeşitli işleri yapması için kullanabiliyordunuz. Biraz Star Trek’tekine benziyordu fakat sadece bloklardan oluşan bir dünya vardı. Açıkçası bunun da bir faydası yoktu, bloklar harika değildi.
Bu nedenle, soru şuydu: SHRDLU gibi bir şey alıp geliştirip, onu tamamen genel hale getirebilir, bir insan gibi çalışmasını sağlayabilir miyiz? İnsanlar bunu 70’ler ve 80’ler boyunca denediler ve gerçekten zor bir iş olduğu görüldü. İnsanların ne hakkında konuşacaklarını asla bilemezsiniz: Her türlü konuda konuşurlar. Önlerinde bulunmayan şeyler hakkında dâhi konuşurlar, hayal güçlerinde olan şeyler hakkında konuşurlar… Bunu bir bilgisayar programının yapabilmesi inanılmaz derecede zordur.
70’ler ve 80’ler boyunca insanlar bilgisayarlardaki dilbilgisini geliştirmeye çalıştılar: daha büyük kurallar kümesiyle daha büyük alanlarla bağlantılı kurallar eklediler. Aslında, bu etkiyi de bilgisayarlaştırmaya başladılar, bu yüzden çok sayıda metin alıp, yüzlerce dilbilim yüksek lisans öğrencisiyle tüm metinleri analiz ettirip, sonra bilgisayar programının tüm metni tarayıp kuralları çıkarmasını sağladılar ve bu kuralları dilin anlaşılmasına yönelik başka bir bilgisayar programı oluşturmak için kullandılar. Temel olarak, insanlar 80’lerde bunu yaptılar. İnsanlar hâlâ bunu yapıyor ve bu analiz edilmiş cümlelerin devasa koleksiyonlarına “treebank” deniyor. Hâlâ çok çok faydalılar. Ama asla gerçekten işe yaramıyorlar. Bunun sebebi yine aynı sorun yüzünden: İnsanların ne hakkında konuşacağını bilemezsiniz. Bu sistemler çok kırılgandır, bu yüzden insanlar gibi çalışmazlar veya insanlar kadar esnek değillerdir.
Ancak 80’lerde farklı bir şekilde işleyen yeni bir yapay zeka oluşturuldu. Şu anda da çevremizi saran bunlardır. Alexa, Siri veya ‘Hey Google’ gibi sistemlere baktığımızda, hepsi bu yeni sistemleri kullanıyor. Üstelik bu sistemler çok farklı bir şekilde çalışıyor. Bu sistemlerde kuralları çözmeye çalışmazsınız: Sistemi çok genel yaparsınız. Sistem, attığınız her şeyi analiz etme konusunda çok iyidir. Bu sistemlere sinir ağları denir. Temel olarak, sistemi bazı verilerle beslersiniz ve istediğiniz çıktıyı söylersiniz, ardından sadece serbest bırakırsınız ve sistemin, eldeki verileri istediğiniz çıktıya eşleştirmeye çalışarak dönüp durmasına izin verirsiniz. Birçok yapay zeka sistemi bu günlerde bu şekilde çalışmaktadır.
Gerçekten de oldukça parlak zekaya sahipler. Bu yüzden Siri’ye “Siri, bana Rachmaninoff çal” derseniz, Siri size muhtemelen Rachmaninoff çalar. Bunun temel olarak sinir ağı sistemlerini kullanarak yapıldığı gerçeği oldukça ilginçtir. Aslında yaptıkları şey ise hiç de bir insan gibi değil. “Rachmaninoff çal” dediğinizde, beyninize girer ve ne anlama geldiğini anlarsınız ve Rachmaninoff kaydını alırsınız. Bu sistemler ise söylediklerinizi duyar ve bunu istatistiksel olarak sinir ağları kullanarak analiz eder. Bunu Apple veya Google sunucuları üzerinden İrlanda, Kaliforniya veya bulundukları herhangi bir yerdeki sunuculara göndererek yapar ve sonra size tüm verileri geri verir.
Bu oldukça etkileyici bir şekilde küresel zeka gibi çalışır.
Bu işi çok iyi yönetmelerine ve sesleri başarıyla halletmelerine rağmen dil bilgisi eksikleri var. “Siri, bana Rachmaninoff çal” dediğinizde ne demek istediğinizi anlamaları gerekiyor ve bu konuda oldukça kötüler. Temel olarak yaptıkları şey, o kelimelerin en olası anlamlarına bakarak iyi bir tahminde bulunmak. İnternetin geneline bakarak, bu görevlerin “Rachmaninoff çal” anlamına gelme olasılığının en yüksek olduğunu belirlemek gibi bir görevleri oluyor kısacası. Yapmanız gereken tek şey, çeşitli kelimeleri bir araya getirmek; adeta kelimelerin olduğu bir çorba gibi, hepsini karıştırıyor ve en iyi tahmini yapıyorsunuz, buna bazen “anlamsal çorba” stratejisi denir. Anahtar kelimeler kullanıyorsunuz.
Bu, insanların dili anlama konusunda yaptıklarıyla aynı şekilde olmadığı için yeni sistemler ortaya çıkmaya başladı. Yakın zamanda, birkaç yıl önce Google farklı bir yaklaşım kullanmaya başladı ve şu an bunu, başta Google Translate olmak üzere her yerde kullanıyor. Bu yaklaşım, neler olacağını belirlemek için sadece anahtar kelimeleri kullanmıyor; aslında bir sonraki kelimeyi, kelimeyi hangi kelimenin takip edeceğini veya önce geleceğini de hesaplayarak olasılıklar kullanıyor. Sana “kedi matın üzerine…” dediğimde muhtemelen “oturdu” diyeceksin çünkü bunu binlerce kez duymuşsundur. Ama “kedi bulutun üzerinde oturdu” dediğimde bu biraz daha alışılmadık bir durum. “kedi bağımsızlık üzerinde oturdu” dediğimde ise gerçekten alışılmadık bir durum olur.
Böylece, belirli kelimelerin ne sıklıkta diğer kelimeleri takip ettiğine bakarak cümlenin dil bilgisinin ne olacağı konusunda iyi bir tahminde bulunabilirsiniz. İşte bu yeni sistemlerin yaptığı şey budur. Son birkaç yılda Google Translate’in daha iyi hale gelmeye başladığını fark ederseniz, bu, bir kelimenin diğerini takip etme istatistiksel olasılığına dikkat etmeye başlamasından kaynaklanır. Bunun şu anda çok sofistike versiyonları var, bunlara “uzun kısa-süreli bellek” (long short-term memory) adı veriliyor ve yaptıkları şey daha önce duyduklarını bir şekilde hatırlamak. Yani, örneğimdeki “kedi matın üzerinde oturdu” cümlesinde, kedi kelimesini hatırlayacaklar ve matların kedilerin bulunabileceği oldukça olası yerler olduğunu düşünecekler. Temel olarak, bir tür hafızaya sahipler ve bunu dil bilgisinin işleyebilmesi için kullanabilirsiniz.
Öyleyse, “the foxes in my greenhouse are jumping around” (seradaki tilkiler etrafa zıplıyor) gibi bir örneği ele alalım. Düşününce, “foxes” ve ardından “are” birbirlerine oldukça uzak. Ancak “are” ile yanındaki isim “greenhouse” olduğu halde, “the foxes in my greenhouse is” demezsiniz, “are” dersiniz çünkü bahsettiğiniz şey tilkilerdir, sera değil. Bu, bu sinir ağları için her zaman çok zor olmuştur. Bu yeni sofistike olanlarla, bunu yapabilirler, hangi fiilin isimle uyum sağlamak için en olası olduğunu çözebilirler.
Bunun inanılmaz göründüğünü söyleyerek bitireceğim ama aslında bu sinir ağları dil bigisi çözümlemesini bizim yaptığımız gibi yapmıyorlar. İnsanlar deneyler yapmışlar: Tal Linzen adında bir araştırmacı, bu sofistike sinir ağlarını insanlar gibi davranarak dil görevlerini yapmaları için kullanmış ve aynı zamanda insanlara da dil görevlerini yaptırmış. Hem sinir ağları hem de insanlar hatalar yaparlar. Ancak sinir ağlarının yaptığı hatalar insanların yaptığı hatalardan oldukça farklıdır. Yani performansları ve dışarıdaki davranışları çok benzer olsa da, aslında derinlerde ne olduğu ikisi için de oldukça farklıdır. Şu anda sahip olduğumuz sinir ağları, yaptıkları şeylerin aslında biz insanların dil kullanımından oldukça farklı olduğu anlaşılıyor.
Çevirmen: Eymen YALAZ
Kaynak: David Adger, Language and Artificial Intelligence, https://serious-science.org/language-and-artificial-intelligence-10095 , Erişim Tarihi: 07.12.2023