Yapay Zekaya Derdini Anlatabilmek

Hayatın zorlukları biraz üstüme üstüme geldiğinde izleyip kahkahalarla güldüğüm birkaç video vardır; bunlardan biri de “İskoç vatandaşların Ses Tanıma sistemiyle imtihanı” diye yorumlayabileceğiniz şu videodur.



 

Çok değil, birkaç on yıl önce Bilim Kurgu kabul edilen, videoda müthiş bir mizahla hicvedilen Ses Tanıma teknolojisi bugün artık neredeyse hepimizin cebinde. Çalan güzel bir melodinin ismini bulmaktan, banka işlemlerimizi yapmaya, e-posta ya da mesajlarımızı sesten yazıya dökmeye kadar bir çok amaçla kullanıyoruz bu teknolojiyi. Tabi günlük hayatımıza, cebimize bile giren bu teknoloji sadece Ses Tanıma değil, daha genel anlamda Yapay Zeka, kısaca AI yani Artificial Intelligence, artık hayatımızın her alanına girmeye başladı. Kimileri felaket senaryoları üzerinde duruyor; AI dünyayı ve bizleri hükmü altına alacak, robotlar işlerimizi elimizden alıp, dünyayı yönetecekler, Terminatör filmi gerçek olacak… Tabi bir kısmı gerçeklik taşımıyor değil bu korkuların: robotlar işimizi elimizden almasa da, biz kendimizi yeni becerilerle donatmazsak, 10 yıl içinde gerçekten teknolojiyle yapılabilecek işler olduğu ve bunun bizi işsiz bırakacağı artık apaçık ortada. Ama bu başka bir blog konusu, meraklısına konuyla ilgili bir araştırma burada.

Peki AI eğitimde ne derece kullanılıyor? Tabi ki eğitim alanında da özellikle data toplayarak öğrenenlerin kişisel çalışma haritalarını belirlemede kullanılıyor, ve daha da fazla kullanılacak. Bunun yanı sıra, Dil Ölçme Değerlendirme alanında da kullanılıyor; bir yabancı dilde ne derece etkili iletişim kurabiliyoruz, bunu değerlendirmek için Yapay Zeka’ya başvuruluyor. Önce nedeninden başlayalım: Konuşma ve Yazma becerilerinin uzman insanlar tarafından değerlendirilmesinde ne sakınca var? Cevap soruda saklı aslında; İNSAN olmaları… Yani; hislerinin olması, acıkmaları, susamaları, yorulmaları, görünüşten, ırktan, dilden, dinden, aksandan (anlaşılır olsa da) etkilenebilmeleri. Sabah başladıkları bir essay okuma işinde, akşama kadar aynı performansı gösterememeleri; ne kadar standardizasyon yapılsa da insan değerlendiriciler arasında puanlama açısından farklılıklar yaşanması; kimisi ‘sıfırcı’ iken, kimisinin ‘eli bol’ olması… Peki; bu Yapay Zeka nasıl yapıyor değerlendirme işini? Bir ‘makine’ nasıl karar veriyor bizim İngilizce’deki konuşma ve yazma becerilerimizin düzeyine? Tek bir şeye dayanarak: VERİ. Önce Yapay Zeka değerlendirme yapacağı dili öğreniyor; sizce nasıl öğrenir bir dili AI? Okuyarak… Yüz binlerce yazılı makale, ses dosyası, o dili incelikli olarak öğrenebileceği her türlü veri ile besleniyor. 6 ay ile 1 sene arası sürüyor bu iş. Sonra sırada o dilde Yazılı ve Sözlü olarak adayların vereceği cevapları değerlendirmesi var. Tabi, burada yanlış bir algıyı düzeltmek lazım; AI ile değerlendirmede öyle her istediğiniz soru tipini kullanamıyorsunuz; yani ‘Hadi bakalım anlat biraz’ diye tamamen açık uçlu bırakmıyorsunuz soruyu, biraz yapılandırılması gerekiyor. Sıra geliyor Yapay Zekaya skorlama öğretmek için veri toplamaya; Field Test yani Saha Testi uygulanıyor bunun için. Bir örnek: PTE Academic sınavının Saha Testi 18 ay sürüyor; 158 ülkeden 126 farklı ana dili olan 10.000 kişi 21 ülke 38 farklı şehirde testi alıyor - yani İskoç vatandaşlarının yazının başındaki sorunu artık geçerli değil! Bu kişiler arasında tabi ki her düzeyi temsil edecek adaylar var: Şimdi, Yapay Zeka’ya kim öğretecek nasıl değerlendireceğini bu test sonuçlarını? Tabi ki Uzman İnsanlar; ama sadece ve sadece gerçekten alanında Uzman olandeğerlendiriciler. Defalarca değerlendiriliyor Field Test sonuçları, farklı farklı insanlar tarafından, birbirleriyle kıyaslanıyor, sonra bir set data daha sunuluyor ve neticede Yapay Zeka’ya öğretiliyor “Bak, bu soruları böyle değerlendirmen gerekiyor” diye. Sonra, bir set veri daha sunuluyor AI ve insan değerlendiricilere değerlendirmeleri için. Aradaki tutarlılığa bakılıyor; hem İnsanlar arasındaki hem de AI ile insanlar arasındaki. Sonuç? Bir insanın başka bir insanla arasındaki değerlendirme tutarlılığından daha yüksek AI’ın bir insanla olan tutarlılığı. Niye? AI sadece ve sadece VERİ’ye dayalı karar veriyor da ondan.

Bu öğrenme, ya da değerlendirme kurulum aşamasından sonra İnsan değerlendiriciler sahneden çekiliyor ve AI başlıyor değerlendirmeye. Bu arada değerlendirme kriterleri sadece yapılar ya da telafuz değil tabi ki, çok boyutlu bir değerlendirme yapıyor; tıpkı insanların yaptığı gibi, içerik - akıcılık - fikirlerin akıcılığı - organizasyon - dil kullanımı ve daha bir çok kritere göre karar veriyor.

Bu yüzden PTE Academic şu an piyasadaki en hızlı sonuç veren (5 iş günü içinde) Uluslararası İngilizce Yeterlilik sınavı, ve AI ile sağlanan nesnelliği sebebiyle (tabi bu tek başına yetmiyor, Test merkezlerinin güvenlik önlemleri de çok önemli) Türkiye’de ve dünyada büyük bir hızla yaygınlaşıyor. Ben konuya çok genel yaklaştım, özel ilginiz varsa Yapay Zeka’nın dil sınavında kullanımı ve PTE Academic ile ilgili daha fazla araştırma ve bilgiye buradan ulaşabilirsiniz.

Özetle, dil sınavlarında Yapay Zeka tam da olması gerektiği gibi kullanılıyor; bizim hayatımızı kolaylaştırmak için… Bitirirken, Yapay Zeka ve teknolojiyle ilgili bu tatlı ninenin haberine bir bakın; yaşasın iyilik :)