Yapay Zeka, Makina Öğrenmesi, Derin Öğrenme, Yapay Sinir Ağları: Kısa Tarihçe

Son yıllarda bilgisayarların veri işlemesi inanılmaz ölçülerde gelişti; sürücüsüz araçların engelleri ve tehlikeleri tanıması bunlara çarpmamak için önlem alması, konuşmaları yazıya dökme, yüz tanıma uygulamaları bilgisayarların gelişimine sadece bir kaç örnek. Artık “Yapay Zeka” (İng. Artificial Intelligence, AI) herkes tarafından duyulan bir terim. Bunun yanında “Makina Öğrenmesi” (İng. Machine Learning, ML), “Derin Öğrenme” (İng. Deep Learning, DL) bunun yanında “Yapay Sinir Ağları” (İng. Artificial Neural Networks, ANN) isimlerini de duymaktayız. Bu kavramlar birbiriyle bağlantılı olmakla birlikte, farklılıklar içermekte.

Yapay Zeka, Makina Öğrenmesi, Derin Öğrenme ve Yapay Sinir Ağlarının birbiriyle olan bağlantıları

Görüntü algılama, ses tanıma uygulamalarının ardında bir “Yapay Zeka” teknolojisi olan “Derin Öğrenme” yatmakta. Derin Öğrenme, canlılarda beyin ve sinir sistemini oluşturan sinir hücresi (nöron) ağların çalışmasından esinlenerek tasarlanmış “Yapay Sinir Ağları”na dayamakta.

Biyolojik Sinir Hücresini (Nöron) oluşturan öğeler

Yapay Sinir Ağları her biri Sinir Hücresini işlevsel olarak taklit eden işlem hücrelerinden, bunların oluşturduğu katmanlardan oluşmakta. Bir katmanın çıktıları, ardından gelen katmanın girişine bağlanarak bir çok katmandan oluşan Yapay Sinir Ağları oluşturulabilmekte.

Yapay Zeka üzerine çalışmalar çok yeni sayılmaz. Bilim insanları ve bilgisayar araştımacıları  1940’lardan bu yana Yapay Sinir Ağları üzerine çalışmakta. 1947’de S.McCulloch ve W.Pitts yayınladıklar makalede ‘Sinir Ağları’nın ilk modelerini öğrenilmemiş ayarlanabilir ağırlık çarpanlarıyla nasıl tasarlanabileceğinin ilk örneklerini gösterdiler. 1957’de F.Rosenblatt biyolojik prensiplere dayanarak öğrenebilen ağırlık çarpanlarıyla çalışan, eşik değerleriyle karar veren ‘Algılayıcı’ (İng. ‘Perceptron’) elektronik tasarımı gerçekleştirdi, ‘Algılayıcı’ IBM 704 bilgisayarında benzeştirilerek(İng. simulation) denendi.

Yapay İşlem/Sinir Hücresi: Algılayıcı (Perceptron)

1960’da B.Widrow ve T.Hoff ‘ADALINE’ (İng. Adaptive Linear Neuron/Element) ‘Uyarlanabilen Doğrusal Nöron/Öğe’yi icat etti.  1970’lere kadar mantık fonksiyonları olan ‘VE’, ‘YA DA’ ve ‘OLUMSUZLUK’ işlevleri doğrusal iki boyutlu bir düzlemde Yapar Sinir Ağlarıyla giriş ve çıkış değerleri öğrenilerek çözülebiliyordu. O ana kadar Yapay Sinir Ağları altın çağını yaşamıştı. Ancak Yapay Sinir Ağlarının yetersizliği  ‘DIŞLAMALI YA DA’ (İng. Exclusive OR, XOR) işleminde ortaya çıktı. ‘DIŞLAMALI YA DA’ işlevi doğrusal iki boyutlu bir düzlemde Yapay Sinir Ağlarıyla çözülemediği 1969’da M.Misky ve S.Papert tarafından gösterildi. Bu Yapay Sinir Ağlarına olan ilgiyi 1980’lerin ortasına kadar neredeyse durdurdu. Bu durum İlk Yapay Zeka Kışı ya da Karanlık Çağı olarak da anılır.

1980’lerin ortasında ise, Yapay Sinir Ağlarına yeni ara katmanlar (Saklı Katman olarak da adlandırılır) ekleyerek ‘DIŞLAMALI YA DA’ işlevi de olmak üzere doğrusal olmayan sorunların ayrıştırılarak çözülebileceği G.Hinton tarafından gösterildi. Çözüm Çok Katmanlı Algılayıcı (İng. Multi-layered Perceptron) olarak adlandırıldı.  Üstelik ‘DIŞLAMLI YA DA’ işlevini çözebilen bir tasarımın tüm diğer işlevleri de çözebileceği kanıtlandı.  Bu arada Aşırı Uyum (İng. Overfitting), Yerel En Uygun Değer (İng. Local Optima) gibi kavramlarda teknoljik yazına kazandırıldı.

Yapay Sinir Ağı, katmanlar ve katmanlar arası bağlantılar

1990’larda Yapay Sinir Ağları beklentileri aşırı şişirildiği ancak Yapay Sinir Ağlarını işleyecek yeterli bilgi işlem gücü olmadığı için beklentiler karşılanamadı. Haksız yere Yapay Sinir Ağları suçlandı sonuç olarak 2000’lerin ortalarına kadar sürecek İkinci Yapay Zeka Kışı’na daha doğrusu durgunluğa girildi.

Ağırlıklı bağlantılarla Yapay Sinir Ağı

1990’ların sonlarına doğru Grafik İşlemciler elektronik oyun pazarının genişlemesiyle hızla bilgisayar donanımlarının önemli bir parçası olmaya, ana işlemcilerin yanında yer almaya başladı. Grafik İşlemciler grafik uygulamaların gereği çoklu paralel vektörel matematiksel işlem yapabilen özel amaçlı yüzlerce işlemcinin bir araya gelmesiyle oluşmakta. Grafik İşlemcilerin çabuk yayılması, maliyetleri düşürüp kolay sağlanabilirliğini arttırdı. Paralel ve hızlı işlem yapısıyla Vektörel Grafik İşlemciler Yapay Zeka, özellikle de Yapay Sinir Ağları üzerine çalışan araştırmacıların dikkatini çekti ve Vektörel Grafik İşlemciler amaçları dışında Yapay Sinir Ağlarınının işletilmesinde kullanılmaya başlandı. Yapay Sinir Ağları üzerine çalışan bilim insanları ve araştırmacılar Vektörel Grafik İşlemcilere yönelik algoritmalar geliştirmeye yoğunlaştılar. 1995’de V.Vapnik ve C.Cortes, Vektör Makina Desteği, SVM (İng. Support Vector Machine) vektörel işlemcilere uygun, destekli öğrenebilen, sınıflandırma algoritmasını icat ettiler.

2000’lerde G.Hinton Yapay Sinir Ağlarından ileri giderek her bir Yapay Sinir Ağı işlemcisinin de bir Yapay Sinir Ağı olarak tasarlandığı Derin Öğrenme (İng. Deep Learning) teknolojisi geliştirdi. Vektörel Grafik İşlemcilerin daha da erişilebilir olması araştırmacıları bu alan yöneltti.

2010’larda ise Grafik İşlemciler hemen her bilgisayarda kişisel amaçlı erişilebilir olması, büyük veri ve bulut bilgisayar sistemlerinin yayılması Derin Öğrenmenin diğer rakip Yapay Zeka teknolojilerinin önüne geçmesini sağladı. Artık, görüntü algılama, ses/konuşma tanıma, çeviri uygulamaları gibi Yapay Zeka uygulamaları gündelik yaşama girdi.    

Bir yanıt yazın