Hepinizin yakından tanıdığı halk kahramanı Zemberek'ten bahsetmek istedim alenen.
Zemberek -çoğunuzun zaten bildiği gibi-, bir doğal dil işleme kütüphanesi. Sayesinde yapabildiğimiz şeylerden birisi de ofis uygulamamız içerisinde Türkçe imlâ denetimi :) Ayrıca Pardus ile Zemberek entegrasyonu çalışmaları sonucunda, Pardus kullanırken mesajlaşma yazılımı, e-posta istemcisi ve hatta tarayıcı içerisinde bir form doldururken dahi imla denetimi yapmak ve hususi olarak istenmediği müddetçe yazım hatası yapmamak, mümkün.
Zemberek gibi açık kaynak kodlu olan ve diğer yazılım projelerinin de kolayca faydalanabileceği, Türkçe dili hakkında bilgi sahibi olan bir uygulamanın ne kadar gerekli olduğu konusunda herkesin hemfikir olduğunu tahmin ediyorum. Türkçe için bir doğal dil işleme aracı ortaya çıkarmak üzere yapılan ilk çalışma Zemberek değil, bu konu ile ilgili kapsamlı çalışmalar daha önceden çeşitli üniversiteler ve özellikle Sabancı Üniversitesi'nden Prof. Dr. Kemal Oflazer ve ekibi tarafından yapılmış. 90'lı yıllarda yapılan bu çalışmalar maalesef çeşitli sebeplerle tamamen açık kaynak kodlu bir gerçeklemeye dönüşmemişler (diğer bir deyişle akademik çalışmalarda kullandıkları gerçeklemeler dışında herkesin faydalanabileceği bir ürün ortaya hiç çıkmamış)(her neyse, bu konuya girmeyelim). Zemberek halen bu alandaki Türkiye'nin ilk ve tek özgür yazılımı olma özelliğini korurken, mütevazi geliştiricileri de “inşallah bu özelliğimizi en kısa zamanda kaybederiz :)” diyorlar. Tek olma özelliklerini kaybedebilirler fakat Zemberek'in ilk olma özelliğini kolay kolay kaybedebileceğini zannetmiyorum.
Zemberek'in temelleri projenin iki geliştiricisinden birisi olan ve şu anda Porto-Rico'da hayatını yazılım alanında çalışarak sürdüren yüksek elektronik ve haberleşme mühendisi Ahmet Afşın Akın'ın 1999 yılında İ.T.Ü.'deki doktora eğitimi sırasında bir ders için yaptığı bir ödev ile başlamış. Hatta bu ödev gelişip Tspell adı ile serpilmeye başlamııış, ve Ahmet Afşın Akın'ın doktorası ile beraber Tspell de ne yazık ki son bulmuş. Fakat bu son bulma durumu, Ahmet'ten 15 dakika büyük olan ve şu an bir diğer Pardus geliştiricisi olan Mehmet Dündar Akın'ın askerden dönüşüne kadar devam edebilmiş.
Yukardaki paragraf ile aşağıdaki paragraf arasına Akın ailesinin Karaman'lı olduğunu, Karamanoğlu Mehmet Bey'in de Türkçe'nin kullanımını fermanla zorunlu kılan ilk kişi olarak 1280 yılında yaşamını yitirmiş yiğit bir bey, amansız bir Türkçe savaşçısı olduğu bilgisini sıkıştırmak isterim. Evet.
Karaman'lı Mehmet'in vatani görevinin sona erişinin ardından kardeşine, Tspell projesine devam etmenin aslında çok iyi bir fikir olabileceği ve ortaya gerçekten işe yarayacak bir çalışmanın çıkabileceği yönündeki ısrarlı tutumu ve yardım sözü ile beraber Ahmet'in bir haber grubunda gördüğü “acaba Türkçe cümle üreten bir algoritma olabilir mi?” sorusuna yanıt bulma merakı birleşince Tspell efsanesi 2004 yılında, kaldığı yerden hayatına devam etme şansı yakalamış. Lâkin Tspell'in kara bahtı yine yakasını bırakmamış; Tspell ismi, Türkçe ile ilgili bir kütüphanenin isminin Tspell olmasının kabul edilemezliğine takılmış, rivayete göre Karamanoğlu Mehmet Bey'in sesi duyulmuş: “tiz değiştiriniz”.
Projenin o dönemki takipçilerinden de gelen “kumkuma”, “ispinoz”, “poyraz”, “mavikedi”, “filinta”, “madrabaz”, “kerkenez”, “dilaver”, “tulumba”, “tantana”, “sebil”, “kelaynak”, “takatuka” gibi yaklaşık 30 isim önerisinin arasından Ganime Betül Akın'ın hakemliği ile Zemberek fotofinişi gören ilk isim olmuş (Zemberek'in başarılı olacağı henüz o günlerden belli imiş).
Pardus geliştiricilerinden bay Görkem Çetin'in -yine- uyku sorunları ile boğuştuğu bir gece, geliştiriciler, Görkem tarafından OpenOffice.org için zaten geliştirmeyi düşündükleri eklentiyi ivedilikle bitirmeye ikna edilmişler ve eklentiyi bir akşamda yazmışlar.
Bu dönem yaklaşık olarak Pardus çalışmalarının hız kazandığı, aynı zamanda Pardus ekibi olarak bizim, Mehmet Dündar Akın ile tanıştığımız kutlu döneme denk geliyor.
Daha sonrasında ise Mehmet'in, Barış Metin ile beraber yürüttüğü Pardus-Zemberek entegrasyonu çalışmaları meyvesini Pardus'un her noktasında Türkçe imla denetimi yapılabilmesini olanaklı hale getiren bir servisin hazırlanması ile verirken, Faik Uygur Thunderbird e-posta istemcisi ve Firefox web tarayıcısı ile de Zemberek'in çalışabilmesini sağlayan bir çalışmaya imza attı.
Zemberek projesinin en eziyetli bölümü 40-50 bin kelime içeren bir imla sözlüğünün içindeki 20 bin kelime kökünün tek tek seçilmesi, kelimelerin özelliklerinin “isim”, “fiil”, “sayı”, “edat” gibi etiketlenmesi oluşturmuş. Bunun üzerine yapılan diğer çalışmalar da eklendiği zaman çok daha net bir şekilde Zemberek'in uzun ve zahmetli bir çalışmanın ürünü olduğunu görüyorsunuz. İki ana geliştiricisinin farklı işlerde çalışıyor olması, projeye ayırdıkları vakti akşamlarından ve hafta sonlarından çaldıkları anlamına geliyor. Sanırım burası, yazı içerisinde geliştirme süreci boyunca gösterdikleri tolerans ve destek'ten ötürü Mehmet'in eşi Ganime Betül ve Ahmet'in eşi Madeline'e teşekkürlerimizi iletmek için en uygun yer oldu.
“Çabucak cırnaklarsa girmece, toparlacık beysbolunuzca kurumalı. Çalçene tezyifmişsiniz sivrilme, gürbüz kerrakesiyi yorgala. Küşat geçekli helmelerken, laçka sansüalizmi yasa. Depderin köçeğimsi heceleme, gelişkin molaslık sanrılayagel: tok ayşekadın böğüresice”
Bir uygulama ile ilgili bir yazıya, uygulamanın kendi ağzından bir post-modern şiir denemesi ile son vermekten daha keyifli ne olabilirdi, bilemiyorum (daha önce "şahane kriptolar sızacağım" demişliği de vardır, hastasıyız).
PS: Hepinizin hangisi olduğunu bildiğiniz müthiş paragraf için http://pisi.uludag.org.tr:8080/zemberek_web/ adresindeki web sayfamızdan faydalandım. Gidip oynamayın.



