Yapay Zekanın Önemli Konularından Biriside Hiç şüphe yok ki Doğal Dil İşlemedir.Doğal Dil işleme Bilgisayar İnsan Etkileşimini kuran önemli dallardan birisidir.Gelecekte ki şuan Japonya da denenmekte insanlar şuanda ki gibi klavye gibi girdi birimlerine ihtiyaç Duymadan bilgisayarla iletişim kurabilecek böylelikle kullanım performansı ve kullanıcı performansı maksimum seviyeye gelecektir.

Ayrıca Şairler ve yazarlar eskisi gibi yazdıkları eserlerin başında günlerce kontrol edip acaba nerelerde yanlışlık vardır diyede beklemiyeceklerdir çünkü Doğal dil işlemeyle birlikte dili oluşturan etmenler yapılar ve kurallar bilgisayara öğretilecek böylece girilen bir metindeki söz dizimsel veya şekilsel hataları bilgisayar düzeltebilecektir.Doğal Dil işlemenin çeşitli alanları bulunmaktır.

  1. Ses Bilimi (Fonetik)
  2. Biçimbilim (Morfolojik)
  3. Sözdizim (Sentaks)
  4. Anlambilim (Semantik)

Biz Bu çalışmamızda Türkçe Bir kelimenin Morfolojik Analizini yapacağız Yani Verilen bir kelimeyi köküne ve eklerine Ayırma.

 

Morfolojik Analiz

Türkçe kelimelerin morfolojik analizi derken akla ilk gelen kelimenin yapısının belirlenmesidir. Kelimeyi tümden incelediğimizde kelimenin kök ve eklerden meydana geldiği görülür. Aynı şekilde kök ve eklerde kendi içlerinde türlere ayrılmıştır.

Türkçe sondan eklemeli bir yapıya sahiptir yani kelimenin saf hali kök ve kökten itibaren gelenlerse ek olarak ifade edilir. Tabi köke eklenen her bir ek bir önceki yapıdan ve kökten kısmen farklı bir anlam türetir.

Örneğin:Evimizdekilerden i köküne ve eklerine ayırırsak

Ev+i+miz+de+ki+ler+den şeklinde olacaktır.

Morfolojik Analizde 2 kısımda incelenecektir.

  1. Verilen Kelimeyi köküne Ayırma–> Kök Analizi
  2. Kelimeyi eklere Ayırma–>Ek Analizi

1.Kök Analizi

Türkçe bir Kelimenin kökünü bulabilmek için öncellikle Kök veritabanına ihtiyacamız olacaktır bunun için kendinize herhangi bir kök veritabanı oluşturabilirsiniz.Daha sonra girilen Bir kelimenin kökünü bulabilmek için Sağdan veya soldan başlayarak Kök veritabanındaki Köklerle girilen kelimemiz karşılaştırılır.

Ardından kök bulunduktan sonra sıra eklerin analizine geçilir yalnız burada bir sorun meydana gelecektir oda şudur ki bulduğumuz kök kelimenin gerçek kökü olmayabilir mesela kelimemiz ağaçlarımızın olsun kelimenin gerçek kökü ağaç olmasına rağmen örneğin veritabanımızda ağaç kökü olmasın veya ağaç kökü örneğin  ağ kökünden sonra gelirse program ağ kökünü gerçek gibi kabul edebilir.

İşte bu sırada Ek Analizi devreye girecek çünkü Türkçe bir kelimenin her bir kökün türüne göre ekler aynı zamanda da eklerinde çeşitlerine ve yapılarına bağlı olarak ardından bir ek zinciri oluşacaktır böylece kök analizi yaparken ek analizinide paralel olarak yürüteceğimizden bir sonraki adımda gerçek kök bulunmuş olacaktır.

2.Ek Analizi

Türkçe Kelimelerde Her bir kökten sonra gelebilecek ek kümeleri bellidir.Türkçede sayısı tam olarak bilinmemekle birlikte yaklaşık olarak 145 ek bulunmaktadır.İşte Türkçedeki ekler Aşağıdaki linktedir.

http://rapidshare.com/files/441294961/mehmet_salih_deveci.rar

Ayrıca Türkçede Herbir Ek’in Ardından Belirli bir ek kümesi ancak gelebilir.Şimdi Ben Herbir eki Dosya da bir satıra denk düşürüp o satırı da bir indis olarak ele aldım böylelikle her satırın bir numarası oluştu ardından her bir ek için bir zincir kullandım.

Örneğin:

123 80 10 20 12 0 12 45 87 23

76 43 23 24 89 90 56 67 54 32

21 15 89 57 35 89 98 46 88 12

………………………………………

………………………………………

………………………………………

………………………………………

45 34 12 87 98 114 134 99 34

12 15 17 85 81 64 12 32 11 10

Yukarıda örnek olarak verilen her bir zincir dosyada kendisine karşı düşen ek e ait bir zincirdir.Zincirde ki her bir numara ek dosyasında kullanılan eklerin dosyadaki indis numarasıdır.Örneğin zincirin ilk satırında ki ilk numara olan 123 ek dosyasında 123.indise karşı düşen ektir.

 

MEHMET SALİH DEVECİ

BİLGİSAYAR MÜHENDİSİ

BU ÇALIŞMAYI İSTEYENLER BANA ULAŞABİLİR AYRICA ANLAŞILMAYAN YERLERİ SORABİLİRSİNİZ MEMNUNİYETLE CEVAPLARIM.

Reklamlar
yorum
  1. Murat Odemis dedi ki:

    çalışmaya ulaşabilmem mümkün mü, algoritma ve kaynak anlamında çok işime yarayacak, iyi akşamlar

    mail : recknet@gmail.com

  2. Derya Dilhun Hacıkulaoğlu dedi ki:

    Merhaba,
    Bazı ürünlerimize gelişmiş Türkçe linguistik destek eklemek için böyle bir yazılıma ihtiyacımız var. Bu konuda sizinle iletişim kurmak isterim.

  3. murat dedi ki:

    merhaba bizim okulda birprojemiz var bu projede sesi sayısal bir veriye çevirmeye çalışıyoruz ama internettte kaynak bulamadık acaba yardımcı olabilir misiniz?Bunu nasıl yapabiliriz?

    • BİLGİSAYAR MÜHENDİSİ dedi ki:

      Dostum bunun için aslında çokça kaynak var ama demek ki sen ingilizce araştırmıyon… Eğer borland builderda yazılmış C++ kodları lazımsa sana gönderebilirim… C# la gerçeklenmesi felanda C#nedir.com da var ordan bakabilirsin…!! Sesi sayısala çevirmek çok zor değil sadece gelen bufferda ki bilgileri örnekleyip quantalayacaksın ordan sayısal verileri elde ediceksin…

  4. Ahmet KAN dedi ki:

    Sayın bilgisayar Mühendisi;
    vermiş olduğunuz linkin içerisindeki dosyalara ulaşmam hayati önem taşımaktadır. Linki yenilemenizi veya linkte belirttiğiniz dosyayı yahut söz ettiğiniz ek zincir kombinasyonlarını bana iletmenizi sizden rica ederim.
    e – posta : lord_of_tigers@windowslive.com
    Şimdiden teşekkür eder çalışmalarınız da başarılarınız devamını canı gönülden dilerim.
    İyi günler…

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Google+ fotoğrafı

Google+ hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Connecting to %s