Gönderen Konu: Ahmet A. Akın: Zemberek-NLP 0.9.0  (Okunma sayısı 5433 defa)

0 Üye ve 1 Ziyaretçi konuyu incelemekte.

Çevrimdışı fortran

  • Forum Gurusu
  • *****
  • İleti: 1.671
  • Bir insanı sevmekle başlar her şey...
    • get GNU
Ahmet A. Akın: Zemberek-NLP 0.9.0
« : 01 Ocak 2014, 11:15:46 öö »
Zemberek-NLP 0.9.0 karasız sürümünü çıkardık. Bazı notlar:

    Zemberek projesinin adı artık Zemberek-NLP. Projenin yeni evi github (https://github.com/ahmetaa/zemberek-nlp)
    Bu kararsız bir sürümdür. 1.0.0 sürümüne kadar her türlü değişik olabilir.
    Yapısal çözümleme ve üretim konularında pek çok hata yapabilir. 1.0.0'a kadar bu hatalar temizlenecek.
    Belirsizlik giderici iyi işlemiyor (Kullanılabilir bile diyemeyiz). Bu konuda düşüncelelerimiz var çaba göstereceğiz.
    Örnek kodlar için https://github.com/ahmetaa/turkish-nlp-examples projesini indirip pom.xml dosyasını Intellij IDEA ya da Eclipse ile açıp çalıştırabilirsiniz. Ya da Git-hub üzerinden kod incelenebilir.
    Ayrıca bağımsız bir uygulama için jar dosyalarına ve bağımlı olduğu kütüphanelere gtihub üzerinden ya da Google Drive dizininden erişilebilir.
    Başka dillerden çözümleme yapma konusunda henüz çalışma yapmadık.
    En az Java 7 ile çalışır.

Projeye istediğimiz zamanı ayıramadık, ayıramıyoruz. Bu projenin durduğu anlamına gelmiyor elbette. Elimizden geldiğince devam ettirmeye niyetimiz var. Sadece zamanlar konusunda söz veremiyoruz. Geçen onca yıl içerisinde bu konuda başka çalışmalar da yapıldı. Örneğin zemebrek-NLP projesine de ciddi katkıda bulunan Ali Ok arkadaşımız daha kaliteli kod yapısına sahip olan ve daha iyi çözümleme yaptığına inandığım https://github.com/aliok/trnltk-java projesini de kısa bir süre içerisinde gerçekleştirdi. Başka bir kütüphane ise Çağrı Çöltekin tarafından yazılan https://github.com/coltekin/TRmorph . Kemal Oflazer hocamızın çözümleyicisi ve Haşim Sak'ın çözümleme ye belirsizlik gidericisi yine alternatif olarak kullanılabilir (Açık kodlu olmasa da akademik amaçla kullanılabiliyor.)

Farklı uygulama ve işletim sistemi entegrasyon konusunda çalışma yapmadık. Daha önceden bu konuda emek harcayan arkadaşlarımız (Serkan Kaba ve Zeki Bildirici gibi) oldu, kararlı 1.0.0 sürümü sonrasında bu konuda başka arkadaşlar bir şeyler yapacaktır diye umuyoruz. Yine de belki C tabanlı TRMorph gibi bir projenin bu tür uygulamalara koyulması daha kolay olabilir.

Şahsım adına konuşursam,
Projede daha çok eksik-hata olmasına rağmen ilerleme kousunda itici güç olacağı düşüncesi ile bu sürümü çıkarmak istedim. 2013'ün son dakikalarına yetişti. Projenin pek çok yerinin tekrar yazılması gerekebilir. Orta vadede hedefim çözümleyici mekanizmasını tekrar elden geçirip hatalarını gidermek ve %90 üstü bir başarı ile işleyen bir belirsizlik giderici yapmak ve testleri tamamlamak. Projeye kod yardımı yapmak isteyen arkadaşlara her zaman kapımız açık ancak bunun için 1.0.0'ı  beklemenin daha uygun olacağını düşünüyorum.

zembereknlp.blogspot.com