SCAN : Metin dosyaları için Java tabanlı etiketleme programı

Başlatan attila, 01 Eylül 2011 - 03:37:11

« önceki - sonraki »

0 Üyeler ve 1 Ziyaretçi konuyu incelemekte.

attila

Metin dosyalarını etiketlemek için forumda bir yazılım isteğinde bulunduktan sonra etiket düzenleme amaçlı yazılımların medya dosyalarına ağırlık verdiğini görmüş ve metin içeriğini de dikkate alan bir yazılım isteğim sonuçsuz kalmıştı. Neyse ki arayan buluyor!

SCAN

Program txt, html, htm, xml, xhtml uzantılarını öntanımlı olarak tanırken pdf, MS Office ve odt uzantılarını ise yazılımın arayüzünden kolaylıkla yüklenebilen eklentilerle tanıyıp işleyebiliyor.  Sadece dosya bilgilerini değil aynı zamanda metin içeriklerini de tarayıp indeksleme özelliği sayesinde aslında bir metin içi arama programı olmaya da yakın ancak bu içerik taramasını başka bir amaçla yapıyor; aşağıda değineceğim. Yazılım öncelikle belirlenen klasör ve alt klasörleri indeksliyor ve herbiri hakkında genel bir bilgi dökümü gösteriyor:




Metin içeriklerini ne yaptığına gelrsek, belirlenen kriterler doğrultusunda döküman içindeki kavramları otomatik  olarak ilgili dosyanın etiketi olarak belirliyor. Otamatik etiketlerin belirlenme kriterleri; dosya başına kaç etiket kullanılacağı, etiket seçiminin hangi düzeyde spesifik kelimelerden oluşacağı vb. ayarlar kullanıcı tarafından ihtiyaca göre düzenlenebiliyor. Baştaki genel indeksleme sonrasında Collection menüsü altında bulunan Autotag Location sekmesi ile otomatik etiketlemede dosya başına kaç etiket istendiği belirlenip indekslenmiş tüm dosyalar için otomatik etiketler atayabiliyorsunuz.  Örnek bir otomatik etiketleme sonucu şu şekilde görünüyor,



Örnekte görüldüğü üzere sol taraftaki temel kolonda Tags başlığı altında programın atadığı tüm etiketler görülebiliyor ve hemen yanında da bu etikete sahip dosyalar listeleniyor. Benim örneğimde sol tarafta 'spinoza' etiketi seçilmiş durumda ve sağ panelde ilgili dosyalar listeleniyor. Dikkat edilirse listelenen dosyaların beş etiketi var çünkü ben o şekilde ayarladım. Siz dilerseniz bu sayıyı 1 ile 10 arasında değiştirebilirsiniz. Bu değişikliği isterseniz tüm dosyalarda yukarıda bahsettiğim Autotag Location sekmesi ile ya da sadece dilediğiniz dosyalar için manuel olarak ilgili dosyaya sağ tıklayıp Edit document tags sekmesine gelerek aşağıdaki pencere örneğinde görüldüğü gibi yapabilirsiniz,



Üstteki pencerede isterseniz altta iri harflerle yer alan ve yazılımın önerilerinden oluşan kavramlardan, isterseniz üst kısımda yer alan küçük yazılmış ve dosya içindeki hemen her kavramın alfabetik olarak listelendiği kısımdan seçim yaparak dosyaya yeni etiket atayabilirsiniz. Diğer taraftan isterseniz dosyada bulunmayan bir kavramı da en üstteki satıra elle girebilirsiniz.

Etiketler dışında dosyalar için kısa notlar girebilir ve bu notları da panelde dosya adı ve etiketleriyle birlikte görüntüleyebilirsiniz. Bilgi ekranında etiket ve not dışında yazar, tarih, dosya boyutu ve daha fazla ayrıntıyı listelemek için View menüsü Columns sekmesinden iligili sütunları ekleyip çıkarabilir, sürükleyerek sütunların yerlerini değiştirebilirsiniz.

Son olarak yazılımın bir başka özelliği de görsel etiket şeması oluşturarak kullanıcının ilgili etiketler arasında kolayca dolaşabilmesini sağlamasıdır. Soldaki ana konsolda en altta yer alan TagCulusturMap bölümüne geldiğimizde yine tüm etiketlerin sıralandığı paneli ve yanında da etiket şemasının yer alacağı paneli görüyoruz. Etiketlerden birini seçtiğimizde yan panelde şu örnekteki gibi bir şema oluşacaktır,



Sol tarafta sanatsal etiketini seçtiğim için şemanın merkezinde bu etiket yer alıyor, sarı noktalar ise dosyalar; üzerlerine geldiğinizde dosya ismi ve özet bilgilerini görebilirsiniz. Şema, sanatsal etiketine sahip diğer dosya ve onların bağlantılı etiketleriyle genişleyerek yayılıyor. Seçtiğiniz etikete göre daha kapsamlı görsel etiket ağaçları, şemaları oluşturmak mümkün. Örneğin,



Büyük şemalarda etiket ve dosyalar ilk başta karmaşık görünse de üst panelden büyüklük ayarlarını yaparak ve şemadaki etiket dallarını sürükleyip yerleştirerek kullanışlı şemalar oluşturabilirsiniz. Oluşturulan şemaları png ya da html olarak dışarı aktarıp kaydedebilirsiniz.

Bahsettiğim dosyalar dışında, ben denemedim ancak birkaç eklenti ile mail, bookmarks ve RSS metinlerini de yazılımın indeksine dahil edip üzerinde çalışabilirsiniz. Web syafaları için de benzer bir eklenti mevcut ancak denemediğim için * bir şey söyleyemiyorum.

Yazılımı indirmek için, http://scan.sourceforge.net/ adresini ziyaret edebilirsiniz.

Not: En az Java 5.0 sisteminizde kurulu olmalıdır. İndirilen arşivden çıkan klasör altında yer alan scan.sh dosyasını erişim hakları sekmesinden, bir program gibi çalışmasına izin ver kısmını işaretledikten sonra çift tıklayarak yazılımı çalıştırabilirsiniz.

Eklentileri Tools menüsü altında bulunan Manage plugins sekmesi ile açılan pencereden kolayca edinebilirsiniz. Aktif olmaları için programın yeniden başlatılması gerekiyor.

Daha işlevsel bir çalışma ortamı için faydalı olmasını umarım.

heartsmagic

@attila, senin bu sorma, arama, bulma ve tanıtma azmini takdir ediyorum gerçekten :)
Bu ara olduğunu düşünmediğim halde bu kadar kapsamlı bir uygulamanın varlığını görmek sevindirdi beni.
Hayattan çıkarı olmayanların, ölümden de çıkarı olmayacaktır.
Hayatlarıyla yanlış olanların ölümleriyle doğru olmalarına imkân var mıdır?


Böylece yalan, dünyanın düzenine dönüştürülüyor.

attila

@heartsmagic, rica ederim ve tabii teşekkür ederim.

Çalışma ortamını mümkün olduğunca kullanışlı hale getirmeye çalışıyorum; forumdan ve sizden edindiklerimin bir kısmı geri dönsün istedim.


eribol

Büyük bir hayranlıkla takip ediyorum. Teşekkürler bu detaylı inceleme ve tanıtım yazısı için.

umutubuntu