[Çözüldü] Bir kelimeyi tüm pdf vb dosyalarda aratmak için yazılım

Başlatan attila, 29 Mayıs 2011 - 18:37:38

« önceki - sonraki »

0 Üyeler ve 1 Ziyaretçi konuyu incelemekte.

attila

Bulmak istediğim bir kelimeyi sistemdeki tüm metin dosyalarında aratabileceğim pdf destekli bir yazılıma ihtiyacım var ama bulamadım. Genellikle dosya ismine göre arama yapan yazılımlar var ama bana metnin içinde arama yapan bir şey lazım. Bilgisi olan arkadaşlar yardımcı olursa sevinirim.

empax

Soyle bir sey buldum ama daha once hic denemedim.
Resimde goruldugu gibi gcc.pdf isimli dosyanin icinde gecen "new" kelimesi bulunmus.




http://desktop.google.com/linux/


Mesaj tekrarı yüzünden mesajınız birleştirildi. Bu mesajın gönderim tarihi : 29 Mayıs 2011 - 18:59:02

Bu isi bir de komutla yapmak mumkunmus.

Alıntı YapLINUX üzerinde find komutu ile dosyalar içinde arama yapabilirsiniz, alt dizinleri de dahil eden bu arama yöntemi için:
find komutu ile
find . -iname '*conf' | xargs grep 'kelime' -sl

-iname '*conf' bölümü aramanın sadece conf dosyalarında yapılacağını belirtir,
-iname '*' yazmanız durumunda tüm dosyalarda arama yapılacaktır.
grep 'kelime' ise aranacak sözcüğün "kelime" olduğunu belirtir.

http://www.veriportal.com/linux-yardim/linux-dosyalar-icinde-arama-yapmak
بسم الله الرحمن الرحيم
|ACEMİLER İÇİN İLK DURAK|Çözüldü|Kod etiketi|

attila

Google desktop kullanmaktan özenle kaçınıyorum. Ne kadar doğru bir yaklaşım bilmiyorum ama bana güvenilir gelmiyor. Yani tüm bilgilerinizi muhtemelen başka bir kaynakla bağlantılı bir programa tanıtmak kuşkulandırıyor beni. Sanırım bahsedilen diğer yöntemi denesem daha iyi olacak.

İlginiz için de teşekkür ederim.

empax

Belki ikinci verdigim yontem ile alakali bir betik vardir. Yoksa yararli bir uygulama olacagindan ilgililere duyrulur.   :)
بسم الله الرحمن الرحيم
|ACEMİLER İÇİN İLK DURAK|Çözüldü|Kod etiketi|

heartsmagic

Google Desktop gibi arayüze sahip bir başka uygulama var mıdır bilemiyorum, fakat eğer illa uygulama arayüze sahip olsun demiyorsan bu arama işini de sık sık yapmam diyorsan uçbirim üzerinden yöntemlere bakabilirsin.

Öncelikle "pdf vb.." demişsin başlıkta. vb ifadesi geniş bir ifade olduğu için öncelikle buradan başlamak istiyorum. grep birçok dosya üzerinde arama yapabilir, haricen bir uygulamaya ihtiyacın yok.

grep aranacak_şey * dersen bulunduğun dizin içindeki tüm dosyalarda aranacak_şey kelimesi aranır.

Fakat senin sorun PDF dosyaları üzerineyse bu yol işe yaramaz zira PDF'ler ikilik dosyalar. Depodaysa pdfgrep isimli bir uygulama mevcut, güzelce yapıyor işini.

pdfgrep aranacak_şey *.pdf

@empax, senin verdiğin yöntem sanırım yine PDF dosyalarında iş görmeyecektir.
Hayattan çıkarı olmayanların, ölümden de çıkarı olmayacaktır.
Hayatlarıyla yanlış olanların ölümleriyle doğru olmalarına imkân var mıdır?


Böylece yalan, dünyanın düzenine dönüştürülüyor.

empax

Deneyimli olan sizsiniz @heartsmagic. Duzeltme icin tesekkurler.  :)
بسم الله الرحمن الرحيم
|ACEMİLER İÇİN İLK DURAK|Çözüldü|Kod etiketi|

attila

@heartsmagic pdf için önerdiğin uygulamayı denedim; işe yarıyor. grep komutu ile de diğer dosyalarda arama yapabildim.

Aslında mesele elimde pek çok makale olması ve bunlar ya pdf formatında ya da mic word docx formatında. grep komutu maalesef docx uzantılı dosyaları görmüyor. bununla ilgili bir öneriniz var mı?

Jaguar

Pdf dosyaları için bir başka çözümde, Adobe Acrobat Reader üzerinden Ctrl+Shift+F kısayolu ile ulaşabileceğimiz arama ekranı üzerinde belirtecegiz klasördeki tüm pdf dosyaları içerisinde arama yapabilirsiniz.

heartsmagic

Alıntı yapılan: attila - 01 Haziran 2011 - 00:56:16
@heartsmagic pdf için önerdiğin uygulamayı denedim; işe yarıyor. grep komutu ile de diğer dosyalarda arama yapabildim.

Aslında mesele elimde pek çok makale olması ve bunlar ya pdf formatında ya da mic word docx formatında. grep komutu maalesef docx uzantılı dosyaları görmüyor. bununla ilgili bir öneriniz var mı?

Docx çok ayrı bir yapıda, doc mesela kolay fakat docx sıkıştırılmış (Zip) dosya biçiminde görünmekte ve doğrudan grep ile ele almak çok zor gibi. Biraz bakındım xgrep isminde xml dosyaları süzebilen bir uygulama mevcut.

unzip -p falanca.docx | xgrep falanca ile denedim fakat xml yapısından şikayet ediyor. Bakınmak gerekiyor ne yazık ki bunun için.
Hayattan çıkarı olmayanların, ölümden de çıkarı olmayacaktır.
Hayatlarıyla yanlış olanların ölümleriyle doğru olmalarına imkân var mıdır?


Böylece yalan, dünyanın düzenine dönüştürülüyor.

attila