[Çözüldü] Veri Madenciliği

Başlatan shigej38, 31 Temmuz 2019 - 10:30:06

« önceki - sonraki »

0 Üyeler ve 1 Ziyaretçi konuyu incelemekte.

shigej38

merhabalar arkadaşlar;
Elimde 2 adet cvs dosyası var a ve b diyelim. a csv dosyasında belli bir sütününü b csv dosyasının belli bir sütünü ile karşılaştırıp aynı bilgiyi içeren satırlarda ki 3 sütünün içerdiği bilgiyi a csv dosyasının içerisine yazdırmak istiyorum bunu nasıl yapabilirim?

szgnblt

Merhaba

Excel power pivot veya vlookup, düşeyara formüllerini incelerseniz yapabilirsiniz.
Veri 1milyon üzerinde ise SQL ile join işlemi performanslı olur.

shigej38

Sevgili [mention=648201]@szgnblt[/mention]:
düşey ara formülünü libre office 6.0 da deniyorum basit bir tablo yaptığım zaman 3 satır 5 sütün şeklinde istediğim veriyi çekiyorum fakat benim esas yapmak istediğim datada formül çalışmıyor
kullandığım förmülde bi yanlışlık mı var acaba?
=VLOOKUP(B2;$'Hastalık- Gen'.A2:C7398;3;0)
bu formülde B2 hücresinde basılı olan bir hastalığı ; hastalık-gen sayfasının A2 ile C7398 arasındaki tablonun ; 3. sütününda ki gen isimleri ; tamamen eşlesenleri vermesini istiyorum.
acaba aralığım mı çok fazla onun için mi çalışamıyor?

szgnblt

Formülde $ işareti ve a sütundan önceki nokta bana formül hatası gibi geldi. A2:C yaparsan en alta kadar sorun olmaz. Excel belgeni paylaşırsan xls olarak yardımcı olmaya çalışırım.

mhmtkrktr

[mention=648204]@shigej38[/mention] Tavsiye kabul edersen,
Sorularını kısa örneklerle belirtirsen, cevaplara daha net ve çabuk ulaşabilirsin. Örn.
Alıntı Yap2 cvs dosyam var.
a dosyası;
Alıntı Yapaaaa bbbb cccc ddddddd
aaaa bbbb eeee ddddddd
aaaa bbbb ffff ddddddd
aaaa bbbb gggg ddddddd

b dosyası;
Alıntı Yapaaaa bbbb hhhh ddddddd
aaaa bbbb cccc ddddddd
aaaa bbbb iiii ddddddd
aaaa bbbb jjjj ddddddd

Ben 3. sütun da aynı olan değerleri bulup, o satırın tamamını farklı bir dosyaya yazmak istiyorum.

Sonuç olarak istediğim;
Alıntı Yapaaaa bbbb cccc ddddddd

Gibi mesela.
Dosya içeriklerinin orjinal dosyadan alıntı olması gerekmez. Örneklediğim şekilde olabilir. Bu sayede yardımcı olmak isteyenler, soruyu anlamaya çalışmak yerine, çözmeye çalışmakla zaman harcarlar.

Dosya formatından da yola çıkarak, ofis formülleri ile yapılabiliyorsa ne âlâ. Yapılamaz ise, ihtiyacının açıklaması yönünde, bir şeyler yapmaya çalışırım.

shigej38

Sevgili [mention=648226]@mhmtkrktr[/mention] ve [mention=648219]@szgnblt[/mention]:
ilginiz için teşekkür ederim.

=VLOOKUP(B2;A2:C7398;3;0)

bu şekilde istediğime yakın sonuç alabildim ancak şöyle bi sorun var aynı hastalığa sebeb olan birden çok gen bulunduğu için benim datalarım içerisinde aynı değerlere sahip olan ancak sadece genleri ve kalıtım modelleri farklı olan bilgiler bulunuyor bu bilgilerden ilk gördüğünü alıyor bu formül ile diğer değerleri görmezden geliyor bunu aynı değere sahip olan bilgilerin gen ve kalıtım modellerini yan yana aynı satıra yazması da işimi görebilir diye düşünüyorum. ancak bunu calc fonksiyonları yöntemi ile yapmak mümkün olmayacaktır herhalde onun için bi script yazıp 2 dosyayı dediğim kriterlerde karşılaştırıp benzer olanları birleştirerek tek bi satıra yazmasını sağlamam gerekicek.

szgnblt

aynı hücreye bu veriyi yazmak biraz sıkıntılı.
linkte verdiğim şekilde sütunlara tek tek yazdırıp sonra =b3&"-"&c3 şeklinde birleştirebilirsin.

https://www.youtube.com/watch?v=knLkh65QdxQ

shigej38

Sevgili [mention=648230]@szgnblt[/mention]:
yardımların için çok teşekkür ederim ancak excel fonksiyonları ile yapılabilecek gibi birşey değil birbiri ile çakışık çok fazla veri var bunu ancak script ile yapabiliriz diye düşünüyorum, veriler hep biribiri ile bağlantılı bi gen birden çok hastalığa sebep olabildiği gibi bir hastalık birden çok genlede alakalı olabiliyor (örn. 22 gen kadar)

shigej38

Merhabalar arkadaşlar konunun çözümü için
Bu Konuya Bakabilirsiniz.