Talend blog serimize “Bileşenleri mappingimize hangi yollarla ekleyebiliriz ve bu yollar arasındaki farklar nelerdir; Metadata menüsüne neden ihtiyaç duyuyoruz” konusuyla devam ediyoruz.
Talend Studio’yu açtığımızda karşımıza çıkan ekranı bir önceki yazımızda incelemiştik. Şimdi ise işlerimize bileşenlerimizi nasıl eklediğimizi detaylandıralım. Sağ taraftaki “palette” menüsünde Talend Studio’da yer alan tüm bileşenleri belli kategoriler altında görüntüleyebiliriz. Örneğin bigdata’da kullanışlı olan bileşenler Big Data altında, excel,csv gibi dosyalar ile çalışırken kullanabileceğimiz bileşenler File altında, Veri kalitesi için özelleşmiş olanlar ise DataQuality altında yer alıyor.
Örneğin File kategorisine bakarsak, altında bir kaç tane daha alt kategori olduğunu ve bileşenlerin yine özelliklerine göre gruplanarak
gösterildiğini söyleyebiliriz. Input sekmesinde okumak için kullanabileceğimiz tüm dosya tipleri yer alıyor. Excel, csv, Xml, Json bunlardan sadece bir kaç tanesi..
Tabi ki bu kadar çok seçenek arasında kaybolmamamız için bir arama butonu da en üstte yer alıyor. Dilediğiniz bileşeni yazarak listede bulma sürenizi kısaltabilir ya da örneğin sadece “input” yazıp filtreleyerek gelen sonuçlar arasında seçeneklerinizi görüp hangisini kullanmak istediğinizi karar verebilirsiniz.
Gelelim bunları nasıl kullandığımıza,
Evet, ilk aklınıza gelen! Tabi ki ilk yöntemimiz bir çok araçta yer alan “sürükle- bırak” metodu. Palette üzerinde seçtiğiniz herhangi bir bileşeni sürükleyip designer’da dilediğiniz bir yere bırakabilirsiniz. Component sekmesinde yer alan ayarları yaptığınızda kullanıma hazır olacaktır.
İkinci yöntem ise sürükle-bıraktan daha kolay, daha hızlı bir metod. Tek yapmanız gereken Designer’da dilediğiniz bir yere mouse’unuz ile bir kere tıklayarak kullanmak istediğiniz bileşenin adını yazmaya başlamak. Sonrasında açılan sayfadan bileşeninizi seçebilirsiniz. Yine aynı şekilde input yazmaya başlarsanız açılan ekranda tüm input bileşenleri listelenecek ve bunlar arasında seçim yapabileceksiniz.
Son yöntemimiz ise bileşenlerin tamamı için değil, input ve output özelinde. Bir dosyayı/tabloyu okumak ya da o dosyaya/tabloya yazmak istediğimizde yukarıda anlattığım gibi Palette alanından ilgili bileşenleri sürükleyip bırakabiliriz. Sonrasında Component bölümünde dosya/tabloya ait gerekli bilgileri yazarak kullanıma hazır hale getirebiliriz.
Örneğin sürükleyip bıraktığımız bu csv okuyan bileşene aşağıdaki alanda dosya yolu belirttikten ve genel ayarları düzenledikten sonra kullanıma hazır hale getiriyoruz.
Fakat bu tercih etmediğimiz yöntem. Çünkü bu şekilde yaptığımızda, tanımlanan dosya/tablo sadece bu job içerisinde kullanılabiliyor. Farklı bir job içerisinde aynı veriye ihtiyaç duyduğumuzda ise en baştan bileşeni sürükleyip tüm tanımlamaları her seferinde yeniden yapmamız gerekiyor.
Dosya/tablo bilgilerinde herhangi bir değişiklik olduğunu ve içerisinde kullanılan tüm joblarda, bileşenin tek tek düzenlenmesi gerektiğini hayal edebiliyor musunuz?
İşte bu yüzden tavsiye edilen kullanım soldaki repository menüsünde göreceğiniz Metadata sekmesinin kullanımıdır. Burada tekrar tekrar kullanabileceğimiz tüm kaynaklar Talend’in kendi repository’sinde tutulur ve gerekli tanımlamalar 1 kez yapılıp içeri alındıktan sonra kullanıma hazırdır. Değişiklik gerektiğinde ise sadece burada yaptığınız güncelleme sonrasında, ilgili tüm joblar otomatik olarak güncellenir.
Yine kullanım alanlarına göre gruplandırılmış, kolay okunabilir bir menü tasarımı mevcut. Veritabanından alacağınız tüm tablolar için tanımlanacak bağlantılar “DB Connections”, excelleriniz “File Excel”, csv’leriniz “File delimited” altında görünür. Yine Bigdata, bulut, Nosql ortamları için ayrı ayrı, çeşitli bir çok gruplama olduğunu görebilirsiniz.
Burada gerekli tanımları oluşturduktan sonra ise hangi job içerisinde kullanacaksanız artık özgürsünüz; sadece sürükleyip bırakın!