16 Ekim 2014 Perşembe

Hadoop Konfigürasyon Ayarları

Hadoop da konfigürasyonlar Configuration sınıfı üzerinden yönetilir. Konfigürasyonlar sisteme xml dosyaları şeklinde import edilebilir. Bunun için farklı yöntemler mevcut.

  • Bu dosyaları kendimiz ayrıştırabileceğimiz gibi GenericOptionsParse sınıfı ile de ayrıştırma işlemi yapılabilir.
  • xml dosyalarının ayrıştırılması ve job ların başlatılması gibi işlemleri soyutlamak için Tool ve ToolRunner sınıfları bulunmakta. Bu sınıfları kullanarak kodlama yapıldığında konfigürasyon dosyalarıdaki parametreler otomatik olarak yüklenmekte ve job'lar çalıştırılmaktadır.
  • Birden çok xml dosyası konfigürasyon ayarları için kodsal olarak eklenebilmektedir: 

    • Configuration.addDefaultResource("hdfs-default.xml");
    • Configuration.addDefaultResource("hdfs-site.xml");
    • Configuration.addDefaultResource("mapred-default.xml");
    • Configuration.addDefaultResource("mapred-site.xml");

  • Konfigürasyon dosyaları job çalıştırılırken komut satırından da eklenebilmektedir:
    • -conf filename
  • Konfigürasyon dosyalarında aynı parametreler var ise en son yüklenen dosyadaki parametre diğerlerini ezmektedir.


  • Bir paremetrenin hiç bir zaman başka değerler ile eilmemesini istiyor isek bu parametrede <final>true</final> özelliği eklenmelidir.
  • Konfigürasyon parametreleri jon çalıştırılırken komut satırından da verilebilmektedir. Bu şekilde ayarlanan parametrelerin önceden aynı isimde tanımlanmış olan değerlere göre önceliği vardır:
    • HADOOP_OPTS="-Dmapred.reduce.tasks=10"

Hiç yorum yok:

Yorum Gönder