Cara Mengatur Ketersediaan Tinggi untuk Namenode - Bagian 5


Hadoop memiliki dua komponen inti yaitu HDFS dan YARN. HDFS untuk menyimpan Data, YARN untuk memproses Data. HDFS adalah Sistem File Terdistribusi Hadoop, yang memiliki Namenode sebagai Layanan Utama dan Datanode sebagai Layanan Budak.

Namenode adalah komponen penting dari Hadoop yang menyimpan metadata data yang disimpan di HDFS. Jika Namenode mati, seluruh cluster tidak akan dapat diakses, ini adalah satu-satunya titik kegagalan (SPOF). Jadi, lingkungan produksi akan memiliki Ketersediaan Tinggi Namenode untuk menghindari penghentian produksi jika salah satu Namenode mati karena berbagai alasan seperti kerusakan mesin, aktivitas pemeliharaan yang direncanakan, dll.

Hadoop 2.x memberikan kemungkinan di mana kita dapat memiliki dua Namenode, satu akan menjadi Namanode Aktif dan yang lainnya akan menjadi Namanode Siaga.

  • Namanode Aktif – Ia mengelola semua operasi klien.
  • Namanode Siaga – Ini mubazir dari Namanode Aktif. Jika NN Aktif tidak berfungsi, maka NN Siaga akan mengambil alih seluruh tanggung jawab NN Aktif.

Mengaktifkan Ketersediaan Tinggi Namenode memerlukan Zookeeper yang wajib untuk failover otomatis. ZKFC (Zookeeper Failover Controller) adalah klien Zookeeper yang digunakan untuk mempertahankan status Namenode.

Persyaratan

  • Praktik Terbaik untuk Menerapkan Server Hadoop di CentOS/RHEL 7 – Bagian 1
  • Menyiapkan Prasyarat Hadoop dan Penguatan Keamanan – Bagian 2
  • Cara Install dan Konfigurasi Cloudera Manager di CentOS/RHEL 7 – Part 3
  • Cara Install CDH dan Konfigurasi Service Placement di CentOS/RHEL 7 – Part 4

Pada artikel ini, kami akan mengaktifkan Ketersediaan Tinggi Namenode di Cloudera Manager.

Langkah 1: Instalasi Zookeeper

1. Masuk ke Cloudera Manager.

http://Your-IP:7180/cmf/home

2. Pada perintah tindakan Kluster (tecmint), pilih “Tambahkan Layanan ”.

3. Pilih layanan “Penjaga Kebun Binatang ”.

4. Pilih server di mana kita akan memasang Zookeeper.

5. Kami akan memiliki 3 Penjaga Kebun Binatang untuk membentuk Kuorum Penjaga Kebun Binatang. Pilih server seperti yang disebutkan di bawah ini.

6. Konfigurasikan properti Zookeeper, di sini kita memiliki properti default. Secara real-time, Anda harus memiliki direktori/titik pemasangan terpisah untuk menyimpan data Zookeeper. Di Bagian-1, kami telah menjelaskan tentang konfigurasi penyimpanan untuk setiap layanan. Klik 'lanjutkan' untuk melanjutkan.

7. Instalasi akan dimulai, setelah diinstal Zookeeper akan dimulai. Anda dapat melihat operasi latar belakang di sini.

8. Setelah berhasil menyelesaikan langkah di atas, Status akan menjadi 'Selesai'.

9. Sekarang, Zookeeper berhasil Diinstal dan Dikonfigurasi. Klik 'Selesai'.

10. Anda dapat melihat layanan Zookeeper di Dasbor Cloudera Manager.

Langkah 2: Mengaktifkan Ketersediaan Tinggi Namenode

11. Buka Cloudera Manager –> HDFS –> Tindakan –> Aktifkan Ketersediaan Tinggi.

12. Masukkan Nama Layanan Nama sebagai “layanan nama1 ” – Ini adalah Namespace umum untuk Namenode Aktif dan siaga.

13. Pilih Namanode Kedua di mana kita akan memiliki Namanode siaga.

14. Di sini kita memilih master2.linux-console.net untuk Namenode siaga.

15. Pilih node Journal, ini adalah layanan wajib untuk menyinkronkan Active dan Standby Namenode.

16. Kami membuat Jurnal Kuorum dengan menempatkan node Jurnal di 3 server seperti yang disebutkan di bawah ini. Pilih 3 server dan klik 'OK'.

17. Klik 'Lanjutkan' untuk melanjutkan.

18. Masukkan jalur direktori Journal Node. Hanya saja kita perlu menyebutkan jalur saat menginstal direktori ini akan secara otomatis dibuat oleh layanan itu sendiri. Kami menyebutnya sebagai '/jn'. Klik 'Lanjutkan' untuk melanjutkan.

19. Ini akan mulai mengaktifkan Ketersediaan Tinggi.

20. Setelah menyelesaikan semua proses latar belakang, kita akan mendapatkan Status 'Selesai'.

21. Terakhir, kita akan mendapat notifikasi 'Berhasil mengaktifkan Ketersediaan Tinggi'. Klik ‘Selesai’.

22. Verifikasi Nama Kode Aktif dan Siaga dengan membuka Cloudera Manager –> HDFS –> Instance.

23. Di sini, Anda dapat menggunakan dua Namenode, satu akan berada dalam status 'Aktif' dan satu lagi akan berada dalam status 'Siaga ' negara bagian.

Kesimpulan

Pada artikel ini, kami telah melalui proses langkah demi langkah untuk mengaktifkan Ketersediaan Tinggi Namenode. Sangat disarankan untuk memiliki Ketersediaan Tinggi Namenode di semua cluster dalam lingkungan real-time. Silakan sampaikan keraguan Anda jika Anda menghadapi kesalahan saat melakukan proses ini. Kita akan melihat Ketersediaan Tinggi Resource Manager di artikel berikutnya.