Є кілька функцій, які роблять HDFS особливо корисним, зокрема такі:

  • Тиражування даних. Реплікація даних забезпечує постійну доступність даних і запобігає втраті даних. …
  • Відмовостійкість і надійність. …
  • Висока доступність. …
  • Масштабованість. …
  • Висока пропускна здатність. …
  • Локальність даних. …
  • моментальні знімки.

Розподілена файлова система Hadoop (HDFS). файлова система, яка керує великими наборами даних, які можуть працювати на звичайному обладнанні. HDFS є найпопулярнішою системою зберігання даних для Hadoop, і її можна використовувати для масштабування одного кластера Apache Hadoop до сотень і навіть тисяч вузлів.

Варіант С (запобігти видаленню даних) не є метою HDFS. Завданнями HDFS є усунення збоїв апаратного забезпечення та відновлення, ефективна обробка наборів даних і забезпечення високої пропускної здатності мережі для переміщення даних.

Файлова система HDFS складається з набір основних служб (NameNode, вторинний NameNode і DataNodes). NameNode і вторинний NameNode керують метаданими HDFS.

Hadoop складається переважно з 3 компонентів.

  • HDFS (розподілена файлова система Hadoop): HDFS працює як рівень зберігання в Hadoop. …
  • MapReduce: MapReduce працює як рівень обробки в Hadoop. …
  • YARN (ще один переговорник щодо ресурсів): YARN — це рівень планування завдань і керування ресурсами в Hadoop.