Є кілька функцій, які роблять HDFS особливо корисним, зокрема такі:
- Тиражування даних. Реплікація даних забезпечує постійну доступність даних і запобігає втраті даних. …
- Відмовостійкість і надійність. …
- Висока доступність. …
- Масштабованість. …
- Висока пропускна здатність. …
- Локальність даних. …
- моментальні знімки.
Розподілена файлова система Hadoop (HDFS). файлова система, яка керує великими наборами даних, які можуть працювати на звичайному обладнанні. HDFS є найпопулярнішою системою зберігання даних для Hadoop, і її можна використовувати для масштабування одного кластера Apache Hadoop до сотень і навіть тисяч вузлів.
Варіант С (запобігти видаленню даних) не є метою HDFS. Завданнями HDFS є усунення збоїв апаратного забезпечення та відновлення, ефективна обробка наборів даних і забезпечення високої пропускної здатності мережі для переміщення даних.
Файлова система HDFS складається з набір основних служб (NameNode, вторинний NameNode і DataNodes). NameNode і вторинний NameNode керують метаданими HDFS.
Hadoop складається переважно з 3 компонентів.
- HDFS (розподілена файлова система Hadoop): HDFS працює як рівень зберігання в Hadoop. …
- MapReduce: MapReduce працює як рівень обробки в Hadoop. …
- YARN (ще один переговорник щодо ресурсів): YARN — це рівень планування завдань і керування ресурсами в Hadoop.