چگونه بومی سازی داده ها در Hadoop به دست می آید؟
چگونه بومی سازی داده ها در Hadoop به دست می آید؟

تصویری: چگونه بومی سازی داده ها در Hadoop به دست می آید؟

تصویری: چگونه بومی سازی داده ها در Hadoop به دست می آید؟
تصویری: ارزش پنهان مهاجرت هادوپ 2024, نوامبر
Anonim

بومی سازی داده ها که در هادوپ . نمونه Wordcount را در نظر بگیرید، جایی که بیشتر کلمات به مدت 5 Lac یا بیشتر تکرار شده است. در این صورت پس از مرحله Mapper، هر خروجی نقشه‌بردار دارای کلماتی در محدوده 5 Lacs خواهد بود. این فرآیند کامل ذخیره سازی خروجی Mapper در LFS نامیده می شود محلی سازی داده ها.

با در نظر گرفتن این موضوع، بومی سازی داده ها در Hadoop چیست؟

مفهومی از داده ها محل در داده هادوپ محل در MapReduce به توانایی انتقال محاسبات به محل واقعی اشاره دارد داده ها به جای حرکت بزرگ، روی گره قرار دارد داده ها به محاسبات این امر تراکم شبکه را به حداقل می رساند و توان عملیاتی کلی سیستم را افزایش می دهد.

همچنین، داده های بزرگ چگونه ذخیره می شوند؟ اکثر مردم به طور خودکار HDFS یا سیستم فایل توزیع شده Hadoop را با Hadoop مرتبط می کنند داده ها انبارها HDFS اطلاعات را در خوشه هایی که از بلوک های کوچکتر تشکیل شده اند ذخیره می کند. این بلوک ها هستند ذخیره شده است در محل فیزیکی ذخیره سازی واحدها مانند درایوهای دیسک داخلی.

بنابراین، چگونه داده ها در Hadoop ذخیره می شوند؟

در یک هادوپ خوشه، داده ها در HDFS و سیستم MapReduce در هر ماشینی در خوشه قرار دارند. داده ها است ذخیره شده است که در داده ها بلوک های روی DataNodes. HDFS آن ها را تکرار می کند داده ها بلوک‌ها، معمولاً 128 مگابایت اندازه دارند و آنها را توزیع می‌کند تا در چندین گره در سراسر خوشه تکثیر شوند.

چگونه فایل ها در HDFS ذخیره می شوند؟

HDFS الف را افشا می کند فایل فضای نام سیستم و اجازه می دهد تا داده های کاربر باشد ذخیره شده است که در فایل ها . در داخل، الف فایل به یک یا چند بلوک تقسیم می شود و این بلوک ها هستند ذخیره شده است در مجموعه ای از DataNodes. NameNode اجرا می شود فایل عملیات فضای نام سیستم مانند باز کردن، بستن و تغییر نام فایل ها و دایرکتوری ها

توصیه شده: