AWS MapReduce چیست؟
AWS MapReduce چیست؟

تصویری: AWS MapReduce چیست؟

تصویری: AWS MapReduce چیست؟
تصویری: What is Amazon EMR and how can I use it for processing data? 2024, نوامبر
Anonim

آمازون الاستیک MapReduce (EMR) یک سرویس وب آمازون است ( AWS ) ابزاری برای پردازش و تحلیل داده های بزرگ. آمازون EMR داده های بزرگ را در یک خوشه Hadoop از سرورهای مجازی در Amazon Elastic Compute Cloud (EC2) و Amazon Simple Storage Service (S3) پردازش می کند.

به این ترتیب، AWS EMR چگونه کار می کند؟

این سرویس تعدادی از نمونه های آمازون EC2 مشخص شده توسط مشتری را شروع می کند که از یک Master و چندین گره دیگر تشکیل شده است. آمازون EMR نرم افزار Hadoop را روی این نمونه ها اجرا می کند. گره اصلی داده های ورودی را به بلوک ها تقسیم می کند و پردازش بلوک ها را بین گره های دیگر توزیع می کند.

علاوه بر بالا، تفاوت بین ec2 و EMR چیست؟ بر خلاف EMR , EC2 گره های برده را به گره های هسته و وظیفه دسته بندی نمی کند. این خطر از دست دادن داده های HDFS را در صورت حذف/از دست رفتن یک گره افزایش می دهد. EC2 از کتابخانه های آپاچی (s3a) برای دسترسی به داده های s3 استفاده می کند. از سوی دیگر، EMR از کد اختصاصی AWS برای دسترسی سریعتر به s3 استفاده می کند.

علاوه بر این، آیا AWS EMR به طور کامل مدیریت می شود؟

آمازون کاهش نقشه الاستیک ( EMR ) هست یک به طور کامل مدیریت شده است پلت فرم Hadoop و Spark از آمازون سرویس وب ( AWS ). با EMR , AWS مشتریان می توانند به سرعت خوشه های Hadoop چند گره ای را برای پردازش حجم کاری داده های بزرگ بچرخانند.

آیا AWS از Hadoop استفاده می کند؟

آمازون خدمات وب استفاده می کند آپاچی منبع باز هادوپ فناوری محاسباتی توزیع شده را برای سهولت در دسترسی به مقادیر زیادی از توان محاسباتی برای اجرای وظایف فشرده داده. هادوپ نسخه منبع باز MapReduce گوگل، در حال حاضر توسط شرکت هایی مانند یاهو و فیس بوک استفاده می شود.

توصیه شده: