موتور پردازش داده پشت Amazon Elastic MapReduce چیست؟
موتور پردازش داده پشت Amazon Elastic MapReduce چیست؟

تصویری: موتور پردازش داده پشت Amazon Elastic MapReduce چیست؟

تصویری: موتور پردازش داده پشت Amazon Elastic MapReduce چیست؟
تصویری: آمازون EMR چیست و چگونه می توانم از آن برای پردازش داده ها استفاده کنم؟ 2024, آوریل
Anonim

آمازون EMR از Apache Hadoop به عنوان توزیع شده خود استفاده می کند موتور پردازش داده . Hadoop یک چارچوب نرم افزاری منبع باز و جاوا است که پشتیبانی می کند داده ها برنامه های کاربردی توزیع شده فشرده که روی خوشه های بزرگ اجرا می شوند از سخت افزار کالا

علاوه بر این، Amazon Elastic MapReduce چیست؟

Amazon Elastic MapReduce ( EMR ) هست یک خدمات وب آمازون ( AWS ) ابزاری برای پردازش و تحلیل داده های بزرگ. آمازون EMR داده های بزرگ را در یک خوشه Hadoop از سرورهای مجازی روی آن پردازش می کند آمازون الاستیک محاسبات ابر ( EC2 ) و آمازون سرویس ذخیره سازی ساده ( S3 ).

علاوه بر این، آیا آمازون EMR به طور کامل مدیریت می شود؟ این یک به طور کامل مدیریت شده است سرویس دریاچه داده که می‌تواند ذخیره‌سازی داده را از منابع محاسباتی جدا کند و به جای آن، خوشه‌های محاسباتی را مقیاس‌پذیر، در دسترس برای استفاده در صورت تقاضا می‌سازد، و شامل توانایی چندین خوشه برای دسترسی همزمان به مجموعه‌های داده یکسان است.

همچنین ممکن است بپرسید AWS EMR چگونه کار می کند؟

به طور کلی، هنگامی که داده ها را در آمازون EMR ، ورودی داده هایی است که به عنوان فایل در سیستم فایل اصلی انتخابی شما ذخیره می شود، مانند آمازون S3 یا HDFS. این داده ها از یک مرحله به مرحله بعد در توالی پردازش منتقل می شوند. مرحله آخر داده های خروجی را در یک مکان مشخص مانند an می نویسد آمازون سطل S3.

تفاوت بین ec2 و EMR چیست؟

بر خلاف EMR , EC2 گره های برده را به گره های هسته و وظیفه دسته بندی نمی کند. این خطر از دست دادن داده های HDFS را در صورت حذف/از دست رفتن یک گره افزایش می دهد. EC2 از کتابخانه های آپاچی (s3a) برای دسترسی به داده های s3 استفاده می کند. از سوی دیگر، EMR از کد اختصاصی AWS برای دسترسی سریعتر به s3 استفاده می کند.

توصیه شده: