کاهش با کلید چیست؟
کاهش با کلید چیست؟

تصویری: کاهش با کلید چیست؟

تصویری: کاهش با کلید چیست؟
تصویری: محافظ جان چیست و چه طور کار می کند؟ 2024, ممکن است
Anonim

عملکرد Spark RDD smallByKey مقادیر هر کدام را ادغام می کند کلید با استفاده از یک انجمن كاهش دادن عملکرد. به طور شهودی به این معنی است که این تابع زمانی که به طور مکرر بر روی یک مجموعه از داده های RDD با پارتیشن های متعدد صرف نظر از ترتیب عنصر اعمال شود، نتیجه یکسانی را ایجاد می کند.

سپس، تفاوت بین groupByKey و reduceByKey چیست؟

groupByKey () فقط برای گروه بندی مجموعه داده خود بر اساس یک کلید است. reduceByKey () چیزی شبیه گروه بندی + تجمع است. reduceByKey می تواند زمانی که روی مجموعه داده های بزرگ اجرا می کنیم استفاده شود. aggregateByKey () از نظر منطقی مشابه است reduceByKey () اما به شما امکان می دهد نتیجه را در برگردانید ناهمسان نوع

همچنین بدانید، چرا کاهش عمل در جرقه است؟ کاهش جرقه عملیات یک عمل نوعی عملیات است و اجرای کامل DAG را برای همه دستورالعمل های تنبل ردیف شده راه اندازی می کند. جرقه RDD كاهش دادن تابع عناصر این RDD را با استفاده از عملگر باینری جابجایی و انجمنی مشخص شده کاهش می دهد. کاهش جرقه عملیات تقریباً مشابه است كاهش دادن روش در اسکالا

علاوه بر بالا، Pairrdd چیست؟

Spark عملیات ویژه ای را روی RDD های حاوی جفت کلید/مقدار ارائه می کند. به این RDD ها RDD های جفتی می گویند. جفت‌های RDD یک بلوک سازنده مفید در بسیاری از برنامه‌ها هستند، زیرا عملیات‌هایی را نشان می‌دهند که به شما امکان می‌دهند روی هر کلید به صورت موازی عمل کنید یا داده‌ها را مجدداً در سراسر شبکه گروه‌بندی کنید. PairRDDs جفت‌های KEY/VALUE هستند.

آیا reduceByKey یک عمل است؟

()reduce مجموعه ای را خروجی می دهد که به گراف غیر چرخه جهت دار (DAG) اضافه نمی شود، بنابراین به عنوان یک عمل . با این حال، reduceByKey () یک RDD را برمی گرداند که فقط یک سطح/حالت دیگر در DAG است، بنابراین یک تبدیل است.

توصیه شده: