ایمپالا در کلان داده چیست؟
ایمپالا در کلان داده چیست؟

تصویری: ایمپالا در کلان داده چیست؟

تصویری: ایمپالا در کلان داده چیست؟
تصویری: استفاده از «کلان داده» برای ایجاد تحولی عظیم در آموزش - learning world 2024, آوریل
Anonim

ایمپالا یک موتور جستجوی پردازش موازی انبوه منبع باز در بالای سیستم های خوشه ای مانند Apache Hadoop است. این بر اساس مقاله درمل گوگل ایجاد شده است. این یک موتور جستجوی تعاملی SQL است که در بالای سیستم فایل توزیع شده Hadoop (HDFS) اجرا می شود. ایمپالا از HDFS به عنوان فضای ذخیره سازی اصلی خود استفاده می کند.

در این رابطه ایمپالا و کندو چیست؟

آپاچی کندو یک استاندارد موثر برای SQL-in-Hadoop است. ایمپالا یک موتور جستجوی SQL منبع باز است که پس از Google Dremel توسعه یافته است. کلودرا ایمپالا یک موتور SQL برای پردازش داده های ذخیره شده در HBase و HDFS است. ایمپالا استفاده می کند کندو megastore و می تواند پرس و جو کند کندو جداول به طور مستقیم

علاوه بر این، کندو یا ایمپالا کدام بهتر است؟ آپاچی کندو ممکن است برای محاسبات تعاملی ایده آل نباشد در حالی که ایمپالا برای محاسبات تعاملی در نظر گرفته شده است. کندو در حالی که Hadoop MapReduce مبتنی بر دسته است ایمپالا است بیشتر مانند پایگاه داده MPP. کندو از انواع پیچیده پشتیبانی می کند اما ایمپالا نمی کند. آپاچی کندو قابل تحمل خطا است در حالی که ایمپالا از تحمل خطا پشتیبانی نمی کند.

همچنین پرسیده شد چرا از ایمپالا استفاده می کنیم؟

ایمپالا از پردازش داده های درون حافظه پشتیبانی می کند، به عنوان مثال، به داده هایی دسترسی می یابد/تجزیه و تحلیل می کند است در گره های داده Hadoop بدون حرکت داده ذخیره می شود. تو می توانی دسترسی به داده ها با استفاده از ایمپالا با استفاده از پرس و جوهای SQL مانند ایمپالا در مقایسه با سایر موتورهای SQL، دسترسی سریع‌تری به داده‌ها در HDFS فراهم می‌کند.

کندو در داده های بزرگ چیست؟

آپاچی کندو هست یک داده ها سیستم انبار برای داده ها خلاصه و تجزیه و تحلیل و برای پرس و جو از بزرگ داده ها سیستم ها در پلت فرم منبع باز Hadoop. این پرس و جوهای SQL مانند را به کارهای MapReduce برای اجرا و پردازش آسان حجم بسیار زیاد تبدیل می کند. داده ها.

توصیه شده: