فهرست مطالب:

آیا می توانم پایتون را روی Hadoop اجرا کنم؟
آیا می توانم پایتون را روی Hadoop اجرا کنم؟

تصویری: آیا می توانم پایتون را روی Hadoop اجرا کنم؟

تصویری: آیا می توانم پایتون را روی Hadoop اجرا کنم؟
تصویری: چیزی که بقیه در مورد برنامه نویسی فکر میکنن vs واقعیت برنامه نویسی 2024, ممکن است
Anonim

با امکان انتخاب بین زبان های برنامه نویسی مانند جاوا، اسکالا و پایتون برای هادوپ بیشتر توسعه دهندگان از اکوسیستم استفاده می کنند پایتون به دلیل پشتیبانی از کتابخانه های آن برای وظایف تجزیه و تحلیل داده ها. هادوپ پخش به کاربر اجازه می دهد تا ایجاد کند و اجرا کردن نقشه/کاهش کارها با هر اسکریپت یا قابل اجرا به عنوان نگاشت یا/و کاهنده.

به همین ترتیب، پرسیده می شود که چگونه پایتون به Hadoop متصل می شود؟

اتصال Hadoop HDFS با پایتون

  1. مرحله 1: مطمئن شوید که Hadoop HDFS به درستی کار می کند. Terminal/Command Prompt را باز کنید، با استفاده از دستورات زیر بررسی کنید که آیا HDFS کار می کند: start-dfs.sh.
  2. مرحله 2: کتابخانه libhdfs3 را نصب کنید.
  3. مرحله 3: کتابخانه hdfs3 را نصب کنید.
  4. مرحله 4: بررسی کنید که آیا اتصال با HDFS موفقیت آمیز است یا خیر.

به طور مشابه، Hadoop در پایتون چیست؟ پایتون یک زبان برنامه نویسی کامل با هدف عمومی است که تقریباً برای انجام هر کاری در دنیای برنامه نویسی می توان از آن استفاده کرد. هادوپ یک چارچوب داده بزرگ است که در جاوا برای مقابله با حجم عظیمی از داده ها نوشته شده است. موسسات آنلاین متعددی وجود دارد که هادوپ با پایتون دوره هایی مانند: Analytixlabs. ادورکا.

پس از آن، سوال این است که چگونه یک برنامه MapReduce پایتون را در Hadoop اجرا کنم؟

نوشتن یک برنامه Hadoop MapReduce در پایتون

  1. انگیزه.
  2. کاری که ما می خواهیم انجام دهیم.
  3. پیش نیازها.
  4. کد کاهش نقشه پایتون مرحله نقشه: mapper.py. مرحله کاهش: reducer.py.
  5. اجرای کد پایتون در Hadoop. نمونه داده های ورودی را دانلود کنید. داده های نمونه محلی را در HDFS کپی کنید.
  6. کد بهبود یافته Mapper و Reducer: با استفاده از تکرار کننده ها و مولدهای پایتون. mapper.py. reducer.py.

جار هدوپ استریمینگ چیست؟

هادوپ توزیع یک ابزار جاوا به نام ارائه می کند Hadoop Streaming . در بسته بندی شده است شیشه فایل. با Hadoop Streaming ، می توانیم کارهای Map Reduce را با یک اسکریپت اجرایی ایجاد و اجرا کنیم. Hadoop Streaming ابزاری است که همراه با هادوپ توزیع می توان از آن برای اجرای برنامه هایی برای تجزیه و تحلیل داده های بزرگ استفاده کرد.

توصیه شده: