فهرست مطالب:

نقاط پرت در تجزیه و تحلیل داده ها چیست؟
نقاط پرت در تجزیه و تحلیل داده ها چیست؟

تصویری: نقاط پرت در تجزیه و تحلیل داده ها چیست؟

تصویری: نقاط پرت در تجزیه و تحلیل داده ها چیست؟
تصویری: آموزش کامل شناسایی و مدیریت داده های پرت با آزمون ماهالانوبیس در SPSS 2024, نوامبر
Anonim

در آمار، یک دادههای خارج از محدوده هست یک داده ها نقطه ای که به طور قابل توجهی با مشاهدات دیگر متفاوت است. یک دادههای خارج از محدوده ممکن است به دلیل تنوع در اندازه گیری باشد یا ممکن است نشان دهنده خطای تجربی باشد. مورد دوم گاهی اوقات از آن حذف می شوند داده ها تنظیم. یک دادههای خارج از محدوده می تواند مشکلات جدی در تجزیه و تحلیل های آماری.

با توجه به این موضوع، چگونه می‌توانید نقاط پرت را در داده‌ها پیدا کنید؟

نقطه ای که خارج از داده ها درونی های مجموعه به عنوان جزئی طبقه بندی می شود دادههای خارج از محدوده ، در حالی که یکی که خارج از حصار بیرونی می افتد به عنوان عمده طبقه بندی می شود دادههای خارج از محدوده . برای پیدا کردن حصارهای داخلی برای خود داده ها ابتدا محدوده بین چارکی را در 1.5 ضرب کنید. سپس، نتیجه را به Q3 اضافه کنید و آن را از Q1 کم کنید.

علاوه بر بالا، آیا باید مقادیر پرت را از داده های خود حذف کنم؟ برای را بیشتر بخش، اگر داده های شما تحت تأثیر این موارد شدید، شما می توان مقید شده است را ورودی به نماینده تاریخی داده های شما که مستثنی می کند موارد پرت . به صورت موردی تعیین کنید چه چیزی را اثر موارد پرت بود. و از آنجا تصمیم بگیرید که آیا می خواهید برداشتن ، تغییر دهید یا نگه دارید پرت ارزش های.

با توجه به این موضوع، تجزیه و تحلیل داده ها چگونه با موارد پرت برخورد می کند؟

در اینجا چهار رویکرد وجود دارد:

  1. رکوردهای پرت را رها کنید. در مورد بیل گیتس، یا یک مورد واقعی دیگر، گاهی اوقات بهتر است آن رکورد را به طور کامل از مجموعه داده خود حذف کنید تا آن شخص یا رویداد از تحلیل شما منحرف نشود.
  2. داده های پرت خود را پوشش دهید.
  3. یک مقدار جدید اختصاص دهید.
  4. یک تحول را امتحان کنید.

نمونه ای از پرت چیست؟

دادههای خارج از محدوده . بیشتر مقداری که "خارج" (بسیار کوچکتر یا بزرگتر از) بسیاری از مقادیر دیگر در مجموعه داده ها قرار دارد. برای مثال در نمرات 25، 29، 3، 32، 85، 33، 27، 28 هر دو 3 و 85 هستند. موارد پرت ".

توصیه شده: