تصویری: چرا Mnist مجموعه داده خوبی است؟
2024 نویسنده: Lynn Donovan | [email protected]. آخرین اصلاح شده: 2023-12-15 23:46
ارقام با اندازه نرمال شده و در یک تصویر با اندازه ثابت در مرکز قرار گرفته اند. این هست یک پایگاه داده خوب برای افرادی که می خواهند تکنیک های یادگیری و روش های تشخیص الگو را بر روی داده های دنیای واقعی امتحان کنند و در عین حال حداقل تلاش خود را برای پیش پردازش و قالب بندی انجام دهند.
به سادگی، فرمت داده های منیست چیست؟
MNIST (موسسه ملی استاندارد و فناوری مختلط) پایگاه داده می باشد مجموعه داده برای ارقام دست نویس، توزیع شده توسط Yann Lecun's THE MNIST پایگاه داده وب سایت ارقام دست نویس. این مجموعه داده شامل جفت، «تصویر رقمی دستنویس» و «برچسب» است. رقم از 0 تا 9 متغیر است، یعنی 10 الگو در کل.
همچنین، چند ویژگی برای پیشبینی در مجموعه دادههای رقم منیست در دسترس ما است؟ این مجموعه داده MNIST شامل 60000 مورد آموزشی و 10000 مورد تست دست نویس است ارقام (0 تا 9). هر یک رقم نرمال شده و در یک تصویر در مقیاس خاکستری (0 - 255) با اندازه 28 × 28 متمرکز شده است. هر تصویر از 784 پیکسل تشکیل شده است که نشان دهنده امکانات از ارقام.
متعاقباً، سؤال این است که منیست چیست؟
موسسه ملی استاندارد و فناوری اصلاح شده
Mnist TensorFlow چیست؟
بارگذاری MNIST مجموعه داده کد از قابلیت های داخلی استفاده می کند TensorFlow برای دانلود مجموعه داده به صورت محلی و بارگذاری آن در متغیر پایتون. در نتیجه (اگر طور دیگری مشخص نشده باشد)، داده ها در پوشه MNIST_data/ بارگیری می شوند.
توصیه شده:
چرا یک پایگاه داده مسطح کمتر از یک پایگاه داده رابطه ای موثر است؟
یک جدول تک فایل مسطح برای ضبط حجم محدودی از داده ها مفید است. اما یک پایگاه داده بزرگ با فایل مسطح می تواند ناکارآمد باشد زیرا فضای و حافظه بیشتری را نسبت به یک پایگاه داده رابطه ای اشغال می کند. همچنین هر بار که یک رکورد جدید را وارد می کنید، نیاز به افزودن داده های جدید دارد، در حالی که پایگاه داده رابطه ای اینطور نیست
چرا ذخیرهسازی دادههای ستونگرا، دسترسی به دادهها روی دیسکها را سریعتر از ذخیرهسازی دادههای ردیفگرا میکند؟
پایگاههای داده ستونگرا (معروف به پایگاههای داده ستونی) برای بارهای کاری تحلیلی مناسبتر هستند، زیرا فرمت داده (فرمت ستونی) به پردازش سریعتر پرس و جو کمک میکند - اسکن، تجمیع و غیره. ستون ها) به طور پیوسته
چرا کیفیت داده ها برای جمع آوری داده های آماری حیاتی است؟
دادههای با کیفیت بالا، بهدلیل وابستگی به تصمیمهای مبتنی بر واقعیت، بهجای شهود معمولی یا انسانی، کارایی بیشتری را در هدایت موفقیت شرکت تضمین میکند. کامل بودن: حصول اطمینان از عدم وجود شکاف در داده ها از آنچه که قرار است جمع آوری شود و آنچه در واقع جمع آوری شده است
چرا Salesforce مکان خوبی است؟
این مسئولیت شخصی هر کارمند Salesforce است که ارزش های شرکت "اعتماد، موفقیت مشتری، نوآوری، پس دادن، برابری، سلامتی، شفافیت و سرگرمی" را حفظ کند. در پایان روز، Salesforce بهترین کار را از افراد خود دریافت می کند، زیرا فرهنگ آن در اولویت قرار دادن افراد است
چرا یک آرایه را مجموعه ای همگن از داده ها می نامند؟
آرایه یک ساختار داده همگن است (عناصر دارای نوع داده یکسانی هستند) که دنباله ای از اشیاء شماره گذاری شده متوالی را در حافظه پیوسته ذخیره می کند. هر شی از آرایه را می توان با استفاده از شماره آن (به عنوان مثال، شاخص) در دسترس قرار داد. وقتی یک آرایه را اعلام می کنید، اندازه آن را تعیین می کنید