مدل GoogLeNet چیست؟
مدل GoogLeNet چیست؟

تصویری: مدل GoogLeNet چیست؟

تصویری: مدل GoogLeNet چیست؟
تصویری: سخنرانی 41: GoogleNet 2024, نوامبر
Anonim

گوگل لنت از قبل آموزش دیده است مدل که در زیر مجموعه ای از پایگاه داده ImageNet که در چالش تشخیص تصویری در مقیاس بزرگ ImageNet (ILSVRC) استفاده می شود، آموزش دیده است.

به سادگی، GoogLeNet چیست؟

گوگل لنت یک شبکه عصبی کانولوشنال از پیش آموزش دیده با عمق ۲۲ لایه است. می توانید یک شبکه آموزش دیده در مجموعه داده ImageNet [1] یا Places365 [2] [3] را بارگیری کنید. شبکه آموزش دیده در ImageNet، تصاویر را در 1000 دسته شی، مانند صفحه کلید، ماوس، مداد و بسیاری از حیوانات طبقه بندی می کند.

مدل Vgg چیست؟ VGG یک شبکه عصبی کانولوشنال است مدل K. Zisserman از دانشگاه آکسفورد در مقاله "شبکه های پیچیده بسیار عمیق برای تشخیص تصویر در مقیاس بزرگ" پیشنهاد شده است. این مدل در ImageNet که مجموعه داده ای از بیش از 14 میلیون تصویر متعلق به 1000 کلاس است، به 92.7٪ دقت آزمون برتر 5 دست می یابد.

همچنین باید بدانید که AlexNet و GoogLeNet چیست؟

الکس نت اولین شبکه عصبی کانولوشنال معروف (CNN) بود. سپس، شبکه های مشابه توسط بسیاری دیگر استفاده شد. GoogleNet معماری کاملاً متفاوتی نسبت به هر دو دارد: از ترکیبی از ماژول‌های آغازین استفاده می‌کند که هر کدام شامل برخی از ادغام، کانولوشن‌ها در مقیاس‌های مختلف و عملیات الحاق است.

شبکه آغازین چیست؟

این مقاله نوع جدیدی از معماری را پیشنهاد می کند - GoogLeNet یا آغاز v1. اساساً یک عصبی کانولوشنال است شبکه (سی ان ان) که 27 لایه عمق دارد. 1×1 لایه کانولوشن قبل از اعمال یک لایه دیگر که عمدتاً برای کاهش ابعاد استفاده می شود.

توصیه شده: