Gensim در پایتون چیست؟
Gensim در پایتون چیست؟

تصویری: Gensim در پایتون چیست؟

تصویری: Gensim در پایتون چیست؟
تصویری: Gensim در پایتون برای مبتدیان توضیح داده شد | یادگیری ماشینی 2024, نوامبر
Anonim

جنسیم یک کتابخانه منبع باز برای مدل سازی موضوع بدون نظارت و پردازش زبان طبیعی، با استفاده از یادگیری ماشین آماری مدرن است. جنسیم در اجرا می شود پایتون و Cython.

با در نظر گرفتن این موضوع، Gensim Word2Vec چیست؟

1. معرفی Word2vec . Word2vec یکی از محبوب ترین تکنیک ها برای یادگیری جاسازی کلمات با استفاده از یک شبکه عصبی دو لایه است. ورودی آن یک پیکره متنی و خروجی آن مجموعه ای از بردارها است. دو الگوریتم آموزشی اصلی برای word2vec یکی کیسه ممتد کلمات (CBOW) و دیگری skip-gram نام دارد.

علاوه بر این، خلاصه سازی Gensim چگونه کار می کند؟ آموزش: اتوماتیک خلاصه سازی استفاده كردن جنسیم . این ماژول به طور خودکار متن داده شده را با استخراج یک یا چند جمله مهم از متن خلاصه می کند. به روشی مشابه، آن را می توان همچنین کلمات کلیدی را استخراج کنید.

متعاقباً ممکن است یکی بپرسد که چگونه Gensim را به پایتون وارد کنم؟

5 پاسخ. ابتدا باید NumPy سپس SciPy و سپس نصب کنید جنسیم (با فرض اینکه قبلاً دارید پایتون نصب شده است). من استفاده کردم پایتون 3.4 چون نصب SciPy با استفاده از نسخه 3.4 آسان تر است. نکات: مطمئن شوید که پیپ در متغیرهای محیطی شما قرار دارد (C:python34scripts را به متغیر محیط خود اضافه کنید).

مجموعه جنسیم چیست؟

موضوع مهم بعدی که برای کار باید با آن آشنا شوید جنسیم هست مجموعه نوشته ها (کوله ای از کلمات). یعنی یک است مجموعه نوشته ها شی که حاوی کلمه id و فرکانس آن در هر سند است. شما می توانید آن را به عنوان جنسیم معادل یک ماتریس Document-Term.

توصیه شده: