فهرست مطالب:

چگونه از سوپ زیبا در پایتون استفاده می کنید؟
چگونه از سوپ زیبا در پایتون استفاده می کنید؟

تصویری: چگونه از سوپ زیبا در پایتون استفاده می کنید؟

تصویری: چگونه از سوپ زیبا در پایتون استفاده می کنید؟
تصویری: پایتون | با 2 خط کد پسورد تولید کن 2024, آوریل
Anonim

اگر از نسخه اخیر دبیان یا لینوکس اوبونتو استفاده می کنید، می توانید Beautiful Soup را با مدیریت بسته سیستم نصب کنید:

  1. $ apt-get نصب کنید پایتون -bs4 (برای پایتون 2)
  2. $ apt-get نصب python3-bs4 (برای پایتون 3)
  3. $ easy_install beautifulsoup4.
  4. $ pip نصب beautifulsoup4.
  5. $ پایتون setup.py نصب کنید.

به همین ترتیب، مردم می پرسند، چگونه یک سوپ زیبا در پایتون درست می کنید؟

برای استفاده سوپ زیبا ، باید آن را نصب کنید: $ pip install beautifulsoup4. سوپ زیبا همچنین به تجزیه کننده متکی است، پیش فرض lxml است. شما ممکن است در حال حاضر دارند آن را، اما باید بررسی کنید (IDLE را باز کنید و سعی کنید lxml را وارد کنید). اگر نه، این کار را انجام دهید: $ pip install lxml یا $ apt- گرفتن نصب پایتون -lxml.

به همین ترتیب، چگونه سوپ زیبا را وارد می کنید؟ برای شروع، وارد كردن را سوپ زیبا کتابخانه، فایل HTML را باز کرده و به آن ارسال کنید سوپ زیبا و سپس بسیار ” نسخه در ترمینال. باید ببینید که پنجره ترمینال شما با یک نسخه با تورفتگی زیبا از متن اصلی html پر شده است (شکل 3 را ببینید).

به همین ترتیب سؤال می شود که سوپ زیبا برای چه استفاده می شود؟

سوپ زیبا یک بسته پایتون برای تجزیه اسناد HTML و XML است (از جمله داشتن نشانه‌گذاری نادرست، به عنوان مثال برچسب‌های بسته نشده، پس از نامگذاری برچسب‌ها سوپ ). یک درخت تجزیه برای صفحات تجزیه شده ایجاد می کند که می تواند باشد استفاده شده برای استخراج داده ها از HTML، که برای scraping وب مفید است.

چگونه یک وب سایت را با پایتون و BeautifulSoup خراش می دهید؟

ابتدا باید تمام کتابخانه هایی را که قرار است استفاده کنیم وارد کنیم. بعد، یک متغیر برای آدرس صفحه اعلام کنید. سپس، از آن استفاده کنید پایتون urllib2 برای دریافت صفحه HTML url اعلام شده. در نهایت، صفحه را تجزیه کنید سوپ زیبا قالب تا بتوانیم استفاده کنیم سوپ زیبا تا روی آن کار کنند.

توصیه شده: