BeautifulSoup İle Web Scraping

Merhaba,
Python’da BeautifulSoup modülü kullanarak, imdb’nin top 250 listesini Web Scraping işlemi ile nasıl çekebileceğimizi anlatacağım.

İlk olarak gerekli modülleri aşağıdaki gibi kuralım;

pip install requests
pip install beautifulsoup4

Daha sonra modülleri import edelim;

import requests
from bs4 import BeautifulSoup

Web Scraping işlemi yaparken verilerini çekeceğimiz sitenin kaynak kodlarını incelememiz gerekiyor. Bunun sebebi, kaynak koddaki etiketler ile yazacağımız koddaki etiketlerin aynı olması lazım.

requests modülü ile URL’ye istek gönderip kaynak kodlarını çekiyoruz, BeautifulSoup ile kodları parse işlemini gerçekleştiriyoruz.

url = "https://www.imdb.com/chart/top/?ref_=nv_mv_250"
r = requests.get(url).content
soup = BeautifulSoup(r, "html.parser")

Daha sonra incelediğimiz kaynak kodlardaki çekeceğimiz verinin etiketini find() metodu ile istediğimiz verileri çekebiliriz.

list = soup.find("tbody", {"class":"lister-list"}).find_all("tr",limit=250)
s = 1
for i in list:
    title = i.find("td",{"class":"titleColumn"}).find("a").text
    yil = i.find("span",{"class":"secondaryInfo"}).text.strip("()")
    rating = i.find("td",{"class":"ratingColumn"}).find("strong").text
    print(f"{s}. {title.ljust(50)} {yil}   Rating: {rating}")
    s += 1

Çıktı;

BeautifulSoup modülü hakkında daha fazlası için tıklayın

Tüm kodlara ulaşmak için Github’a Göz Atın.

Diğer projelere ulaşmak için tıklayın.

BeautifulSoup İle Web Scraping | IMDb Top 250

Previous Post

Selenium ile Web Scraping | Hava Durumu Verisi Çekme

Next Post

BeautifulSoup İle Web Scraping | Kitapyurdu Çok Satanlar Listesi

Adblock Detected

Lütfen reklam engelleyicinizi devre dışı bırakarak bizi destekleyin.

Related Articles

Adblock Detected

Lütfen reklam engelleyicinizi devre dışı bırakarak bizi destekleyin.