Home>>Python>>BeautifulSoup İle Web Scraping | IMDb Top 250
PythonWeb Scraping

BeautifulSoup İle Web Scraping | IMDb Top 250

Merhaba,
Python’da BeautifulSoup modülü kullanarak, imdb’nin top 250 listesini Web Scraping işlemi ile nasıl çekebileceğimizi anlatacağım.

İlk olarak gerekli modülleri aşağıdaki gibi kuralım;

pip install requests
pip install beautifulsoup4

Daha sonra modülleri import edelim;

import requests
from bs4 import BeautifulSoup

Web Scraping işlemi yaparken verilerini çekeceğimiz sitenin kaynak kodlarını incelememiz gerekiyor. Bunun sebebi, kaynak koddaki etiketler ile yazacağımız koddaki etiketlerin aynı olması lazım.

requests modülü ile URL’ye istek gönderip kaynak kodlarını çekiyoruz, BeautifulSoup ile kodları parse işlemini gerçekleştiriyoruz.

url = "https://www.imdb.com/chart/top/?ref_=nv_mv_250"
r = requests.get(url).content
soup = BeautifulSoup(r, "html.parser")

Daha sonra incelediğimiz kaynak kodlardaki çekeceğimiz verinin etiketini find() metodu ile istediğimiz verileri çekebiliriz.

list = soup.find("tbody", {"class":"lister-list"}).find_all("tr",limit=250)
s = 1
for i in list:
    title = i.find("td",{"class":"titleColumn"}).find("a").text
    yil = i.find("span",{"class":"secondaryInfo"}).text.strip("()")
    rating = i.find("td",{"class":"ratingColumn"}).find("strong").text
    print(f"{s}. {title.ljust(50)} {yil}   Rating: {rating}")
    s += 1

Çıktı;

Çıktı

BeautifulSoup modülü hakkında daha fazlası için tıklayın

Tüm kodlara ulaşmak için Github’a Göz Atın.

Diğer projelere ulaşmak için tıklayın.

Adblock Detected

Lütfen reklam engelleyicinizi devre dışı bırakarak bizi destekleyin.

Refresh Page