beautifulsoup ile haber çekme arşivleri

20Jan 2019 by admin 3 Comments

Python BeautifulSoup Haber Okuma Örneği

Code library

Python BeutifulSoup html ve xml dosyalarını işlemek için oluşturulmuş bir modüldür. BeautifulSoup modülü yardımıyla http://ekonomi.haber7.com sitesi üzerinden haber başlıkları, linkleri ve içeriklerinin çekilmesini adım adım anlatımı, 1. Modüllerin dahil edilmesi, çağrılması(request, BeautifulSoup) ve headers bilgilerin oluşturulmasını içerir. Headers bilgileri karşı site tarafından engellenmemek için kulanılır. import requests from bs4 import BeautifulSoup #Site tarafından bloklanmamak için gönderdiğimiz tarayıcı bilgileri headers = requests.utils.default_headers() headers.update({ 'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:52.0) Gecko/20100101 Firefox/52.0', }) 2. İstek yapılacak ve html/lxml dönüşümü yapılacak alanı belirtir. print("Lütfen bekleyin... Haberler çekiliyor...\n") url= "http://ekonomi.haber7.com/" istek=requests.get(url,headers) soup = BeautifulSoup(istek.content, "lxml") 3. Site içeresinden tespit edilen haber başlıklarını ve linklerin yollarını belirtir. print(" LİNKlER VE HABERLER ŞU ŞEKİLDE:\n ------------------------------") #Learn News Name and Link From Website haberler=soup.find_all("div",{"class": "title"}) linkler=soup.find_all("a",{"class": "news"}) 4. Çekilen linkler içeresinden tekrar istek yaparak haber içeriğinin…

Tag: beautifulsoup ile haber çekme