implementasi data scraping dari web asli
Hallo semua ,hari ini kita akan belajar lagi tentang data scraping.
Disini kita akan mengambil konten dari web https://quotes.toscrape.com ,nah kita
ambil teks “The world…….” Dan “Albert Einstein
Berikut adalah source kode
dan hasil nya
Penjelasan alur program
1.Input
Pada tahap input kita
definisikan variable html
2.Proses
1. Dari variabel html terhubung ke website target ,kita
merequests/ambil dari web dari https://quotes.toscrape.com
2.
Setelah target ditemukan kita lanjut dengan fungsi
Requests untuk mengambil data dari website target
3.
Selanjutnya kita ambil content dari web tersebut
dengan mencari element dan kelas atributnya
4.
Lalu ditampilkan
3. Output
Selanjutnya tampilkan variable quote dan author
Penjelasan alur koding
-Ini adalah sebuah prasyarat bahwa kita akan menggunakan
library beautifulsoup4 dan requests untuk mengambil data
from bs4 import BeautifulSoup
import requests
-selanjutnya kita menggunakan variabel html untuk merequests
data dari web target 'https://quotes.toscrape.com'
html = requests.get('https://quotes.toscrape.com')
-kita juga menggunakan beautifulsoup untuk mengambil conten
dari web target
html_soup = BeautifulSoup(html.content,'html.parser')
-kita mulai untuk mengambil data nya ,yaitu dengan menggunakan variabel quote cari(find) element span dengan kelas atribut text
quote = html_soup.find('span', class_ = 'text').text
-ini juga sama dengan tahap sebelumnya, buat variabel author
cari element small dengan kelas atribut author
author = html_soup.find('small', class_ = 'author').text
print(quote)
print(author)




Komentar
Posting Komentar