implementasi data scraping dari web asli

Hallo semua ,hari ini kita akan belajar lagi tentang data scraping.

Disini kita akan mengambil konten dari web https://quotes.toscrape.com ,nah kita ambil teks “The world…….” Dan “Albert Einstein

Berikut adalah source kode dan hasil nya

Penjelasan alur program

1.Input

Pada tahap input kita definisikan variable html

2.Proses

1. Dari variabel html terhubung ke website target ,kita merequests/ambil dari web dari https://quotes.toscrape.com

2. Setelah target ditemukan kita lanjut dengan fungsi Requests untuk mengambil data dari website target

3. Selanjutnya kita ambil content dari web tersebut dengan mencari element dan kelas atributnya

4. Lalu ditampilkan

3. Output

Selanjutnya tampilkan variable quote dan author

Penjelasan alur koding

-Ini adalah sebuah prasyarat bahwa kita akan menggunakan library beautifulsoup4 dan requests untuk mengambil data

from bs4 import BeautifulSoup

import requests

-selanjutnya kita menggunakan variabel html untuk merequests data dari web target 'https://quotes.toscrape.com'

html = requests.get('https://quotes.toscrape.com')

-kita juga menggunakan beautifulsoup untuk mengambil conten dari web target

html_soup = BeautifulSoup(html.content,'html.parser')

-kita mulai untuk mengambil data nya ,yaitu dengan menggunakan variabel quote cari(find) element span dengan kelas atribut text

quote = html_soup.find('span', class_ = 'text').text

-ini juga sama dengan tahap sebelumnya, buat variabel author cari element small dengan kelas atribut author

author = html_soup.find('small', class_ = 'author').text

-lalu tampilkan variabel

print(quote)

print(author)

SEKIAN BELAJAR KITA HARI INI SEMOGA BERMANFAAT. TERIMA KASIH SEE YOU

Jejeblog