implementasi data scraping dari web asli

 Hallo semua ,hari ini kita akan belajar lagi tentang data scraping.

Disini kita akan mengambil konten dari web https://quotes.toscrape.com ,nah kita ambil teks “The world…….” Dan “Albert Einstein 



Berikut adalah source kode dan hasil nya




Penjelasan alur program

1.Input

Pada  tahap input kita definisikan variable html

2.Proses

1.          Dari variabel html terhubung ke website target ,kita merequests/ambil dari web dari     https://quotes.toscrape.com

2.       Setelah  target ditemukan kita lanjut dengan fungsi Requests untuk mengambil data dari website target

3.       Selanjutnya kita ambil content dari web tersebut dengan mencari element dan kelas atributnya

4.       Lalu ditampilkan

 

3. Output

Selanjutnya tampilkan variable quote  dan author


Penjelasan alur koding

-Ini adalah sebuah prasyarat bahwa kita akan menggunakan library beautifulsoup4 dan requests untuk mengambil data

from bs4 import BeautifulSoup

import requests

 

-selanjutnya kita menggunakan variabel html untuk merequests data dari web target 'https://quotes.toscrape.com'

html = requests.get('https://quotes.toscrape.com')

 

-kita juga menggunakan beautifulsoup untuk mengambil conten dari web target

html_soup = BeautifulSoup(html.content,'html.parser')

 

-kita mulai untuk mengambil data nya ,yaitu dengan menggunakan variabel quote  cari(find) element span dengan kelas atribut text


quote = html_soup.find('span'class_ = 'text').text


-ini juga sama dengan tahap sebelumnya, buat variabel author cari element small dengan kelas atribut author


author = html_soup.find('small'class_ = 'author').text

 -lalu tampilkan variabel

print(quote)

print(author)

 SEKIAN BELAJAR KITA  HARI INI SEMOGA BERMANFAAT. TERIMA KASIH SEE YOU









Komentar

Postingan populer dari blog ini

Membuat program kasir sederhana (Pilihan menu makanan) Python.

FUNGSI DAN TUGAS BEBERAPA LEMBAGA YANG MENGATUR INTERNET

Penyusunan sketsa,penyusunan prototipe toko online dan menampilkan data toko online dalam bentuk json