Selenium

Cara Mendapatkan URL Saat Ini dengan Selenium

Cara Mendapatkan URL Saat Ini dengan Selenium
Selenium adalah alat untuk pengujian browser, otomatisasi web, dan pengikisan web. Saat mengerjakan proyek Selenium Anda, Anda mungkin perlu mengetahui URL halaman yang ditampilkan oleh browser web yang dikontrol Selenium Anda. Informasi ini mungkin berguna untuk melacak URL tempat Anda mengekstrak beberapa data sehingga Anda dapat memperbarui data secara otomatis menggunakan beberapa skrip.

Pada artikel ini, saya akan menunjukkan cara mendapatkan URL browser saat ini dengan Selenium. Jadi, mari kita mulai.

Prasyarat:

Untuk mencoba perintah dan contoh artikel ini, Anda harus memiliki,

1) Distribusi Linux (lebih disukai Ubuntu) diinstal pada komputer Anda.
2) Python 3 diinstal di komputer Anda.
3) PIP 3 diinstal di komputer Anda.
4) Python virtualenv paket terinstal di komputer Anda.
5) Mozilla Firefox atau browser web Google Chrome terpasang di komputer Anda.
6) Harus tahu cara menginstal Driver Firefox Gecko atau Driver Web Chrome.

Untuk memenuhi syarat 4, 5, dan 6 silahkan baca artikel saya Pengenalan Selenium dengan Python 3 di Linuxhint.com.

Anda dapat menemukan banyak artikel tentang topik lain di LinuxHint.com. Pastikan untuk memeriksanya jika Anda memerlukan bantuan.

Menyiapkan Direktori Proyek:

Untuk menjaga semuanya tetap teratur, buat direktori proyek baru selenium-url/ sebagai berikut:

$ mkdir -pv selenium-url/drivers

Navigasikan ke selenium-url/ direktori proyek sebagai berikut:

$ cd selenium-url/

Buat lingkungan virtual Python di direktori proyek sebagai berikut:

$ virtualenv .venv

Aktifkan lingkungan virtual sebagai berikut:

$ sumber .venv/bin/aktifkan

Instal pustaka Selenium Python di lingkungan virtual Anda menggunakan PIP3 sebagai berikut:

$pip3 instal selenium

Unduh dan instal semua driver web yang diperlukan di pengemudi/ direktori proyek. Saya telah menjelaskan proses mengunduh dan menginstal driver web di artikel saya Pengenalan Selenium dengan Python 3. Jika Anda memerlukan bantuan, cari di LinuxPetunjuk.com untuk artikel itu.

Saya akan menggunakan browser web Google Chrome untuk demonstrasi di artikel ini. Jadi, saya akan menggunakan chromedriver biner dengan Selenium. Anda harus menggunakan geckodriver biner jika Anda ingin menggunakan browser web Firefox.

Mendapatkan URL Saat Ini dengan Selenium:

Buat skrip Python ex01.py di direktori proyek Anda dan ketik baris kode berikut di dalamnya.

dari selenium impor webdriver
dari selenium.webdriver.umum.kunci impor Kunci
pilihan = webdriver.Opsi Chrome()
pilihan.tanpa kepala = Benar
browser = webdriver.Chrome(executable_path="./driver/chromedriver", opsi = opsi)
peramban.get("https://duckduckgo.com/")
cetak (peramban.url_saat ini)
peramban.Menutup()

Setelah selesai, simpan ex01.py skrip python.

Di sini, baris 1 dan baris 2 mengimpor semua komponen yang diperlukan dari perpustakaan Python Selenium.

Baris 4 membuat objek Opsi Chrome, dan baris 5 mengaktifkan mode tanpa kepala untuk browser web Chrome.

Baris 7 membuat Chrome peramban objek menggunakan chromedriver biner dari pengemudi/ direktori proyek.

Baris 9 memberitahu browser untuk memuat duckduckgo.situs web com.

Baris 10 mencetak URL browser saat ini. Sini, peramban.url_saat ini properti digunakan untuk mengakses URL browser saat ini.

Baris 12 menutup browser.

Jalankan skrip Python ex01.py sebagai berikut:

$ python3 ex01.py

Seperti yang Anda lihat, URL saat ini (https://duckduckgo.com) dicetak di konsol.

Pada contoh sebelumnya, saya telah mengunjungi situs web duckduckgo.com dan mencetak URL saat ini di konsol. Ini mengembalikan URL halaman yang kami kunjungi. Tidak terlalu mewah karena kita sudah tahu URL halamannya. Sekarang, mari kita cari sesuatu di DuckDuckGo dan coba cetak URL halaman hasil pencarian di konsol.

Buat skrip Python ex02.py di direktori proyek Anda dan ketikkan baris kode berikut di dalamnya.

dari selenium impor webdriver
dari selenium.webdriver.umum.kunci impor Kunci
pilihan = webdriver.Opsi Chrome()
pilihan.tanpa kepala = Benar
browser = webdriver.Chrome(executable_path="./driver/chromedriver", opsi = opsi)
peramban.get("https://duckduckgo.com/")
cetak (peramban.url_saat ini)
searchInput = browser.find_element_by_id('search_form_input_homepage')
cariInput.send_keys('selenium hq' + Tombol.MEMASUKKAN)
cetak (peramban.url_saat ini)
peramban.Menutup()

Setelah selesai, simpan ex02.py skrip python.

Di sini, baris 1-10 sama dengan di ex01.py. Jadi, saya tidak menjelaskannya lagi.

Baris 12 menemukan kotak teks pencarian dan menyimpannya di cariInput variabel.

Baris 13 mengirimkan permintaan pencarian selenium terbaik dalam cariInput kotak teks dan menekan tombol kunci menggunakan Kunci.MEMASUKKAN.

Setelah halaman pencarian dimuat, peramban.url_saat ini digunakan untuk mengakses URL saat ini yang diperbarui.

Baris 15 mencetak URL terkini yang diperbarui di konsol.

Baris 17 menutup browser.

Jalankan ex02.py Script Python sebagai berikut:

$ python3 ex02.py

Seperti yang Anda lihat, skrip Python ex02.py mencetak 2 URL.

Yang pertama adalah URL beranda mesin pencari DuckDuckGo.

Yang kedua adalah URL saat ini yang diperbarui setelah melakukan pencarian di mesin pencari DuckDuckGo menggunakan kueri selenium terbaik.

Kesimpulan:

Pada artikel ini, saya telah menunjukkan kepada Anda cara mendapatkan URL browser web saat ini menggunakan perpustakaan Selenium Python. Sekarang, Anda seharusnya dapat membuat proyek Selenium Anda lebih menarik.

Game Lab Aplikasi Oculus Teratas
Jika Anda adalah pemilik headset Oculus maka Anda harus tahu tentang sideloading. Sideloading adalah proses menginstal konten non-toko di headset Anda...
10 Game Teratas untuk Dimainkan di Ubuntu
Platform Windows telah menjadi salah satu platform yang mendominasi untuk bermain game karena persentase besar dari game yang berkembang saat ini untu...
5 Game Arkade Terbaik untuk Linux
Saat ini, komputer adalah mesin serius yang digunakan untuk bermain game. Jika Anda tidak bisa mendapatkan skor tinggi baru, Anda akan tahu apa yang s...