Ilmu Data

Tutorial Plot Python

Tutorial Plot Python
Plotly adalah perusahaan analitik yang dikenal untuk mengembangkan analitik, statistik, dan alat grafik waktu nyata untuk aplikasi berbasis web dan skrip Python mandiri. Dalam pelajaran ini, kita akan melihat contoh-contoh dasar dengan Plotly dan membangun grafik data deret waktu yang sederhana dan intuitif yang akan 100% bersifat interaktif namun mudah untuk dirancang. Grafik ini dapat digunakan dalam presentasi karena sepenuhnya interaktif dan siap dimainkan.

Ada juga opsi untuk menyimpan desain grafik secara offline sehingga dapat diekspor dengan mudah. Ada banyak fitur lain yang membuat penggunaan perpustakaan sangat mudah:

Untuk mulai menggunakan paket Plotly, kita perlu mendaftar akun di situs web yang disebutkan sebelumnya untuk mendapatkan nama pengguna dan kunci API yang valid yang dengannya kita dapat mulai menggunakan fungsinya. Untungnya, paket harga gratis tersedia untuk Plotly yang dengannya kami mendapatkan cukup banyak fitur untuk membuat bagan tingkat produksi.

Menginstal Plotly

Sekedar catatan sebelum memulai, Anda dapat menggunakan lingkungan virtual untuk pelajaran ini yang dapat kita buat dengan perintah berikut:

python -m virtualenv plotly
sumber numpy/bin/aktifkan

Setelah lingkungan virtual aktif, Anda dapat menginstal pustaka Plotly di dalam virtual env sehingga contoh yang kita buat selanjutnya dapat dieksekusi:

instal pip plotly

Kami akan menggunakan Anaconda dan Jupyter dalam pelajaran ini. Jika Anda ingin menginstalnya di mesin Anda, lihat pelajaran yang menjelaskan "Cara Menginstal Anaconda Python di Ubuntu 18".04 LTS” dan bagikan umpan balik Anda jika Anda menghadapi masalah apa pun. Untuk menginstal Plotly dengan Anaconda, gunakan perintah berikut di terminal dari Anaconda:

conda install -c plotly plotly

Kami melihat sesuatu seperti ini ketika kami menjalankan perintah di atas:

Setelah semua paket yang dibutuhkan terinstal dan selesai, kita dapat mulai menggunakan pustaka Plotly dengan pernyataan impor berikut:

impor plotly

Setelah Anda membuat akun di Plotly, Anda memerlukan dua hal - nama pengguna akun dan kunci API. Hanya ada satu kunci API milik setiap akun. Jadi simpan di tempat yang aman seolah-olah Anda kehilangannya, Anda harus membuat ulang kunci dan semua aplikasi lama yang menggunakan kunci lama akan berhenti bekerja.

Di semua program Python yang Anda tulis, sebutkan kredensial sebagai berikut untuk mulai bekerja dengan Plotly:

plotly.alat.set_credentials_file(username = 'username', api_key = 'your-api-key')

Mari kita mulai dengan perpustakaan ini sekarang.

Memulai dengan Plotly

Kami akan menggunakan impor berikut dalam program kami:

impor panda sebagai pd
impor numpy sebagai np
impor scipy sebagai sp
impor plotly.plotly sebagai py

Kami menggunakan:

Untuk beberapa contoh, kami akan menggunakan dataset Plotly sendiri yang tersedia di Github. Terakhir, harap perhatikan bahwa Anda juga dapat mengaktifkan mode offline untuk Plotly saat Anda perlu menjalankan skrip Plotly tanpa koneksi jaringan:

impor panda sebagai pd
impor numpy sebagai np
impor scipy sebagai sp
impor plotly
plotly.offline.init_notebook_mode(terhubung=Benar)
impor plotly.offline sebagai py

Anda dapat menjalankan pernyataan berikut untuk menguji instalasi Plotly:

cetak (plot).__Versi: kapan__)

Kami melihat sesuatu seperti ini ketika kami menjalankan perintah di atas:

Kami akhirnya akan mengunduh kumpulan data dengan Pandas dan memvisualisasikannya sebagai tabel:

impor plotly.figure_factory sebagai ff
df = pd.read_csv("https://raw.githubusercontent.com/plotly/datasets/master/school_
pendapatan.csv")
tabel = ff.buat_tabel(df)
py.iplot (tabel, nama file = 'tabel')

Kami melihat sesuatu seperti ini ketika kami menjalankan perintah di atas:

Sekarang, mari kita membangun Grafik batang untuk memvisualisasikan data:

impor plotly.graph_objs sebagai go
data = [pergi.Batang(x=df.Sekolah, y=df.Perempuan)]
py.iplot(data, nama file = 'women-bar')

Kami melihat sesuatu seperti ini ketika kami menjalankan cuplikan kode di atas:

Ketika Anda melihat grafik di atas dengan notebook Jupyter, Anda akan disajikan dengan berbagai opsi Zoom in/out pada bagian tertentu dari grafik, pilih Box & Lasso dan banyak lagi.

Bagan Batang yang Dikelompokkan

Beberapa diagram batang dapat dikelompokkan bersama untuk tujuan perbandingan dengan sangat mudah dengan Plotly. Mari kita gunakan dataset yang sama untuk ini dan tunjukkan variasi kehadiran pria dan wanita di universitas:

wanita = pergi.Batang(x=df.Sekolah, y=df.Perempuan)
laki-laki = pergi.Batang(x=df.Sekolah, y=df.Pria)
data = [pria, wanita]
tata letak = pergi.Tata Letak(barmode = "grup")
ara = pergi.Gambar(data = data, tata letak = tata letak)
py.iplot (gambar)

Kami melihat sesuatu seperti ini ketika kami menjalankan cuplikan kode di atas:

Meskipun ini terlihat bagus, label di sudut kanan atas tidak, benar! Mari kita perbaiki mereka:

wanita = pergi.Batang(x=df.Sekolah, y=df.Wanita, nama = "Wanita")
laki-laki = pergi.Batang(x=df.Sekolah, y=df.Pria, nama = "Pria")

Grafik terlihat jauh lebih deskriptif sekarang:

Mari kita coba mengubah barmode:

tata letak = pergi.Tata Letak(barmode = "relatif")
ara = pergi.Gambar(data = data, tata letak = tata letak)
py.iplot (gambar)

Kami melihat sesuatu seperti ini ketika kami menjalankan cuplikan kode di atas:

Diagram Pai dengan Plotly

Sekarang, kami akan mencoba membuat Diagram Pai dengan Plotly yang menetapkan perbedaan mendasar antara persentase wanita di semua universitas. Nama universitas akan menjadi label dan angka sebenarnya akan digunakan untuk menghitung persentase keseluruhan. Berikut ini cuplikan kode untuk hal yang sama:

jejak = pergi.Pai(label = df.Sekolah, nilai = df.Perempuan)
py.iplot([trace], nama file='pie')

Kami melihat sesuatu seperti ini ketika kami menjalankan cuplikan kode di atas:

Hal baiknya adalah Plotly hadir dengan banyak fitur memperbesar dan memperkecil dan banyak alat lain untuk berinteraksi dengan bagan yang dibuat.

Visualisasi data Time Series dengan Plotly

Memvisualisasikan data deret waktu adalah salah satu tugas terpenting yang muncul saat Anda menjadi analis data atau insinyur data.

Dalam contoh ini, kami akan menggunakan dataset terpisah di repositori GitHub yang sama dengan data sebelumnya yang tidak melibatkan data bercap waktu secara khusus. Seperti di sini, kami akan memplot variasi saham pasar Apple dari waktu ke waktu:

keuangan = pd.read_csv("https://raw.githubusercontent.com/plotly/datasets/master/
keuangan-grafik-apel.csv")
data = [pergi.Sebar(x=keuangan.Tanggal, y=financial['AAPL.Menutup'])]
py.iplot (data)

Kami melihat sesuatu seperti ini ketika kami menjalankan cuplikan kode di atas:

Setelah Anda mengarahkan mouse ke garis variasi grafik, Anda dapat menentukan detail titik:

Kami juga dapat menggunakan tombol perbesar dan perkecil untuk melihat data khusus setiap minggu.

Bagan OHLC

Bagan OHLC (Buka Tinggi Rendah Tutup) digunakan untuk menunjukkan variasi entitas dalam rentang waktu. Ini mudah dibuat dengan PyPlot:

dari datetime impor datetime
open_data = [33.0, 35.3, 33.5, 33.0, 34.1]
data_tinggi = [33.1, 36.3, 33.6, 33.2, 34.8]
data_rendah = [32.7, 32.7, 32.8, 32.6, 32.8]
tutup_data = [33.0, 32.9, 33.3, 33.1, 33.1]
tanggal = [datetime(tahun=2013, bulan=10, hari=10),
datetime(tahun=2013, bulan=11, hari=10),
datetime(tahun=2013, bulan=12, hari=10),
datetime(tahun=2014, bulan=1, hari=10),
datetime(tahun=2014, bulan=2, hari=10)]
jejak = pergi.Ohlc(x=tanggal,
buka=buka_data,
tinggi=data_tinggi,
rendah=data_rendah,
tutup=close_data)
data = [jejak]
py.iplot (data)

Di sini, kami telah menyediakan beberapa titik data sampel yang dapat disimpulkan sebagai berikut:

Sekarang, mari kita jalankan cuplikan kode yang kami sediakan di atas. Kami melihat sesuatu seperti ini ketika kami menjalankan cuplikan kode di atas:

Ini adalah perbandingan yang sangat baik tentang bagaimana membuat perbandingan waktu suatu entitas dengan miliknya sendiri dan membandingkannya dengan pencapaiannya yang tinggi dan rendah.

Kesimpulan

Dalam pelajaran ini, kita melihat perpustakaan visualisasi lain, Plotly yang merupakan alternatif yang sangat baik untuk Matplotlib dalam aplikasi kelas produksi yang diekspos sebagai aplikasi web, Plotly adalah perpustakaan yang sangat dinamis dan kaya fitur untuk digunakan untuk tujuan produksi, jadi ini pasti keterampilan yang perlu kita miliki di bawah ikat pinggang kita.

Temukan semua kode sumber yang digunakan dalam pelajaran ini di Github. Silakan bagikan umpan balik Anda tentang pelajaran di Twitter dengan @sbmaggarwal dan @LinuxHint.

5 Produk Mouse Komputer Ergonomis Terbaik untuk Linux
Apakah penggunaan komputer yang lama menyebabkan rasa sakit di pergelangan tangan atau jari Anda?? Apakah Anda menderita persendian yang kaku dan teru...
Cara Mengubah Pengaturan Mouse dan Touchpad Menggunakan Xinput di Linux
Sebagian besar distribusi Linux dikirimkan dengan pustaka "libinput" secara default untuk menangani kejadian input pada sistem. Ini dapat memproses ke...
Petakan ulang tombol mouse Anda secara berbeda untuk perangkat lunak yang berbeda dengan Kontrol Tombol X-Mouse
Mungkin Anda membutuhkan alat yang dapat membuat kontrol mouse Anda berubah dengan setiap aplikasi yang Anda gunakan. Jika demikian, Anda dapat mencob...