panda

Cara Menggunakan Boxplot dengan Python

Cara Menggunakan Boxplot dengan Python
Plot kotak digunakan untuk meringkas kumpulan data dengan menggunakan metode plot kotak dan kumis. Fungsi ini membantu pengguna untuk memahami ringkasan data dengan benar. Plot kotak bisa sangat berguna ketika kita ingin mengetahui bagaimana data didistribusikan dan disebarkan. Tiga jenis kuartil digunakan dalam plot kotak untuk memplot data:. Nilai-nilai ini termasuk nilai statistik median, maksimum, minimum, kuartil atas, dan kuartil bawah. Plot kotak merangkum data ini dalam 25ini, 50ini, dan 75ini persentil. Tutorial ini akan menunjukkan cara membuat plot kotak berdasarkan kumpulan data yang diberikan menggunakan panda dan yg keturunan dr laut perpustakaan Python.

Prasyarat

Jika Anda adalah pengguna Python baru, pertama-tama Anda harus mengatur lingkungan untuk menampilkan output dari plot kotak. Anda dapat menggunakan juru bahasa Python apa pun untuk mengeksekusi kode. Dalam tutorial ini, saya akan menggunakan spyder3 untuk mengeksekusi kode. Jika Anda belum menginstal panda dan yg keturunan dr laut perpustakaan sebelumnya, maka Anda harus menjalankan perintah berikut dari terminal untuk menginstal perpustakaan ini:

$ pip3 menginstal panda seaborn

Plot kotak dengan panda

Itu petak kotak() metode dari panda digunakan untuk menghasilkan angka plot kotak berdasarkan bingkai data. Metode ini mengandung banyak argumen; beberapa argumen ini digunakan dalam contoh di bawah ini. Bagian dari tutorial ini akan menyertakan dua contoh yang akan menunjukkan cara membuat plot kotak di panda. Anda dapat menggunakan data yang dihasilkan secara acak di perpustakaan NumPy, atau data dari file CSV, untuk menghasilkan plot kotak di panda.

Contoh 1: Plot kotak berdasarkan nilai acak

Plot kotak dalam contoh berikut dibuat menggunakan JumlahPy dan panda. Pustaka NumPy digunakan dalam skrip untuk membuat objek bingkai data dengan menghasilkan larik dua dimensi nilai acak yang berisi 5 baris dan 5 kolom. Isi dari bingkai data akan dicetak menggunakan kepala() metode. Selanjutnya, petak kotak() metode yang digunakan untuk menghasilkan plot kotak dengan warna biru, ukuran font 10, dan sudut putar 30 derajat untuk menampilkan nilai kolom.

#!/usr/bin/env python3
# Impor perpustakaan panda
impor panda sebagai pd
# Impor pustaka NumPy untuk membuat angka acak untuk array
impor numpy sebagai np
"
Hasilkan kumpulan data berdasarkan array NumPy yang dibuat secara acak
dan nilai lima kolom
"
kerangka data = pd.DataFrame(np.acak.randn(5,5), kolom=['2016', '2017', '2018',
'2019', '2020'])
 
# Cetak nilai kerangka data
cetak (bingkai data).kepala())
# Tampilkan plot kotak berdasarkan nilai kerangka data
kerangka data.boxplot(grid='false', color='blue',fontsize=10, rot=30 )

Keluaran

Output berikut akan muncul setelah menjalankan kode:.

Contoh 2: Plot kotak berdasarkan data CSV

Plot kotak dalam contoh berikut dihasilkan dari data CSV. Buat file CSV bernama bank.csv menggunakan data berikut.

bank.csv

SL,Nama_Klien,Jenis_Akun,Jenis Kelamin,Saldo
1, Maria Hernandez, Menabung, Wanita, 120000
2,Mary Smith,Saat ini,Wanita,40000
3,David Smith,Saat ini,Pria,379000
4,Maria Rodriguez,Menyimpan,Wanita,56000
5,Mark Lee,Menyimpan,Pria,93500
6,Jonathan Bing,Saat ini,Pria,5900
7,Daniel Williams,Menyimpan,Pria,2300
8,Mike Brown,Saat ini,Pria,124888
9,Paul Smith,Saat ini,Pria,59450
10,Maria Lopez,Menyimpan,Wanita,487600

Dalam skrip berikut, matplotlib perpustakaan digunakan untuk mengatur ukuran gambar dari plot kotak dan untuk menampilkan output inline. Semua catatan dari Bank.csv file dimuat menggunakan baca_csv() metode dari panda. 8 catatan pertama dari bingkai data kemudian dicetak menggunakan kepala() metode. Itu petak kotak() metode yang digunakan dalam pernyataan berikut untuk menggambar gambar plot kotak menggunakan warna merah berdasarkan 'Jenis akun' dengan kolom bernama 'Keseimbangan.'

#!/usr/bin/env python3
# Impor panda untuk menghasilkan plot kotak
impor panda sebagai pd
# Impor matplotlib untuk mengatur ukuran gambar plot kotak
impor matplotlib.pyplot sebagai plt
# Impor get_ipython untuk memformat output sebaris
dari IPython impor get_ipython
get_ipython().run_line_magic('matplotlib', 'sebaris')
# Atur ukuran gambar
plt.rcParams['angka.ukuran gambar'] = (8,4)
# Muat kumpulan data dari file CSV
df = pd.read_csv("bank.csv")
# Cetak 8 baris pertama dari data yang dimuat
cetak(df.kepala(8))
# Menampilkan plot kotak berdasarkan parameter yang digunakan
df.boxplot(oleh ='Account_Type',grid='True',column =['Balance'], color='red')

Keluaran

Output berikut akan muncul setelah menjalankan kode:.

Plot kotak dengan seaborn

Pustaka Python lain yang biasa digunakan untuk menggambar plot kotak adalah pustaka yg keturunan dr laut.  Salah satu fitur penting dari perpustakaan ini adalah ia memiliki banyak kumpulan data sampel bawaan untuk menguji berbagai tugas. Dua contoh berikutnya akan mencakup penggunaan dua kumpulan data sampel yang berbeda untuk menggambar plot kotak menggunakan: yg keturunan dr laut Perpustakaan.

Contoh 3: Plot kotak berdasarkan parameter x

Contoh berikut menggunakan kumpulan data sampel, bernama 'berlian,' dari yang lahir di laut perpustakaan untuk menghasilkan plot kotak. Di sini, gaya kisi didefinisikan menggunakan set_style() metode. Itu load_dataset() metode yang digunakan untuk memuat data 'berlian' Himpunan data. Lima catatan pertama dicetak dari kumpulan data dan petak kotak() Metode ini kemudian digunakan untuk menggambar plot kotak berdasarkan kolom, bernama 'kedalaman,' dengan warna biru.

# Impor perpustakaan seaborn untuk menghasilkan plot kotak
impor seaborn sebagai sns
# Impor matplotlib untuk mengatur ukuran gambar plot kotak
impor matplotlib.pyplot sebagai plt
# Impor get_ipython untuk memformat output sebaris
dari IPython impor get_ipython
get_ipython().run_line_magic('matplotlib', 'sebaris')
# Atur gaya kisi
sns.set_style("kotak putih")
# Atur ukuran gambar
plt.rcParams['angka.ukuran gambar'] = (8,4)
# Muat kumpulan data sampel
diamond_dataset = sns.load_dataset('berlian')
# Tampilkan 5 catatan pertama dari kumpulan data
cetak (kumpulan data_diamond.kepala())
# Gambarkan gambar plot kotak
sns.boxplot(x=diamond_dataset['kedalaman'], warna='biru')

Keluaran

Output berikut akan muncul setelah menjalankan kode:.

Contoh 4: Plot kotak berdasarkan parameter x dan y

Contoh berikut menggunakan sampel dataset bernama 'penerbangan' untuk menggambar plot kotak. Di sini, parameter x dan y dari plot kotak() metode yang digunakan untuk menggambar gambar. Pernyataan lain mirip dengan contoh sebelumnya.

# Impor perpustakaan seaborn untuk menghasilkan plot kotak
impor seaborn sebagai sns
# Impor matplotlib untuk mengatur ukuran gambar plot kotak
impor matplotlib.pyplot sebagai plt
# Impor get_ipython untuk memformat output sebaris
dari IPython impor get_ipython
get_ipython().run_line_magic('matplotlib', 'sebaris')
 
# Atur gaya kisi
sns.set_style("garis gelap")
# Atur ukuran gambar
plt.rcParams['angka.ukuran gambar'] = (12,4)
 
# Muat kumpulan data sampel
flight_dataset = sns.load_dataset('penerbangan')
# Tampilkan 5 catatan pertama dari kumpulan data
cetak (set data_penerbangan.kepala())
 
# Gambarkan gambar plot kotak
sns.boxplot(x='bulan', y='penumpang', data=flight_dataset, warna='biru')

Keluaran

Output berikut akan muncul setelah menjalankan kode:.

Kesimpulan

Saat bekerja dengan sejumlah besar data, Anda mungkin ingin meringkas data dengan menggunakan diagram, seperti plot kotak box. Tutorial ini menggunakan beberapa contoh untuk menunjukkan cara membuat plot kotak dengan dua pustaka Python.

5 Kartu Tangkap Game Teratas
Kita semua telah melihat dan menyukai gameplay streaming di YouTube. PewDiePie, Jakesepticye, dan Markiplier hanyalah beberapa pemain top yang telah m...
Cara Mengembangkan Game di Linux
Satu dekade yang lalu, tidak banyak pengguna Linux yang memprediksi bahwa sistem operasi favorit mereka suatu hari nanti akan menjadi platform game po...
Port Sumber Terbuka dari Mesin Game Komersial
Rekreasi mesin game gratis, open source, dan lintas platform dapat digunakan untuk bermain lama serta beberapa judul game yang cukup baru. Artikel ini...