Ilmu Data

Tutorial Python Seaborn

Tutorial Python Seaborn
Dalam pelajaran tentang perpustakaan Python Seaborn ini, kita akan melihat berbagai aspek dari perpustakaan visualisasi data ini yang dapat kita gunakan dengan Python untuk menghasilkan grafik yang indah dan intuitif yang dapat memvisualisasikan data dalam bentuk yang diinginkan bisnis dari sebuah platform. Untuk melengkapi pelajaran ini, kita akan membahas bagian-bagian berikut:

Ini sepertinya banyak yang harus ditutupi. Mari kita mulai sekarang.

Apa itu perpustakaan Python Seaborn?

Pustaka Seaborn adalah paket Python yang memungkinkan kita membuat infografis berdasarkan data statistik. Karena dibuat di atas matplotlib, jadi, secara inheren kompatibel dengannya. Selain itu, mendukung struktur data NumPy dan Pandas sehingga plot dapat dilakukan langsung dari koleksi tersebut those.

Memvisualisasikan data yang kompleks adalah salah satu hal terpenting yang ditangani Seaborn. Jika kita membandingkan Matplotlib dengan Seaborn, Seaborn mampu membuat hal-hal mudah yang sulit dicapai dengan Matplotlib. Namun, penting untuk dicatat bahwa Seaborn bukan alternatif untuk Matplotlib tetapi pelengkapnya. Sepanjang pelajaran ini, kita juga akan menggunakan fungsi Matplotlib dalam cuplikan kode. Anda akan memilih untuk bekerja dengan Seaborn dalam kasus penggunaan berikut:

Sekedar catatan sebelum memulai adalah bahwa kami menggunakan lingkungan virtual untuk pelajaran ini yang kami buat dengan perintah berikut:

python -m virtualenv seaborn
sumber seaborn/bin/aktifkan

Setelah lingkungan virtual aktif, kita dapat menginstal perpustakaan Seaborn di dalam virtual env sehingga contoh yang kita buat selanjutnya dapat dieksekusi:

instal pip seaborn

Anda dapat menggunakan Anaconda juga untuk menjalankan contoh-contoh ini yang lebih mudah. Jika Anda ingin menginstalnya di mesin Anda, lihat pelajaran yang menjelaskan "Cara Menginstal Anaconda Python di Ubuntu 18".04 LTS” dan bagikan tanggapan Anda. Sekarang, mari kita beralih ke berbagai jenis plot yang dapat dibangun dengan Python Seaborn.

Menggunakan Kumpulan Data Pokemon

Untuk mempertahankan pelajaran ini, Kami akan menggunakan dataset Pokemon yang dapat diunduh dari Kaggle. Untuk mengimpor dataset ini ke dalam program kami, kami akan menggunakan perpustakaan Pandas. Berikut adalah semua impor yang kami lakukan dalam program kami:

impor panda sebagai pd
dari matplotlib impor pyplot sebagai plt
impor seaborn sebagai sns

Sekarang, kita dapat mengimpor dataset ke dalam program kita dan menunjukkan beberapa contoh data dengan Pandas sebagai:

df = pd.read_csv('Pokemon.csv', indeks_kol=0)
df.kepala()

Perhatikan bahwa untuk menjalankan cuplikan kode di atas, kumpulan data CSV harus ada di direktori yang sama dengan program itu sendiri. Setelah kami menjalankan cuplikan kode di atas, kami akan melihat output berikut (di notebook Anaconda Jupyter):

Merencanakan kurva Regresi Linier

Salah satu hal terbaik tentang Seaborn adalah fungsi ploting cerdas yang disediakannya yang tidak hanya memvisualisasikan kumpulan data yang kami sediakan untuknya, tetapi juga membangun model regresi di sekitarnya. Misalnya, dimungkinkan untuk membuat plot regresi linier dengan satu baris kode. Berikut adalah cara melakukannya:

sns.lmplot(x='Serangan', y='Pertahanan', data=df)

Setelah kita menjalankan potongan kode di atas, kita akan melihat output berikut:

Kami memperhatikan beberapa hal penting dalam cuplikan kode di atas:

Jangan takut jika Anda pikir kami tidak dapat memiliki plot tanpa garis regresi itu. Kita dapat ! Mari kita coba potongan kode baru sekarang, mirip dengan yang terakhir:

sns.lmplot(x='Attack', y='Defense', data=df, fit_reg=False)

Kali ini, kita tidak akan melihat garis regresi di plot kita:

Sekarang ini jauh lebih jelas (jika kita tidak membutuhkan garis regresi linier). Tapi ini belum berakhir. Seaborn memungkinkan kami membuat plot yang berbeda dan itulah yang akan kami lakukan.

Membangun Plot Kotak

Salah satu fitur terbesar di Seaborn adalah bagaimana ia dengan mudah menerima struktur Pandas Dataframes untuk memplot data. Kita cukup meneruskan Dataframe ke perpustakaan Seaborn sehingga ia dapat membuat boxplot darinya:

sns.petak kotak(data=df)

Setelah kita menjalankan potongan kode di atas, kita akan melihat output berikut:

Kita dapat menghapus pembacaan pertama dari total karena itu terlihat sedikit canggung ketika kita benar-benar merencanakan kolom individual di sini:

stats_df = df.drop(['Total'], sumbu=1)
# Plot kotak baru menggunakan stats_df
sns.boxplot(data=stats_df)

Setelah kita menjalankan potongan kode di atas, kita akan melihat output berikut:

Swarm Plot dengan Seaborn

Kami dapat membuat plot Swarm desain intuitif dengan Seaborn. Kami akan kembali menggunakan dataframe dari Pandas yang kami muat sebelumnya, tetapi kali ini, kami akan memanggil fungsi show Matplotlib untuk menampilkan plot yang kami buat. Berikut cuplikan kodenya:

sns.set_context("kertas")
sns.swarmplot(x="Serangan", y="Pertahanan", data=df)
plt.menunjukkan()

Setelah kita menjalankan potongan kode di atas, kita akan melihat output berikut:

Dengan menggunakan konteks Seaborn, kami mengizinkan Seaborn untuk menambahkan sentuhan pribadi dan desain yang mengalir untuk plotnya. Dimungkinkan untuk menyesuaikan plot ini lebih jauh dengan ukuran font khusus yang digunakan untuk label di plot untuk mempermudah pembacaan. Untuk melakukan ini, kita akan meneruskan lebih banyak parameter ke fungsi set_context yang berfungsi seperti yang terdengar. Misalnya, untuk mengubah ukuran font label, kami akan menggunakan font.parameter ukuran. Berikut cuplikan kode untuk melakukan modifikasi:

sns.set_context("kertas", font_scale=3, rc="font.ukuran":8,"sumbu.ukuran label":5)
sns.swarmplot(x="Serangan", y="Pertahanan", data=df)
plt.menunjukkan()

Setelah kita menjalankan potongan kode di atas, kita akan melihat output berikut:

Ukuran font untuk label diubah berdasarkan parameter yang kami berikan dan nilai yang terkait dengan font.parameter ukuran. Satu hal yang menjadi keahlian Seaborn adalah membuat plotnya sangat intuitif untuk penggunaan praktis dan ini berarti bahwa Seaborn bukan hanya paket Python latihan tetapi sebenarnya sesuatu yang dapat kita gunakan dalam penerapan produksi kita.

Menambahkan Judul ke plot

Sangat mudah untuk menambahkan judul ke plot kami. Kita hanya perlu mengikuti prosedur sederhana menggunakan fungsi tingkat Sumbu di mana kita akan memanggil set_judul() berfungsi seperti yang kami tampilkan dalam cuplikan kode di sini:

sns.set_context("kertas", font_scale=3, rc="font.ukuran":8,"sumbu.ukuran label":5)
plot_saya = sns.swarmplot(x="Serangan", y="Pertahanan", data=df)
my_plot.set_title("Plot Kawanan LH")
plt.menunjukkan()

Setelah kita menjalankan potongan kode di atas, kita akan melihat output berikut:

Dengan cara ini, kami dapat menambahkan lebih banyak informasi ke plot kami.

Seaborn vs Matplotlib

Saat kita melihat contoh dalam pelajaran ini, kita dapat mengidentifikasi bahwa Matplotlib dan Seaborn tidak dapat dibandingkan secara langsung tetapi dapat dilihat sebagai saling melengkapi. Salah satu fitur yang membuat Seaborn selangkah lebih maju adalah cara Seaborn dapat memvisualisasikan data secara statistik.

Untuk memanfaatkan parameter Seaborn sebaik mungkin, kami sangat menyarankan untuk melihat dokumentasi Seaborn dan mencari tahu parameter apa yang digunakan untuk membuat plot Anda sedekat mungkin dengan kebutuhan bisnis.

Kesimpulan

Dalam pelajaran ini, kita melihat berbagai aspek dari perpustakaan visualisasi data ini yang dapat kita gunakan dengan Python untuk menghasilkan grafik yang indah dan intuitif yang dapat memvisualisasikan data dalam bentuk yang diinginkan bisnis dari sebuah platform. Seaborm adalah salah satu perpustakaan visualisasi terpenting dalam hal rekayasa data dan menyajikan data dalam sebagian besar bentuk visual, jelas merupakan keterampilan yang perlu kita miliki karena memungkinkan kita untuk membangun model regresi linier.

Silakan bagikan umpan balik Anda tentang pelajaran di Twitter dengan @sbmaggarwal dan @LinuxHint.

Game Remaster HD untuk Linux yang Belum Pernah Rilis Linux Sebelumnya
Banyak pengembang dan penerbit game datang dengan remaster HD dari game lama untuk memperpanjang umur waralaba, harap penggemar meminta kompatibilitas...
Cara Menggunakan AutoKey untuk Mengotomatiskan Game Linux
AutoKey adalah utilitas otomatisasi desktop untuk Linux dan X11, diprogram dengan Python 3, GTK dan Qt. Dengan menggunakan skrip dan fungsionalitas MA...
Cara Menampilkan Penghitung FPS di Game Linux
Game Linux mendapat dorongan besar ketika Valve mengumumkan dukungan Linux untuk klien Steam dan game mereka pada tahun 2012. Sejak itu, banyak game A...