Pada artikel ini, kita akan mengeksplorasi berbagai metode plot data dengan menggunakan python Pandas. Kami telah mengeksekusi semua contoh pada editor kode sumber pycharm dengan menggunakan matplotlib.paket pyplot.
Merencanakan dalam Pandas Python
Di Panda, .plot() memiliki beberapa parameter yang dapat Anda gunakan berdasarkan kebutuhan Anda. Biasanya, dengan menggunakan parameter 'kind', Anda dapat menentukan jenis plot yang akan Anda buat.
Sintaks untuk Merencanakan Data menggunakan Pandas Python
Sintaks berikut digunakan untuk memplot DataFrame di Pandas Python:
# impor panda dan matplotlib.Paket pyplotimpor panda sebagai pd
impor matplotlib.pyplot sebagai plt
# Siapkan Data untuk membuat DataFrame
data_frame =
'Kolom1': ['bidang1', 'bidang2', 'bidang3', 'bidang4',… ],
'Kolom2': ['bidang1', 'bidang2', 'bidang3', 'bidang4',… ]
var_df= pd.DataFrame(data_frame, kolom=['Kolom1', 'Kolom2])
cetak (Variabel)
# merencanakan grafik batang
var_df.merencanakan.bar(x='Kolom1', y='Kolom2')
plt.menunjukkan()
Anda juga dapat menentukan jenis plot dengan menggunakan parameter kind sebagai berikut:
var_df.plot(x='Kolom1', y='Kolom2', jenis='bar')Objek Pandas DataFrames memiliki metode plot berikut untuk membuat plot:
- Merencanakan Pencar: merencanakan.menyebarkan()
- Merencanakan Batang: merencanakan.bar() , plot.barh() di mana h mewakili plot batang horizontal.
- Merencanakan Garis: merencanakan.garis()
- Merencanakan Pai: merencanakan.pai()
Jika pengguna hanya menggunakan metode plot() tanpa menggunakan parameter apa pun, itu akan membuat grafik garis default.
Kami sekarang akan menguraikan beberapa jenis utama plot secara rinci dengan bantuan beberapa contoh.
Scatter Plotting di Panda
Dalam jenis plot ini, kami telah mewakili hubungan antara dua variabel. Mari kita ambil contoh.
Contoh
Misalnya, kami memiliki data korelasi antara dua variabel GDP_growth dan Oil_price. Untuk memplot hubungan antara dua variabel, kami telah mengeksekusi potongan kode berikut pada editor kode sumber kami:
impor matplotlib.pyplot sebagai pltimpor panda sebagai pd
gdp_cal= pd.Bingkai Data(
'GDP_growth': [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Harga_Minyak': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame(gdp_cal, column=['Oil_Price', 'GDP_growth'])
cetak (df)
df.plot(x='Oil_Price', y='GDP_growth', jenis = 'scatter', color= 'red')
plt.menunjukkan()
Diagram Garis Plotting di Pandas
Plot diagram garis adalah jenis plot dasar di mana informasi yang diberikan ditampilkan dalam rangkaian titik data yang selanjutnya dihubungkan oleh segmen garis lurus. Menggunakan grafik Garis, Anda juga dapat menunjukkan tren informasi dari waktu ke waktu.
Contoh
Dalam contoh yang disebutkan di bawah, kami telah mengambil data tentang tingkat inflasi tahun lalu. Pertama, siapkan datanya lalu buat DataFrame. Kode sumber berikut memplot grafik garis dari data yang tersedia:
impor panda sebagai pdimpor matplotlib.pyplot sebagai plt
infl_cal = 'Tahun': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame(infl_cal, kolom=['Tahun', 'Infl_Rate'])
data_frame.plot(x='Tahun', y='Infl_Rate', jenis='baris')
plt.menunjukkan()
Dalam contoh di atas, Anda perlu mengatur jenis = 'garis' untuk plot grafik garis.
Metode 2# Menggunakan plot.garis() metode
Contoh di atas, Anda juga dapat menerapkan menggunakan metode berikut:
impor panda sebagai pdimpor matplotlib.pyplot sebagai plt
inf_cal = 'Tahun': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Nilai_Inflasi': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame(inf_cal, kolom=['Inflation_Rate'], indeks=[2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
data_frame.merencanakan.garis()
plt.title('Ringkasan Tingkat Inflasi 11 Tahun Terakhir')
plt.ylabel('Nilai_Inflasi')
plt.xlabel('Tahun')
plt.menunjukkan()
Grafik garis berikut akan ditampilkan setelah menjalankan kode di atas:
Plotting Bar Chart di Pandas
Plot diagram batang digunakan untuk mewakili data kategorikal. Dalam jenis plot ini, batang persegi panjang dengan ketinggian yang berbeda diplot berdasarkan informasi yang diberikan. Bagan batang dapat diplot dalam dua arah horizontal atau vertikal yang berbeda.
Contoh
Kami telah mengambil tingkat melek huruf dari beberapa negara dalam contoh berikut:. DataFrames dibuat di mana 'Country_Names' dan 'literacy_Rate' adalah dua kolom dari DataFrame. Menggunakan Pandas, Anda dapat memplot informasi dalam bentuk grafik batang sebagai berikut:
impor panda sebagai pdimpor matplotlib.pyplot sebagai plt
lit_kal =
'Nama_Negara': ['Pakistan', 'AS', 'China', 'India', 'UK', 'Austria', 'Mesir', 'Ukraina', 'Saudia', 'Australia',
'Malaysia'],
'Litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame(lit_cal, kolom=['Nama_Negara', 'litr_Rate'])
cetak(data_frame)
data_frame.merencanakan.bar(x='Nama_Negara', y='litr_Rate')
plt.menunjukkan()
Anda juga dapat menerapkan contoh di atas menggunakan metode berikut:. Setel kind="bar" untuk diagram batang yang diplot di baris ini:
data_frame.plot(x='Nama_Negara', y='litr_Rate', jenis='bar')plt.menunjukkan()
Plot diagram batang horizontal
Anda juga dapat memplot data pada bilah horizontal dengan mengeksekusi kode berikut:
impor matplotlib.pyplot sebagai pltimpor panda sebagai pd
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame(data_chart, kolom=['litr_Rate'], index=['Pakistan', 'USA', 'China', 'India', 'UK', 'Austria', 'Mesir', 'Ukraina', 'Saudia' , 'Australia',
'Malaysia'])
df.merencanakan.barh()
plt.title('Tingkat Melek Huruf di Berbagai Negara')
plt.ylabel('Nama_Negara')
plt.xlabel('Litr_Rate')
plt.menunjukkan()
dalam df.merencanakan.barh(), barh digunakan untuk ploting horizontal. Setelah menjalankan kode di atas, diagram batang berikut ditampilkan di jendela:
Pembuatan Diagram Pai di Panda
Bagan pai mewakili data dalam bentuk grafik melingkar di mana data ditampilkan menjadi irisan berdasarkan kuantitas yang diberikan.
Contoh
Dalam contoh berikut, kami telah menampilkan informasi tentang 'Bahan_Bumi' dalam irisan yang berbeda pada diagram lingkaran. Pertama, buat DataFrame, lalu, dengan menggunakan panda, tampilkan semua detail pada grafik.
impor panda sebagai pdimpor matplotlib.pyplot sebagai plt
material_per = 'Bagian_Bumi': [71,18,7,4]
kerangka data = pd.DataFrame(material_per,columns=['Earth_Part'],index = ['Water','Mineral','Sand','Metals'])
kerangka data.merencanakan.pie(y='Earth_Part',figsize=(7, 7),autopct='%1.1f%%', keterkejutan=90)
plt.menunjukkan()
Kode sumber di atas memplot grafik pai dari data yang tersedia:
Kesimpulan
Pada artikel ini, Anda telah melihat cara memplot DataFrames di Pandas python. Berbagai jenis plot dilakukan dalam artikel di atas. Untuk memplot lebih banyak jenis seperti kotak, hexbin, hist, kde, kepadatan, luas, dll., Anda dapat menggunakan kode sumber yang sama hanya dengan mengubah jenis plot.