panda

Cara Merencanakan Data di Pandas Python

Cara Merencanakan Data di Pandas Python
Visualisasi data memainkan peran penting dalam analisis data. Pandas adalah perpustakaan analisis data yang kuat dengan python untuk ilmu data. Ini menyediakan berbagai opsi untuk visualisasi data dengan .plot() metode. Bahkan jika Anda seorang pemula, Anda dapat dengan mudah memplot data Anda menggunakan perpustakaan Pandas. Anda perlu mengimpor panda dan matplotlib.paket pyplot untuk visualisasi data.

Pada artikel ini, kita akan mengeksplorasi berbagai metode plot data dengan menggunakan python Pandas. Kami telah mengeksekusi semua contoh pada editor kode sumber pycharm dengan menggunakan matplotlib.paket pyplot.

Merencanakan dalam Pandas Python

Di Panda, .plot() memiliki beberapa parameter yang dapat Anda gunakan berdasarkan kebutuhan Anda. Biasanya, dengan menggunakan parameter 'kind', Anda dapat menentukan jenis plot yang akan Anda buat.

Sintaks untuk Merencanakan Data menggunakan Pandas Python

Sintaks berikut digunakan untuk memplot DataFrame di Pandas Python:

# impor panda dan matplotlib.Paket pyplot
impor panda sebagai pd
impor matplotlib.pyplot sebagai plt
# Siapkan Data untuk membuat DataFrame
data_frame =
'Kolom1': ['bidang1', 'bidang2', 'bidang3', 'bidang4',… ],
'Kolom2': ['bidang1', 'bidang2', 'bidang3', 'bidang4',… ]

var_df= pd.DataFrame(data_frame, kolom=['Kolom1', 'Kolom2])
cetak (Variabel)
# merencanakan grafik batang
var_df.merencanakan.bar(x='Kolom1', y='Kolom2')
plt.menunjukkan()

Anda juga dapat menentukan jenis plot dengan menggunakan parameter kind sebagai berikut:

var_df.plot(x='Kolom1', y='Kolom2', jenis='bar')

Objek Pandas DataFrames memiliki metode plot berikut untuk membuat plot:

Jika pengguna hanya menggunakan metode plot() tanpa menggunakan parameter apa pun, itu akan membuat grafik garis default.

Kami sekarang akan menguraikan beberapa jenis utama plot secara rinci dengan bantuan beberapa contoh.

Scatter Plotting di Panda

Dalam jenis plot ini, kami telah mewakili hubungan antara dua variabel. Mari kita ambil contoh.

Contoh

Misalnya, kami memiliki data korelasi antara dua variabel GDP_growth dan Oil_price. Untuk memplot hubungan antara dua variabel, kami telah mengeksekusi potongan kode berikut pada editor kode sumber kami:

impor matplotlib.pyplot sebagai plt
impor panda sebagai pd
gdp_cal= pd.Bingkai Data(
'GDP_growth': [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Harga_Minyak': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame(gdp_cal, column=['Oil_Price', 'GDP_growth'])
cetak (df)
df.plot(x='Oil_Price', y='GDP_growth', jenis = 'scatter', color= 'red')
plt.menunjukkan()

Diagram Garis Plotting di Pandas  

Plot diagram garis adalah jenis plot dasar di mana informasi yang diberikan ditampilkan dalam rangkaian titik data yang selanjutnya dihubungkan oleh segmen garis lurus. Menggunakan grafik Garis, Anda juga dapat menunjukkan tren informasi dari waktu ke waktu.

Contoh

Dalam contoh yang disebutkan di bawah, kami telah mengambil data tentang tingkat inflasi tahun lalu. Pertama, siapkan datanya lalu buat DataFrame. Kode sumber berikut memplot grafik garis dari data yang tersedia:

impor panda sebagai pd
impor matplotlib.pyplot sebagai plt
infl_cal = 'Tahun': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame(infl_cal, kolom=['Tahun', 'Infl_Rate'])
data_frame.plot(x='Tahun', y='Infl_Rate', jenis='baris')
plt.menunjukkan()

Dalam contoh di atas, Anda perlu mengatur jenis = 'garis' untuk plot grafik garis.

Metode 2# Menggunakan plot.garis() metode

Contoh di atas, Anda juga dapat menerapkan menggunakan metode berikut:

impor panda sebagai pd
impor matplotlib.pyplot sebagai plt
inf_cal = 'Tahun': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Nilai_Inflasi': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame(inf_cal, kolom=['Inflation_Rate'], indeks=[2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
data_frame.merencanakan.garis()
plt.title('Ringkasan Tingkat Inflasi 11 Tahun Terakhir')
plt.ylabel('Nilai_Inflasi')
plt.xlabel('Tahun')
plt.menunjukkan()

Grafik garis berikut akan ditampilkan setelah menjalankan kode di atas:

Plotting Bar Chart di Pandas

Plot diagram batang digunakan untuk mewakili data kategorikal. Dalam jenis plot ini, batang persegi panjang dengan ketinggian yang berbeda diplot berdasarkan informasi yang diberikan. Bagan batang dapat diplot dalam dua arah horizontal atau vertikal yang berbeda.

Contoh

Kami telah mengambil tingkat melek huruf dari beberapa negara dalam contoh berikut:. DataFrames dibuat di mana 'Country_Names' dan 'literacy_Rate' adalah dua kolom dari DataFrame. Menggunakan Pandas, Anda dapat memplot informasi dalam bentuk grafik batang sebagai berikut:

impor panda sebagai pd
impor matplotlib.pyplot sebagai plt
lit_kal =
'Nama_Negara': ['Pakistan', 'AS', 'China', 'India', 'UK', 'Austria', 'Mesir', 'Ukraina', 'Saudia', 'Australia',
'Malaysia'],
'Litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame(lit_cal, kolom=['Nama_Negara', 'litr_Rate'])
cetak(data_frame)
data_frame.merencanakan.bar(x='Nama_Negara', y='litr_Rate')
plt.menunjukkan()

Anda juga dapat menerapkan contoh di atas menggunakan metode berikut:. Setel kind="bar" untuk diagram batang yang diplot di baris ini:

data_frame.plot(x='Nama_Negara', y='litr_Rate', jenis='bar')
plt.menunjukkan()

Plot diagram batang horizontal

Anda juga dapat memplot data pada bilah horizontal dengan mengeksekusi kode berikut:

impor matplotlib.pyplot sebagai plt
impor panda sebagai pd
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame(data_chart, kolom=['litr_Rate'], index=['Pakistan', 'USA', 'China', 'India', 'UK', 'Austria', 'Mesir', 'Ukraina', 'Saudia' , 'Australia',
'Malaysia'])
df.merencanakan.barh()
plt.title('Tingkat Melek Huruf di Berbagai Negara')
plt.ylabel('Nama_Negara')
plt.xlabel('Litr_Rate')
plt.menunjukkan()

dalam df.merencanakan.barh(), barh digunakan untuk ploting horizontal. Setelah menjalankan kode di atas, diagram batang berikut ditampilkan di jendela:

Pembuatan Diagram Pai di Panda

Bagan pai mewakili data dalam bentuk grafik melingkar di mana data ditampilkan menjadi irisan berdasarkan kuantitas yang diberikan.

Contoh

Dalam contoh berikut, kami telah menampilkan informasi tentang 'Bahan_Bumi' dalam irisan yang berbeda pada diagram lingkaran. Pertama, buat DataFrame, lalu, dengan menggunakan panda, tampilkan semua detail pada grafik.

impor panda sebagai pd
impor matplotlib.pyplot sebagai plt
material_per = 'Bagian_Bumi': [71,18,7,4]
kerangka data = pd.DataFrame(material_per,columns=['Earth_Part'],index = ['Water','Mineral','Sand','Metals'])
kerangka data.merencanakan.pie(y='Earth_Part',figsize=(7, 7),autopct='%1.1f%%', keterkejutan=90)
plt.menunjukkan()

Kode sumber di atas memplot grafik pai dari data yang tersedia:

Kesimpulan

Pada artikel ini, Anda telah melihat cara memplot DataFrames di Pandas python. Berbagai jenis plot dilakukan dalam artikel di atas. Untuk memplot lebih banyak jenis seperti kotak, hexbin, hist, kde, kepadatan, luas, dll., Anda dapat menggunakan kode sumber yang sama hanya dengan mengubah jenis plot.

OpenTTD vs Simutrans
Membuat simulasi transportasi Anda sendiri bisa menyenangkan, santai, dan sangat menarik. Itulah mengapa Anda perlu memastikan bahwa Anda mencoba game...
Tutorial OpenTTD
OpenTTD adalah salah satu game simulasi bisnis paling populer di luar sana. Dalam game ini, Anda perlu membuat bisnis transportasi yang luar biasa. Na...
SuperTuxKart untuk Linux
SuperTuxKart adalah judul hebat yang dirancang untuk memberi Anda pengalaman Mario Kart gratis di sistem Linux Anda. Ini cukup menantang dan menyenang...