awk

Awk Pangkas Spasi Putih

Awk Pangkas Spasi Putih
Sebagai seorang programmer, Anda mungkin harus bekerja dengan file yang berbeda untuk menyimpan dan memanipulasi data. Satu tugas manipulasi file dasar melibatkan penghapusan spasi putih dalam file. Spasi putih terdiri dari spasi, baris kosong, nbsp, dan tab. Pemrogram sering kali perlu menghapus spasi putih sehingga hanya data yang diperlukan yang disimpan dan spasi putih yang tidak perlu dapat dihilangkan. Spasi putih dapat berupa spasi awal (di awal baris) atau spasi tambahan (di akhir baris).

Berikut ini termasuk beberapa skenario di mana menghapus spasi putih mungkin diperlukan:

Dimungkinkan untuk menghapus spasi secara manual jika file yang hanya berisi beberapa baris. Tapi, untuk file yang berisi ratusan baris, maka akan sulit untuk menghapus semua spasi secara manual. Ada berbagai alat baris perintah yang tersedia untuk tujuan ini, termasuk sed, awk, cut, dan tr. Di antara alat-alat ini, awk adalah salah satu perintah yang paling kuat.

Apa Itu Awk?

Awk adalah bahasa scripting yang kuat dan berguna yang digunakan dalam manipulasi teks dan pembuatan laporan. Perintah awk disingkat menggunakan inisial masing-masing orang (Aho, Weinberger, dan Kernighan) yang mengembangkannya. Awk memungkinkan Anda untuk mendefinisikan variabel, fungsi numerik, string, dan operator aritmatika; membuat laporan yang diformat; dan banyak lagi.

Artikel ini menjelaskan penggunaan perintah awk untuk memangkas spasi putih. Setelah membaca artikel ini, Anda akan mempelajari cara menggunakan perintah awk untuk melakukan hal berikut:

Perintah dalam artikel ini dilakukan pada Ubuntu 20.04 Sistem Fossa Fossa. Namun, perintah yang sama juga dapat dilakukan pada distribusi Linux lainnya. Kami akan menggunakan aplikasi Terminal Ubuntu default untuk menjalankan perintah di artikel ini. Anda dapat mengakses terminal menggunakan pintasan keyboard Ctrl+Alt+T.

Untuk tujuan demonstrasi, kami akan menggunakan file sampel bernama "sampel".txt.” untuk melakukan contoh yang disediakan dalam artikel ini.

Lihat Semua Spasi Putih dalam File

Untuk melihat semua spasi putih yang ada dalam file, pipa output dari perintah cat ke perintah tr, sebagai berikut:

$ sampel kucing.txt | tr " " "*" | tr "\t" "&"

Perintah ini akan menggantikan semua spasi dalam file yang diberikan dengan karakter (*)). Setelah memasukkan perintah ini, Anda akan dapat melihat dengan jelas di mana semua spasi putih (termasuk spasi putih awal dan akhir) ada dalam file.

Karakter * di tangkapan layar berikut menunjukkan di mana semua spasi putih ada dalam file sampel. Satu * mewakili spasi tunggal.

Pangkas Semua Spasi

Untuk menghapus semua spasi putih dari file, pipa perintah out of cat ke perintah awk, sebagai berikut:

$ sampel kucing.txt | awk ' gsub(/ /,""); cetak '

Dimana

Perintah di atas menggantikan semua spasi putih (/ /) dengan apa-apa (“”).

Pada tangkapan layar berikut, Anda dapat melihat bahwa semua spasi putih, termasuk spasi putih awal dan akhir, telah dihapus dari output.

Pangkas Spasi Putih Utama

Untuk menghapus hanya spasi putih utama dari file, pipa perintah out of cat ke perintah awk, sebagai berikut:

$ sampel kucing.txt | awk ' sub(/^[ \t]+/, ""); cetak '

Dimana

Perintah di atas menggantikan satu atau lebih spasi di awal string (^[ \t]+ ) dengan apa-apa (“") untuk menghapus spasi putih di depan.

Pada tangkapan layar berikut, Anda dapat melihat bahwa semua spasi putih terkemuka telah dihapus dari output.

Anda dapat menggunakan perintah berikut untuk memverifikasi bahwa perintah di atas telah menghapus spasi putih terkemuka:

$ sampel kucing.txt | awk ' sub(/^[ \t]+/, ""); cetak ' | tr " " "*" |
tr "\t" "&"

Pada tangkapan layar di bawah, terlihat jelas bahwa hanya spasi putih utama yang telah dihapus.

Pangkas Spasi Belakangan

Untuk menghapus hanya spasi putih tambahan dari file, pipa perintah out of cat ke perintah awk, sebagai berikut:

$ sampel kucing.txt | awk ' sub(/[ \t]+$/, ""); cetak '

Dimana

Perintah di atas menggantikan satu atau lebih spasi di akhir string ([ \t]+ $) tanpa apa-apa ( "") untuk menghapus spasi tambahan.

Anda dapat menggunakan perintah berikut untuk memverifikasi bahwa perintah di atas telah menghapus spasi putih tambahan:

$ sampel kucing.txt | awk ' sub(/[ \t]+$/, ""); cetak ' | tr " " "*" | tr "\t" "&"

Dari tangkapan layar di bawah, terlihat jelas bahwa spasi putih yang tertinggal telah dihapus.

Pangkas Spasi Putih Depan dan Belakang

Untuk menghapus spasi putih awal dan akhir dari file, pipa perintah out of cat ke perintah awk, sebagai berikut:

$ sampel kucing.txt | awk ' gsub(/^[ \t]+|[ \t]+$/, ""); cetak '

Dimana

Perintah di atas menggantikan spasi awal dan akhir (^[ \t]+ [ \t]+$) tanpa apa pun (“”) untuk menghapusnya.

Untuk menentukan apakah perintah di atas telah menghapus spasi putih awal dan akhir dalam file, gunakan perintah berikut:

$ sampel kucing.txt | awk ' gsub(/^[ \t]+|[ \t]+$/, ""); cetak ' |
tr " " "*" | tr "\t" "&"

Dari tangkapan layar di bawah, terlihat jelas bahwa spasi putih awal dan akhir telah dihapus, dan hanya spasi putih di antara string yang tersisa.

Ganti Banyak Spasi dengan Satu Spasi

Untuk mengganti beberapa spasi dengan satu spasi, pipa perintah out of cat ke perintah awk, sebagai berikut:

$ sampel kucing.txt | awk ' gsub(/[ ]+/," "); cetak '

Dimana:

Perintah di atas menggantikan beberapa spasi putih ([ ]+) dengan satu spasi putih (““).

Anda dapat menggunakan perintah berikut untuk memverifikasi bahwa perintah di atas telah menggantikan beberapa spasi dengan spasi putih:

$ sampel kucing.txt | awk ' sub(/[ \t]+$/, ""); cetak ' | | tr " " "*" | tr "\t" "&"

Ada beberapa spasi di file sampel kami. Seperti yang Anda lihat, beberapa spasi putih dalam sampel.File .txt diganti dengan satu spasi putih dengan menggunakan perintah awk.

Untuk memangkas spasi putih hanya pada baris yang berisi karakter tertentu, seperti koma, titik dua, atau titik koma, gunakan perintah awk dengan -F pemisah masukan.

Misalnya, yang ditunjukkan di bawah ini adalah file sampel kami yang berisi spasi putih di setiap baris.

Untuk menghapus spasi putih hanya dari baris yang berisi koma (,), perintahnya adalah sebagai berikut:

$ sampel kucing1.txt | awk -F, '/,/gsub(/ /,""); mencetak'

Dimana (-F,) adalah pemisah bidang input.

Perintah di atas hanya akan menghapus dan menampilkan spasi putih dari baris yang berisi karakter tertentu (,) di dalamnya. Garis lainnya tidak akan terpengaruh.

Kesimpulan

Itu saja yang perlu Anda ketahui untuk memangkas spasi putih di data Anda menggunakan perintah awk. Menghapus spasi putih dari data Anda mungkin diperlukan karena beberapa alasan berbeda. Apa pun alasannya, Anda dapat dengan mudah memangkas semua spasi putih di data Anda menggunakan perintah yang dijelaskan dalam artikel ini. Anda bahkan dapat memangkas spasi putih awal atau akhir, memangkas spasi putih awal dan akhir, dan mengganti multi spasi dengan satu spasi dengan perintah awk.

Game Lab Aplikasi Oculus Teratas
Jika Anda adalah pemilik headset Oculus maka Anda harus tahu tentang sideloading. Sideloading adalah proses menginstal konten non-toko di headset Anda...
10 Game Teratas untuk Dimainkan di Ubuntu
Platform Windows telah menjadi salah satu platform yang mendominasi untuk bermain game karena persentase besar dari game yang berkembang saat ini untu...
5 Game Arkade Terbaik untuk Linux
Saat ini, komputer adalah mesin serius yang digunakan untuk bermain game. Jika Anda tidak bisa mendapatkan skor tinggi baru, Anda akan tahu apa yang s...