Apache Solr

Mesin Pencari Self-Hosted Terbaik

Mesin Pencari Self-Hosted Terbaik
Apakah bos Anda tahu bahwa Anda sedang mencari pekerjaan lain?? Sudahkah Anda memberi tahu orang penting Anda tentang ketidakmampuan untuk memutuskan apakah Anda ingin memiliki anak atau tidak?? Apakah Anda orang tua tahu tentang orientasi seksual Anda?? Yah, Google dan mesin pencari utama lainnya melakukannya.

“Sebagian besar pengguna menelusuri Google saat masuk, sehingga semua informasi tentang kehidupan online mereka tersedia: penelusuran YouTube, email, dan riwayat penelusuran sebelumnya,” kata Adam Tauber, pengembang utama mesin metasearch yang menghormati privasi, Searx.

Tentu saja, Anda dapat menggunakan Tor untuk anonimitas dan selalu menghapus semua jejak aktivitas Anda setelah setiap pencarian, tetapi melakukannya setelah setiap pencarian kemungkinan besar akan menjadi tua dengan cepat. Sebagai gantinya, Anda harus mempertimbangkan untuk memasang mesin pencari yang di-hosting-sendiri yang mampu mengambil informasi untuk Anda tanpa mengungkapkan sesuatu yang sensitif tentang Anda.

Kami telah memilih dua mesin pencari seperti itu, dan kami juga memperkenalkan tiga mesin pencari tambahan untuk menunjukkan kepada Anda bahwa alternatif yang sangat baik untuk mesin pencari berpemilik seperti Google atau Bing sudah ada dan lebih mudah dipasang dan digunakan daripada yang Anda kira.

1. YaCy

YaCy adalah mesin pencari peer-to-peer terdistribusi gratis yang komponen intinya ditulis dalam Java. Karena semua pengguna YaCy sama, dan karena mesin pencari tidak menyimpan permintaan pencarian pengguna, penyensoran tidak mungkin dilakukan.

Saat ini, YaCy mengindeks sekitar 1.4 miliar dokumen dalam indeksnya berkat aktivitas lebih dari 600 operator sejenis yang berkontribusi setiap bulannya. Sebagai perbandingan, indeks Google Penelusuran berisi ratusan miliar halaman web dan berukuran lebih dari 100.000.000 gigabyte.

Sementara YaCy masih memiliki jalan panjang sebelum dapat menyaingi mesin pencari terpusat terbesar di dunia, itu sudah dapat digunakan sebagai portal pencarian untuk intranet pribadi dan aplikasi khusus proyek karena YaCy dapat beroperasi sebagai alat pencarian tunggal tanpa jaringan dengan yang lain. teman sebaya.

YaCy dapat dengan mudah diintegrasikan ke halaman web mana pun berkat cuplikan kode sederhana yang dapat dengan mudah disalin dan ditempel tanpa modifikasi apa pun.

2. Carix

Searx digambarkan sebagai mesin metasearch yang menghargai privasi dan dapat diretas. Ini tersedia di bawah GNU Affero General Public License versi 3, dan tujuan utamanya adalah untuk melindungi privasi penggunanya dengan tidak pernah membagikan alamat IP pengguna atau riwayat pencarian dengan mesin pencari dari mana ia mengumpulkan hasil.

“Saat menggunakan Searx, alamat IP Searx, Agen Pengguna acak, dan kueri penelusuran dikirim ke Google secara default,” Adam Tauber, alias asciimoo, menjelaskan cara kerja mesin metasearch-nya. “Tentu saja, Anda dapat menyesuaikan Searx untuk meneruskan parameter tambahan lainnya seperti bahasa pencarian atau nomor halaman dari halaman hasil yang diminta.”

Searx secara otomatis memblokir semua cookie pelacakan yang disajikan oleh mesin pencari untuk mencegah modifikasi hasil berbasis profil pengguna, yang dapat dihasilkan dari mesin pencari yang mencoba menerapkan pencarian yang bersifat individual berdasarkan apa yang diketahui mesin tentang pengguna. Searx 100 persen gratis, dan siapa pun dapat memodifikasinya sesuai kebutuhan. Anda bahkan dapat mengambil kode Searx dan menjalankan mesin metasearch di server Anda sendiri, yang pasti akan mengatasi masalah apa pun yang mungkin Anda miliki terkait log.

3. Pencarian elastis

ElasticSearch adalah mesin pencari berdasarkan Lucene, perpustakaan perangkat lunak pencarian informasi sumber terbuka dan gratis yang didukung oleh Apache Software Foundation dan dirilis di bawah Lisensi Perangkat Lunak Apache.

ElasticSearch menyediakan mesin pencari teks lengkap dengan antarmuka web HTTP. Mesin pencari dapat digunakan untuk mencari semua jenis dokumen, dan dapat dengan mudah didistribusikan ke beberapa node.

Dimungkinkan untuk membangun mesin pencari yang dihosting sendiri menggunakan ElasticSearch dan Docker, dan Anda dapat menemukan tutorial yang menjelaskan prosesnya di sini.

4. Ambar

Ambar adalah mesin pencari dokumen sumber terbuka dengan banyak fitur berguna. Ini mendukung perayapan otomatis, penandaan, dan pencarian teks lengkap instan, hanya untuk memberikan beberapa contoh. Salah satu fitur paling menarik dari Ambar adalah kemampuannya untuk melakukan OCR pada gambar dan file PDF PDF. Bahasa yang didukung termasuk Inggris, Jerman, Rusia, Italia, Prancis, Spanyol, Polandia, dan Belanda.

Ambar dapat dengan mudah digunakan dengan satu file komposisi buruh pelabuhan, dan Anda dapat mempelajari cara melakukannya di sini.

5. Apache Solr

Ditulis dalam Java, Apache Solr adalah platform pencarian perusahaan yang mencakup pencarian teks lengkap, penyorotan hit, pencarian segi, pengindeksan waktu nyata, pengelompokan dinamis, dan banyak fitur penting lainnya. Itu dibuat pada tahun 2004 untuk proyek in-house di CNET Networks. CNET Networks dengan baik hati menyumbangkannya ke Apache Software Foundation pada tahun 2006, di mana ia lulus dari status inkubasi menjadi proyek tingkat atas yang berdiri sendiri pada tahun 2007.

Saat ini, Solr adalah platform pencarian perusahaan yang sangat andal, terukur, dan toleran terhadap kesalahan yang mendukung fitur pencarian dan navigasi dari banyak situs internet terbesar di dunia, termasuk DuckDuckGo, eHarmony, dan BestBuy. Kamu bisa

Cara Menginstal dan Mengonfigurasi YaCy

Instalasi YaCy sangat sederhana, dan hanya membutuhkan beberapa menit karena Anda tidak perlu menginstal database eksternal atau server web-YaCy dilengkapi dengan semua yang diperlukan.

  1. Buka situs web resmi YaCy dan unduh paket terbaru untuk Linux.
  2. Instal lingkungan runtime OpenJDK 8.
    • Jika Anda menggunakan distribusi berbasis Debian, gunakan perintah berikut: $ sudo apt-get install openjdk-8-jre
    • Jika tidak, ikuti petunjuk khusus untuk distribusi Anda.
  3. Ekstrak paket yang diunduh ke lokasi pilihan Anda.
  4. Buka folder baru dan mulai "startYACY.sh” di Terminal.
  5. Anda akan melihat pesan konfirmasi yang memberi tahu Anda bahwa YaCy dimulai sebagai daemon

Kesimpulan

Mesin pencari tahu lebih banyak tentang kami daripada yang ingin diakui kebanyakan orang. Jika Anda ingin berhenti memberi makan perusahaan besar dengan data menarik, Anda dapat mengambil tindakan sendiri dan menyiapkan mesin pencari yang dihosting sendiri untuk melindungi privasi Anda. Meskipun mesin pencari yang dihosting sendiri masih memiliki jalan panjang untuk dapat digunakan sepenuhnya, potensi mereka untuk mengungguli orang-orang seperti Google ada di sana dan menangkapnya hanyalah masalah menarik lebih banyak pengguna.

Cara Menggunakan Xdotool untuk Merangsang Klik Mouse dan Keystroke di Linux
Xdotool adalah alat baris perintah sumber terbuka dan gratis untuk mensimulasikan klik mouse dan penekanan tombol. Artikel ini akan membahas panduan s...
5 Produk Mouse Komputer Ergonomis Terbaik untuk Linux
Apakah penggunaan komputer yang lama menyebabkan rasa sakit di pergelangan tangan atau jari Anda?? Apakah Anda menderita persendian yang kaku dan teru...
Cara Mengubah Pengaturan Mouse dan Touchpad Menggunakan Xinput di Linux
Sebagian besar distribusi Linux dikirimkan dengan pustaka "libinput" secara default untuk menangani kejadian input pada sistem. Ini dapat memproses ke...