CARA KERJA SEARCH ENGINE (MESIN PENCARI)
Mesin pencari atau Search engine adalah program
komputer yang dirancang untuk melakukan pencarian atas berkas-berkas
yang tersimpan dalam layanan www, ftp, publikasi milis, ataupun news
group dalam sebuah ataupun sejumlah komputer peladendalam
suatu jaringan. Search engine merupakan perangkat pencari informasi dari
dokumen-dokumen yang tersedia. Hasil pencarian umumnya ditampilkan
dalam bentuk daftar yang seringkali diurutkan menurut tingkat akurasi
ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits.
Informasi yang menjadi target pencarian bisa terdapat dalam berbagai
macam jenis berkas seperti halaman situs web, gambar, ataupun
jenis-jenis berkas lainnya.
Cara Kerja Mesin Pencari
Mesin pencari web bekerja dengan cara menyimpan informasi tentang
banyak halaman web, yang diambil langsung dari WWW. Halaman-halaman ini
diambil dengan web crawler — browser web otomatis yang mengikuti
setiap pranala/link yang dilihatnya. Isi setiap halaman lalu dianalisis
untuk menentukan cara indeks-nya (misalnya, kata-kata diambil dari
judul, subjudul, atau field khusus yang disebut meta tag). Data tentang halaman web disimpan dalam sebuah database indeks
untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari,
seperti Google, menyimpan seluruh atau sebagian halaman sumber (yang
disebut cache) maupun informasi tentang halaman web itu sendiri.
Selain halaman web, Mesin pencari juga menyimpan dan memberikan
informasi hasil pencarian berupa pranala yang merujuk pada file,
seperti file audio, file video, gambar, foto dan sebagainya,
serta informasi tentang seseorang, suatu produk, layanan, dan informasi
beragam lainnya yang semakin terus berkembang sesuai dengan
perkembangan teknologi informasi.
Ketika seseorang mengunjungi mesin pencari dan memasukkan query,
biasanya dengan memasukkan kata kunci, mesin mencari indeks dan
memberikan daftar halaman web yang paling sesuai dengan kriterianya,
biasanya disertai ringkasan singkat mengenai judul dokumen dan
kadang-kadang sebagian teksnya.
Ada jenis mesin pencari lain: mesin pencari real-time,
seperti Orase. Mesin seperti ini tidak menggunakan indeks. Informasi
yang diperlukan mesin tersebut hanya dikumpulkan jika ada pencarian
baru. Jika dibandingkan dengan sistem berbasis indeks yang digunakan
mesin-mesin seperti Google, sistem real-time ini unggul dalam
beberapa hal: informasi selalu mutakhir, (hampir) tak ada pranala mati,
dan lebih sedikit sumber daya sistem yang diperlukan. (Google
menggunakan hampir 100.000 komputer, Orase hanya satu.) Tetapi, ada juga
kelemahannya: pencarian lebih lama rampungnya.
Manfaat mesin pencari bergantung pada relevansi hasil-hasil yang
diberikannya. Meskipun mungkin ada jutaan halaman web yang mengandung
suatu kata atau frasa, sebagian halaman mungkin lebih relevan, populer,
atau autoritatif daripada yang lain. Kebanyakan mesin pencari
menggunakan berbagai metode untuk menentukan peringkat hasil pencarian
agar mampu memberikan hasil “terbaik” lebih dahulu. Cara mesin
menentukan halaman mana yang paling sesuai, dan urutan halaman-halaman
itu diperlihatkan, sangat bervariasi. Metode-metode nya juga berubah
seiring waktu dengan berubahnya penggunaan internet dan berevolusinya
teknik-teknik baru.
Sebagian besar mesin pencari web adalah usaha komersial yang didukung
pemasukan iklan dan karenanya sebagian menjalankan praktik
kontroversial, yaitu membolehkan pengiklan membayar agar halaman mereka
diberi peringkat lebih tinggi dalam hasil pencarian.
Proses Pencarian
Melakukan pencarian dokumen yang dimuat pada suatu situs bisa begitu
mudah dan kelihatannya mungkin sulit juga. apalagi mengignat begitu
menyebarnya informasi dimana-mana, bahkan University of Calofornia
menyebutkan saat ini telah terdapat lebih dari 50 milyar halaman web
di internet, meskipun tidak ada ada satupun yang benar-benar tahu jumlah
persisnya.
kesulitan yang mungkin terjadi adalah karena WWW tersebut tidak
terdata dalam bentuk yang terstandardisasi isinya. tidak sama halnya
dengan katalog yang ada di perpustakaan, yang memiliki standardisasi
secara mendunia berdasarkan subjek dari judul buku, meskipun jumlahnya
juga tidak sedikit.
Dalam pencarian di web, pengguna selalu memperkirakan kata apa yang
di kira-kira terdapat pada halaman yang ingin anda temukan. atau
kira-kira apa subjek yang dipilih oleh seseorang untuk mengelolah
halaman situs yang mereka kelola, topik apa saja kira-kira yang di
bahas.
Jika pengguna melakukan apa yang dikenal dengan pencarian pada
halaman web, sebenarnya tidaklah melakukan pencarian. tidak mungkin
melakukan pencarian di WWW secara langsung.
Pada web benar-benar terdiri dari banyak sekali halaman web yang
ingin disimpan dari berbagai server diseluruh dunia. Komputer pengguna
tidak langsung melakukan pencarian kepada seluruh komputer tersebut
secara langsung.
Apa yang mungkin pengguna lakukan hanyalah melalui komputer untuk
mengakses satu atau lebih perantara yang disebut dengan alat bantu
pencarian yang ada saat ini. Melakukan pencarian pada alat bantu itu
tadi ke database yang dimiliki. data base tersebut mengkoleksi
situs-situs yang ditemukan dan simpan.
alat bantu pencarian ini menyediakan hasil pencarian dalam bentuk hypertext link dengan
URL menuju halaman lainnya. ketika anda klik link ini, dan menuju ke
alamat tersebut maka dokumen, gambar, suara dan banyak lagi bentuk
lainnya yang ada pada server tersebut disediakan, sesuai dengan
informasi yang terdapat di dalamnya. layanan ini bisa menjangkau ke
manapun di seluruh dunia.
Prinsip Umum Dari Mesin Pencari
Sistem kinerja mesin ini ada beberapa hal yang perlu di perhatikan
terutama keterkaitannya dengan masalah arsitekrut dan mekanismenya.
Spider
Merupakan program yang men-download halaman-halaman yang mereka
temukan, mirip dengan browser. Perbedannya adalah bahwa browser
menapilkan secara langsung informasi yang ada (baik tekas, gambar, dll).
Untuk kepentingan manusia yang menggunakannya pada saat itu, sedangkan
spider tidak melakukan untuk menampilkan dalam bentuk yang terlihat
seperti itu, karena kepentingannya adalah untuk mesin, bukan untuk
manusia, spider pun dijalankan oleh mesin secara otomatis.
Kepentingannya adalah untuk mengambil halaman-halaman yang dikunjunginya
untuk disimpan kedalam database yang dimiliki oleh search engine.
Crawler
Merupakan program yang dimiliki search engine untuk melacak dan
menemukan link yang terdapat dari setiap halaman yang ditemuinya.
Tugasnya adalah untuk menentukan spoder harus pergi kemana dan
mengevaluasi link berdasarkan alamat yang ditentukan dari awal. Crawler
mengikuti link dan mencoba menemukan dokumen yang belum dikenal oleh
search engine.
Indexer
Komponen ini melakukan aktifitas untuk menguraikan masing-masing
halaman dan meneliti berbagai unsur, seperti teks, headers, struktur
atau fitur dari gaya penulisan, tag HTML khusus, dll.
Database
Merupakan tempat standar untuk menyimpan data-data dari halaman yang
telah dikunjungi, di-download dan sudah dianalisis. kadang kala disebut
juga dengan index dari suatu search engine.
Result Engine
Mesin yang melakukan penggolongan dan penentuan peringkat dari hasil
pencarian pada search engine. Mesin ini menentukan halaman mana yang
menemui kriteria terbaik dari hasil pencarian berdasarkan permintaan
penggunanya, dan bagaimana bentuk penampulan yang akan ditampilkan.
Proses ini dilaksanakan berdasarkan algoritma perangkingan yang
dimiliki oleh search engine tersebut, mengikuti kaidah perangkingan
hakaman yang dipergunakan oleh mereka adalah hak mereka, para peneliti
mempelajari sifat-sifat yang mereka gunakan, terutama untuk meningkatkan
pencarian yang dihasilkan oleh serach engine tersebut.
Web Server
Merupakan komponen yang melayani permintaan dan memberikan respon
balik dari permintaan tersebut. Web Server ini biasanya
menghasilkan informasi atau dokumen dalam format HTML. Pada halaman
tersebut tersedia layanan untuk mengisikan kata kunci pencarian yang
diinginkan oleh usernya. Web Server ini juga bertanggung jawab dalam
menyampaikan hasil pencarian yang dikirimkan kepada komputer yang
meminta informasi.
Untuk lebih jelas silahkan klik Disini

Tidak ada komentar:
Posting Komentar
Ketik disini