DEFINISI SEARCH ENGINE
Search engine atau mesin pencari merupakan sebuah website yang mempu mengindeks berbagai URL atau alamat web yang berada di dunia maya sehingga mempunyai database besar tentang berbagai URL lengkan dengan deskripsinya. Search engine bertujuan untuk memudahkan seseorang dalam menemukan apa yang dicari dalam dunia maya sesuai dengan apa yang diinginkan. Bisa dibayangkan, dalam hitungan detik dapat ditemukan ratusan ribu informasi yang diinginkan. Berbagai format file dapat dibaca oleh search engine, baik berupa teks, gambar, suara, video, presentasi, animasi maupun file asli. Jutaan orang memanfaatkan mesin pencari secara bersamaan dalam waktu 24 jam non-stop setiap harinya. Hal inilah yang menyebabkan search engine sebagai fasilitas vital di intenet.
SEJARAH SEARCH ENGINE
Search engine yang pertama kali muncul adalah “Wandex” dari World Wide Web Wanderer, suatu web crawler yang dibangun oleh Matthew Gray di MIT pada 1993 namun sekarang wandex tidak berfungsi lagi. Pada tahun yang sama muncul mesin pencari web bernama Aliweb, dan sampai saat ini masih beroperasi dengan baik. Pada tahun 1994, Carnegie Mellon University telah memperkenalkan sebuah mesin pencari pertama yang bernama Lycos, di mana mesin pencari ini sekarang berkembang menjadi usaha komersial yang cukup besar. Segera sesudah itu, beberapa mesin pencari banyak bermunculan dan bersaing untuk memperebutkan popularitas. Termasuk di antaranya adalah WebCrawler, Hotbot, Excite, Infoseek, Inktomi, dan AltaVista. Mereka bersaing dengan direktori-direktori populer seperti misalnya Yahoo!. Perkembangan selanjutnya, direktori-direktori tersebut menggabungkan atau menambahkan teknologi mesin pencari agar fungsinya semakin meningkat. Pada tahun 2002, Yahoo! mengakuisisi Inktomi dan selang satu tahun mengakuisisi Overture yang memiliki AlltheWeb dan Altavista. Tahun 2004, Yahoo! meluncurkan mesin pencarinya sendiri yang didasarkan pada teknologi gabungan dari mesin-mesin yang telah diakuisisi tersebut dan memberikan pelayanan dengan mengutamakan mesin pencari Web dibandingkan direktorinya.
Pada Desember 2003, Orase meluncurkan versi pertama dari teknologi pencari secara real-time. Mesin ini memiliki banyak fungsi baru dan kemampuannya meningkat sangat canggih. Pada akhir tahun 1990-an, mesin pencari dikenal sebagai bintang-bintang yang paling cemerlang dalam kompetisi berinvestasi di Internet. Sebagian lagi, sama sekali menyingkirkan mesin pencari publiknya, dan hanya memasarkan edisi-edisi Enterprise saja, seperti misalnya Northern Light yang dulunya adalah salah satu dari 8 atau 9 mesin pencari awal setelah Lycos muncul.
Sebelum munculnya Web, ada pula mesin-mesin pencari untuk protokol atau penggunaan lain, seperti misalnya Archie search engine untuk situs-situs FTP anonim dan Veronica search engine untuk Gopher protocol. Mesin-mesin pencari lainnya adalah: a9.com, AlltheWeb, Ask Jeeves, Clusty, Gigablast, Teoma, Wisenut, GoHook, Kartoo, dan Vivisimo.
CARA KERJA SEARCH ENGINE
Seperti telah disinggung di awal, search engine dirancang untuk mengindeks hasil temuan berupa alamat web (URL, FTP, dan lain-lain) dari sistem database. Untuk menunjang tugas tersebut, search engine dilengkapi program khusus yaitu: spider, bot (robot), dan crawler. Sang ‘laba-laba elektronik ‘(spider) dan robot akan “merayap”dari satu alamat web ke alamat web lain, dari satu link ke link lainnya. Ketika sang laba-laba tersebut tiba pada sebuah halaman web, dia akan membuat indeks dari sebagian besar kata-kata yang terdapat dalam situs tesebut. Sedangkan pemilik halaman web mengirimkan URL situsnya ke search engine agar dikunjungi laba-laba dan dicantumkan ke dalam basis data search engine tersebut.
Ketika mencari data atau informasi di web menggunakan search engine, sebenarnya Anda membuat permintaan kepada search engine tersebut untuk mengecek indeks yang telah disusun oleh search engine pada basis datanya, kemudian mencocokkannya dengan keyword (kata kunci) yang diminta. Setelah data sesuai dengan yang diminta, search engine akan menyajikan kepada Anda dalam bentuk daftar link pada layar monitor, selanjutnya informasi tersebut dapat diklik untuk diantar ke situs sesuai tujuan.
Perlu diingat bahwa ketika Anda menggunakan salah satu search engine untuk mendapatkan informasi, sebenarnya tidak mencari informasi ke seluruh web di dunia maya namun hanya bagian terkecil saja. Mengapa hal ini terjadi? Semua itu disebabkan keterbatasan kemampuan masing-masing search engine dalam menemukan informasi pada web yang diperkirakan berjumlah ratusan milyar!, dan bertambah sekitar 7 juta per harinya!. Tidak ada search engine satu pun mampu mengumpulkan informasi dalam basis data yang memuat ratusan milyar alamat URL. Dapat dibayangkan, Anda harus mencari informasi di antara ratusan milyar halaman web tanpa menggunakan search engine. Tanpa alat tersebut, mustahil informasi dapat ditemukan. Saat ini, alat tersebut merupakan salah satu hal yang paling urgent ketika mencari informasi di internet.
Kebanyakan mesin pencari menggunakan berbagai metode untuk menentukan peringkat hasil pencarian agar mampu memberikan hasil “terbaik” lebih dahulu. Cara mesin menentukan halaman web mana yang paling sesuai, dan urutan halaman-halaman tersebut diperlihatkan pada hasil pencarian sangat bervariasi. Metode-metodenya juga berubah seiring waktu dengan berubahnya penggunaan internet dan berevolusinya teknik-teknik baru.
Sebagian besar mesin pencari web (search engine) berbasis komersial yang didukung adanya penambahan iklan sehingga sebagian pencari web melakukan praktik yang kontroversial, yaitu mengijinkan pemasang iklan membayar dengan jumlah tertentu agar halaman web mereka diberi peringkat lebih tinggi dalam hasil pencarian.
Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti Google (maupun mesin pencari yang sejenis), menyimpan seluruh maupun sebagian halaman sumber (yang disebut cache) atau informasi tentang halaman web itu sendiri. Ada jenis mesin pencari lain: mesin pencari real-time, seperti Orase. Mesin pencari jenis ini tidak menggunakan indeks. Informasi yang diperlukan oleh mesin tersebut hanya dikumpulkan jika ada pencarian baru. Jika dibandingkan dengan sistem berbasis indeks yang digunakan mesin-mesin seperti Google, sistem real-time ini unggul dalam hal: informasi selalu mutakhir, (hampir) tak ada pranala mati, dan lebih sedikit sumberdaya sistem yang diperlukan. (Google menggunakan hampir 100.000 komputer, Orase hanya satu.).
CONTOH SEARCH ENGINE TERBAIK
Secara garis besar, search engine dapat dibedakan menjadi dua kelompok yaitu: individual search engine dan meta search engine. Sistem kerja Individual Search Engine adalah dengan cara mengumpulkan data dari web kemudian menampilkan hasil temuan tersebut berdasarkan indeks pada basis data secara individu (sendiri). Beberapa contoh search engine dalam kelompok ini yaitu:
* Google (www.google.com)
* Hotbot (www.hotbot.com)
* FastSearch (www.fastsearch.com)
Sedangkan cara kerja Meta Search Engine adalah dengan cara mencari indeks atau data dari beberapa individual search engine secara serempak (bersama-sama). Beberapa contoh search engine dalam kelompok ini adalah:
* Ixquick (www.ixquick.com)
* Meta Crawler (www.go2net.com/search.html)
* QbSearch (www.qbsearch.com)
PENGATURAN TOOL SEARCH ENGINE
Tool pada masing-masing search engine sangat bervariasi dengan tujuan untuk memudahkan pengguna mendapatkan hasil temuan yang relevan. Namun sebagian besar, fasilitas tersebut hampir serupa dalam mendeklarasikan sebuah kata yang berdekatan. Sebagai contoh, ketika menganalisa suatu halaman, Google (atau search engine yang sejenis) melihat halaman-halaman lain yang me-link ke halaman tersebut untuk menjelaskannya. Umumnya, beberapa search engine menampilkan hasil temuannya sesuai dengan kata yang berdekatan. Untuk itu pilihlah kata kunci (keyword) yang tepat ketika mencari informasi di internet.
Search engine yang paling populer dan mudah dalam penggunaannya adalah Google. Tool-tool yang disediakan disamping mendukung berbagai bahasa seperti: Bahasa Indonesia, Bahasa Jawa, Bahasa Inggris, dan lain-lain, juga dapat menentukan hasil pencarian dokumen dalam format file doc, pdf, zip dan format file lain. Hasil tampilan juga dapat di-filter sesuai kebutuhan. Google hanya memberikan hasil halaman yang mengandung semua kata yang dicari. Tidak perlu menggunakan kata “dan”. Untuk membatasi lebih jauh, gunakan saja kata-kata yang lebih banyak tanpa kata sambung.
Google mengabaikan kata-kata dan karakter umum, yang dikenal dengan kata-kata henti. Google secara otomatis mengabaikan kata-kata seperti “http” dan “.com,” sebagaimana dengan digit-digit dan huruf-huruf yang berdiri sendiri, karena mereka jarang membantu mempersempit sebuah pencarian, dan dapat memperlambat pencarian.
Gunakan tanda “+” untuk memasukkan kata-kata henti dalam pencarian Anda. Pastikan untuk memasukkan spasi sebelum tanda “+”. (Anda juga bisa memasukkan tanda “+” dalam frase pencarian). Setiap hasil pencarian, Google mengandung satu atau lebih serapan dari halaman web, yang menunjukkan bagaimana kata-kata pencarian Anda digunakan dalam konteks halaman tersebut.
Untuk menyediakan hasil yang paling akurat, Google tidak menggunakan pencarian “stem” atau dukungan “wildcard”. Dengan kata lain, Google mencari kata-kata persis dengan yang Anda masukkan dalam kotak pencarian. Mencari “eduka” atau “eduka*” tidak akan memberikan hasil “edukator”. Jika merasa ragu, cobalah kata lain: “airline” dan “airlines,” sebagai contoh.
Pencarian Google tidak terpengaruh dengan huruf besar maupun kecil. Semua huruf, walau berbeda pengetikannya, akan dianggap huruf kecil semua. Sebagai contoh, pencarian “edukasi”, “EDUKASI”, dan “EduKaSI” akan memberikan hasil yang sama.
Pencarian Google secara default tidak sensitif terhadap aksen atau tanda-tanda diakritis, seperti, [Muenchen] dan [München] akan menemukan halaman yang sama. Jika Anda ingin mendeskriminasikan antara dua kata tersebut, gunakan tanda + seperti [+Muenchen] dan [+München].
Anda dapat mengecualikan suatu kata dari pencarian Anda dengan menempatkan tanda minus (“-“) langsung di depan kata yang ingin Anda hindarkan. (Jangan lupa untuk menempatkan satu buah spasi kosong sebelum tanda minus).
Dengan Google, Anda dapat mencari frase menggunakan tanda kutip. Kata-kata yang berada di antara tanda kutip ganda (“ilmu komputer”) akan muncul bersama-sama dalam semua dokumen hasil pencarian (kecuali jika berupa kata penutup, kata tertentu yang memerlukan tanda “+”). Beberapa karakter tertentu berfungsi sebagai penghubung frase. Google mengenali tanda minus, garis miring, titik, tanda sama dengan, dan apostrof sebagai penghubung frase.
Beberapa kata, jika diikuti oleh sebuah titik-dua, mempunyai arti khusus bagi Google. Salah satu contohnya adalah kata “site:”. Untuk mencari sebuah domain atau situs khusus, gunakan sintaks “site:edukasi.net” pada kotak pencarian Google.
Untuk mencari galeri foto tumbuhan, sebaiknya menggunakan bahasa Latin atau Inggris. Namun yang lebih akurat adalah menggunakan bahasa Latin karena terdapat beberapa kata kunci dalam bahasa Inggris yang memiliki arti berbeda. Misalkan mencari bunga Mawar (Rose), maka yang akan muncul bisa nama orang, nama restoran, nama majalah, dan lain-lain. Mengapa hal ini bisa terjadi? Disebabkan tidak terdapat kata lain sebagai penunjuk kata tersebut. Jadi harus lengkap dalam memasukkan kata kunci, seharusnya “Rose+Flower”.
TIPS AMAN SAAT BROWSING
Bagi mereka yang sudah berpengalaman dalam menggunakan mesin pencari (search engine) tentu tidak menjadi masalah ketika mencari informasi di internet secara cepat dan tidak terjebak dalam situs yang menyesatkan.
Namun bagi newbie (pendatang baru) di dunia internet tentu mengalami kesulitan dalam mencari kata kunci yang tepat sehingga akan terjebak ke situs yang tidak diinginkan. Ada beberapa hal yang perlu diperhatikan ketika menggunakan mesin pencari untuk mencari data baik berupa teks, gambar, animasi, software maupun dalam bentuk dokumen asli (misal: DOC, PPT, PDF, dan lain-lain). Apabila ingin mencari informasi dalam bentuk gambar saja, Google telah menyediakan fasilitas tersebut sehingga hasil temuan dari kata kata kunci yang dimasukkan akan berupa gambar lengkap dengan ukuran fila aslinya. Sebagian orang tidak ingin menampilkan gambar dalam halaman web agar mempercepat proses loading semua informasi dalam bentuk teks. Teknik ini biasanya digunakan jika jaringan internet menggunakan dial up, atau dapat digunakan untuk memproteksi dari iklan-iklan dalam halaman situs yang dicari.Selain dapat memproteksi diri dari gambar, iklan, maupun animasi (bukan dalam format flash), juga dapat memproteksi diri dari berbagai ancaman spyware/spam. Untuk mengatur proteksi tersebut, bukalah salah satu web browser (Internet Explorer, Netscape, maupun Mozilla).Diasumsikan web browser yang digunakan adalah Internet Explorer.
Pada menu Tool pilih Internet Options, setelah jendela Internet Options terbuka pilih Tab Advance. Pada opsi Multimedia, hilangkan tanda centang Play animation in web pages, Play videos in web pages, dan Show Picture. Sedangkan untuk memproteksi diri dari spyware/spam, gunakan tool Antispay yang dapat didownload secara gratis di Internet.
JEBAKAN DI INTERNET
Hati-hati jika searching di Internet untuk mencari informasi, karena beberapa halaman web sering memberikan informasi yang sangat berbahaya. Sebagai contoh, ketika mencari informasi dengan beberapa kata kunci “crack” atau “serial number” maka Anda akan di-link ke beberapa halaman web komersial atau bahkan web yang berisi jutaan virus. Contoh lain, kata kunci yang sangat populer umumnya digunakan untuk menjebak pencari informasi untuk mengklik halaman web yang tidak diinginkan. Kata kunci ini biasanya diambil dari beberapa hal yang populer seperti judul film animasi kartun, nama bintang film, nama tokoh, dan lain-lain. Ketika sedang browsing di Internet dan tiba – tiba muncul sebuah pesan peringatan bahwa komputer Anda sudah terinfeksi sebuah virus dan harus segera dihapus, kemudian disuruh mengklik pesan untuk mendownload antivirusnya. Bisa jadi pesan tersebut itulah yang akan menginfeksi komputer Anda.
Agar lebih aman dalam mencari informasi di Internet, usahakan membentengi komputer dengan program antivirus yang sudah teruji performanya.