Selamat datang|benvenuto|welcome|ようこそ|환영|欢迎|સ્વાગત|ยินดีต้อนรับ|ترحيب|স্বাগত|sugeng rawuh

Senin, 30 Januari 2012

Search Engine

Dalam dunia website/weblog sekarang ini, khususnya bagi para publisher dan blogger diperlukan pengetahuan tentang Search Engine Optimization, website/weblog yang telah sobat buat tugas selanjutnya adalah mendaftarkan website/weblog sobat ke mesin pencari Google atau yang lainnya. Sebelum mendaftarkan website/weblog yang telah dibuat; sekarang yang menjadi pertanyaan apa itu search engine optimization, cara kerja dan fungsi suatu search engine.

I.            Pengertian Search Engine
Mesin pencari web atau yang lebih dikenal dengan istilah web search engine merupakan program komputer yang dirancang untuk mencari informasi yang tersedia didalam dunia maya. Berbeda halnya dengan direktori web (seperti dmoz.org) yang dikerjakan oleh manusia untuk mengelompokkan suatu halaman informasi berdasarkan kriteria yang ada, web search engine mengumpulkan informasi yang tersedia secara otomatis.
II.            Cara Kerja Search Engine
Mesin pencari web bekerja dengan cara menyimpan hampir semua informasi halaman web, yang diambil langsung dari www. Halaman-halaman ini diambil secara otomatis. Isi setiap halaman lalu dianalisis untuk menentukan cara mengindeksnya (misalnya, kata-kata diambil dari judul, subjudul, atau field khusus yang disebut meta tag). Data
tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman web itu sendiri.

Ketika seorang pengguna mengunjungi mesin pencari dan memasukkan query, biasanya dengan memasukkan kata kunci, mesin mencari indeks dan memberikan daftar halaman web yang paling sesuai dengan kriterianya, biasanya disertai ringkasan singkat mengenai judul dokumen dan terkadang sebagian teksnya.

Mesin pencari lain yang menggunakan proses real-time, seperti Orase, tidak menggunakan indeks dalam cara kerjanya. Informasi yang diperlukan mesin tersebut hanya dikumpulkan jika ada pencarian baru. Jika dibandingkan dengan sistem berbasis indeks yang digunakan mesin-mesin seperti Google, sistem real-time ini unggul dalam beberapa hal seperti informasi selalu mutakhir, (hampir) tak ada broken link, dan lebih sedikit sumberdaya sistem yang diperlukan (Google menggunakan hampir 100.000 komputer, Orase hanya satu.). Tetapi, ada juga kelemahannya yaitu pencarian lebih lama rampungnya.
III.            Komponen utama dalam Search Engine
Sebuah search engine memiliki beberapa komponen agar dapat menyediakan layanan utamanya sebagai sebuah mesin pencari informasi. Komponen tersebut antara lain :

                a.            Web Crawler
Web crawler atau yang dikenal juga dengan istilah web spider bertugas untuk mengumpulkan semua informasi yang ada di dalam halaman web. Web crawler bekerja secara otomatis dengan cara memberikan sejumlah alamat website untuk dikunjungi serta menyimpan semua informasi yang terkandung didalamnya. Setiap kali web crawler mengunjungi sebuah website, maka dia akan mendata semua link yang ada dihalaman yang dikunjunginya itu untuk kemudian di kunjungi lagi satu persatu.

Proses web crawler dalam mengunjungi setiap dokumen web disebut dengan web crawling atau spidering. Beberapa websites, khususnya yang berhubungan dengan pencarian menggunakan proses spidering untuk memperbaharui data data mereka. Web crawler biasa digunakan untuk membuat salinan secara sebhagian atau keseluruhan halaman web yang telah dikunjunginya agar dapat dip roses lebih lanjut oleh system pengindexan. Crawler dapat juga digunakan untuk proses pemeliharaan sebuah website, seperti memvalidasi kode html sebuah web, dan crawler juga digunakan untuk memperoleh data yang khusus seperti mengumpulkan alamat e-mail.

Web crawler termasuk kedalam bagian software agent atau yang lebih dikenal dengan istilah program bot. Secara umum crawler memulai prosesnya dengan memberikan daftar sejumlah alamat website untuk dikunjungi, disebut sebagai seeds. Setiap kali sebuah halaman web dikunjungi, crawler akan mencari alamat yang lain yang terdapat didalamnya dan menambahkan kedalam daftar seeds sebelumnya.

Dalam melakukan prosesnya, web crawler juga mempunyai beberapa persoalan yang harus mampu di atasinya. Permasalahan tersebut mencakup :

        §   Halaman mana yang harus dikunjungi terlebih dahulu.
        §   Aturan dalam proses mengunjungi kembali sebuah halaman.
        §   Performansi, mencakup banyaknya halaman yang harus dikunjungi.
        §   Aturan dalam setiap kunjungan agar server yang dikunjungi tidak kelebihan beban.
        §   Kegagalan, mencakup tidak tersedianya halaman yang dikunjungi, server down, timeout, maupun jebakan yang sengaja dibuat oleh webmaster.
        §   Seberapa jauh kedalaman sebuah website yang akan dikunjungi.
        §   Hal yang tak kalah pentingnya adalah kemampuan web crawler untuk mengikuti
perkembangan teknologi web, dimana setiap kali teknologi baru muncul, web crawler harus dapat menyesuaikan diri agar dapat mengunjungi halaman web yang menggunakan teknologi baru tersebut.

Proses sebuah web crawler untuk mendata link – link yang terdapat didalam sebuah halaman web menggunakan pendekatan regular expression. Crawler akan menelurusi setiap karakter yang ada untuk menemukan hyperlink tag html (<a>). Setiap hyperlink tag yang ditemukan diperiksa lebih lanjut apakah tag tersebut mengandung atribut nofollow rel, jika tidak ada maka diambil nilai yang terdapat didalam attribute href yang merupakan sebuah link baru.

                b.            Indexing system
Indexing system bertugas untuk menganalisa halaman web yang telah tersimpan sebelumnya dengan cara mengindeks setiap kemungkinan term yang terdapat di dalamnnya. Data term yang ditemukan disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya.

Indexing system mengumpulkan, memilah dan menyimpan data untuk memberikan kemudahan dalam pengaksesan informasi secara tepat dan akurat. Proses pengolahan halaman web agar dapat digunakan untuk proses pencarian berikutnya dinakamakan web indexing. Dalam implementasinya index system dirancang dari penggabungan beberapa cabang ilmu antara lain ilmu bahasa, psikologi, matematika, informatika, fisika, dan ilmu komputer.

Tujuan dari penyimpanan data berupa indeks adalah untuk performansi dan kecepatan dalam menemukan informasi yang relevan berdasarkan inputan user. Tanpa adanya indeks, search engine harus melakukan scan terhadap setiap dokumen yang ada didalam database. Hal ini tentu saja akan membutuhkan proses sumber daya yang sangat besar dalam proses komputasi. Sebagai contoh, indeks dari 10.000 dokumen dapat diproses dalam waktu beberapa detik saja, sedangkan penulusuran secara berurutan setiap kata yang terdapat di dalam 10.000 dokumen akan membutuhkan waktu yang berjam lamanya. Tempat tambahan mungkin akan dibutuhkan di dalam computer untuk penyimpanan indeks, tapi hal ini akan terbayar dengan penghematan waktu pada saat pemrosesan pencarian dokumen yang dibutuhkan.
                c.            Search system
Search system inilah yang berhubungan langsung dengan pengguna, meyediakan hasil pencarian informasi yang diinginkan. Ketika seorang pengguna mengunjungi mesin pencari dan memasukkan kata pencarian biasanya dengan beberapa kata kunci, search system akan mencari data dari indeks database, data yang cocok kemudian akan ditampilkan, biasanya disertai ringkasan singkat mengenai judul dokumen dan terkadang sebagian teksnya.
Contoh- contohsearch engine
Yahoo!
  Salah satu portal terbesar di Internet, selain MSN., dan juga salah satu mesin pencaru tertua. Halaman utamanya sendiri tidak terlalu ramah untuk pencarian, tetapi Yahoo! menyediakan search.yahoo.com untuk itu. Yahoo! menggunakan jasa Google untuk mencari informasi di web, ditambah dengan informasi dari databasenya sendiri. Kelebihan Yahoo! adalah direktorinya. Yahoo! juga menyediakan pencarian yellow pages dan peta, yang masih terbatas pada Amerika Serikat. Yahoo juga menyediakan pencarian gambar.  berikut ini kelebihan dan kekurangannya yang lebih jelas : 
Kelebihan:
  1. carta surat menyurat modern untuk membuat orang menjadi lebih maju
2. salah satu web yang menyediakan layanan fasilitas gratis
3. salah satunyapun yang anda bilang, bila di refresh cepat
4. banyak fasilitas yang disediakan, seperti: Y!A Y!A Y! mail Y! 360 dan lain2
5. sudah ada di banyak negara
Kekurangan:
  1. Satu id yahoo hanya untuk yahoo, tak bisa untuk produk windows, seperti IM dan msn
2. Teralu mudah untuk membuat id, sehingga kadang-kadang disalah gunakan
3. Fitur Y!M msh sangat kalah jauh dengan IM keluaran windows
4. Skin untuk Y!M msh sangatlah simple, tak seperti IM yang ada cukup banyak
Alltheweb
    Keunggulan Alltheweb adalah pencarian file pada FTP Server. Tidak seperti web, FTP adalah teknologi internet yang ditujukan untuk menyimpan dan mendistribusikan file, biasanya program, audio atau video. Web sebenarnya lebih ditujukan untuk teks. Sejauh ini, hanya AllTheWeb yang menyediakan jasa pencarian file.  
Kelebihan
  Kemudahan dalam mencari.
  Tampilan yang sederhana seperti Google.
  Alltheweb langsung menyediakan fungsi untuk pencarian berita, musik, gambar, dan video.
  Menu bantuan terlihat jelas, dan di dalamnya tersedia sejumlah opsi bantuan yang banyak, sehingga sekali lagi kemudahan tampak bagi si pengguna.
Kekurangan
  Pencarian yang lama dibandingkan dengan mesin pencari lainnya.
  Halaman pencarian hanya dibatasi dengan sebuah garis sehingga membingungkan si pengguna.
  Pada link-link yang tidak berguna terkadang masih terlihat dalam beberapa hari, sehingga terlihat kurang aktual. Hal ini menunjukan tidak cepatnya Allltheweb melakukan update.
MSN
    Mesin pencari dari Microsoft Network ini menawarkan pencarian baik dengan kata kunci maupun dari direktori. Pemakai Internet Explorer kemungkinan besar sudah pernah menggunakan mesin pencari ini. Situs Searchenginewatch mencatat MSN sebagai mesin pencari ketiga populer setelah Google dan Yahoo! Tak ada pencarian image, atau news. Menyediakan pencarian peta, yellow pages, white pages, pencarian pekerjaan, rumah. 
Kelebihan
  mampu mencari video, musik, gambar, dan beragam format file spesial.
Kekurangan
  pencarian. Dibutuhkan waktu yang lama sampai hasil ditampilkan di halaman MSN.
  Pengguna juga sulit membedakan antara iklan dan bukan iklan pada halaman pencariannya. Penampilan iklan hanya dibedakan dari hasil asli melalui sebuah titik di depannya.
AskJeeves
  Situs mesin pencari yang satu ini mengunggulkan kemampuannya untuk memahami bahasa manusia. Pengguna bisa menggunakan kalimat lengkap, bukan kata kunci. Situs ini berguna untuk mengetahui jawaban dari pertanyaan(misal: when did world war II end?) 
  Kelebihan
1.       Keunggulan utamanya adalah ia akan mencari situs penyedia jawaban untuk pertanyaan anda.
Google    
  Selain pencarian web, Google juga menyediakan jasa pencarian gambar, pencarian ?berita serta pencarian pada arsip USENET (newsgroup), serta direktori, seperti Yahoo! Kelemahannya terletak pada tidak tersedianya pencarian file, video, dan audio. Keunggulan Google terutama adalah pada pencarian teks, terutama dari algoritma PageRank, database-nya yang besar serta banyaknya jenis file yang diindeksnya.
Kelebihan
  Kecepatan dan kemudahan dalam mencari.
  lebih canggih dengan fitur yang dimilikinya.
  Tampilan yang sederhana.
  Google merupakan satu-satunya mesin pencari yang memilki cach. Dengan adanya cache ini, si pencari dapat menghemat waktu pencarian, karena hasil pencarian yang akan ditampilkan.
  Dapat mencari segala informasi seperti gambar, berita artikel, hiburan dll.
Kekurangan
  Dengan kelebihan yang dimilikinya, ternyata mesin pencari ini jadi bidikan para spamer untuk menampilkan iklan-iklan yang tidak diperlukan. Mereka memanfaatkan setiap celah yang ada pada sistem algoritma Google untuk memaksa iklan mereka tampil pada halaman terdepan. Maka, pencarian pun terasa tergangggu.
Altavista
 
   Satu saat, AltaVista pernah menjadi mesin pencari terbesar. Saat ini, selain Alltheweb, Altavista juga menawarkan pencarian audio dan video. Keunggulan AltaVista adalah pilihan pencarian yang paling lengkap di antara semua mesin pencari.

 
Kelebihan
  keunggulan dalam hal pencarian halaman web, video, gambar, MP3, dan file audio lainnya. Dalam pencarian berita pun Altavista mampu mencari berita teraktual.
  Altavista mampu menetapkan berapa umur maksimal yang akan ditampilkan.
Kekurangan
  Dalam hal pencarian data yang kurang bagus. Sering kali mesin pencari ini menampilkan hasil yang sama sekali tidak ada kaitannya dengan tema yang dicari.
Lycos
  Salah satu mesin pencari tertua. Saat ini Lycos lebih dikenal sebagai portal, sehingga fungsi pencarinya tidak terlalu menonjol. Lycos, selain mendukung pencarian web, juga menyediakan pencarian file MP3, dan video pada http://multimedia.lycos.com. 
Kelebihan
  1. Lycos mampu mencari data dengan cepat dan ini merupakan kelebihannya.
  2. Dalam hal pencarian cepat.
  3. Lycos menyediakan fungsi “Fun Search” yang lebih diperuntukkan bagi kalangan remaja. Ini sangat membantu bagi kalangan yang membutuhkan gosip dan lagu terbaru dari para selebritis pujaan.
  4. Lycos juga menampilkan 50 pencarian terbesar di halaman depannya.
Kekurangan
  Untuk mencari berita-berita aktualnya, pengguna harus masuk ke bagian site map karena berita-berita tersebut tidak ditampilkan di halaman depan.
Sering tidak spesifik karena datanya kebanyakan masih mengambil data dari mesin pencari Alltheweb yang tergolong paling lamban dalam pencarian data.
Duck Duck Go
Pada awalnya, DuckDuckGo.com terlihat seperti Google. Tapi ada banyak kehalusan yang membuat mesin pencari spartan yang berbeda. DuckDuckGo memiliki beberapa fitur apik, informasi seperti 'nol-klik' (semua jawaban Anda ditemukan pada halaman hasil pertama). DuckDuckgo menawarkan disambiguasi meminta (membantu untuk menjelaskan apa pertanyaan Anda benar-benar bertanya). Dan spam iklan jauh lebih kecil dari Google. Berikan DuckDuckGo.com mencoba ... Anda mungkin sangat menyukai mesin pencari ini bersih dan sederhana.
Yippy
  Yippy adalah mesin Web Deep bahwa pencarian mesin pencari lainnya untuk Anda. Berbeda dengan Web biasa, yang diindeks oleh program spider robot, Deep halaman web biasanya sulit untuk menemukan oleh pencarian konvensional. Di situlah Yippy menjadi sangat berguna. Jika Anda sedang mencari untuk blog bunga hobi jelas, informasi pemerintah jelas, sulit-untuk-menemukan berita yang tidak jelas, penelitian akademik dan konten lain-jelas, maka Yippy adalah alat Anda.
Bing
  Mahalo adalah 'bertenaga manusia' pencarian satu situs dalam daftar ini, mempekerjakan sebuah komite editor secara manual menyaring dan ribuan dokter hewan potongan konten. Ini berarti bahwa Anda akan mendapatkan hasil yang lebih sedikit Mahalo memukul dari Anda akan mendapatkan pada Bing atau Google. Tetapi juga berarti bahwa sebagian besar hasil Mahalo memiliki kualitas yang lebih tinggi konten dan relevansi (sebaik editor manusia bisa menilai).

Mahalo juga menawarkan web biasa mencari selain mengajukan pertanyaan. Tergantung pada mana dari dua kotak pencarian yang Anda gunakan di Mahalo, anda akan mendapatkan hits konten topik langsung atau disarankan jawaban atas pertanyaan Anda.

Coba Mahalo. Anda mungkin seperti itu cukup untuk bahkan menjadi editor di sana.
Webopedia
  Webopedia adalah salah satu website yang paling berguna di World Wide Web. Webopedia adalah sumber ensiklopedi didedikasikan untuk mencari definisi terminologi dan komputer techno. Ajarkan diri 'domain sistem nama ' apa yang ada, atau mengajar diri sendiri apa 'DDRAM' berarti pada komputer Anda. Webopedia benar-benar sumber daya yang sempurna untuk orang-orang non-teknis untuk memahami lebih dari komputer di sekitar mereka.
Wisenut
  Searchenginesshowdown.com pada awal Maret 2002 menyatakan bahwa banyaknya informasi atau situs yang ditampung oleh database Wisenut.com adalah sekitar 579 juta buah. Sedangkan Wisenut.com mengklaim sekitar 1,5 miliar buah yang telah masuk dalam databasenya. Wisenut.com, sebagaimana layaknya sebuah search engine generasi terbaru, bebas dari banner iklan dan aneka image yang memberatkan. Tampilannya yang sederhana mempercepat mengaksesan halaman depan dan proses penampilan hasil yang dicari. Wisenut.com mampu mencari informasi ke konten den
  dan 25 bahasa dunia yang berbeda, tetapi tidak ada bahasa Indonesia.
  Encoding languange Wisenut.com juga mampu beralih ke 21 kode bahasa. Wisenut.com dilengkapi pula dengan fasilitas WiseWatch, yang fungsinya untuk melakukan pemfilteran konten-konten pornografi (/www.wisenut.com/preferences). Search engine yang secara resmi diluncurkan pada September 2001 ini menyediakan pula form isian bagi orang yang ingin mencantumkan situsnya ke dalam database (www.wisenut.com/submitsite.html).

Tidak ada komentar:

Posting Komentar