Kamis, 03 September 2015

Mesin Pencarian (Search Engine)



Mesin pencari web (web search engine) adalah program komputer yang dirancang untuk melakukan pencarian atas berkas-berkas yang tersimpan dalam layanan www, ftp, publikasi milis, ataupun news group dalam sebuah ataupun sejumlah komputer peladen dalam suatu jaringan. Search engine merupakan perangkat pencari informasi dari dokumen-dokumen yang tersedia. Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits. Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam jenis berkas seperti halaman situs web, gambar, ataupun jenis-jenis berkas lainnya. Beberapa mesin pencari juga diketahui melakukan pengumpulan informasi atas data yang tersimpan dalam suatu basisdata ataupun direktori web.

Contoh mesin pencari :
  1. Google ( http://www.google.com/ )
  2. Yahoo ( http://www.yahoo.com/ )
  3. Open Directory ( http://www.dmoz.com/ )
  4. MSN ( http://www.msn.com/ )
  5. Live ( http://www.live.com )
  6. Altavista ( http://www.altavista.com )
  7. AOL ( http://www.aol.com )
  8. Altheweb ( http://www.althweb.com )
  9. Baidu ( http://www.baidu.com )
  10. Looksmart ( http://www.looksmart.com )
  11. Solusee ( http://www.solusee.com )
Garis waktu (daftar mesin pemcarian)
Tahun
Mesin
Status
1993
Tidak aktif
Tidak aktif
1994
Aktif,
Aggregator
Aktif,
Yahoo Search
Aktif
1995
Tidak aktif
(URL dialihkan ke Yahoo!)
Aktif
Tidak aktif
Aktif
Aktif
Aktif,
Diluncurkan sebagai direktori
1996
Aktif,
Agregator
Diakuisisi Yahoo!
Aktif
(lycos.com)
Aktif
(berubah nama menjadi ask.com)
1997
Tidak aktif
Aktif
1998
Aktif
Aktif
dengan nama Bing
1999
Tidak aktif
(URL dialihkan ke Yahoo!)
Aktif,
berubah nama menjadi Yellowee.com
Aktif
Aktif
Tidak aktif
2000
Aktif
2002
Diakuisisi Yahoo!
2003
Aktif
2004
Aktif,
Meluncurkan pencarian web sendiri
(lihat Yahoo! Directory, 1995)
Tidak aktif
Aktif
2005
Aktif
Aktif
Aktif
Ditutup
2006
Tidak aktif
Aktif
Aktif
Aktif dengan nama Bing
Berganti nama menjadi MSN Search
Aktif
Aktif
2007
Tidak aktif
Tidak aktif
Tidak aktif
Aktif
2008
Tidak aktif
(dialihkan ke Bing)
Tidak aktif
Tidak aktif
Tidak aktif
Tidak aktif
Tidak aktif
(dialihkan ke Ecosia)
Aktif
Aktif, Aggregator
2009
Aktif,
Sebelumnya Live Search
Aktif
Tidak aktif
karena tidak ada dana
Aktif
2010
Aktif
Tidak aktif
Aktif,
Pencarian global
Aktif
2011
Aktif
Aktif,
Pencarian Turki
2012
Aktif
2013
Aktif

Cara kerja mesin pencarian:
Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak halaman web, yang diambil langsung dari WWW. Halaman-halaman ini diambil dengan web crawlerbrowser web otomatis yang mengikuti setiap pranala/link yang dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara indeks-nya (misalnya, kata-kata diambil dari judul, subjudul, atau field khusus yang disebut meta tag). Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman web itu sendiri.
Melakukan pencarian dokumen yang dimuat pada suatu situs bisa begitu mudah dan kelihatannya mungkin sulit juga. apalagi mengingat begitu menyebarnya informasi dimana-mana, bahkan University of Calofornia menyebutkan saat ini telah terdapat lebih dari 50 miliar halaman web di internet, meskipun tidak ada ada satupun yang benar-benar tahu jumlah persisnya.
kesulitan yang mungkin terjadi adalah karena WWW tersebut tidak terdata dalam bentuk yang terstandardisasi isinya. tidak sama halnya dengan katalog yang ada di perpustakaan, yang memiliki standardisasi secara mendunia berdasarkan subjek dari judul buku, meskipun jumlahnya juga tidak sedikit.
Dalam pencarian di web, pengguna selalu memperkirakan kata apa yang di kira-kira terdapat pada halaman yang ingin anda temukan. atau kira-kira apa subjek yang dipilih oleh seseorang untuk mengelola halaman situs yang mereka kelola, topik apa saja kira-kira yang di bahas.
Jika pengguna melakukan apa yang dikenal dengan pencarian pada halaman web, sebenarnya tidaklah melakukan pencarian. tidak mungkin melakukan pencarian di WWW secara langsung.
Pada web benar-benar terdiri dari banyak sekali halaman web yang ingin disimpan dari berbagai server diseluruh dunia. Komputer pengguna tidak langsung melakukan pencarian kepada seluruh komputer tersebut secara langsung.
Apa yang mungkin pengguna lakukan hanyalah melalui komputer untuk mengakses satu atau lebih perantara yang disebut dengan alat bantu pencarian yang ada saat ini. Melakukan pencarian pada alat bantu itu tadi ke database yang dimiliki. database tersebut mengkoleksi situs-situs yang ditemukan dan simpan.
alat bantu pencarian ini menyediakan hasil pencarian dalam bentuk hypertext link dengan URL menuju halaman lainnya. ketika anda klik link ini, dan menuju ke alamat tersebut maka dokumen, gambar, suara dan banyak lagi bentuk lainnya yang ada pada server tersebut disediakan, sesuai dengan informasi yang terdapat di dalamnya. layanan ini bisa menjangkau ke manapun di seluruh dunia.
Tidak mungkin seseorang untuk melakukan pencarian ke seluruh komputer yang terhubung internet ini, atau bahkan alat bantu pencarian yang mengklaim bahwa melakukannya, tidak benar.

Cara Kerja Mesin Pencari Google:
1. Anda menulis blog, menciak, memperbarui situs, atau menambahkan konten ke situs
2. Google bot merangkak pada situs untuk menemukan posting Anda
  • Google bot mengikuti link. Jika tidak ada link ke situs Anda, biasanya hal ini tidak akan dijelajahi secara mendalam atau secara teratur
  • Google bot tidak akan menjelajah situs Anda jika Anda tidak memberitahu mereka dengan sebuah robot.txt
  • Jika link ke situs Anda memiliki tag nofollow, google bot tidak mengunjungi link tersebut.
  • Google juga dapat menemukan situs Anda dengan perangkat lunak ping untuk blog atau sitemap.xml
  • Semakin banyak link yang Anda miliki dari halaman otoritas yang lebih tinggi dari situs anda, halaman otoritas Anda sendiri akan lebih besar juga. Selama mereka tidak menggunakan tag “nofollow”
3. Setelah merangkak halaman akan diindeks dalam hitungan detik
  • Konten halaman disimpan dalam sebuah indeks terbalik. –> Judul halaman dan link data disimpan dalam satu indeks yang digunakan untuk pencarian yang luas dan kompetitif. –> Pada konten halaman disimpan di lain indeks yang digunakan untuk pencarian isi halaman dan isi yang tidak jelas
  • Jika Anda tidak mencari web yang aktif, tapi google cache hal itu, yang terus-menerus akan diperbarui


4. Google memperkirakan domain dan otoritas keseluruhan halaman berdasarkan link
5. Halaman diperiksa terhadap kebijakan editorial
  • Pencarian berkualitas Google tim dan tim webspam meninjau dan memperbaiki algoritma (Baca : Dokumen Pedoman Penilaian Google Bocor : Cuplikan)
  • Lebih dari 10.000 penguji tersembunyi untuk tingkat kualitas pencarian mereka
  • Google memohon laporan spam dari pengguna.
  • Google mendapatkan DMCA pemberitahuan untuk mencatat pekerjaan bajakan
6. Hukuman diterapkan dan setiap halaman, sekarang Google memiliki banyak daftar data terlampir untuk membantu kepentingan pengguna
7. Query Pengguna Google
– Pada query google terbanyak, sebenarnya anda masuk dalam beberapa kontrol atau kelompok eksperimental secara bersamaan. Pada dasarnya, semua query terlibat dalam beberapa tes
8. Google menyarankan kata kunci didasarkan pada apa yang telah diketik beberapa karakter.
9. Google menggunakan sinonim untuk mencari kata-kata serupa untuk menyertakan dalam permintaan pencarian.
10. Hasil set awal dibuat
– Google mengklaim mendapatkan jutaan hasil tetapi hanya 1.000 atau kurang yang pernah ditampilkan
– Hasil lokalisasi: situs lokal yang dipromosikan dalam hasil pencarian
11. Hasil set diurutkan berdasarkan kewenangan dan pagerank, dan halaman duplikat dihapus
11.1. Google menemukan iklan yang relevan berdasarkan kata kunci, iklan menyesuaikan lokasi jenis dan pengguna
11.2. Iklan tunduk pada kebijakan editorial
n Pengiklan beroperasi di luar pedoman mungkin memiliki akun iklan yang mereka dilarang
n Jika kata kunci memiliki volume pencarian yang rendah atau terlalu sedikit menghasilkan klik, iklan mungkin akan secara otomatis dinonaktifkan
n Bisnis disukai, mungkin seperti amazon.com, tokobagus.com mungkin akan diberikan diskon
11.3. Iklan yang relevan yang diorder berdasarkan potensi laba (tawaran x skor kualitas iklan)
11.4. Untuk sebagian besar pengiklan konten sudah dibuat tapi kadang-kadang isi kata kunci dinamis digunakan untuk membuat iklan agar tampak lebih relevan
n Beberapa iklan juga memiliki ekstensi yang tersedia, seperti link situs, nomor telepon, produk, link, lokasi, dll
11.5. Jika iklan menghasilkan tingkat melalui klik yang cukup tinggi, beberapa mungkin ditampilkan di atas hasil pencarian
11.6. Sisanya pergi ke rel yang benar di mana mereka ditampilkan
11.7. Hasil akan muncul dibawah satu detik, miliaran kali dalam sehari, menghasilkan lebih dari 20 miliar dolar setahun untuk google!
12. Penyaring diterapkan
  • Dengan pencarian universal, jika google berpikir hasil berita, hasil belanja, hasil video, buku hasil, hasil lokal, atau bentuk lain dari pencarian vertikal yang relevan maka mereka mungkin mencampur secara langsung ke dalam hasil pencarian.
  • Personalisasi pengguna: situs yang pernah dikunjungi pengguna sering dipromosikan
  • Manipulasi teks jangkar yang berlebihan dapat menyebabkan situs yang akan dihapus dari hasil
  • Interkonektivitas lokal mempengaruhi hasil : jika halaman yang terhubung dengan baik antara situs lain dengan peringkat tinggi, maka peringkat mereka dapat meningkatkan
  • Tren: jika istilah pencarian telah meledak besar dalam volume pencarian dan / atau banyak hasil berita terbaru, google mungkin menempatkan bobot tambahan pada hasil konten lebih segar
  • Tren: Perolehan Google +1 dan situs jejaring sosial lainnya menempatkan bobot tambahan
  • Beberapa halaman dari domain yang sama dapat dikelompokkan bersama-sama jika semua memiliki peringkat tinggi.
13. Hasil organik ditampilkan
Hasil akan muncul dibawah satu detik, miliaran kali dalam sehari, menghasilkan lebih dari 20 miliar dolar setahun untuk google!

1 komentar: