Wednesday, 27 April 2016

SEO : Sistem ranking berbasis algoritma (Crawling, indexing dan ranking)

Memahami bagaimana cara bekerja mesin pencari dalam melakukan perayapan, pengindexan, dan pe-ranking-an sangat berguna untuk praktisi SEO, karena dapat membantu untuk menentukan tindakan yang akan dilakukan agar dapat sesuai dengan tujuan atau goal.

Dalam artikel kali ini kita hanya membahas cara beroperasi mesin pencari Google dan Bing, dan kita tidak membahas mesin pencari lainnya yang popoler di negara lain seperti Yandex (Rusia), Baidu (China), Seznam (Czech Republic), dan Naver (Korea).

Untuk memperoleh hasil yang relevan, mesin pencari harus menjalankan tugas yang sangat banyak dengan sangat baik. Kita dapat memikirkannya dengan sederhana seperti :
  • Merayapi dan mengindex triliunan dokumen (halaman dan file) pada web (perlu diperhatikan bahwa mesin pencari mengabaikan halaman yang dirasa "tidak penting", mungkin karena halaman tersebut dirasa tidak menambahkan nilai baru, atau tidak ada referensi dari web lainnya).
  • Menanggapi permintaan pengguna, dan menyediakan daftar halaman yang relevan.
Dalam sesi artikel ini, kita hanya membahas fungsi dasar dari pandangan non-tehnical.  Dan kita mulai dengan membahasa bagaimana mesin pencari melihat dan menemukan konten.

Perayapan & Pengindeksan
Untuk menawarkan kemungkinan hasil terbaik, mesin pencari harus mencoba untuk menemukan semua halaman yang dapat diakses publik (yang artinya dapat kita akses secara bebas dan langsung tanpa perlu mendaftar, karena ada halaman yang disembunyikan atau harus memperoleh hak akses untuk mengaksesnya) pada web di seluruh dunia dan kemudian menampilkan mana yang terbaik dan cocok dengan permintaan user.

Langkah pertama dalam proses ini disebut crawling (perayapan) web. Mesin pencari memulai dengan halaman pertama situs yang dinilai mempunyai kualitas yang sangat tinggi, dan kemudian mengunjungi link-link pada setiap halaman situs tersebut untuk menemukan halaman web lainnya.

Struktur link dari web membantu untuk mengaitkan semua halaman web yang dibuat publik sebagai hasil dari seseorang yang menghubungkan mereka. Melalui link, robot otomatis yang dimiliki mesin pencari, disebut crawlers atau  spiders, dapat meraih/mencapai triliunan dokumen yang saling terhubung.

Pada gambar di bawah ini, Anda dapat melihat halaman depan USA.gov, website official pemerintan U.S. Link pada halaman ditandai dengan outlined warna merah.  Perayapan pada halaman ini akan dimulai dengan loading halaman, menganalisan konten, dan kemudian melihat halaman lain yang di link dari USA.gov.

Website official pemerintah U.S

Mesin pencari akan meload halaman-halaman lain dan menganalisa konten yang baik. Proses ini diulangi berkali-kali dan berkali-kali sampai proses perayapan selesai. Proses ini luar biasa kompleks, sebagai sebuah web yang besar dan tempat yang kompleks.

Catatan:
Mesin pencari tidak mencoba merayapi seluruh web setiap hari. Faktanya, Mereka mungkin menyadari halaman yang mereka pilih untuk dirayapi karena halaman tersebut dinilai seperti tidak cukup penting untuk dijadikan sebagai hasil pencarian. Kita akan mendiskusikan lebih lanjut di artikel yang lain.

Langkah pertama dalam proses ini adalah membangun istilah index. Ini adalah sebuah database besar yang mendaftarkan semua istilah penting pada masing-masing halaman yang dirayapi mesin pencari.

 Banyak data lainnya juga yang direkam, seperti sebuah peta dari semua halaman yang masing-masing halaman mempunyai link ke, teks yang dapat diklik dari link tersebut (dikenal sebagai anchor text), apakah link tersebut dianggap sebagai iklan, dan lainnya.

Untuk menyelesaikan tugas penting ini dari memegang ratusan sampai triliunan data dari halaman yang dapat diakses hanya dalam waktu detik. mesin pencari membangun data center yang besar untuk mengelola data tersebut.

Konsep kunci untuk membangun sebuah mesin pencari adalah memutuskan dimana untuk memulai perayapan dari web. Meskipun demikian secara teori Anda dapat mulai dari banyak tempat yang berbeda pada web, secara idealnya Anda akan mulai merayapi dengan website yang yang sudah terpercaya.

Memulai dengan rangkaian website yang sudah dikenal dan sudah terpercaya memungkinkan mesin pencari untuk mengukur seberapa banyak mereka percaya website lain yang mereka temukan melalui proses perayapan.

Perbaikan dan Ranking
Hampir semua mesin pencari dimulai dengan form seperti gambar di bawah ini


Langkah selanjutnya dalam proses pencarian terjadi ketika mesin pencari memberikan hasil halaman yang relevan pada web yang dirasa dapat dipercaya memberikan hasil yang memuaskan user. Proses ini meminta mesin pencari untuk memeriksa ratusan sampai triliunan kumpulan data dari dokumen dan melakukan dua hal :

Pertama, hanya mengembalikan hasil yang berhubungan dengan permintaan user, dan Kedua, ranking dari hasil yang diurutkan berdasarkan tingkat ke-penting-annya. Dua hal penting tersebut relevan dan penting(importance) adalah proses SEO yang mempunyai pengaruh berarti.

Relevance adalah tingkat yang mana konten dari dokumen dikembalikan dalam pencarian yang cocok dengan maksud dan istilah yang diminta oleh user. Tingkat relevansi dari dokumen meningkat jika halaman berisi istilah yang berhubungan dengan potongan kata yang diminta oleh user, atau jika link ke halaman datang dari halaman yang relevan dan menggunakan teks anchor yang berhubungan.

Anda dapat berpikir tentang relevansi seperti langkah pertama untuk menjadi "didalam game". Jika Anda tidak berhubungan dengan query (permintaan), mesin pencari tidak akan mempertimbangkan Anda untuk dimasukkan ke dalam hasil pencarian untuk query tersebut.

importance mengacu ke kepentingan yang berhubungan, diukur melalui citation / kutipan (tindakan yang bekerja mereferensikan lainnya, sering terjadi dalam dokuman akademik dan bisnis), dari dokumen yang yang diberikan yang cocok dengan query user.

Importance memberikan peningkatan dokumen dengan setiap dokumen lainnya yang mereferensikannya. Pada dunia online sekarang ini, citation dapat datang dari bentuk link untuk dokumen atau yang mereferensikannya pada situs sosial media. Menentukan berapa bobot dari sinyal ini yang dikenal sebagai citation analysis.

Anda dapat memikirkan importance sebagai sebuah cara untuk menentukan yang mana halaman, dari sebuah kelompok atau halaman yang sama berhubungan, muncul pertama di dalam hasil pencarian, yang kedua, dan seterusnya.

Kepercayaan mesin pencari yang dipunyainya adalah bagian penting dari penentuan ini. Tentu, persamaan sedikit lebih komplesk daripada ini, dan tidak semua halaman adalah secara sama berhubungan. Akhirnya, kombinasi dari relevance dan importance yang menentukan urutan ranking.

Sehingga ketika Anda melihat mesin pencari menghasilkan halaman seperti gambar dibawah ini, Anda dapat mengira bahwa mesin pencari (dalam kasus ini, Bing) percaya "the superhero stamps page on ebay" nilai kombinasi tertinggi untuk relevance dan importance untuk query "marvel superhero stamps".

Tampilan Bing mesin pencari

importance dan relevance tidak ditentukan secara manual (triliunan orang - jam akan membutuhkan seluruh penduduk bumi sebagai tenaga kerja). Sebaliknya, mesin pencari bekerja hati-hati, persamaan matematik --algoritma-- untuk mengurutkan gandum dari jerami dan kemudian me-ranking gandum di urutan kualitas. Algoritma ini sering mengandung ratusan komponen. Dalam bidang pemasaran pencarian, mereka sering disebut sebagai ranking factors atau  algorithmic ranking criteria.

No comments:

Post a Comment