Friday, 29 April 2016

Memahami apa yang mesin pencari "lihat" pada sebuah halaman web

Perayapan mesin pencari dan program pengindeks an adalah pada dasarnya program perangkat lunak. Program ini adalah luar biasa powerful. Mereka merayapi ratusan dari triliunan halaman web, menganalisa kontan dari semua halaman ini, dan menganalisa semua link di halaman ini yang mengarah ke lain halaman. Kemudian mereka mengorganisirnya ke dalam sebuah rangkaian dari database yang bertanggung jawab terhadap query pencarian user dengan sebuah rangkaian kesesuaian tingkat tinggi dari hasil dalam persepuluh detik.

Ini adalah sebuah pencapaian yang menakjubkan, tapi mereka mempunyai keterbatasannya. Software sangat mechanical, dan dia hanya dapat memahami pada porsi sebagian besar halaman web. Perayap mesin pencari menganalisa bentuk HTML mentah dari halaman web. Jika Anda ingin melihat ini seperti apa, Anda dapat melakukannya dengan menggunakan browser Anda dan melakukan view source.

Gambar di bawah ini menampilkan bagaimana untuk melakukannya di dalam browser, baik itu browser Firefox maupun Chrome.



Melihat source menggunakan Chrome, caranya klik-kanan pada halaman web nanti akan muncul menu dan pilih "view page source"


Melihat source di Firefox

Ada juga bermacam-macam tool web development di browser (add-ons dan extensions) yang memberikan fasilitas untuk melihat source code di dalam browser yang Anda pilih, serta mendeteksi web application dan Javascript libraries. Satu dari sebagian besar tool analisis code yang digunakan secara luas adalah Web Developer, oleh Chris Pederick, tersedia untuk Chrome, Firefox, dan Opera.

Saat Anda melihat soure, Anda akan dipersembahkan dengan code yang tepat untuk halaman web yang web server kirim ke browser Anda. Ini hampir seperti apa yang perayap mesin pencari lihat (mesin pencari juga melihat HTTP  Header untuk halaman, yang mana status code tersebut diterima dari web server tempat halaman tersebut di hosting).

Dalam beberapa kasus Google akan meng-ekskusi Javascript pada halaman dengan baik. Untuk  lebih lanjut bagaimana mereka melakukan ini, Kita akan bahas pada artikel lain. Ketika mencoba untuk menganalisa konten yang user lihat pada halaman web, mesin pencari secara besar mengabaikan code yang berhubungan dengan navigasi yang ditampilkan di halaman. Seperti ditampilkan pada gambar dibawah ini, tidak ada yang perlu dilakukan untuk konten halaman.


Contoh source kode halaman web

Perayap mesin pencari sebagian besar tertarik dengan text HTML pada halaman. Gambar di bawah ini adalah contoh text HTML dari the Moz home page.

Contoh text HTML di dalam source code yang menampilkan real content.

 Meskipun demikian pada gambar di atas masih menampilkan beberapa HTML encoding, Anda dapat melihat text "regular" secara jelas di dalam code. Ini adalah konten unik yang perayap lihat dalam pencarian.

Sebagai tambahan, mesin pencari membaca beberapa elemen lainnya. Salah satu nya adalah page title atau judul halaman. Judul halaman adalah salah satu dari sebagian besar faktor penting dalam ranking yang diberikan ke halaman web. Ini adalah text yang ditampilkan dalam title bar browser (di atas menu browser dan address bar).

Gambar di bawah ini menampilkan kode yang perayap lihat.

Meta tag di dalam source HTML

 Highlight area pertama pada gambar di atas untuk tag <title>. Tag <title> sering kali (tidak selalu) digunakan sebagai judul dari listing Anda di  hasil pencarian mesin pencari. Perhatikan pada gambar di bawah ini.

Hasil pencarian menampilkan tag title


 Sebagai tambahan untuk judul halaman, mesin pencari sebelumnya menggunakan tag meta keyword.  Ini adalah daftar dari keyword yang Anda harapkan berhubungan dengan halaman. Spammer (Orang yang mencoba memanipulasi hasil pencarian dengan melanggar pedoman mesin pencari) merusak nilai SEO dari tag ini beberapa tahun yang lalu, sehingga nilai tersebut sekarang ditiadakan, sepertinya mesin pencari tidak menggunakannya lagi. Membelanjakan waktu pada meta keyword tidak direkomendasikan karena tidak punyak keuntungan dalam SEO.

Area highlight kedua pada gambar di atas (tentang "Meta tag di dalam source HTML") menampilkan meta tag keyword.

Mesin pencari juga membaca tag meta description (area highlight ketiga dalam source HTML gambar di di tentang "Meta tag di dalam source HTML"). Bagaimanapun juga, konten tag meta description tidak secara langsung digunakan oleh mesin pencari dalam algoritma rankingnya.

Meskipun begitu, tag meta description  memainkan peran kunci, mesin pencari sering menggunakannya sebagaian bagian dari semua deskripsi untuk halaman Anda di dalam mesin pencari. Oleh karena itu, sebaik mungkin dalam menulis meta description dapat mempengaruhi pada berapa banyak klik yang Anda dapat kan pada listing pencarian Anda, dan click-through rate pada daftar pencarian Anda akan berdampak pada ranking Anda.

Gambar di bawah ini menampilkan contoh tag meta description yang digunakan sebagai deskripsi pada hasil pencarian.

Meta deskription yang digunakan dalam hasil pencarian


 Catatan:
keyword yang dimiliki user secara khusus ditampilkan dalam huruf tebal ketika mereka terlihat dalam hasil pencarian (kadang-kadang kata yang hampir sama juga ditampilkan dalam huruf tebal secara baik). Seperti yang ditampilkan pada contoh gambar di atas TripAdvisor dalam huruf tebal pada awal deskripsi. Ini disebut keyword in context (KWIC).

Elemen ke-empat yang mesin pencari baca adalah attribute alt dalam images. attribut alt adalah aslinya dimaksudkan untuk mengijinkan sesuatu dirender untuk audience yang tidak dapat melihat image, terutama :

    • Orang-orang dengan gangguan penglihatan yang tidak mempunyai pilihan selain dari pada melihat image
    • Orang-orang yang mematikan fitur gambar untuk dapat menjelajah web site secara lebih cepat. Ini umumnya hanya masalah untuk siapa yang tidak mempunyai koneksi broadband.
    Dukungan untuk yang mempunyai gangguan penglihatan adalah sebab utama untuk menggunakan atribut alt. 

    Mesin pencari juga membaca text yang berada di dalam atribut alt dari sebuah tag image <img>. Sebuah tag image berisi sebuah elemen yang digunakan untuk menceritakan halaman web untuk menampilkan sebuah image.

    Elemen lain yang mesin pencari baca adalah tag <noscript>. Secara historis kemampuan mesin pencari untuk membaca Javascript adalah cukup terbatas., tetapi ini telah berubah setelah beberapa waktu dan Google mengatakan mereka meng-eksekusi lebih JavaScript hari ini. Bagaimanapun juga, sebuah persentase kecil dari user tidak mengijinkan JavaScript untuk berjalan ketika mereka meload halaman web (pengalaman kami sekitar 2%). Untuk user tersebut, tidak ada yang akan ditampilkannya ketika JavaScript berada pada halaman web, kecuali halaman berisi sebuah tag <noscript>.

    Disini contoh JavaScript sangat sederhana yang didemonstrasikan :

    <script type="text/javascript">
    document.write("It is a Small World After All!")
    </script>
    <noscript>Your browser does not support JavaScript!</noscript>

      porsi <noscript> dari ni adalah Your browser does not support JavaScript!. Dalam contoh ini, Anda juga dapat memilih untuk membuat tag <noscript> berisi text "It is a Small World After All!". tag <noscript> harus digunakan untuk mempresentasikan konten dari JavaScript.

    No comments:

    Post a Comment