Dalam kaitannya dengan SEO kita sering mendengar istilah duplicate content. Apa maksud dari duplicate content tersebut dan bagaimana pengaruhnya terhadap peringkat situs di search engine?
Sesuai dengan namanya, istilah duplicate content berkaitan erat dengan content atau isi halaman web. Seperti yang kita ketahui bersama, di Internet terdapat jutaan website. Jika satu website saja memiliki puluhan halaman web, bisa dibayangkan ada berapa banyak halaman web di Internet.
Nah, antara halaman web yang satu dengan yang lainnya itu tidak tertutup
kemungkinan memiliki isi yang sama. Barangkali tidak 100% sama, tapi bisa dikatakan mirip. Itulah yang dinamakan dengan duplicate content.
Ada beberapa sebab mengapa duplicate content tersebut bisa terjadi, yaitu antara lain:
1. Copy Paste
Tidak jarang sebuah halaman web isinya merupakan duplikasi (salinan) dari halaman web dari situs lain. Istilah kasarnya yaitu jiplakan atau hasil copy paste. Menulis artikel yang menarik dan berbobot itu memang tidak gampang, jadi wajar saja jika sering terjadi praktik copy paste semacam itu.
2. Versi Cetak (Print Friendly) dan PDF
Pernahkah Anda menjumpai artikel di website yang memiliki versi cetak (print friendly) dan PDF? Joomla adalah salah satu CMS yang memiliki fitur semacam itu. Nah, versi cetak dan PDF sepertiĀ ini juga bisa menyebabkan terjadinya duplicate content.
3. Adanya Perubahan URL
Situs Internet yang mengalami perubahan struktur URL sering juga menyebabkan terjadinya duplicate content. Mengapa bisa terjadi? Ya, karena halaman web yang lama telah tersimpan di database search engine. Nah, ketika search engine mengindeks halaman web dengan URL yang baru (tapi isinya sama seperti yang lama) terjadilah duplicate content tersebut.
Selain contoh di atas, masih banyak kasus lain yang bisa menyebabkan duplicate content.
Apa Pengaruh Duplicate Content?
Sudah bukan rahasia lagi kalau search engine, khususnya Google lebih menyukai isi halaman web yang unik. Dengan kata lain Google tidak menyukai adanya duplicate content.
Lalu bagaimana jika search engine menemukan duplicate content di situs kita? Nah itu dia masalahnya. Kemungkinan terburuknya yaitu peringkat situs kita di search engine akan menjadi korbannya.
Bagaimana Cara Menghindari Duplicate Content?
Duplicate content bisa terjadi kapan saja tanpa kita sadari. Bisa jadi kita merasa bahwa isi halaman web yang kita buat benar-benar unik, tidak ada yang menyamai, tapi siapa tahu ada situs lain yang juga memiliki halaman web dengan isi yang sama. Walaupun kemungkinannya sangat kecil tapi itu bisa saja terjadi.
Namun demikian dengan menghindari copy paste, setidaknya kita telah berupaya untuk membuat content yang unik sehingga bisa meminimalisasi terjadinya duplicate content. Selain itu ada beberapa tips sederhana untuk mencegah duplicate content di situs kita.
1. Robots.txt
Gunakan robots.txt untuk memblokir halaman web yang memiliki content sama atau mirip agar tidakĀ di-indeks oleh search engine. Misalnya pada kasus versi cetak dan PDF di atas.
2. Redirect Permanent
Jika suatu saat kita mengubah struktur URL dari situs kita, gunakan 301 redirect (RedirectPermanent) pada file .htaccess untuk me-redirect halaman web dengan URL lama ke URL yang baru.
3. Internal Link
Anda harus konsisten apabila membuat internal link. Jangan membuat beberapa link yang berbeda untuk halaman web yang sama, karena akan dianggap sebagai duplicate content.
Contohnya http://www.example.com/about dan http://www.example.com/about/.


Anasta | May 28th, 2010 jam 1:20 pm
Pak, salah satu website saya menggunakan session id utk faktor keamanan, dan karena memang berbentuk situs dinamik, banyak terjadi duplikasi, karena switching proses, bagaimana mengatasinya ya pak, me non aktifkan session id menurut saya cukup berbahaya, mohon petunjuknya. Terima Kasih.
Wahyu Wibowo | May 29th, 2010 jam 8:48 am
Kalau website perlu login memang penggunaan session ID tidak bisa dihindari.