Cara Kami “Mengatasi” Content Scraping oleh Web Lain

Artikel ini bukan tips dan trik ataupun tutorial bagaimana cara mengatasi pencurian konten (artikel). Ini hanya sebuah artikel berisi cerita pengalaman kami di Androbuntu.com, tentang bagaimana kami “mengatasi” content scrapping yang dilakukan oleh web dan blog lain.

Jika kamu memiliki blog atau situs, apa yang saya ceritakan dibawah ini mungkin dapat kamu coba juga. Namun saya tidak merekomendasikan. Semua resiko ditanggung sendiri.

Omong-omong, content scaping secara garis besar adalah sebuah proses pengambilan konten (biasanya artikel dan gambar) dari suatu web atau blog. Untuk mendapatkan pemahaman yang lebih mendalam, kamu bisa browsing sendiri di Google, sudah banyak yang membahasnya.

Sebenarnya tidak semua content scraping itu buruk. Faktanya, mesin pencari seperti Google, DuckDuckGo, dan Bing juga melakukan scraping untuk menampilkan hasil pencarian di halaman mereka.

Namun content scraping menjadi menyebalkan ketika dilakukan oleh orang-orang malas namun ingin mendapatkan uang dengan mudah, yaitu dengan cara melakukan scraping terhadap blog atau web milik orang lain.

Konten tersebut kemudian akan di publikasi di web miliknya sendiri. Biasanya hanya akan butuh waktu 1-5 menit setelah artikel original terbit, artikel tersebut juga akan muncul di blog si orang malas.

Beberapa orang malas juga biasanya akan me-rewrite atau mengalih bahasakan artikel tersebut. Itu adalah fitur tambahan dari program scraping yang mereka gunakan.

Bayangkan, dengan waktu publish yang hampir sama, ini akan membuat Google “bingung” menentukan siapa sebenarnya penulis asli artikel tersebut.

Dalam jangka panjang, blog kita akan dianggap sebagai blog “sampah” karena memiliki kesamaan artikel dengan blog lain (blog si orang malas). Dan pada akhirnya, lambat laun ranking blog kita di mesin pencari akan semakin turun.

Mereka tidak merasakan bagaimana rasanya riset keyword, membuat gambar ilustrasi, dan menulis artikel selama berjam-jam. Yang mereka tau cuma scraping kemudian gajian. Masa bodoh dengan blog orang lain yang turun ranking-nya gara-gara mereka.

Selain dilakukan secara otomatis menggunakan plugin, copas mentah-mentah artikel secara manual juga dapat disebut dengan content scraping. Namun yang saya bahas disini ialah content scraping otomatis menggunakan plugin.

Table of Contents

Cara yang Benar Menghadapi Content Scraping

Jika blog kamu di scraping secara otomatis, sebenarnya ada beberapa cara “benar” untuk mengatasinya. Pertama, kamu bisa mencari tahu dimana blog tersebut di host menggunakan situs seperti who.is.

Hubungi perusahaan hosting melalui halaman yang mereka sediakan, atau bisa juga melalui email. Katakan pada mereka bahwa salah satu customer mereka telah melakukan pelanggaran, yaitu melakukan scraping konten milik kamu.

Jangan lupa untuk mencantumkan url artikel original blog kamu dengan url artikel hasil scraping di blog orang malas.

Berdasarkan pengalaman saya, biasanya kurang dari 3 hari laporan akan segera di tanggapi dan blog si orang malas akan langsung di hapus (biasanya akunnya juga di banned secara permanen). Beberapa perusahaan hosting bahkan akan melakukan tindakan kurang dari satu hari.

Untuk kamu yang belum tahu, setiap perusahaan hosting (biasanya) memang mengharamkan customer mereka melakukan pencurian konten, apa lagi secara otomatis menggunakan plugin. Jadi jika si pemilik konten melapor ke mereka, mereka akan langsung melakukan tindakan.

Tapi ada satu perusahaan hosting asal Indonesia yang tidak setegas itu. Saya pernah melaporkan pencurian konten ke pihak mereka, alih-alih melakukan banned ke si orang malas, perusahaan hosting ini justru meminta orang malas untuk menghapus seluruh artikel yang mereka copas dari Androbuntu.

Awalnya saya cukup kaget. Karena setahu saya, seluruh perusahaan hosting sangat mengharamkan pencurian konten. Namun ternyata masih ada perusahaan hosting yang takut kehilangan satu customer malasnya seperti itu.

Kapan-kapan saya akan ceritakan detailnya pada satu artikel khusus mengenai hal ini.

Selain melapor ke pihak perusahaan hosting, masih ada banyak hal lagi yang dapat kamu lakukan untuk mengatasi scraping konten. Mulai dari melapor ke Google DMCA, menghubungi langsung si pemilik blog untuk berhenti scraping konten kita, dan masih banyak lagi. Kamu bisa baca tutorialnya di Gooogle, sudah banyak yang membahasnya.

Namun untuk opsi menghubungi langsung si orang malas, sepertinya itu akan jadi usaha yang sia-sia. Dengan melakukan scraping saja sudah menunjukan orang seperti apa mereka.

Cara Kami “Mengatasi” Content Scraping oleh Web Lain

Kata “Mengatasi” sengaja saya apit dalam tanda petik, karena memang ini tidak benar-benar “mengatasi”.

Jadi, apa yang kami lakukan ketika tahu ada sebuah blog atau situs yang melakukan scraping pada Androbuntu.com?

Saat akan memposting artikel baru, yang kami posting hanyalah judul artikel tanpa isi. Kami ingin memastikan bahwa di blog orang malas juga akan memposting hal yang sama (hanya judul tanpa isi artikel).

Setelah artikel tanpa isi tersebut juga tayang di blog orang malas, baru kami akan mengisi artikel tersebut yang sebenarnya sudah kami tulis, tinggal di copas di edit saja.

Jika tidak ada perubahan url dan waktu penerbitan artikel, blog si orang malas tidak akan melakukan update artikel seperti yang kita lakukan. Jadi, kini di blog orang malas hanya akan ada judul tanpa isi artikel. Sedangkan kita akan memiliki artikel yang lengkap dengan isinya.

Kami juga kadang-kadang memposting artikel baru dengan tanggal penayangan yang dimundurkan jika sedang malas untuk melakukan hal diatas. Jadi misal hari ini adalah tanggal 10 Desember, kami akan menyetel tanggal penayangan pada 10 November.

Cara ini juga terbukti ampuh. Blog milik si orang malas tidak akan bisa menerbitkan artikel yang kita mundurkan tanggal penayangannya.

Jadi, plugin atau program apa pun itu yang digunakan untuk scraping konten memiliki kelemahan. Pertama, dia tidak bisa ikut melakukan update artikel jika artikel original telah di update.

Kedua, dia tidak bisa men-scraping artikel yang dimundurkan waktu penayangannya.

Sebagai bonus, terkadang kami juga menerbitkan artikel-artikel random berisi gambar jorok. Silahkan berimajinasi sendiri gambar jorok seperti apa yang kami gunakan. Yang jelas bukan gambar jorok normal seperti wanita telanjang, atau semacamnya.

Setelah artikel random tersebut juga tayang di blog milik si orang malas, kami akan langsung menghapusnya dari Androbuntu. Agar tidak mencederai SEO Androbuntu, kami menyetel agar artikel tersebut tidak dibaca oleh mesin pencari (terima kasih untuk plugin YOAST SEO).

Ikuti Channel YouTube Androbuntu dan dapatkan info teknologi terbaru setiap hari