Seminggu terakhir ini saya direpotkan oleh prilaku mbah google yang bernama webmasters. Tidak seperti biasanya, sitemap yang telah saya submit ke google webmaster berprilaku aneh.
Biasanya setelah submit atau resubmit, tanda centang hijau akan muncul menandakan bahwa sitemap yang saya kirim, sudah di unduh oleh google dan dinyatakan valid. Jumlah URL yang dikirimkan melalui sitemap tersebut akan ditampilkan di layar monitor.
Namun kali ini, tanda hijau tidak mau muncul, dan sebaliknya hanya gambar jam yang muncul. Memang gambar jam ini biasanya menandakan proses unduh yang tertunda (pending download), dan seringkali hanya butuh waktu beberapa menit untuk proses downloadnya yang kemudian akan berubah menjadi centang hijau. Tapi tunggu punya tunggu, selama 3 hari, gambar jam itu masih belum juga berubah.
Biasanya saya hanya mensubmit 1 sitemap atom.xml?redirect=false&start-index=1&max-results=500, dan ini sudah cukup. Tapi setelah error yang saya alami, saya mencoba mensubmit sitemap dengan cara yang berbeda beda, namun hasilnya masih tetap sama. Seharusnya ada 370+ url yang di index oleh google, dan seperti yang terlihat di gambar, yang terdata di webmasters hanya berjumlah 343 url. ~_~
Ber “hipotesa” sendiri.
1. Blog saya kena penalty deindex oleh google, sehingga sitemap yang saya kirim ditolak. Derita panda – derita saya
2. Ada bagian dari template blog yang mempengaruhi kinerja crawler google, kemungkinan besar gara gara malfunction javascript yang terpasang di template tersebut.
3. Ada posting yang memuat kata terlarang seperti B*M dan lain lain yang mungkin tidak disukai oleh google
4. Sitemap yang berupa rss.xml dan atom.xml mengalami error, kemungkinan besar gara-gara posting yang di hapus atau link nya error.
Mari kita selesaikan hipotesa ini. pertama tama, deindex atau jumlah index di google bisa di pantau dengan kata kunci site:www.urlsaya.com
Dari hasil penelusuran saya dapatkan, blog saya memiliki jumlah halaman terindex sebanyak 930. Jumlah ini jauh di atas jumlah url yang saya submit. Menurut yang saya ketahui, bila blog kita kena deindex google, jumlah pencarian menggunakan keywords site: ini akan bekurang dan terus berkurang hingga akhirnya menjadi 0, namun kenyataannya, jumlah ini masih sama dan tidak berubah.
Mungkin ada bagian javascript yang membuat blog saya sulit untuk di crawler. Crawler secara terjemahan kasar, saya artikan sebagai proses yang dilakukan google untuk menyimpan data-data dari halaman yang ada dalam blog. Proses ini berjalan sesuai dengan daftar url alias sitemap yang sudah kita kirimkan sebelumnya. Proses ini penting karena salah satu fungsi dari proses ini adalah menganalisa keywords/ kata kunci yang ditampilkan di dalam blog saya.
Kecurigaan javascript sebagai pemicu error cukup beralasan, sebab, setahu saya, google crawler akan menghindari semua kata atau kalimat atau url yang di generate oleh javascript.
Nah template-template jaman sekarang, kebanyakan menggunakan fasilitas script createSummaryAndThumb. Saya mencurigai, proses pemotongan posting blog oleh script ini tidak disukai oleh crawler google.
Namun hipotesa ini terbantahkan dengan kenyataan bahwa, blog blog saya yang lain, yang juga menggunakan createSummaryAndThumb ternyata tidak mengalami hal yang serupa, kasus ini hanya terjadi di blog yang www.gaptekupdate.co.
Alhasil, semua script saya babat habis dari blog saya, mulai dari create summary, navigation bar, sampai dengan widget widget yang mengandung javascript saya babat habis. Hasilnya ? Tetap Sama !
Hipotesa ke 3 juga terbantahkan, dengan kenyataan bahwa kata ‘terlarang’ yang saya sebutkan tersebut, ternyata masih bisa di cari menggunakan google.
Terakhir, sitemap error ! bagaimana cara mengatasinya ?
Sebelumnya saya mencoba melakukan metode trial & error. biasanya sitemap default seperti /feeds/posts/default hanya akan mengirimkan maksimal 26 url saja, sedangkan jumlah posting saya jauh lebih besar daripada 26, untuk itu, saya menggunakan
atom.xml?redirect=false&start-index=1&max-results=500
yang bila diterjemahkan ke dalam bahasa manusia menjadi:
“Gunakan atom.xml sebagai sitemap, dengan mengacuhkan proses redirect yang dilakukan oleh sitemap, lakukan pendataan mulai post nomor 1 dan lakukan terus sampai mendapatkan hasil url sebanyak 500”
nah trial error yang saya lakukan adalah:
1. start 1 max 500 = hasil 343, dan conteng hijau tidak pernah muncul
2. start 1 max 100 = hasil 101, conteng hijau tidak muncul
3. start 101 max 100 = hasil tidak ada, conteng hijau tidak muncul
4. start 201 max 999 = hasil 174 dan tanda conteng hijaunya muncul
Ternyata, ada bagian cacad di dalam atom.xml, kemungkinan berada diantara posting ke 101 sampai dengan posting ke 200. Hal ini juga berlaku sama bila atom.xml diganti menjadi rss.xml.
Akhirnya saya nekat. satu satunya cara untuk me reset atom.xml ini hanya dengan menghapus semua posting saya. Hipotesa terakhir ini saya harapkan akan berhasil.
Langkah Terakhir
1. Sebelum nekat menghapus isi post dalam blog, saya melakukan proses ekspor blog. Proses ini akan mendownload seluruh isi posting dan komentar yang terdapat dalam blog saya
2. Setelah hasil jerih payah saya yang berupa posting, tersimpan aman di dalam harddisk, saya melakukan proses hapus post dan hapus komentar
4. Setelah semua proses hapus dan delete ini selesai, saya kembali mencoba me resubmit sitemap saya ke google webmaster tool. Hasilnya, sukses besar !!!, webmaster menunjukkan bahwa saya telah mengirimkan 1 url dan tanda conteng hijau muncul. Atom.xml telah di reset dengan sempurna.
5. Saatnya mengimpor kembali postingan yang sebelumnya saya ekspor dan simpan tadi. Kemudian tidak lupa untuk memilih publikasikan terhadap semua post yang telah saya unggah tadi.
Proses impor ini relatif aman, semuanya tidak berubah, tanggal posting, jumlah komentar dan lain lain masih tetap sama dengan sebelumnya, namun ada kekurangan di jumlah Page View, yaitu jumlah pembaca untuk satu halaman tertentu akan menghilang. Namun statistik jumlah pengunjung total, tetap tidak berubah. (syukurlah)
6. Kembali saya melakukan resubmit sitemap tadi, dan… ternyata, hasilnya sesuai dengan yang diharapkan, jumlah url, tanda conteng hijau dll sudah normal kembali. Sekarang tinggal menunggu proses reindex ulang oleh mbah google. terima kasih
kalo untuk wordpress gmana mas?
kalau wordpress keqnya sama aja. metode export->delete->trus import ulang.
oh iya, kalo wordpress self host. plugin google sitemap. bisa di regenerate ulang sitemapnya pake plugin itu
Ternyata bikin rank kita bagus susah juga ya, bikin duit di internet jadi gak mudah
ya begitulah om, tergantung garis tangan keqnya.
Lebih keliatan hasil submit-Nya ya gan kalo ditambah max. Seperti yang saya rasakan juga demikian. Jadi langsung ketarget sasarannya.
bisa masuk semua indexnya..
kalo saya ko setelah submit sitemap blog saya malah susah ke index …
kalo ada yang tau itu kenapa ya ,,, saya baru 3 bulan belajar blog
salah satu cara memaksa google untuk ngeindex halaman kita yg paling enak pake social bookmark, coba lintas.me
Submit sitemap sekarang kan udah enak, ada tombol test di google webmasternya.
oh iya, menurut yg saya dengar, google lagi galau ngeindex blogspot, khususnya yang pake custom domain.
http://www.google.com/support/forum/p/Webmasters/thread?tid=62dd987b15f66d5d&hl=en
coba submit feed standard dulu
/feeds/posts/default
atau
/feeds/posts/default?alt=rss
sama seperti yang gue rasakan sekarang gan. bingung juga harus gimana semua posting tidak bisa diindeks google. coba cara agan diatas semoga berhasil 😀
thx gan
ane juga status index pending mulu padahal waktu ditest ga ada yang error kenapa ya ?
emang gitu deh, pending. tunggu aja ampe kelar kerja crawlernya google
Wah kayaknya harus hapus posting neh… jangan2 web ane kena sandbox