Server mengembalikan kesalahan 404. Yandex: kesalahan umum. Halaman hypertext dan fitur-fiturnya

Semua kesalahan yang ditentukan tidak penting untuk Yandex, itu akan mengindeks halaman dalam hal apa pun. Namun mereka dapat mencegah calon pengunjung halaman Anda menemukannya di antara jutaan halaman lainnya.

Kesalahan 404 "Tidak ditemukan" tidak ditangani dengan benar
Periksa apa yang dilakukan skrip Anda jika terjadi kesalahan. Jika skrip melaporkan kesalahan dan pada saat yang sama mengeluarkan kode keluar normal 200, maka pesan tersebut akan diindeks. Jika skrip Anda mengembalikan kode HTTP 404, pesan kesalahan ini tidak akan diindeks.
Hal ini juga berlaku untuk dokumen biasa.

Beberapa server dikonfigurasi sedemikian rupa sehingga jika terjadi kesalahan, mereka mengirim pesan dengan kode penyelesaian normal 200. Hal ini mencegah robot menghapus link ke halaman di database. Server web modern mana pun memungkinkan Anda mengubah pesan kesalahan standar dan mengirimkannya dengan kode kesalahan yang benar.
Spam, atau tidak perlu menipu pengguna Spam adalah berita utama dan kata kunci yang diberi rasa sejumlah besar
kata-kata dari kueri paling populer, sejumlah besar teks yang “ditulis” pada halaman dengan warna latar belakang atau font yang sangat kecil, serta banyak trik lain untuk menarik pengguna ke halaman mereka dengan cara menipu.
Mereka tidak boleh digunakan karena dua alasan.

Pertama, ini tidak menambah ketenaran pembuat halaman dan tentu saja mengganggu pengguna.
Kedua, Yandex memantau perubahan abnormal tersebut dan mengurangi tempat dokumen di halaman hasil. Selain itu, spam meningkatkan ukuran dokumen dan, oleh karena itu, mengurangi kontras kata-kata di dalamnya, yang juga memengaruhi tempat dokumen dalam daftar dokumen yang ditemukan. Dalam kasus penggunaan spam yang berbahaya, administrasi Yandex dapat mengecualikan halaman dan situs tersebut dari database. Halaman dengan waktu pengalihan nol juga dikecualikan dari pengindeksan.

Tanggal yang salah
Banyak sumber daya yang terbuang saat mengindeks dokumen yang sama yang dihasilkan oleh server web dalam pengkodean berbeda. Pada saat yang sama, mesin pencari Rusia masih menyimpan dokumen dalam salah satu pengkodean di database mereka.

Disarankan untuk menonaktifkan semua pengkodean kecuali satu untuk pengindeksan. Jika pengkodean dikeluarkan berdasarkan port ke server, maka robots.txt yang berbeda harus dikeluarkan pada port (server) yang berbeda. Artinya di semua port/server, kecuali yang utama, harus ditulis

Jika pengkodean dikeluarkan, misalnya, berdasarkan direktori, maka Anda perlu membuat satu file robots.txt yang akan menulisnya
Larang: /alt
larang: /mac

larang: /koi
Mengindeks satu situs di server yang berbeda Masalah ini terjadi ketika server memiliki mirror dan/atau pengkodean yang diawali dengan nama host, misalnya.
www.chto-to.ru: win.chto-to.ru, koi-www.chto-to.ru, wwwmac.chto-to.ru
dll.
Robot tidak dapat menentukan alamat “utama” secara mandiri.

Satu-satunya hal yang dapat dilakukan (dan dilakukan) adalah menentukan bahwa dua dokumen cocok dengan pengkodeannya, dan hanya mengindeks salah satunya.

Oleh karena itu, mungkin saja bagian berbeda dari situs Anda diindeks pada host yang berbeda. Jika Anda ingin seluruh situs Anda diindeks berdasarkan satu alamat (host), cegah pengindeksan sisanya dengan menyetel file robots.txt yang sesuai. Setelah beberapa waktu (saat robot merayapi), semua dokumen yang diindeks akan merujuk ke host ini. Kesalahan 404 adalah kesalahan yang paling dikenal dan umum dalam dokumen hypertext. Ini melaporkan bahwa halaman di alamat yang diberikan tidak ada. Faktanya, kita berbicara tentang tidak adanya file html untuk dokumen tertentu, sehingga situs mengembalikan kesalahan. Untuk memahami masalah ini secara lebih rinci, serta sejumlah file layanan yang dimiliki setiap sumber daya, Anda perlu mempelajari masalah yang terkait dengan representasi hypertext halaman menggunakan bahasa HTML(Bahasa Markup HyperText - “bahasa

markup hiperteks

"), dan protokol HTTP yang melaluinya akses dilakukan. Meskipun Anda harus memahami bahasa pemrogramannya, penyajiannya sangat sederhana sehingga siapa pun dapat memahaminya.

Internet lahir pada saat insinyur Inggris Timothy John Berners-Lee menemukan bentuk hypertext yang mewakili halaman teks di jaringan dan menjelaskan prinsip mengaksesnya menggunakan protokol aplikasi HTTP. Menurut gambaran umum, pengguna membuat permintaan jaringan untuk sumber daya tertentu dari perangkatnya, yaitu dari browser. Saat ini, sesi dibuka di server yang sedang diakses. Halaman HTML dikembalikan sebagai respons.

Tentu saja, saat ini algoritma yang lebih kompleks digunakan untuk mengakses dan “memaging” halaman besar, namun prinsip umum tetap sama. Untuk mengakses sumber daya, Anda memerlukan nama domain dan alamat IP. Hanya jika kriteria ini terpenuhi dan sumber daya berfungsi dengan baik maka “kesalahan 404 tidak ditemukan” akan dikembalikan untuk dokumen yang hilang.

Seperti apa tampilan halaman 404 default

Situs ini mungkin memiliki atau tidak memiliki halaman kesalahan akses khusus “http 404 tidak ditemukan”. Seorang pengguna dengan sedikit pengalaman, biasanya, cukup gugup saat menerimanya dan percaya bahwa ini adalah kesalahannya. Faktanya, semuanya jauh lebih sederhana; jawabannya mengikuti penjelasan di atas.

Kode kesalahan 404 dikembalikan sebagai halaman terpisah yang dirancang dalam desain situs hanya jika situs tersebut memiliki file 404.html. Biasanya terletak di direktori root. Jika tidak, browser akan menampilkan kesalahan ini bersama dengan pesan bahwa akses tidak tersedia. Dan biasanya terlihat seperti lembaran putih dengan pesan kesalahan.

Saat mengembangkan situs web, sistem manajemen konten biasanya digunakan. Mereka berisi halaman 404 yang menunjukkan file fungsi jalan ke dia. Biasanya, halaman seperti itu berisi pesan tentang alamat yang tidak ada dan link untuk menuju halaman rumah lokasi. Templat halaman 404 dapat dikustomisasi sesuai keinginan Anda, karena ini adalah halaman di situs web Anda yang dapat Anda gunakan sesuai keinginan.

Untuk membuat ulang template, Anda memerlukan pengetahuan HTML untuk menandai file. Harap dicatat bahwa dalam beberapa kasus, file dengan halaman tersebut mungkin memiliki nama yang berbeda - err404. html, 404.php. Perbedaan dari standar paling sering dikaitkan dengan fungsionalitas yang lebih luas, serta fitur sistem. Misalnya, di WordPress, dokumen dapat ditemukan di direktori 404.php. Di bilah alamat, "halaman kesalahan 404 tidak ditemukan" akan ditampilkan seperti ini: domain.ru/404/.

Kami mengadaptasi halaman 404 standar agar sesuai dengan tujuan Anda

Untuk meningkatkan usability (penerimaan bagi pengguna) situs, tentunya perlu dibuat halaman yang akan menarik pengunjung ke situs Anda dan membantu mereka terus menjelajah. Hal-hal yang perlu diperhatikan saat menulis kode:

  • Sebagian besar pengunjung yang menemukan halaman yang tidak ada mengunjungi situs dari mesin pencari atau melalui link di forum, situs web, dll. jejaring sosial, yaitu, dari mana tautan lama ke laman yang sudah lama tidak berfungsi mungkin berada.
  • Pengguna tidak mencari situs Anda, tetapi mencari informasi yang menarik kata kunci, yaitu jika tidak ada yang diinginkan, pengunjung meninggalkan situs dan jarang melihatnya.

Artinya, Anda harus memahami bahwa mempertahankan pengunjung seperti itu tidak mudah, tetapi itu mungkin!

Ambil templat standar yang tersedia di Internet, atau buat sendiri, dengan mempertimbangkan fitur-fitur di atas:

  1. Jelaskan secara singkat kepada orang tersebut apa yang terjadi dan mengapa dia tidak melihat apa yang dia cari. Tunjukkan padanya pilihan untuk tindakan lebih lanjut yang akan membantunya menemukan apa yang dia cari.
  2. Tampilan di halaman 404 bilah pencarian sehingga pengunjung dapat segera menemukan apa yang diinginkannya.
  3. Pastikan untuk menampilkan menu situs Anda di sini, yang dengannya seseorang dapat memahami ke mana harus pergi.
  4. Pastikan halaman tersebut menarik pengguna dan dia ingin mencari informasi tentang sumber daya Anda. Gunakan solusi teks dan visual yang penuh warna dan menarik.

Untuk membuat halaman kesalahan server 404 menarik bagi pengguna, cukup membuatnya tersenyum atau tertarik. Oleh karena itu, cobalah untuk mengerjakan orisinalitas ide untuk bagian sumber daya Anda tersebut.

Mengedit halaman 404

Anda dapat mengedit file langsung dari sistem manajemen konten; untuk melakukan ini, Anda perlu menambahkan markup dan gambar yang diinginkan.
Saat membuatnya, dipandu oleh fakta bahwa informasi harus dibuka dengan cepat dan tanpa penundaan. Halaman tersebut harus “ringan” (mengambil sedikit ruang), bermanfaat, dan menawarkan alternatif selain mencari dokumen yang tidak ada.

  • pergi ke rumah;
  • daftar halaman peringkat situs;
  • buka peta sumber daya;
  • tombol untuk memberi tahu administrasi tentang tautan "rusak" pada sumber tertentu.

Selebihnya, asisten terbaik adalah imajinasi, standar perusahaan, dan ide orisinal perancang.

Kesimpulan

Halaman 404 tidak ditemukan adalah file layanan yang dapat diubah dan diperluas untuk menarik lebih banyak pengunjung ke situs. File ini diperlukan, karena jika tidak, browser akan menampilkan pesan kesalahan, setelah itu kemungkinan memikat seseorang kepada Anda akan menjadi nol. Cobalah untuk mengisinya dengan gambar berwarna dan bahkan humor ringan.

Halaman 404 dirancang untuk memberi tahu pengguna bahwa url (alamat halaman) yang dia tentukan tidak ada.
URL yang salah seperti itu juga bisa disebut “tautan rusak”.
Banyak situs membuat halaman 404 untuk kenyamanan penggunanya. Seringkali ini indah dan halaman yang menarik, yang membuat pengguna tersenyum bukannya kecewa karena alamat halamannya salah.
Saat membuat halaman 404, ada komponen teknis penting yang sangat mempengaruhi peringkat situs di dalamnya mesin pencari, jika semuanya tidak dikonfigurasi dengan benar.

Jika Anda tertarik untuk membuat halaman 404, maka Anda perlu mempertimbangkan tiga hal:
1) Redirect dari semua url yang salah dimasukkan ke halaman 404 di .htaccess.
2) Respon server yang benar setelah pengalihan (kode halaman http harus 404, bukan 200).
3) Menutup halaman 404 dari pengindeksan di robots.txt

Saya harus segera mencatat bahwa semua hal di atas ditulis untuk situs yang ditulis sendiri, terutama dalam PHP. Ada plugin untuk WordPress untuk mengkonfigurasinya. Namun dalam artikel ini kita akan melihat bagaimana segala sesuatunya terlihat dalam kenyataan. %)

Mengarahkan URL yang salah ke halaman 404

Hal pertama yang Anda lakukan adalah membuat halaman 404 itu sendiri sehingga Anda memiliki tempat untuk mengirim orang %).
Pengalihan url dikonfigurasi dalam file .htaccess
Cukup masukkan baris:
Dokumen Kesalahan 404 http://mysite.com/404.php
Dimana “situssaya.com” adalah domain Anda, dan http://situssaya.com/404.php adalah jalur ke halaman sebenarnya. Jika situs Anda dalam html, maka barisnya akan terlihat seperti:
Dokumen Kesalahan 404 http://mysite.com/404.html
Verifikasinya sangat sederhana. Setelah file .htaccess dengan baris di atas diupload ke hosting, lakukan pengecekan dengan memasukkan URL yang jelas-jelas tidak ada (link rusak), contoh: http://mysite.com/$%$%
Jika terjadi pengalihan ke halaman yang Anda buat, maka semuanya berfungsi.
Jadi, seluruh file .htaccess, di mana HANYA pengalihan 404 dikonfigurasi, akan terlihat seperti ini:
____________________________
Mesin Tulis Ulang menyala
Dokumen Kesalahan 404 http://mysite.com/404.html
____________________________

Respons server yang benar (kode halaman http)

Yang penting saat redirect ada respon server yang benar yaitu 404 Tidak Ditemukan.
Hal ini perlu dijelaskan tersendiri.

Saat diminta, url apa pun diberi status (kode halaman http).
Untuk semua halaman yang ada, ini adalah: HTTP/1.1 200 OK
Untuk halaman yang dialihkan: HTTP/1.1 302 Ditemukan
Jika halamannya tidak ada, seharusnya HTTP/1.1 404 Not Found

Artinya, URL apa pun yang dimasukkan, ia diberi status, kode respons server tertentu.
Anda dapat memeriksa respons server pada sumber daya seperti bertal.ru atau SEARCH CONCOLE GOOGLE – Pindai/Lihat sebagai bot GOOGLE.
Jika Anda tidak memiliki pengalihan melalui .htaccess ke halaman 404, maka URL apa pun yang tidak ada yang dimasukkan oleh pengguna, serta tautan rusak, akan menerima respons “HTTP/1.1 404 Not Found”

Setelah Anda mengatur redirect ke halaman 404 author Anda melalui .htaccess seperti dijelaskan di atas, lalu masukkan tautan yang rusak (url tidak valid yang jelas-jelas tidak ada), seperti http://mysite.com/$%$% , respons server akan:
- HTTP/1.1 302 pertama Ditemukan (pengalihan),
- lalu HTTP/1.1 200 OK (halaman ada).

Periksa melalui bertal.ru.
Apa artinya ini? Artinya Google dapat menambahkan semua link yang rusak ke database-nya (indeks), seperti halaman yang ada dengan konten halaman 404. Faktanya, halaman duplikat. Dan ini sangat berbahaya bagi optimasi mesin pencari.

Dalam hal ini, Anda perlu melakukan dua hal:
1) Atur respons server yang benar pada halaman 404.
2) Blokir halaman 404 dari pengindeksan. Ini dilakukan melalui file robots.txt

Mengonfigurasi respons server HTTP/1.1 404 Not Found untuk halaman yang tidak ada

Respons server dapat disesuaikan berkat fungsi php di awal halaman:

Tulis di awal file 404.
Akibatnya, kita akan menerima respons terhadap tautan yang rusak:

Tutup halaman 404 dari pengindeksan

Anda dapat memblokir halaman agar tidak diindeks di file rodots.txt. Hati-hati dengan alat ini, karena melalui file ini situs Anda pada dasarnya berkomunikasi dengan robot pencari!
Teks lengkap file rodots.txt, yang HANYA menutup pengindeksan halaman 404, terlihat seperti ini:
____________________________
Agen pengguna: *
Melarang:
Larang: /404.php
____________________________

Catatan kode: "/404.php" berarti jalur menuju halaman. Jika di situs Anda halaman 404.php (atau 404.html) terletak di beberapa folder, maka jalurnya akan terlihat seperti:
/holder/404.php
dimana "holder" adalah nama foldernya.

Itu semua tentang halaman 404. Periksa pengoperasian halaman, pengalihan tautan yang rusak, dan respons server.
Saya ulangi: Semua hal di atas adalah untuk situs yang ditulis sendiri. Jika Anda menggunakan WordPress, Anda mungkin ingin mencari plugin kesalahan 404 yang layak.