Il server ha restituito l'errore 404. Yandex: errori tipici. Pagine ipertestuali e loro caratteristiche

Tutto errori specificati non sono fondamentali per Yandex, esso indicizzerà comunque le pagine. Ma possono impedire ai potenziali visitatori della tua pagina di trovarla tra milioni di altre.

L'errore 404 "Non trovato" non viene gestito correttamente
Controlla cosa fanno i tuoi script in caso di errori. Se lo script segnala un errore e allo stesso tempo emette un normale codice di uscita pari a 200, il messaggio verrà indicizzato. Se il tuo script restituisce il codice HTTP 404, questo messaggio di errore non verrà indicizzato.
Ciò vale anche per i documenti ordinari.

Alcuni server sono configurati in modo tale che in caso di errore inviino un messaggio con un codice di completamento normale pari a 200. Ciò impedisce al robot di rimuovere il collegamento alla pagina nel database. Qualsiasi server Web moderno consente di modificare i messaggi di errore standard e di inviarli con il codice di errore corretto.
Spam o nessuna necessità di ingannare l'utente Lo spam è caratterizzato da titoli e parole chiave un gran numero
parole delle query più popolari, grandi quantità di testo “scritto” sulla pagina con il colore di sfondo o con caratteri molto piccoli, così come tanti altri trucchi per attirare gli utenti sulle proprie pagine con l'inganno.
Non dovrebbero essere utilizzati per due motivi.

In primo luogo, ciò non aggiunge fama al creatore della pagina e naturalmente irrita gli utenti.
In secondo luogo, Yandex monitora tali cambiamenti anomali e riduce la posizione del documento nella pagina dei risultati. Inoltre, lo spam aumenta le dimensioni del documento e, quindi, riduce il contrasto delle parole in esso contenute, il che influisce anche sulla posizione del documento nell'elenco di quelli trovati. In caso di uso dannoso dello spam, l'amministrazione Yandex può escludere tali pagine e siti dal database. Sono escluse dall'indicizzazione anche le pagine con tempi di reindirizzamento pari a zero.

Date errate
Molte risorse vengono sprecate quando si indicizzano gli stessi documenti prodotti da server web con codifiche diverse. Allo stesso tempo, i motori di ricerca russi conservano ancora i documenti in una delle codifiche nei loro database.

Si consiglia di disabilitare tutte le codifiche tranne una per l'indicizzazione. Se le codifiche vengono emesse per porta ai server, allora diversi robots.txt devono essere emessi su porte (server) diverse. Ciò significa che in tutte le porte/server, tranne quello principale, dovrebbe essere scritto

Se le codifiche vengono emesse, ad esempio, per directory, è necessario creare un file robots.txt in cui verrà scritto
Non consentire: /alt
non consentire: /mac

non consentire: /koi
Indicizzazione di un sito su server diversi Questo problema si verifica quando il server ha mirror e/o le codifiche hanno il prefisso nel nome host, ad es.
www.chto-to.ru: win.chto-to.ru, koi-www.chto-to.ru, wwwmac.chto-to.ru
ecc.
Il robot non è in grado di determinare autonomamente l'indirizzo “principale”.

L'unica cosa che può fare (e fa) è determinare che due documenti corrispondano alle codifiche e indicizzarne solo uno.

Pertanto, è possibile che parti diverse del tuo sito siano indicizzate su host diversi. Se desideri che l'intero sito venga indicizzato in base a un indirizzo (host), impedisci l'indicizzazione del resto impostando il file robots.txt appropriato. Dopo un po' di tempo (mentre il robot esegue la scansione), tutti i documenti indicizzati faranno riferimento a questo host. L'errore 404 è l'errore più riconoscibile e comune nei documenti ipertestuali. Segnala che la pagina all'indirizzo indicato non esiste. Stiamo infatti parlando dell'assenza di un file html per il documento specificato, quindi il sito restituisce un errore. Per comprendere il problema in modo più dettagliato, nonché il numero di file di servizio di ciascuna risorsa, è necessario studiare il problema associato alla rappresentazione ipertestuale delle pagine utilizzando Linguaggio HTML(HyperText Markup Language - “linguaggio

markup ipertestuale

") e il protocollo HTTP attraverso il quale viene effettuato l'accesso. Anche se dovrai conoscere il linguaggio di programmazione, la sua presentazione è così semplice che chiunque può capirlo.

Internet è nata nel momento in cui l'ingegnere inglese Timothy John Berners-Lee ha inventato una forma ipertestuale per rappresentare le pagine di testo sulla rete e ha descritto il principio per accedervi utilizzando il protocollo applicativo HTTP. Secondo l'idea generale, l'utente effettua una richiesta di rete per una risorsa specifica dal suo dispositivo, ovvero dal browser. In questo momento viene aperta una sessione sul server a cui si accede. Come risposta viene restituita una pagina HTML.

Naturalmente, oggigiorno vengono utilizzati algoritmi più complessi per l'accesso e il "pagamento" di pagine di grandi dimensioni, ma principio generale rimane lo stesso. Per accedere alla risorsa è necessario un nome di dominio e un indirizzo IP. Solo se questi criteri sono soddisfatti e la risorsa è funzionante verrà restituito un “errore 404 non trovato” per un documento mancante.

Come appare una pagina 404 predefinita

Il sito potrebbe avere o meno una pagina di errore di accesso personalizzata "http 404 non trovato". Un utente con poca esperienza, di regola, è piuttosto nervoso quando lo riceve e crede che sia colpa sua. In effetti, tutto è molto più semplice; la risposta segue da quanto sopra.

Il codice di errore 404 viene restituito come una pagina separata progettata nella progettazione del sito solo se il sito dispone di un file 404.html. Di solito si trova nella directory principale. Altrimenti, il browser visualizzerà questo errore insieme a un messaggio che indica che l'accesso non è disponibile. E di solito sembra un foglio bianco con un messaggio di errore.

Quando si sviluppano siti Web, vengono solitamente utilizzati sistemi di gestione dei contenuti. Contengono una pagina 404 che indica file di funzioni modo per lei. In genere, una pagina di questo tipo contiene un messaggio su un indirizzo inesistente e un collegamento a cui accedere pagina iniziale sito. Il modello di pagina 404 può essere personalizzato come desideri, poiché è una pagina del tuo sito web che puoi utilizzare come preferisci.

Per rifare il modello, avrai bisogno della conoscenza dell'HTML per contrassegnare il file. Tieni presente che in alcuni casi il file con la pagina potrebbe avere un nome diverso: err404. html, 404.php. Le differenze rispetto allo standard sono spesso associate a funzionalità più ampie, nonché a caratteristiche del sistema. Ad esempio, in WordPress il documento si trova nella directory 404.php. Nella barra degli indirizzi, verrà visualizzato "errore 404 pagina non trovata" in questo modo: domain.ru/404/.

Adattiamo la pagina standard 404 per adattarla ai vostri scopi

Per migliorare l'usabilità (accettabilità per gli utenti) del sito, ovviamente, è necessario creare una pagina che attiri il visitatore sul tuo sito e lo aiuti a continuare la navigazione. Cose da considerare quando si scrive il codice:

  • Una parte significativa dei visitatori che incontrano pagine inesistenti accedono al sito dai motori di ricerca o tramite collegamenti su forum, siti Web, ecc. reti sociali, cioè da dove possono essere localizzati vecchi collegamenti a pagine defunte da tempo.
  • Gli utenti non cercano il tuo sito, ma informazioni di loro interesse parola chiave, cioè in assenza di ciò che desidera, il visitatore abbandona il sito e lo visualizza raramente.

Cioè, devi capire che non sarà così facile fidelizzare tali visitatori, ma è possibile!

Prendi un modello standard disponibile su Internet o creane uno tuo, tenendo conto delle funzionalità di cui sopra:

  1. Spiega brevemente alla persona cosa è successo e perché non vede quello che stava cercando. Mostragli le opzioni per ulteriori azioni che lo aiuteranno a trovare ciò che sta cercando.
  2. Visualizza a pagina 404 barra di ricerca in modo che il visitatore possa trovare subito ciò che desidera.
  3. Assicurati di visualizzare qui il menu del tuo sito, con l'aiuto del quale una persona può capire dove andare.
  4. Assicurati che la pagina attiri l'utente e che voglia trovare informazioni sulla tua risorsa. Utilizza testi colorati e interessanti e soluzioni visive.

Per rendere attraente per l'utente una pagina di errore del server 404, è sufficiente farlo sorridere o interessarlo. Pertanto, prova a lavorare sull'originalità dell'idea per una sezione del genere della tua risorsa.

Modifica della pagina 404

Puoi modificare il file direttamente dal sistema di gestione dei contenuti; per fare ciò, devi aggiungere il markup e le immagini desiderate.
Quando lo crei, lasciati guidare dal fatto che le informazioni dovrebbero essere aperte rapidamente e senza indugio. La pagina deve essere “leggera” (occupare poco spazio), utile e offrire alternative alla ricerca di un documento inesistente.

  • vai a casa;
  • elenco delle pagine in classifica del sito;
  • vai alla mappa delle risorse;
  • un pulsante per informare l'amministrazione di un collegamento “interrotto” su una fonte specifica.

Per il resto, il miglior assistente sarà l'immaginazione, gli standard aziendali e idea originale designer.

Conclusione

La pagina 404 non trovata è un file di servizio che può essere modificato ed espanso per attirare più visitatori sul sito. Questo file è necessario, perché altrimenti il ​​browser visualizzerà un messaggio di errore, dopo il quale la possibilità di attirare una persona sarà pari a zero. Prova a riempirlo con immagini colorate e persino con umorismo leggero.

La pagina 404 ha lo scopo di informare l'utente che l'URL (indirizzo della pagina) da lui specificato non esiste.
Tali URL errati possono anche essere chiamati “collegamenti interrotti”.
Molti siti creano le loro pagine 404 per la comodità dei propri utenti. Spesso questi sono belli e pagine interessanti, che fanno sorridere l'utente invece di essere deluso dal fatto che l'indirizzo della pagina non sia corretto.
Quando si crea una pagina 404, c'è un'importante componente tecnica che influenza notevolmente il posizionamento dei siti al suo interno motori di ricerca, se tutto non è configurato correttamente.

Se sei interessato a creare una pagina 404, allora devi considerare tre punti:
1) Reindirizzamento da tutti gli URL inseriti in modo errato alla pagina 404 in .htaccess.
2) Risposta corretta del server dopo il reindirizzamento (il codice della pagina http deve essere 404, non 200).
3) Chiusura della pagina 404 dall'indicizzazione in robots.txt

Dovrei subito notare che tutto quanto sopra è stato scritto per siti autoprodotti, principalmente in PHP. Esistono plugin per WordPress per configurare lo stesso. Ma in questo articolo vedremo come appare tutto nella realtà. %)

Reindirizzamento degli URL errati alla pagina 404

La prima cosa da fare è creare la pagina 404 stessa in modo da avere un posto dove inviare le persone %).
Il reindirizzamento dell'URL è configurato nel file .htaccess
Basta inserire la riga:
DocumentoErrore 404 http://miosito.com/404.php
Dove "miosito.com" è il tuo dominio e http://miosito.com/404.php è il percorso della pagina reale. Se il tuo sito è in html, la riga sarà simile a:
Documentoerrore 404 http://miosito.com/404.html
La verifica è molto semplice. Dopo aver caricato sull'hosting il file .htaccess con la riga sopra, effettuate una verifica inserendo un URL evidentemente inesistente (link interrotto), ad esempio: http://miosito.com/$%$%
Se si verifica un reindirizzamento alla pagina creata, significa che tutto funziona.
Quindi, l'intero file .htaccess, dove è configurato SOLO un reindirizzamento 404, sarà simile a questo:
____________________________
RewriteEngine acceso
Documentoerrore 404 http://miosito.com/404.html
____________________________

Risposta corretta del server (codice della pagina http)

È molto importante che durante il reindirizzamento ci sia una risposta corretta del server, vale a dire 404 Non trovato.
Questo deve essere spiegato separatamente.

Quando richiesto, a qualsiasi URL viene assegnato uno stato (codice della pagina http).
Per tutte le pagine esistenti, questo è: HTTP/1.1 200 OK
Per le pagine reindirizzate: HTTP/1.1 302 Trovato
Se la pagina non esiste, dovrebbe essere HTTP/1.1 404 Not Found

Cioè, indipendentemente dall'URL inserito, gli viene assegnato uno stato, un determinato codice di risposta del server.
Puoi controllare la risposta del server su una risorsa come bertal.ru o SEARCH CONCOLE GOOGLE – Scansiona/Visualizza come bot GOOGLE.
Quando non si verificava un reindirizzamento tramite .htaccess alla pagina 404, qualsiasi URL inesistente inserito dall'utente, così come i collegamenti interrotti, riceveva la risposta "HTTP/1.1 404 Not Found"

Dopo aver impostato un reindirizzamento alla pagina dell'autore 404 tramite .htaccess, come descritto sopra, inserendo un collegamento interrotto (URL non valido che ovviamente non esiste), come http://miosito.com/$%$% , la risposta del server sarà:
- primo HTTP/1.1 302 Trovato (reindirizzamento),
- e poi HTTP/1.1 200 OK (la pagina esiste).

Controlla su bertal.ru.
Cosa significa questo? Ciò significa che Google può aggiungere tutti i collegamenti interrotti al suo database (indice), come le pagine esistenti con il contenuto di una pagina 404, in effetti pagine duplicate. E questo è incredibilmente dannoso per l’ottimizzazione dei motori di ricerca.

In questo caso devi fare due cose:
1) Imposta la risposta corretta del server sulla pagina 404.
2) Blocca l'indicizzazione della pagina 404. Questa operazione viene eseguita tramite il file robots.txt

Configurazione della risposta del server HTTP/1.1 404 Non trovato per pagine inesistenti

La risposta del server è personalizzabile grazie a funzioni php all'inizio della pagina:

Scrivilo all'inizio del file 404.
Di conseguenza, dovremmo ricevere una risposta al collegamento interrotto:

Chiudi 404 pagine dall'indicizzazione

Puoi impedire l'indicizzazione di una pagina nel file rodots.txt. Fai attenzione con questo strumento, perché attraverso questo file il tuo sito comunica essenzialmente con i robot di ricerca!
Il testo completo del file rodots.txt, dove è chiusa SOLO l'indicizzazione della pagina 404, si presenta così:
____________________________
Agente utente: *
Non consentire:
Non consentire: /404.php
____________________________

Note sul codice: "/404.php" indica il percorso della pagina. Se sul tuo sito la pagina 404.php (o 404.html, rispettivamente) si trova in qualche cartella, il percorso sarà simile a:
/holder/404.php
dove "holder" è il nome della cartella.

Questo è tutto sulla pagina 404. Controlla il funzionamento della pagina, i reindirizzamenti dei collegamenti interrotti e le risposte del server.
Ripeto: tutto quanto sopra riguarda i siti scritti da sé. Se utilizzi WordPress, potresti voler cercare un plugin di errore 404 decente.