Codifica HTML. In quale codifica salvare la pagina web. Risoluzione dei problemi con la codifica errata della pagina Web Modifica della codifica in html

1. Abbiamo un file: Miofile.html.
2. È necessario salvarlo nella codifica Unicode -> UTF-8. Soluzione 1.
  1. Apri Myfile.html in un editor di testo Taccuino.
  2. Selezionare "Salva con nome...".
  3. Seleziona la codifica UTF-8.
  4. Fare clic sul pulsante - Salva.

Soluzione 2.
  1. Apri Myfile.html in un editor di testo Blocco note++(c'è anche un editor PSPad)
  2. Menù -> Codifiche.
    Qui vediamo (Notepad++ si determina da solo) la codifica del file che abbiamo aperto.
  3. Scegliere Converti in UTF-8 senza distinta base(BOM - Contrassegno ordine byte).
    (Codiroaka "UTF-8 senza BOM" è preferito e differisce solo da "UTF-8").
  4. Menù -> File -> Salva.

Rilevamento della codifica del browser

Noi stessi diciamo al browser quale codifica è impostata per questo file HTML.
Questo viene fatto utilizzando il META tag 1) L'esempio sopra indica al browser che il file HTML scaricato viene salvato con la codifica utf-8. Se il file HTML viene salvato con la codifica Windows-1251, allora: 2) Importante!
Durante la transcodifica dei file non dimenticare di cambiare le direttive nel tag META siano rilevanti.
Se una codifica è specificata nel tag META e il file viene salvato in un'altra codifica, vedremo "abracadabra" sullo schermo.

3) Se il META tag contiene la codifica richiesta, ma il sito visualizza ancora “abracadabra”, quindi è necessario verificare le impostazioni del sito sull'hosting (server web).
Di solito sull'hosting, la codifica è impostata su utf-8 nelle impostazioni del sito.
Se le impostazioni di hosting specificano la codifica windows-1251, è necessario modificare l'impostazione in utf-8.

Nel primo capitolo di questo tutorial, riguardante la costruzione generale di un documento html, ho detto che tutti i documenti html dovrebbero avere il seguente template di codice:

- inizio del documento
- inizio della testa
- chiudere la testa
- inizio del corpo
- chiusura del corpo
- fine del documento

Dove tra i tag vengono indicate le informazioni che intendono essere visualizzate sullo schermo nel modulo di cui abbiamo bisogno e tra i tag esclusivamente informazioni di servizio destinate ai motori di ricerca e ai browser di determinati utenti. Quindi che tipo di informazioni sono queste e a cosa servono? Risponderò in modo sistematico e parziale in questo capitolo.

Taggato </b> ci è già familiare, con l'aiuto di esso indichiamo il nome del documento nel titolo della pagina. Adesso una nuova etichetta <b><meta> </b>(non richiede un tag di chiusura) con l'aiuto di esso indicheremo proprio queste informazioni di servizio sulla nostra pagina.</p> <b><meta> </b> il tag ha i seguenti attributi: <ul><li><b>http-equiv</b>- indica al browser come elaborare il contenuto principale del documento, o meglio, in base a quali dati.</li><li><b>nome</b>- nome informativo. (usato insieme all'attributo <b>contenuto</b>)</li><li><b>contenuto</b>- contenuto informativo associato al meta nome ( <b>nome</b>)</li> </ul><p>Ora, usando esempi, approfondiremo l'essenza della questione.</p> <h2>Codifica dei caratteri e linguaggio</h2> <p>Esempio (molto necessario e importante):</p> <p> <b><meta http-equiv="Content-Type" Content="text/html; Charset=Windows-1251"> </b></p> <p>Innanzitutto ti dirò perché è necessaria questa riga nell'intestazione di un documento html. Questa voce indica al browser la codifica in cui è stata scritta questa pagina: il formato del documento e il layout della tastiera, in questo caso è cirillico per Windows. Se questa riga non è scritta nel titolo della pagina, è molto probabile che tutto il testo della tua pagina venga visualizzato sotto forma di "geroglifici" incomprensibili per l'uomo per diversi utenti di determinati browser. Naturalmente, l'utente può applicare il comando a tale documento nel browser <b>Visualizza->Codifica->Cirillico</b>, ma potrebbe non essere a conoscenza di questa funzione e perché disturbare una persona con questa azione.</p> <p>Ora suddividiamo la nostra registrazione sillaba per sillaba: <br><b><meta http-equiv="Content-Type" </b>- indicare cosa faremo in questo meta tag <b>Tipo di contenuto</b>- tipo di contenuto <br><b>Contenuto="testo/html;</b>- vale a dire il suo testo <br><b>Set di caratteri=Windows-1251"></b>- documento per Windows - Cirillico dove <b>1251 </b> codifica del layout della tastiera, quindi ad esempio verrà impostata la tastiera inglese <b>Set di caratteri=Windows-1252</b></p> <p>Attualmente, i webmaster avanzati consigliano di utilizzare la codifica <b>UTF8</b></p> <p>Cioè scrivere in testa al documento in questo modo:</p> <p> <b><meta http-equiv="Content-Type" content="text/html; charset=utf-8"> </b></p> <p> <b><meta http-equiv="Content-Language" Content="ru"> </b></p> <p>Questa riga dice quella lingua <b>Lingua</b> il documento è russo <b>Contenuto="it"</b></p> <p>L'impostazione errata della lingua e del layout della tastiera può portare a conseguenze disastrose.</p> <h2>Informazioni sul documento</h2> <p> <b><meta name="author" Content="Остап Бендер"> </b> <br><b><meta name="copyright" Content=""Рога и копыта" Остап Бендер"> </b></p> <p>Questi meta descrittori hanno lo scopo di fornire una dichiarazione di copyright direttamente nell'intestazione del codice html, quindi <b>nome="autore"</b> indica il nome dell'autore della pagina, e <b>nome="copyright"</b> diritto d'autore (copyright), che può indicare il cognome, il nome, il patronimico dell'autore del sito, il nome dell'azienda, il marchio... ecc. Inoltre, includendo tale descrizione nel titolo del documento, semplifica notevolmente il compito del motore di ricerca quando cerca il tuo sito per nome dell'autore, nome dell'azienda, marca...</p> <p> <b><meta name ="Generator" Content="Microsoft Notepad"> </b></p> <p>Se vuoi puoi indicare con quale editor html è stata scritta questa pagina.</p> <h2>Descrizione della pagina e parole chiave</h2> <p> <b><meta name="description" Content="Acquistiamo corna e zoccoli a prezzi competitivi!"> </b></p> <p><b>Descrizione</b>- una breve descrizione della pagina. Questa descrizione viene spesso utilizzata dai motori di ricerca per visualizzare nei risultati di ricerca, per qualsiasi richiesta, informazioni sul sito e sul suo scopo.</p> <p> <b><meta name="keywords" Content ="рога, копыта, рожки, рог, копыто, копытце, закупка, покупка, приобретение, выгодно, продать, купить, сбыть, реализовать, корова, бык, коровьи, бычьи, оплата, деньги, наличные, цена, цене"> </b></p> <p><b>Parole chiave</b>- parole chiave della pagina web, sempre destinate ai motori di ricerca.</p> <p>Immagina di cercare in qualche motore di ricerca un sito con informazioni su dove puoi vendere le stesse corna e zoccoli :) Quali parole e frasi inserirai nella riga "Cerca"? Beh, probabilmente qualcosa del tipo: “Dove posso vendere le corna di mucca?” o "Vendi zoccoli a buon prezzo". Quindi, se definisci le parole chiave e, per così dire, prevedi i pensieri di un potenziale visitatore, puoi sperare che l'uno o l'altro motore di ricerca fornisca un collegamento al tuo sito nelle prime righe. del risultato della ricerca. Naturalmente, l'inserimento di questo meta-descrittore non garantisce che il tuo sito otterrà il primo posto nella ricerca di queste parole, ma non dovresti comunque trascurarlo. Tuttavia, questo è un argomento di discussione separato.</p> <p>Ricorda che la descrizione <b>descrizione</b> non deve superare più di 200 caratteri di lunghezza e parole chiave <b>parole chiave</b> 1000 caratteri, altrimenti potrebbe avere un effetto dannoso sulla promozione del tuo sito al TOP dei motori di ricerca.</p> <h2>Indirizzo</h2> <p> <b><meta name="Publisher-Email" Content="Ваш_e-mail@сервер.домен"> </b> <br><b><meta name="Publisher-URL" Content="http://www.Ваш_сайт/"> </b></p> <p>Penso che sia chiaro... l'indirizzo della tua casella di posta è indicato qui <b>Editore-E-mail</b> e indirizzo del sito web <b>URL dell'editore</b></p> <h2>Aggiornamento della pagina</h2> <p> <b><meta name ="revisit-after" Content="15 days"> </b></p> <p>Se una determinata pagina del tuo sito prevede un costante aggiornamento e/o aggiunta di contenuti informativi, allora sarebbe bene includere questa descrizione nel titolo di questa pagina. Questa introduzione consentirà al programma robot di visitare tempestivamente il tuo sito e indicizzarne il contenuto. Nel nostro esempio abbiamo dichiarato che aggiorneremo il contenuto della pagina almeno una volta ogni 15 giorni, puoi stare certo che il programma robot prenderà nota dei tuoi piani e verrà a “visitarti” una volta ogni quindici giorni per controllare se è cambiato qualcosa per te...</p> <h2>Validità e cache del documento</h2> <p>Per accelerare il caricamento delle pagine e risparmiare traffico, i browser moderni salvano le pagine visitate dall'utente nella cache (sul disco rigido) e quando le visitano di nuovo le caricano non dal server, ma direttamente dal cache. In effetti, questa funzione è buona... ma c'è un “ma”, il fatto è che il browser potrebbe visualizzare informazioni obsolete da alcune pagine. Immagina, ad esempio, che il tuo sito web sia una sorta di pubblicazione periodica di notizie online e l'utente riceverà, invece delle ultime notizie, informazioni obsolete che sono archiviate nella sua cache!! e senza capire quale sia il “guaio”, prenderà il tuo sito per un sito “morto”, abbandonato e non aggiornato da nessuno.</p> <p>Per forzare il browser a caricare una determinata pagina non dal disco rigido, ma dal server, è necessario un meta tag con questa sintassi, che indica il giorno della settimana, giorno, mese, anno, ora (hh:mm :ss) e fuso orario( <b>GMT+03:00</b>- Ora di Mosca + tre ore). Il giorno della settimana e l'ora del giorno non possono essere specificati. Ora, quando un browser legge una pagina, la pagina verrà caricata dal server se la data e l'ora specificate sono arrivate o sono scadute, e viceversa dalla cache se l'ora specificata non è ancora arrivata.</p> <p>Di seguito, per ogni evenienza, sono riportate le tabelle delle abbreviazioni delle parole inglesi per i mesi e i giorni della settimana</p> <td valign="top"> </td> <p>Attributo <b>contenuto</b> può essere assegnato un valore <b>"0" <meta http-equiv="Expires" content="0"> </b> in questo caso la pagina verrà sempre caricata dal server.</p> <p>E ancora una cosa... alcuni robot di ricerca potrebbero rifiutarsi di indicizzare un documento con una data ovviamente obsoleta. -non sfidare il destino...</p> <p> <b><meta http-equiv="pragma" content="no-cache"> </b></p> <p>E una voce del genere impedirà completamente al browser di memorizzare nella cache questa pagina.</p> <h2>Comandi per il robot</h2> <p> <b><meta name="robots" content="Index,follow"> </b></p> <p>Questo meta tag ha lo scopo di fornire al robot di ricerca uno o un altro comando.</p> <p>Elenco dei possibili comandi per il robot:</p> <ul><li><b>Indice</b>- indicizzare la pagina</li><li><b>Nessun indice</b>- non indicizzare la pagina</li><li><b>Seguire</b>- tenere traccia dei collegamenti ipertestuali su una pagina</li><li><b>Non seguire</b>- non seguire i collegamenti ipertestuali sulla pagina</li><li><b>Tutto</b>- indicizzare la pagina e tenere traccia dei collegamenti ipertestuali sulla pagina (impostazione predefinita)</li><li><b>Nessuno</b>- non indicizzare la pagina e non tenere traccia dei collegamenti ipertestuali sulla pagina</li> </ul><h2>Passaggio automatico a un'altra pagina</h2> <p> <b><meta content="10; URL=http://www.mysite/index.html"> </b></p> <p>Se all'improvviso per qualche motivo decidi di cambiare l'indirizzo URL del tuo sito, sarebbe bene lasciare una pagina come questa al suo vecchio posto:</p> <p> <html> <br> <head> <br> <meta http-equiv="Content-Type" Content="text/html; Charset=Windows-1251"> <br><b><meta content="10; URL=http://www.mysite/index.html"> </b> <br> <title>Inoltro



L'indirizzo del sito è stato modificato, dopo 10 secondi il tuo browser verrà automaticamente reindirizzato al nuovo indirizzo:
http://www.miosito.ru/
Clicca qui per effettuare il trasferimento immediato.
Ci scusiamo per l'inconveniente causato.


Analizziamo e comprendiamo la riga dell'esempio:

meta- Aggiorna (ripristino) indica al browser che questa pagina deve essere aggiornata
contenuto="10;- aggiornamento dopo un numero di secondi specificato (nel nostro caso dieci)
URL=http://www.miosito/index.html"- l'indirizzo della nuova/diversa pagina a cui andare.

Ma se nel titolo Aggiorna Se ometti l'indirizzo URL, come mostrato nell'esempio, il browser aggiornerà costantemente il contenuto di questa pagina ogni 30 secondi (o non 30.. per quanto tempo scrivi..).

Questo metodo è ampiamente utilizzato nei feed di notizie, dove le informazioni fluiscono in un flusso, per così dire, e richiedono un aggiornamento costante.

Effetti quando si segue un collegamento


Queste intestazioni creano effetti visivi quando si passa da una pagina all'altra.

  • Pagina-Invio- Effetto aspetto della pagina
  • Pagina-Esci- Effetto di scomparsa della pagina

In cui:

  • Durata- durata dell'effetto in secondi
  • Transizione- Uno dei numeri degli effetti proposti (da 0 a 23) elencati nella tabella:
NumeroDescrizione dell'effettoNumeroDescrizione dell'effetto
0 Rettangoli all'interno12 Dissoluzione
1 Rettangoli verso l'esterno13 Panorama verticale verso l'interno
2 Cerchio verso l'interno14 Panorama verticale verso l'esterno
3 Cerchia fuori15 Panorama orizzontale verso l'interno
4 Inondazione verso l'alto16 Panorama orizzontale verso l'esterno
5 Inondazione17 Angoli a sinistra - in basso
6 Flusso a destra18 Angoli a sinistra - in alto
7 Sfumatura a sinistra19 Angoli a destra - in basso
8 Tende verticali20 Angoli a destra - in alto
9 Tende orizzontali21 Strisce orizzontali casuali
10 Gradini orizzontali22 Strisce verticali casuali
11 Gradini verticali23 Selezione casuale degli effetti

File pagina1.html





Effetti di transizione della pagina



Nota:


Gli effetti di transizione da una pagina all'altra non funzionano in tutti i browser.




"Andare"


File pagina2.html





Effetti di transizione della pagina



Nota:


Gli effetti dell'apertura e chiusura delle pagine web saranno visibili solo durante la navigazione
da una pagina all'altra oppure utilizzando i pulsanti "indietro" e "avanti".
Quando si apre la pagina per la prima volta, nonché durante il riavvio
gli effetti di transizione non saranno visibili.


Clicca su "Vai" per passare alla pagina successiva
e valutare l'effetto della transizione da una pagina all'altra.


"Andare"


    Lascia che ti ricordi ancora una volta che i meta tag dovrebbero essere usati abilmente e con competenza, soprattutto quando si tratta di comandi per il robot e di codifica dei caratteri, altrimenti tutto il tuo lavoro potrebbe andare in malora..

    Intestazione Aggiorna(transizione automatica a un'altra pagina) può essere utilizzato in modo non standard. Alcuni autori lo utilizzano per creare una sorta di presentazione "presentazione", in cui le pagine che cambiano sono fotogrammi della presentazione. Immagina che una persona arrivi su un sito del genere e qui dica “Appoggiati e rilassati..” :) e poi immagini, grafici, testi appaiono da soli.. e l'ultima pagina è un vicolo cieco dove l'utente porta il sito “ nelle sue mani” o forse vicino al primo. Ricorda sempre la regola d'oro di un webmaster: l'importante è non esagerare!

Dopo ASCIIè stato ampliato (inizialmente non utilizzava tutti gli 8 bit), quindi è diventato possibile utilizzare non 128, ma 256 (2 all'ottava potenza) caratteri diversi che possono essere codificati in un byte di informazioni.
Questo miglioramento ha permesso di aggiungere alla codifica ASCII simboli delle lingue nazionali di diversi paesi, oltre all'alfabeto latino già esistente.
Opzioni di codifica estese ASCII Ce ne sono molti perché ci sono anche molte lingue nel mondo. Penso che molti di voi abbiano sentito parlare di una codifica come KOI8 (Codice di scambio di informazioni, 8 bit) - anche questa è una codifica estesa ASCII. KOI8 includeva numeri, lettere dell'alfabeto latino e russo, nonché segni di punteggiatura, caratteri speciali e pseudografici.

Codifica ISO

L'International Standards Organization ha creato una gamma di codifiche per diversi alfabeti/lingue.

Codifiche serie ISO 8859

Codifica Descrizione
ISO 8859-1 (latino-1) Latino esteso, compresi i caratteri della maggior parte delle lingue dell'Europa occidentale (inglese, danese, irlandese, islandese, spagnolo, italiano, tedesco, norvegese, portoghese, romancio, faroese, svedese, gaelico scozzese e parti di olandese, finlandese, francese), come nonché alcune lingue dell’Europa orientale (albanese) e africane (afrikaans, swahili). Nel Latin-1 mancano il simbolo dell'euro e la lettera maiuscola Ÿ. Questa tabella codici è considerata la codifica predefinita per documenti HTML e messaggi di posta elettronica. Inoltre, i primi 256 caratteri Unicode corrispondono a questa tabella codici.
ISO 8859-2 (latino-2) Latino esteso, compresi i caratteri delle lingue dell'Europa centrale e dell'Europa orientale (bosniaco, ungherese, polacco, slovacco, sloveno, croato, ceco). Latin-2, come Latin-1, non ha il simbolo dell'euro.
ISO 8859-3 (latino-3) Latino esteso, compresi i caratteri delle lingue dell'Europa meridionale (maltese, turco ed esperanto).
ISO 8859-4 (latino-4) Latino esteso, compresi i caratteri delle lingue del Nord Europa (groenlandese, estone, lettone, lituano e lingue sami).
ISO 8859-5 (latino/cirillico) Cirillico, compresi i caratteri delle lingue slave (bielorusso, bulgaro, macedone, russo, serbo e in parte ucraino).
ISO 8859-6 (latino/arabo) Simboli usati in arabo. I caratteri di altre lingue basate sull'arabo non sono supportati. Per visualizzare correttamente il testo ISO 8859-6 è necessario il supporto per la scrittura bidirezionale e i moduli di caratteri sensibili al contesto.
ISO 8859-7 (latino/greco) Simboli della lingua greca moderna. Può essere utilizzato anche per scrivere testi in greco antico in ortografia monotona.
ISO 8859-8 (latino/ebraico) Simboli dell'ebraico moderno. Viene utilizzato in due versioni: con un ordine logico dei caratteri (richiede il supporto per la scrittura bidirezionale) e con un ordine visivo dei caratteri.
ISO 8859-9 (latino-5) Una variante del Latin-1 che sostituisce i caratteri islandesi usati raramente con quelli turchi. Utilizzato per le lingue turca e curda.
ISO 8859-10 (latino-6) Una variante latina-4 più adatta alle lingue scandinave.
ISO 8859-11 (latino/tailandese) Simboli della lingua tailandese.
ISO 8859-13 (latino-7) Variante latina-4, più adatta alle lingue baltiche.
ISO 8859-14 (latino-8) Una scrittura latina estesa che include caratteri delle lingue celtiche come il gaelico scozzese e il bretone.
ISO 8859-15 (latino-9) Una variante di Latin-1 che sostituisce i caratteri usati raramente con quelli necessari per supportare pienamente finlandese, francese ed estone. Inoltre, il simbolo dell'euro è stato aggiunto al Latin-9.
ISO 8859-16 (latino-10) Latino esteso, compresi i caratteri delle lingue dell'Europa meridionale e orientale (albanese, ungherese, italiano, polacco, rumeno, sloveno, croato), nonché alcune lingue dell'Europa occidentale (irlandese nella nuova ortografia, tedesco, finlandese, francese ). Come Latin-9, Latin-10 ha aggiunto il simbolo dell'euro.

Per i documenti in inglese e nella maggior parte delle altre lingue dell'Europa occidentale, la codifica è ampiamente supportata ISO-8859-1.

Nell'HTML ISO-8859-1è la codifica predefinita (in XHTML e HTML5 la codifica predefinita è UTF-8).
Quando si utilizza una codifica di pagina diversa da ISO-8859-1, è necessario indicarla nel tag .

Per HTML4:

Per HTML5:

Un esempio di codifica ANSI è la ben nota Windows-1251.

Windows-1251 differisce favorevolmente da altre codifiche cirilliche a 8 bit (come CP866 e ISO 8859-5) per la presenza di quasi tutti i caratteri utilizzati nella tipografia russa per il testo normale (manca solo l'accento). Contiene anche tutti i simboli delle altre lingue slave: ucraino, bielorusso, serbo, macedone e bulgaro.
Di seguito sono riportati i valori decimali dei caratteri di codifica Windows-1251.

Per visualizzare i simboli della tabella in un documento HTML, utilizzare la seguente sintassi:

& + codice + ;

Codifica Windows-1251 (CP1251)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .UN .B .C .D .E .F

8.
Ђ
402
Ѓ
403

201A
ѓ
453

201E

2026

2020

2021

20 CA

2030
Љ
409

2039
Њ
40A
Ќ
40C
Ћ
40B
Џ
40F

9.
ђ
452

2018

2019

201C

201D

2022

2013
-
2014

2122
љ
459

203A
њ
45A
ќ
45C
ћ
45B
џ
45F

UN.

A0
Ў
40E
ў
45E
Ј
408
¤
A4
Ґ
490
¦
A6
§
A7
Ehi
401
©
A9
Є
404
«
AB
¬
AC
­
A.D
®
A.E.
Ї
407

B.
°
B0
±
B1
І
406
і
456
ґ
491
µ
B5

B6
·
B7
e
451

2116
є
454
»
BB
ј
458
Ѕ
405
ѕ
455
ї
457

C.
UN
410
B
411
IN
412
G
413
D
414
E
415
E
416
Z
417
E
418
Y
419
A
41A
l
41B
M
41C
N
41D
DI
41E
P
41F

D.
R
420
CON
421
T
422
U
423
F
424
X
425
C
426
H
427
Sh
428
SCH
429
Kommersant
42A
Y
42B
B
42C
E
42D
Yu
42E
IO
42F

E.
UN
430
B
431
V
432
G
433
D
434
e
435
E
436
H
437
E
438
th
439
A
43A
l
43B
M
43C
N
43D
O
43E
N
43F

F.
R
440
Con
441
T
442
A
443
F
444
X
445
ts
446
H
447
w
448
sch
449
ъ
44A
S
44B
B
44C
eh
44D

44E
IO
44F

Codifiche standard UNICODE

Unicode è uno standard di codifica dei caratteri che consente di rappresentare i caratteri di quasi tutte le lingue scritte del mondo, nonché i caratteri speciali. I caratteri rappresentati in Unicode sono codificati come numeri interi senza segno. Unicode ha diverse forme di rappresentazione dei caratteri su un computer: UTF-8, UTF-16 (UTF-16BE, UTF-16LE) e UTF-32 (UTF-32BE, UTF-32LE). (Inglese: formato di trasformazione Unicode - UTF).
UTF-8è una codifica attualmente comune ampiamente utilizzata nei sistemi operativi e nel Web. Il testo costituito da caratteri Unicode numerati meno di 128 (area codice da U+0000 a U+007F) contiene caratteri impostati ASCII con i codici corrispondenti. Poi ci sono aree di caratteri di varie scritture, segni di punteggiatura e simboli tecnici. Per i caratteri cirillici sono destinate aree di caratteri con codici da U+0400 a U+052F, da U+2DE0 a U+2DFF, da U+A640 a U+A69F.

Codifica UTF-8è universale e ha una riserva impressionante per il futuro. Ciò la rende la codifica più conveniente da utilizzare su Internet.



Abilita JavaScript per visualizzare il

Quando creano un sito Web, i webmaster alle prime armi hanno spesso domande: quale codifica utilizzare per il sito Web, in che modo UTF-8 differisce da Windows-1251 e come inserirlo nel META Charset delle pagine HTML del sito. Le risposte a tutte queste domande sono in questo articolo.

Cos'è la codifica del sito e come funziona?

La codifica può essere presentata sotto forma di una tabella composta da diverse lettere, numeri e altri simboli comprensibili all'uomo, che sono codificati in un certo modo. Quando si apre un file di testo, che include pagine HTML, il computer legge dall'intestazione del file in quale codifica è stato salvato e visualizza il testo nella codifica appropriata, convertendo i dati del computer in una forma comprensibile agli esseri umani confrontando questi dati con tabella di codifica. Se le informazioni di codifica dall'intestazione del file corrispondono alla codifica in cui i dati sono memorizzati nella pagina HTML, l'utente vede le lettere, i numeri e altri simboli a lui familiari. Se c'è una discrepanza, il risultato è che all'utente viene presentato un set di caratteri incomprensibile, questo accade soprattutto nei vecchi programmi di posta elettronica. Se un utente riceve una lettera con parole incomprensibili, semplicemente passando attraverso diverse codifiche, di solito è possibile indovinare e selezionare quella in cui è scritta la lettera e, di conseguenza, un insieme di caratteri incomprensibili si trasforma in comprensibile dall'uomo testo.

La stessa cosa accade con le pagine HTML del sito. Se il documento è stato salvato, ad esempio, con la codifica UTF-8 e il documento stesso contiene un tag META che indica che si tratta di codifica Windows-1251, il browser confronterà nuovamente i dati salvati nel file con la tabella della codifica specificato e poiché i caratteri sono codificati in modo diverso, il browser visualizzerà un insieme di caratteri incomprensibili invece del solito testo, oppure alcune lettere potrebbero essere in forma normale, mentre altre lettere o simboli potrebbero essere visualizzati, ad esempio ad esempio, sotto forma di punti interrogativi. Tutto quanto sopra vale anche per la visualizzazione dei nomi dei file.

Quando si crea un nuovo documento in un editor di testo, è meglio assicurarsi immediatamente che sia selezionata la codifica desiderata. Gli editor moderni consentono di convertire il testo di un documento aperto da una codifica all'altra e il Blocco note standard consente di selezionare la codifica solo durante il salvataggio del file.

Le codifiche più comuni

Dal paragrafo precedente sai già cos'è la codifica e perché è così importante scriverla correttamente nel codice delle pagine del sito. Scopriamo ora quale tra le tante codifiche è meglio scegliere per il futuro sito. Poiché il sistema operativo più comune e più facile da apprendere è sempre stato il sistema operativo Windows, la maggior parte degli sviluppatori web ha creato pagine HTML nella codifica Windows-1251 (ANSI), utilizzata per impostazione predefinita. Ma Windows-1251 non supporta un numero molto elevato di lettere e simboli e gli sviluppatori desiderano utilizzare varie frecce, cuori, quadrati e altri simboli nei loro testi, inclusa la necessità di combinare parole di diverse lingue in un unico documento, quindi è stato sostituito da tempo con l'arrivo dell'UTF-8 più esteso e la maggior parte degli sviluppatori utilizza questa codifica.

Problemi di codifica non solo nella pagina HTML

Il sito, sia che si tratti semplicemente di una raccolta di documenti HTML statici o di complessi script dinamici che generano pagine al volo, è ospitato su un server web, che funziona anch'esso con una codifica specifica. E se il server fornisce informazioni in una codifica e le tue pagine o script vengono salvati in una codifica diversa, potrebbero verificarsi nuovamente problemi con la visualizzazione delle pagine nel browser dell'utente. Molti hosting consentono di modificare le impostazioni e selezionare la codifica in base a quella utilizzata nei file del sito tramite il pannello di controllo, oppure è possibile scriverla nel file .htaccess se l'hosting utilizza il popolare server web Apache.

Quasi nessun sito web moderno può funzionare senza l'utilizzo di un database MySQL e può anche diventare fonte di problemi di codifica. Se i file del sito vengono salvati in una codifica e le informazioni nel database sono in un'altra, sulla pagina quella parte delle informazioni emesse dal database può essere visualizzata sotto forma degli stessi punti interrogativi o altri simboli incomprensibili . Per evitare problemi con la codifica, dovrebbe essere lo stesso per il server web, il database MySQL, negli script, nelle pagine HTML del sito e nel tag META, che è scritto nel codice HTML. Se si verificano problemi con la visualizzazione del testo, verificare quanto sopra per individuare il problema.

META Charset del documento HTML

Per indicare al browser e ai motori di ricerca in quale codifica vengono salvate le pagine del sito, nel loro codice viene scritto un META Charset.

Per la codifica Windows-1251:

Titolo della pagina

Testo della pagina


Per la codifica UTF-8:

Titolo della pagina

Testo della pagina


Ora sai cos'è la codifica del sito e dove cercare i problemi se il testo viene visualizzato in modo errato in qualsiasi parte del sito.

E' vietata la copia dell'articolo.