HTML კოდირება. რა კოდირებით უნდა შეინახოთ ვებ გვერდი. ვებ გვერდის არასწორი კოდირების პრობლემების გადაჭრა HTML-ში კოდირების შეცვლა

1. გვაქვს ფაილი: Myfile.html.
2. თქვენ უნდა შეინახოთ Unicode -> UTF-8 კოდირებით. გამოსავალი 1.
  1. გახსენით Myfile.html ტექსტურ რედაქტორში რვეული.
  2. აირჩიეთ "შენახვა როგორც...".
  3. აირჩიეთ UTF-8 კოდირება.
  4. დააჭირეთ ღილაკს - შენახვა.

გამოსავალი 2.
  1. გახსენით Myfile.html ტექსტურ რედაქტორში Notepad ++(ასევე არის PSPad რედაქტორი)
  2. მენიუ -> კოდირებები.
    აქ ჩვენ ვხედავთ (Notepad++ თავად განსაზღვრავს) ჩვენ მიერ გახსნილი ფაილის კოდირებას.
  3. აირჩიეთ გადაიყვანეთ UTF-8-ზე BOM-ის გარეშე(BOM - Byte Order Mark).
    (Codiroaka "UTF-8 გარეშე BOM" სასურველია და განსხვავდება მხოლოდ "UTF-8"-ისგან).
  4. მენიუ -> ფაილი -> შენახვა.

ბრაუზერის კოდირების გამოვლენა

ჩვენ თვითონ ვეუბნებით ბრაუზერს, თუ რა კოდირებაა დაყენებული ამ HTML ფაილისთვის.
ეს კეთდება META ტეგის გამოყენებით 1) ზემოთ მოყვანილი მაგალითი ბრაუზერს ავალებს, რომ გადმოწერილი HTML ფაილი შენახულია utf-8 კოდირებით. თუ HTML ფაილი შენახულია Windows-1251 კოდირებით, მაშინ: 2) მნიშვნელოვანი!
ფაილების ტრანსკოდირებისას არ დაგავიწყდეთ შეცვლადირექტივები META ტეგში იყოს შესაბამისი.
თუ META ტეგში მითითებულია ერთი კოდირება, ხოლო ფაილი შენახულია სხვა კოდირებით, მაშინ ჩვენ ეკრანზე დავინახავთ "აბრაკადაბრას".

3) თუ META ტეგი შეიცავს საჭირო დაშიფვრას, მაგრამ საიტი კვლავ აჩვენებს "abracadabra", შემდეგ თქვენ უნდა შეამოწმოთ საიტის პარამეტრები ჰოსტინგზე (ვებ სერვერზე).
როგორც წესი, ჰოსტინგზე, საიტის პარამეტრებში კოდირება დაყენებულია utf-8-ზე.
თუ ჰოსტინგის პარამეტრებში მითითებულია Windows-1251 კოდირება, მაშინ თქვენ უნდა შეცვალოთ პარამეტრი utf-8-ზე.

ამ გაკვეთილის პირველ თავში, html დოკუმენტის ზოგადი კონსტრუქციის შესახებ, მე ვთქვი, რომ ყველა html დოკუმენტს უნდა ჰქონდეს შემდეგი კოდის შაბლონი:

- დოკუმენტის დასაწყისი
- თავის დასაწყისი
- თავის დახურვა
- სხეულის დასაწყისი
- სხეულის დახურვა
- დოკუმენტის დასასრული

სად ტეგებს შორის ნაჩვენებია ინფორმაცია ეკრანზე გამოსატანად ჩვენთვის საჭირო ფორმით და ტეგებს შორის ექსკლუზიურად სერვისული ინფორმაცია, რომელიც განკუთვნილია გარკვეული მომხმარებლების საძიებო სისტემებისთვის და ბრაუზერებისთვის. რა სახის ინფორმაციაა ეს და რისთვის არის განკუთვნილი? ამ თავში სისტემატურად და ნაწილობრივად გიპასუხებ.

მონიშნულია </b>ჩვენ უკვე ვიცნობთ, მისი დახმარებით გვერდის სათაურში ვანიშნებთ დოკუმენტის სახელს. ახლა ახალი ტეგი <b><meta> </b>(არ საჭიროებს დახურვის ტეგს) მისი დახმარებით ჩვენ მივუთითებთ ამ სერვისის ინფორმაციას ჩვენს გვერდზე.</p> <b><meta> </b>ტეგს აქვს შემდეგი ატრიბუტები: <ul><li><b>http-ეკვივი</b>- ეუბნება ბრაუზერს, თუ როგორ უნდა დაამუშაოს დოკუმენტის ძირითადი შინაარსი, უფრო სწორად, რა მონაცემებზე დაყრდნობით.</li><li><b>სახელი</b>- საინფორმაციო სახელი. (გამოიყენება ატრიბუტთან ერთად <b>შინაარსი</b>)</li><li><b>შინაარსი</b>- მეტა სახელთან დაკავშირებული ინფორმაციის შინაარსი ( <b>სახელი</b>)</li> </ul><p>ახლა, მაგალითების გამოყენებით, ჩავუღრმავდებით საკითხის არსს.</p> <h2>სიმბოლოების კოდირება და ენა</h2> <p>მაგალითი (ძალიან საჭირო და მნიშვნელოვანი):</p> <p> <b><meta http-equiv="Content-Type" Content="text/html; Charset=Windows-1251"> </b></p> <p>პირველ რიგში, მე გეტყვით, რატომ არის საჭირო ეს ხაზი html დოკუმენტის სათაურში. ეს ჩანაწერი მიუთითებს ბრაუზერს იმ კოდირებაზე, რომელშიც ეს გვერდი იყო დაწერილი - დოკუმენტის ფორმატი და კლავიატურის განლაგება, ამ შემთხვევაში ეს არის კირილიცა Windows-ისთვის. თუ ეს სტრიქონი არ არის ჩაწერილი გვერდის სათაურში, მაშინ დიდია ალბათობა იმისა, რომ თქვენს გვერდზე არსებული მთელი ტექსტი გამოჩნდეს „იეროგლიფების“ სახით, რომლებიც ადამიანებისთვის გაუგებარია გარკვეული ბრაუზერების სხვადასხვა მომხმარებლისთვის. რა თქმა უნდა, მომხმარებელს შეუძლია გამოიყენოს ბრძანება ასეთ დოკუმენტზე ბრაუზერში <b>ხედი->დაშიფვრა->კირილიცა</b>, მაგრამ მან შეიძლება არ იცოდეს ამ ფუნქციის შესახებ და რატომ აწუხებს ადამიანი ამ მოქმედებით.</p> <p>ახლა მოდით დავყოთ ჩვენი ჩანაწერის მარცვალი მარცვლების მიხედვით: <br><b><meta http-equiv="Content-Type" </b>- მიუთითეთ რას ვაკეთებთ ამ მეტა ტეგში <b>შინაარსი-ტიპი</b>- შინაარსის ტიპი <br><b>Content="text/html;</b>- კერძოდ მისი ტექსტი <br><b>Charset=Windows-1251"></b>- დოკუმენტი Windows-ისთვის - კირილიცა სად <b>1251 </b>კლავიატურის განლაგების კოდირება, ასე, მაგალითად, ინგლისური კლავიატურა იქნება დაყენებული <b>Charset=Windows-1252</b></p> <p>ამჟამად, მოწინავე ვებმასტერები გირჩევენ კოდირების გამოყენებას <b>UTF 8</b></p> <p>ანუ დოკუმენტის თავში ჩაწერეთ ასე:</p> <p> <b><meta http-equiv="Content-Type" content="text/html; charset=utf-8"> </b></p> <p> <b><meta http-equiv="Content-Language" Content="ru"> </b></p> <p>ეს ხაზი ამბობს იმ ენას <b>ენა</b>დოკუმენტი რუსულია <b>შინაარსი = "en"</b></p> <p>ენისა და კლავიატურის არასწორად დაყენებამ შეიძლება გამოიწვიოს საშინელი შედეგები.</p> <h2>დოკუმენტის ინფორმაცია</h2> <p> <b><meta name="author" Content="Остап Бендер"> </b> <br><b><meta name="copyright" Content=""Рога и копыта" Остап Бендер"> </b></p> <p>ეს მეტა დესკრიპტორები გამიზნულია საავტორო უფლებების შესახებ განცხადების მიწოდებისთვის პირდაპირ html კოდის თავში, ასე რომ <b>სახელი = "ავტორი"</b>მიუთითებს გვერდის ავტორის სახელს და <b>სახელი = "საავტორო უფლება"</b>საავტორო უფლება (საავტორო უფლება), რომელშიც შეიძლება მიუთითებდეს საიტის ავტორის გვარი, სახელი, პატრონიმი, კომპანიის სახელი, ბრენდი... და ა.შ. გარდა ამისა, დოკუმენტის სათაურში ასეთი აღწერილობის ჩართვით, თქვენ მნიშვნელოვნად გაამარტივებს საძიებო სისტემის ამოცანას თქვენი საიტის ავტორის სახელის, კომპანიის სახელის, ბრენდის მიხედვით ძიებისას...</p> <p> <b><meta name ="Generator" Content="Microsoft Notepad"> </b></p> <p>თუ გსურთ, შეგიძლიათ მიუთითოთ რომელი html რედაქტორით დაიწერა ეს გვერდი.</p> <h2>გვერდის აღწერა და საკვანძო სიტყვები</h2> <p> <b><meta name="description" Content="ჩვენ ვყიდულობთ რქებს და ჩლიქებს კონკურენტულ ფასებში!"> </b></p> <p><b>აღწერა</b>- გვერდის მოკლე აღწერა. ამ აღწერილობას ხშირად იყენებენ საძიებო სისტემები ძიების შედეგებში, ნებისმიერი მოთხოვნის, საიტის და მისი დანიშნულების შესახებ ინფორმაციის საჩვენებლად.</p> <p> <b><meta name="keywords" Content ="рога, копыта, рожки, рог, копыто, копытце, закупка, покупка, приобретение, выгодно, продать, купить, сбыть, реализовать, корова, бык, коровьи, бычьи, оплата, деньги, наличные, цена, цене"> </b></p> <p><b>საკვანძო სიტყვები</b>- ვებ გვერდის საკვანძო სიტყვები, ისევ საძიებო სისტემებისთვის განკუთვნილი.</p> <p>წარმოიდგინეთ, რომ რომელიმე საძიებო სისტემაში ეძებთ საიტს, სადაც არის ინფორმაცია იმის შესახებ, თუ სად შეგიძლიათ გაყიდოთ იგივე რქები და ჩლიქები :) რა სიტყვებს და ფრაზებს შეიყვანთ "ძიების" ხაზში? კარგად, ალბათ მსგავსი რამ: "სად შემიძლია ძროხის რქები გავყიდო?" ან „ჩლიქების გაყიდვა კარგ ფასად“ ასე რომ, თუ თქვენ განსაზღვრავთ საკვანძო სიტყვებს და, ასე ვთქვათ, იწინასწარმეტყველებთ პოტენციური ვიზიტორის აზრებს, შეგიძლიათ იმედი გქონდეთ, რომ ამა თუ იმ საძიებო სისტემა მოგცემთ ბმულს თქვენს საიტზე პირველ სტრიქონში. ძიების შედეგიდან. რა თქმა უნდა, ამ მეტადესკრიპტორის შეყვანა არ იძლევა გარანტიას, რომ თქვენი საიტი პირველ ადგილს დაიკავებს ამ სიტყვების ძიებაში, მაგრამ მაინც არ უნდა უგულებელყოთ იგი. თუმცა ეს ცალკე განხილვის თემაა.</p> <p>გახსოვდეთ, რომ აღწერა <b>აღწერა</b>არ უნდა აღემატებოდეს 200 სიმბოლოს და საკვანძო სიტყვებს <b>საკვანძო სიტყვები</b> 1000 სიმბოლოს, წინააღმდეგ შემთხვევაში შეიძლება საზიანო გავლენა მოახდინოს თქვენი საიტის საძიებო სისტემების TOP-ში პოპულარიზაციაზე.</p> <h2>მისამართი</h2> <p> <b><meta name="Publisher-Email" Content="Ваш_e-mail@сервер.домен"> </b> <br><b><meta name="Publisher-URL" Content="http://www.Ваш_сайт/"> </b></p> <p>მგონი გასაგებია.. თქვენი საფოსტო ყუთის მისამართი აქ არის მითითებული <b>გამომცემელი-ელ.ფოსტა</b>და საიტის მისამართი <b>გამომცემელი-URL</b></p> <h2>გვერდის განახლება</h2> <p> <b><meta name ="revisit-after" Content="15 days"> </b></p> <p>თუ თქვენს საიტზე გარკვეული გვერდი გულისხმობს მუდმივ განახლებას ან/და საინფორმაციო კონტენტის დამატებას, მაშინ კარგი იქნება, რომ ეს აღწერილობა ამ გვერდის სათაურში შეიტანოთ. ეს შესავალი საშუალებას მისცემს რობოტის პროგრამას დროულად ეწვიოს თქვენს საიტს და მოახდინოს მისი შინაარსის ინდექსირება. ჩვენს მაგალითში ჩვენ განვაცხადეთ, რომ ვაპირებთ გვერდის შინაარსის განახლებას მინიმუმ 15 დღეში ერთხელ, შეგიძლიათ დარწმუნებული იყოთ, რომ რობოტის პროგრამა გაითვალისწინებს თქვენს გეგმებს და მოვა "თქვენთან" თხუთმეტ დღეში ერთხელ. რათა შეამოწმოთ რამე შეიცვალა თუ არა თქვენთვის...</p> <h2>დოკუმენტის ვალიდობა და ქეში</h2> <p>გვერდის დატვირთვის დაჩქარების, ასევე ტრაფიკის დაზოგვის მიზნით, თანამედროვე ბრაუზერები ინახავენ მომხმარებლის მიერ მონახულებულ გვერდებს ქეშში (მყარ დისკზე) და მათ ხელახლა სტუმრობისას იტვირთება არა სერვერიდან, არამედ პირდაპირ ქეში. სინამდვილეში, ეს ფუნქცია კარგია... მაგრამ არის ერთი "მაგრამ", ფაქტია, რომ ბრაუზერმა შეიძლება აჩვენოს მოძველებული ინფორმაცია რომელიმე გვერდიდან. წარმოიდგინეთ, მაგალითად, თქვენი ვებსაიტი არის ერთგვარი პერიოდული ონლაინ ახალი ამბების გამოცემა და მომხმარებელი უახლესი ამბების ნაცვლად მიიღებს მოძველებულ ინფორმაციას, რომელიც ინახება მის ქეშში!! და იმის გაგების გარეშე, თუ რა არის "პრობლემა", ის მიიღებს თქვენს საიტს "მკვდარ" საიტად, მიტოვებულ და არავის მიერ განახლებულ საიტზე.</p> <p>იმისათვის, რომ ბრაუზერმა აიძულოს ჩატვირთოს კონკრეტული გვერდი არა მყარი დისკიდან, არამედ სერვერიდან, საჭიროა ამ სინტაქსით მეტათეგი, რომელიც მიუთითებს კვირის დღეს, დღეს, თვეს, წელს, დროს (hh:mm :ss) და დროის ზონა ( <b>GMT+03:00</b>- მოსკოვის დრო + სამი საათი). კვირის დღე და დღის დრო შეიძლება არ იყოს მითითებული. ახლა, როდესაც ბრაუზერი კითხულობს გვერდს, გვერდი იტვირთება სერვერიდან, თუ მითითებული თარიღი და დრო ჩამოვიდა ან ამოიწურა, და, პირიქით, ქეშიდან, თუ მითითებული დრო ჯერ არ მოსულა.</p> <p>ქვემოთ, ყოველი შემთხვევისთვის, მოცემულია ინგლისური სიტყვების აბრევიატურების ცხრილები კვირის თვეებისა და დღეებისთვის</p> <td valign="top"> </td> <p>ატრიბუტი <b>შინაარსი</b>შეიძლება მიენიჭოს მნიშვნელობა <b>"0" <meta http-equiv="Expires" content="0"> </b>ამ შემთხვევაში გვერდი ყოველთვის იტვირთება სერვერიდან.</p> <p>და კიდევ ერთი რამ... ზოგიერთმა საძიებო რობოტმა შეიძლება უარი თქვას აშკარად მოძველებული თარიღის მქონე დოკუმენტის ინდექსირებაზე. - ბედი ნუ ცდები...</p> <p> <b><meta http-equiv="pragma" content="no-cache"> </b></p> <p>და ასეთი ჩანაწერი მთლიანად აკრძალავს ბრაუზერს ამ გვერდის ქეშირებას.</p> <h2>ბრძანებები რობოტისთვის</h2> <p> <b><meta name="robots" content="Index,follow"> </b></p> <p>ეს მეტათეგი გამიზნულია საძიებო რობოტს მისცეს ამა თუ იმ ბრძანებას.</p> <p>რობოტის შესაძლო ბრძანებების სია:</p> <ul><li><b>ინდექსი</b>- გვერდის ინდექსირება</li><li><b>Noindex</b>- არ მოახდინო გვერდის ინდექსირება</li><li><b>მიჰყევით</b>- აკონტროლეთ ჰიპერბმულები გვერდზე</li><li><b>Nofollow</b>- ნუ მიჰყვებით გვერდზე არსებულ ჰიპერბმულებს</li><li><b>ყველა</b>- გვერდის ინდექსირება და ჰიპერბმულების თვალყურის დევნება გვერდზე (ნაგულისხმევი)</li><li><b>არცერთი</b>- არ განახორციელოთ გვერდის ინდექსირება და არ აკონტროლოთ ჰიპერბმულები გვერდზე</li> </ul><h2>ავტომატური გადასვლა სხვა გვერდზე</h2> <p> <b><meta content="10; URL=http://www.mysite/index.html"> </b></p> <p>თუ მოულოდნელად რაიმე მიზეზით გადაწყვეტთ თქვენი საიტის URL მისამართის შეცვლას, კარგი იქნება, რომ მსგავსი გვერდი ძველ ადგილას დატოვოთ:</p> <p> <html> <br> <head> <br> <meta http-equiv="Content-Type" Content="text/html; Charset=Windows-1251"> <br><b><meta content="10; URL=http://www.mysite/index.html"> </b> <br> <title>გადამისამართება



საიტის მისამართი შეიცვალა, 10 წამის შემდეგ თქვენი ბრაუზერი ავტომატურად გადამისამართდება ახალ მისამართზე:
http://www.mysite.ru/
დააწკაპუნეთ აქ დაუყოვნებლივ გადასატანად.
ბოდიშს გიხდით შექმნილი უხერხულობისთვის.


მოდით გავაანალიზოთ და გავიგოთ ხაზი მაგალითიდან:

მეტა- განახლება (აღდგენა) ეუბნება ბრაუზერს, რომ ეს გვერდი უნდა განახლდეს
content="10;- განაახლეთ მითითებული წამის შემდეგ (ჩვენს შემთხვევაში ათი)
URL=http://www.mysite/index.html"- ახალი/განსხვავებული გვერდის მისამართი, რომელზეც უნდა გადახვიდეთ.

მაგრამ თუ სათაურში განაახლეთთუ თქვენ გამოტოვებთ URL მისამართს, როგორც ეს ნაჩვენებია მაგალითში, მაშინ ბრაუზერი მუდმივად განაახლებს ამ გვერდის შინაარსს ყოველ 30 წამში (კარგად, თუ არა 30.. რამდენი ხანი დაწერთ..).

ეს მეთოდი ფართოდ გამოიყენება ახალი ამბების არხებში, სადაც ინფორმაცია მიედინება, ასე ვთქვათ, ნაკადში და საჭიროებს მუდმივ განახლებას.

ეფექტები ბმულზე დაკვირვებისას


ეს სათაურები ქმნის ვიზუალურ ეფექტებს ერთი გვერდიდან მეორეზე გადასვლისას.

  • გვერდი-შეიყვანეთ- გვერდის გარეგნობის ეფექტი
  • გვერდი - გასვლა- გვერდის გაქრობის ეფექტი

რომელშიც:

  • ხანგრძლივობა- ეფექტის ხანგრძლივობა წამებში
  • გარდამავალი- შემოთავაზებული ეფექტის ერთ-ერთი ნომერი (0-დან 23-მდე) ჩამოთვლილია ცხრილში:
ნომერიეფექტის აღწერანომერიეფექტის აღწერა
0 მართკუთხედები შიგნით12 დაშლა
1 მართკუთხედები გარედან13 ვერტიკალური პანორამა შიგნით
2 შემოხაზეთ შიგნით14 ვერტიკალური პანორამა გარედან
3 შემოხაზეთ გარეთ15 ჰორიზონტალური პანორამა შიგნით
4 წყალდიდობა ზევით16 ჰორიზონტალური პანორამა გარედან
5 წყალდიდობა ქვემოთ17 კუთხეები მარცხნივ - ქვემოთ
6 მიედინება მარჯვნივ18 კუთხეები მარცხნივ - ზემოთ
7 გაქრება მარცხნივ19 კუთხეები მარჯვნივ - ქვემოთ
8 ვერტიკალური ჟალუზები20 კუთხეები მარჯვნივ - ზევით
9 ჰორიზონტალური ჟალუზები21 შემთხვევითი ჰორიზონტალური ზოლები
10 ჰორიზონტალური ნაბიჯები22 შემთხვევითი ვერტიკალური ზოლები
11 ვერტიკალური ნაბიჯები23 შემთხვევითი ეფექტის შერჩევა

ფაილი page1.html





გვერდის გადასვლის ეფექტები



შენიშვნა:


ერთი გვერდიდან მეორეზე გადასვლის ეფექტები არ მუშაობს ყველა ბრაუზერში.




"წადი"


ფაილი page2.html





გვერდის გადასვლის ეფექტები



შენიშვნა:


ვებ გვერდების გახსნისა და დახურვის ეფექტები გამოჩნდება მხოლოდ ნავიგაციის დროს
ერთი გვერდიდან მეორეზე ან „უკან“ და „წინ“ ღილაკების გამოყენებით.
გვერდის პირველად გახსნისას, ასევე გადატვირთვისას
გარდამავალი ეფექტები არ იქნება ხილული.


შემდეგ გვერდზე გადასასვლელად დააჭირეთ "გადასვლას".
და შეაფასეთ ერთი გვერდიდან მეორეზე გადასვლის ეფექტი.


"წადი"


    კიდევ ერთხელ შეგახსენებთ, რომ მეტა-ტეგები უნდა იქნას გამოყენებული ოსტატურად და კომპეტენტურად, განსაკუთრებით მაშინ, როდესაც საქმე ეხება რობოტის და სიმბოლოების დაშიფვრის ბრძანებებს, წინააღმდეგ შემთხვევაში, მთელი თქვენი ნამუშევარი შეიძლება დაიკარგოს.

    სათაური განაახლეთ(ავტომატური გადასვლა სხვა გვერდზე) შეიძლება გამოყენებულ იქნას არასტანდარტული გზით, ზოგიერთი ავტორი იყენებს მას ერთგვარი "პრეზენტაციის" სლაიდ შოუს შესაქმნელად, სადაც გვერდების შეცვლა არის პრეზენტაციის ჩარჩო. წარმოიდგინეთ, რომ ადამიანი შემოდის ასეთ საიტზე და აქ ამბობს: "დაიხარე და დაისვენე..." :) და მერე ჩნდება თავისით სურათები, გრაფიკები, ტექსტები.. ბოლო გვერდი კი არის ჩიხი, სადაც მომხმარებელი იღებს საიტს. საკუთარ ხელში“ ან შესაძლოა პირველთან ახლოს. უბრალოდ ყოველთვის გახსოვდეთ ვებმასტერის ოქროს წესი: მთავარია არ გადააჭარბოთ!

მოგვიანებით ASCIIგაფართოვდა (თავდაპირველად იგი არ იყენებდა 8 ბიტს), ამიტომ შესაძლებელი გახდა არა 128, არამედ 256 (2-დან მე-8 ხარისხამდე) სხვადასხვა სიმბოლოების გამოყენება, რომლებიც შეიძლება დაშიფრულიყო ინფორმაციის ერთ ბაიტში.
ამ გაუმჯობესებამ შესაძლებელი გახადა კოდირების დამატება ASCIIსხვადასხვა ქვეყნის ეროვნული ენების სიმბოლოები, გარდა უკვე არსებული ლათინური ანბანისა.
გაფართოებული კოდირების პარამეტრები ASCIIბევრი მათგანია იმის გამო, რომ მსოფლიოში ასევე ბევრი ენაა. მე ვფიქრობ, რომ ბევრ თქვენგანს გსმენიათ ისეთი კოდირების შესახებ, როგორიცაა KOI8 (ინფორმაციის გაცვლის კოდი, 8 ბიტი) - ეს ასევე გაფართოებული კოდირებაა. ASCII. KOI8 მოიცავდა რიცხვებს, ლათინური და რუსული ანბანის ასოებს, ასევე პუნქტუაციის ნიშნებს, სპეციალურ სიმბოლოებს და ფსევდოგრაფიკას.

ISO კოდირება

სტანდარტების საერთაშორისო ორგანიზაციამ შექმნა სხვადასხვა ანბანის/ენის კოდირების სპექტრი.

ISO 8859 სერიის კოდირება

კოდირება აღწერა
ISO 8859-1 (ლათინური-1) გაფართოებული ლათინური, დასავლეთ ევროპის ენების უმეტესობის სიმბოლოების ჩათვლით (ინგლისური, დანიური, ირლანდიური, ისლანდიური, ესპანური, იტალიური, გერმანული, ნორვეგიული, პორტუგალიური, რომაული, ფარერული, შვედური, შოტლანდიური გელური და ჰოლანდიური, ფინური, ფრანგული ნაწილები), როგორც ასევე ზოგიერთი აღმოსავლეთ ევროპული (ალბანური) და აფრიკული ენა (აფრიკელები, სუაჰილი). ლათინურ-1-ს აკლია ევროს ნიშანი და დიდი ასო Ÿ. ეს კოდის გვერდი ითვლება ნაგულისხმევ დაშიფვრად HTML დოკუმენტებისა და ელ.ფოსტის შეტყობინებებისთვის. ასევე, პირველი 256 Unicode სიმბოლო შეესაბამება ამ კოდის გვერდს.
ISO 8859-2 (ლათინური-2) გაფართოებული ლათინური, ცენტრალური ევროპის და აღმოსავლეთ ევროპის ენების სიმბოლოების ჩათვლით (ბოსნიური, უნგრული, პოლონური, სლოვაკური, სლოვენური, ხორვატიული, ჩეხური). Latin-2, ისევე როგორც Latin-1, აკლია ევროს ნიშანი.
ISO 8859-3 (ლათინური-3) გაფართოებული ლათინური, მათ შორის სიმბოლოები სამხრეთ ევროპული ენებიდან (მალტური, თურქული და ესპერანტო).
ISO 8859-4 (ლათინური-4) გაფართოებული ლათინური, მათ შორის სიმბოლოები ჩრდილოეთ ევროპის ენებიდან (გრენლანდიური, ესტონური, ლატვიური, ლიტვური და სამი ენები).
ISO 8859-5 (ლათინური/კირილიცა) კირილიცა, მათ შორის სიმბოლოები სლავური ენებიდან (ბელორუსული, ბულგარული, მაკედონიური, რუსული, სერბული და ნაწილობრივ უკრაინული).
ISO 8859-6 (ლათინური/არაბული) არაბულში გამოყენებული სიმბოლოები. სხვა არაბული ენების სიმბოლოები არ არის მხარდაჭერილი. ISO 8859-6 ტექსტის სწორად საჩვენებლად საჭიროა ორმხრივი ჩაწერისა და კონტექსტზე მგრძნობიარე სიმბოლოების ფორმების მხარდაჭერა.
ISO 8859-7 (ლათინური/ბერძნული) თანამედროვე ბერძნული ენის სიმბოლოები. ასევე შეიძლება გამოყენებულ იქნას ძველი ბერძნული ტექსტების მონოტონური ორთოგრაფიით დასაწერად.
ISO 8859-8 (ლათინური/ებრაული) თანამედროვე ებრაული სიმბოლოები. იგი გამოიყენება ორ ვერსიაში: სიმბოლოების ლოგიკური თანმიმდევრობით (მოითხოვს მხარდაჭერას ორმხრივი წერისთვის) და სიმბოლოების ვიზუალური თანმიმდევრობით.
ISO 8859-9 (ლათინური-5) ლათინური-1-ის ვარიანტი, რომელიც ცვლის იშვიათად გამოყენებულ ისლანდიურ სიმბოლოებს თურქულით. გამოიყენება თურქული და ქურთული ენებისთვის.
ISO 8859-10 (ლათინური-6) ლათინური 4 ვარიანტი უფრო შესაფერისი სკანდინავიური ენებისთვის.
ISO 8859-11 (ლათინური/ტაილანდური) ტაილანდური ენის სიმბოლოები.
ISO 8859-13 (ლათინური-7) ლათინური-4 ვარიანტი, უფრო მოსახერხებელია ბალტიისპირეთის ენებისთვის.
ISO 8859-14 (ლათინური-8) გაფართოებული ლათინური დამწერლობა, რომელიც მოიცავს სიმბოლოებს კელტური ენებიდან, როგორიცაა შოტლანდიურ-გალური და ბრეტონული.
ISO 8859-15 (ლათინური-9) Latin-1-ის ვარიანტი, რომელიც ცვლის იშვიათად გამოყენებულ სიმბოლოებს, რომლებიც საჭიროა ფინური, ფრანგული და ესტონური სრული მხარდაჭერისთვის. გარდა ამისა, ევროს ნიშანი დაემატა Latin-9-ს.
ISO 8859-16 (ლათინური-10) გაფართოებული ლათინური, მათ შორის სიმბოლოები სამხრეთ და აღმოსავლეთ ევროპის ენებიდან (ალბანური, უნგრული, იტალიური, პოლონური, რუმინული, სლოვენური, ხორვატიული), ისევე როგორც ზოგიერთი დასავლეთ ევროპის ენები (ირლანდიური ახალი მართლწერაში, გერმანული, ფინური, ფრანგული. ). Latin-9-ის მსგავსად, Latin-10-მა დაამატა ევროს ნიშანი.

ინგლისურ ენაზე და სხვა დასავლეთ ევროპის ენებზე დოკუმენტებისთვის, კოდირება ფართოდ არის მხარდაჭერილი ISO-8859-1.

HTML-ში ISO-8859-1არის ნაგულისხმევი კოდირება (XHTML და HTML5-ში ნაგულისხმევი კოდირება არის UTF-8).
ISO-8859-1-ის გარდა გვერდის კოდირების გამოყენებისას, ეს უნდა მიუთითოთ ტეგში .

HTML4-ისთვის:

HTML5-ისთვის:

ANSI კოდირების მაგალითია კარგად ცნობილი Windows-1251.

Windows-1251დადებითად განსხვავდება სხვა 8-ბიტიანი კირილიცის კოდირებისგან (როგორიცაა CP866 და ISO 8859-5) რუსულ ტიპოგრაფიაში ჩვეულებრივი ტექსტისთვის გამოყენებული თითქმის ყველა სიმბოლოს არსებობით (მხოლოდ აქცენტის ნიშანი აკლია). იგი ასევე შეიცავს ყველა სიმბოლოს სხვა სლავური ენებისთვის: უკრაინული, ბელორუსული, სერბული, მაკედონიური და ბულგარული.
ქვემოთ მოცემულია კოდირების სიმბოლოების ათობითი მნიშვნელობები Windows-1251.

ცხრილის სიმბოლოების საჩვენებლად HTML დოკუმენტში გამოიყენეთ შემდეგი სინტაქსი:

& + კოდი + ;

Windows კოდირება-1251 (CP1251)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .ა .ბ .C .დ .ე .ფ

8.
Ђ
402
Ѓ
403

201A
ѓ
453

201E

2026

2020

2021

20AC

2030
Љ
409

2039
Њ
40A
Ќ
40C
Ћ
40 ბ
Џ
40F

9.
ђ
452

2018

2019

201C

201D

2022

2013
-
2014

2122
љ
459

203A
њ
45A
ќ
45C
ћ
45 ბ
џ
45F

ა.

A0
Ў
40E
ў
45E
Ј
408
¤
A4
Ґ
490
¦
A6
§
A7
იო
401
©
A9
Є
404
«
AB
¬
A.C.
­
ახ.წ
®
A.E.
Ї
407

ბ.
°
B0
±
B1
І
406
і
456
ґ
491
µ
B5

B6
·
B7

451

2116
є
454
»
BB
ј
458
Ѕ
405
ѕ
455
ї
457

C.

410

411
IN
412

413

414

415
და
416

417
და
418

419
TO
41A

41ბ

41C

41D
შესახებ
41E

41F

დ.

420
თან
421

422

423

424
X
425
C
426

427

428
SCH
429
კომერსანტი
42A

42 ბ

42C

42D
იუ
42E
მე
42F

ე.

430

431

432

433

434

435
და
436

437
და
438

439
რომ
43A

43ბ

43C

43D

43E

43F

ფ.

440
თან
441

442
ზე
443

444
X
445

446

447

448
სჩ
449
ъ
44A

44B

44C
უჰ
44D
yu
44E
მე
44F

UNICODE სტანდარტული კოდირება

Unicode არის სიმბოლოების კოდირების სტანდარტი, რომელიც საშუალებას გაძლევთ წარმოადგინოთ მსოფლიოს თითქმის ყველა წერილობითი ენის სიმბოლო და სპეციალური სიმბოლოები. უნიკოდში წარმოდგენილი სიმბოლოები დაშიფრულია როგორც ხელმოუწერელი რიცხვები. უნიკოდს აქვს კომპიუტერზე სიმბოლოების წარმოდგენის რამდენიმე ფორმა: UTF-8, UTF-16 (UTF-16BE, UTF-16LE) და UTF-32 (UTF-32BE, UTF-32LE). (ინგლისური: Unicode transformation format - UTF).
UTF-8არის ამჟამად გავრცელებული კოდირება, რომელიც ფართოდ გამოიყენება ოპერაციულ სისტემებში და ინტერნეტში. ტექსტი, რომელიც შედგება Unicode სიმბოლოებისგან, დანომრილი 128-ზე ნაკლები (კოდის არე U+0000-დან U+007F-მდე) შეიცავს სიმბოლოებს ASCIIშესაბამისი კოდებით. შემდეგი არის სხვადასხვა დამწერლობის, პუნქტუაციის ნიშნების და ტექნიკური სიმბოლოების სიმბოლოების სფეროები. სიმბოლოების არეები კოდებით U+0400-დან U+052F-მდე, U+2DE0-დან U+2DFF-მდე, U+A640-დან U+A69F-მდე გამოყოფილია კირიული სიმბოლოებისთვის.

კოდირება UTF-8არის უნივერსალური და აქვს შთამბეჭდავი რეზერვი მომავლისთვის. ეს ხდის მას ყველაზე მოსახერხებელ დაშიფვრას ინტერნეტში გამოსაყენებლად.



გთხოვთ, ჩართოთ JavaScript სანახავად

ვებსაიტის შექმნისას დამწყებ ვებოსტატებს ხშირად უჩნდებათ კითხვები: რა კოდირება გამოიყენონ ვებსაიტისთვის, რით განსხვავდება UTF-8 windows-1251-ისგან და როგორ შეიყვანოთ იგი საიტის HTML გვერდების META Charset-ში. ყველა ამ კითხვაზე პასუხი მოცემულია ამ სტატიაში.

რა არის საიტის კოდირება და როგორ მუშაობს იგი?

კოდირება შეიძლება წარმოდგენილი იყოს ცხრილის სახით, რომელიც შედგება სხვადასხვა ასოების, რიცხვებისა და ადამიანისთვის გასაგები სხვა სიმბოლოებისგან, რომლებიც დაშიფრულია გარკვეული გზით. როდესაც ხსნით ტექსტურ ფაილს, რომელიც მოიცავს HTML გვერდებს, კომპიუტერი კითხულობს ფაილის სათაურიდან, თუ რა კოდირებით იყო შენახული და აჩვენებს ტექსტს შესაბამის კოდირებით, გარდაქმნის კომპიუტერის მონაცემებს ადამიანებისთვის გასაგებ ფორმაში, ამ მონაცემების შედარებით. კოდირების ცხრილი. თუ ფაილის სათაურიდან კოდირების ინფორმაცია ემთხვევა კოდირებას, რომელშიც მონაცემები ინახება HTML გვერდზე, მაშინ მომხმარებელი ხედავს ასოებს, ციფრებს და სხვა სიმბოლოებს, რომლებსაც იცნობს. თუ არსებობს შეუსაბამობა, შედეგი არის ის, რომ მომხმარებელს ეძლევა სიმბოლოების გაუგებარი ნაკრები, ეს განსაკუთრებით ხშირად ხდება ელ.ფოსტის ძველ პროგრამებში. თუ მომხმარებელი იღებს წერილს გაუგებარი სისულელეებით, მაშინ, უბრალოდ, სხვადასხვა კოდირების გავლისას, ჩვეულებრივ, შესაძლებელია გამოიცნოს და შეარჩიოს ის, რომელშიც დაწერილია ასო და შედეგად, სიმბოლოების გაუგებარი ნაკრები გადაიქცევა ადამიანისათვის გასაგებად. ტექსტი.

იგივე ხდება საიტის HTML გვერდებზე. თუ დოკუმენტი შენახული იყო, მაგალითად, UTF-8 კოდირებით და თავად დოკუმენტი შეიცავს META ტეგს, რომელიც მიუთითებს, რომ ეს არის Windows-1251 კოდირება, მაშინ ბრაუზერი კვლავ შეადარებს ფაილში შენახულ მონაცემებს კოდირების ცხრილს. მითითებულია მასში და რადგან სიმბოლოები დაშიფრულია -სხვანაირად, ბრაუზერი აჩვენებს სიმბოლოების გაუგებარ კრებულს ჩვეულებრივი ტექსტის ნაცვლად, ან ზოგიერთი ასო შეიძლება იყოს ნორმალურ ფორმაში, ხოლო სხვა ასოები ან სიმბოლოები შეიძლება იყოს ნაჩვენები, მაგალითად, კითხვის ნიშნების სახით. ყოველივე ზემოთქმული ასევე ეხება ფაილის სახელების ჩვენებას.

ტექსტურ რედაქტორში ახალი დოკუმენტის შექმნისას უმჯობესია დაუყოვნებლივ დარწმუნდეთ, რომ სასურველი კოდირებაა შერჩეული. თანამედროვე რედაქტორები საშუალებას გაძლევთ გადაიყვანოთ ღია დოკუმენტის ტექსტი ერთი კოდირებიდან მეორეში, ხოლო სტანდარტული Notepad საშუალებას გაძლევთ აირჩიოთ კოდირება მხოლოდ ფაილის შენახვისას.

ყველაზე გავრცელებული კოდირებები

წინა აბზაციდან თქვენ უკვე იცით რა არის კოდირება და რატომ არის ასე მნიშვნელოვანი მისი სწორად ჩაწერა საიტის გვერდების კოდში. მოდით ახლა გავარკვიოთ, თუ რომელი კოდირებიდან ჯობია ავირჩიოთ მომავალი საიტისთვის. ვინაიდან ყველაზე გავრცელებული და ადვილად შესასწავლი ოპერაციული სისტემა ყოველთვის იყო Windows ოპერაციული სისტემა, ვებ დეველოპერების უმეტესობამ შექმნა HTML გვერდები Windows-1251 (ANSI) კოდირებით, რომელიც გამოიყენებოდა ნაგულისხმევად. მაგრამ windows-1251 არ უჭერს მხარს ასოების და სიმბოლოების ძალიან დიდ რაოდენობას და დეველოპერებს სურთ გამოიყენონ სხვადასხვა ისრები, გული, კვადრატები და სხვა სიმბოლოები თავიანთ ტექსტებში, მათ შორის, სხვადასხვა ენიდან სიტყვების ერთ დოკუმენტში გაერთიანების აუცილებლობის ჩათვლით, ის უკვე დიდი ხანია შეიცვალა, უფრო გაფართოებული UTF-8 ჩამოვიდა და დეველოპერების უმეტესობა იყენებს ამ დაშიფვრას.

კოდირების პრობლემები არა მხოლოდ HTML გვერდზე

საიტი, იქნება ეს უბრალოდ სტატიკური HTML დოკუმენტების კრებული თუ რთული დინამიური სკრიპტები, რომლებიც წარმოქმნიან გვერდებს ფრენის დროს, მასპინძლობს ვებ სერვერზე, რომელიც ასევე მუშაობს სპეციფიკური კოდირებით. და თუ სერვერი გვაწვდის ინფორმაციას ერთ დაშიფვრაში და თქვენი გვერდები ან სკრიპტები ინახება სხვა კოდირებით, მაშინ ისევ შეიძლება იყოს პრობლემები მომხმარებლის ბრაუზერში გვერდების ჩვენებისას. ბევრი ჰოსტინგი საშუალებას გაძლევთ შეცვალოთ პარამეტრები და აირჩიოთ კოდირება საიტის ფაილებში გამოყენებული პანელის მიხედვით, ან შეგიძლიათ ჩაწეროთ ის .htaccess ფაილში, თუ ჰოსტინგი იყენებს პოპულარულ Apache ვებ სერვერს.

თითქმის არცერთ თანამედროვე ვებსაიტს არ შეუძლია ფუნქციონირება MySQL მონაცემთა ბაზის გამოყენების გარეშე და ის ასევე შეიძლება გახდეს კოდირების პრობლემების წყარო. თუ საიტის ფაილები ინახება ერთ კოდირებაში, ხოლო მონაცემთა ბაზაში ინფორმაცია მეორეშია, მაშინ გვერდზე ინფორმაციის ის ნაწილი, რომელიც გამოდის მონაცემთა ბაზიდან, შეიძლება გამოჩნდეს იგივე კითხვის ნიშნების ან სხვა გაუგებარი სიმბოლოების სახით. . კოდირებასთან დაკავშირებული პრობლემების თავიდან ასაცილებლად, იგივე უნდა იყოს ვებ სერვერისთვის, MySQL მონაცემთა ბაზაში, სკრიპტებში, საიტის HTML გვერდებზე და META ტეგში, რომელიც იწერება HTML კოდში. თუ პრობლემები გაქვთ ტექსტის ჩვენებასთან დაკავშირებით, შეამოწმეთ ყველა ზემოთ მოცემული პრობლემა.

HTML დოკუმენტის META Charset

იმისათვის, რომ ბრაუზერს და საძიებო სისტემებს ვუთხრათ, თუ რა კოდირებით არის შენახული საიტის გვერდები, მათ კოდში ჩაიწერება META Charset.

Windows-1251 კოდირებისთვის:

გვერდის სათაური

გვერდის ტექსტი


UTF-8 კოდირებისთვის:

გვერდის სათაური

გვერდის ტექსტი


ახლა თქვენ იცით, რა არის საიტის კოდირება და სად უნდა მოძებნოთ პრობლემები, თუ ტექსტი არასწორად არის ნაჩვენები საიტის რომელიმე ნაწილში.

სტატიის კოპირება აკრძალულია.