एचटीएमएल 5 मा मेटा चार्सेट ट्याग

एचटीएमएल 5 मा एन्कोडिङ क्यारेक्टर सेट गर्दै

एचटीएमएल 5 को परिचय गर्नु अघि, elementrequiredyou को साथ दस्तावेज मा वर्ण एन्कोडिंग को सेटिंग को तल केहि देख्यो कि कुनै पनि verbose रेखा को लिखने को लागि। यदि तपाईं आफ्नो वेब पृष्ठमा एचटीएमएल 4 को प्रयोग गर्दै हुनुहुन्छ यो मेटा चार्सेट तत्व हो:

यो सामग्री विशेषताको वरिपरि तपाईंले देख्न उद्धरण चिन्हहरू कोडिस गर्न महत्त्वपूर्ण छ: सामग्री = " पाठ / html; charset = iso-8859-1 " । सबै एचटीएमएल विशेषताहरू जस्तै, यो उद्धरण चिन्हले विशेषताको मान परिभाषित गर्छ, यो संकेत गर्दछ कि सम्पूर्ण स्ट्रिंग पाठ / html; charset = iso-8 9 9-1 यस तत्वको सामग्री हो। यो उचित एचटीएमएल हो र यो कसरी यो स्ट्रिङ लिखित अर्थ थियो। यो पनि अयोग्य लामो र बदसूरत छ! यो पनि केहि चीज छैन जुन तपाईले तपाइँको टाउकोको शीर्षलाई सम्झना गर्नुहुनेछ! अधिकतर अवस्थामा, वेब विकासकर्ताहरूले यस कोडलाई एक साइटबाट एक साइटबाट कुनै पनि नया प्रतिलिपिमा टाँस्न सक्दछ किनभने यो खरिदबाट लेख्न धेरै सोधिरहेको थियो।

HTML5 अतिरिक्त & # 34; स्टफ & # 34;

एचटीएमएल 5 भाषामा नयाँ तत्वहरू मात्र थप्नु भएन तर यो एचटीटीटीको सिन्ट्याक्समा धेरै सरल बनाइएको छ, मेटा चार्सेट तत्व सहित। एचटीएमएल 5 सँग, तपाइँ मेटा तत्वको लागि वाक्यलाई सम्झना गर्न सजिलोसँग तपाईँको क्यारेक्टर इन्कोडिङ थप्न सक्नुहुन्छ। तपाईं तल देख्नुहुन्छ:

त्यो लेखिएको सिंक्याक्सलाई हामीले यस लेखको सुरुमा के लेखेका थियौं तुलना गर्नुहोस्, पुरानो वाक्यविन्यात्मक HTML4 को लागि प्रयोग गरिएको छ, र तपाईंले HTML5 संस्करण साँच्चै नै लेख्न र सम्झना गर्न कति सजिलो हुनेछ। यसलाई अवस्थित साइटबाट कुनै अवस्थित नयाँ कुनै पनि नयाँ फाइलमा प्रतिलिपि बनाउन र टाँस्नु आवश्यक छ, यो बिल्कुल केहि छ, अगाडिको अन्त वेब विकासकर्ताको रूपमा, तपाईले सम्झन सक्नुहुनेछ। समयको यो धेरै धेरै अधिक छैन, तर जब तपाइँ अन्य सिन्ट्याक्स क्षेत्रहरू जुन HTML5 सरलीकृत गर्दछन्, बचतहरू थपिन्छन्!

क्यारेक्टर एन्कोडिङ सधैँ समावेश गर्नुहोस्

तपाईंले सँधै तपाईंको वेब पेजहरूको लागि क्यारेक्टर एन्कोडिङ समावेश गर्नु पर्छ, भले पनि तपाईले कुनै पनि विशेष क्यारेक्टरहरू गर्नुभएन भने पनि। यदि तपाइँ अक्षर एन्कोडिङ समावेश गर्दैन भने, तपाईंको साइट UTF-7 को प्रयोग गरेर क्रस साइट स्क्रीप्टिंग आक्रमणमा हानिकारक हुन्छ।

यस परिदृश्यमा, एन्ट्याकरले तपाईंको साइटमा कुनै क्यारेक्टर एन्कोडिङ परिभाषित गर्दैन भनेर देख्दछ, त्यसैले यसले ब्राउजरलाई सोच्दछ कि पृष्ठको क्यारेक्टर एन्कोडिङ वास्तवमा UTF-7 हो। अर्को, आक्रमणकारीले वेब पेजमा UTF-7 इन्कोडेड लिपिहरू इन्जेक्सन गर्दछ र तपाईंको साइट ह्याक गरिएको छ। यो स्पष्ट रूपमा सबैका लागि तपाईंको कम्पनीबाट तपाईका आगन्तुकहरूलाई समस्याग्रस्त छ। सुसमाचार हो कि यो बचाउन एक सरल समस्या हो - केवल तपाईंको सबै वेबपृष्ठहरूमा क्यारेक्टर इनकोडिङ थप गर्न निश्चित हुनुहोस्।

क्यारेक्टर एन्कोडिङ कहाँ थप्न

वेबपेजको लागि क्यारेक्टर एन्कोडिङ तपाईको एचटीएमएलको <हेडर> तत्वको पहिलो रेखा हुनुपर्दछ। यो यो सुनिश्चित गर्दछ कि ब्राउजरले कुन एन्कोडिङ एन्कोडिङ भनेको हो भने यो पृष्ठको अरु केहि पनि गर्दैन र डिस्टा टाइप को लागी अन्य पहिचान गर्दछ कि यो एचटीएमएल पृष्ठ। तपाइँको HTML लाई पढ्नैपर्छ:

<हेड> <मेटा चार्सेट = "UTF-8"> ...

अतिरिक्त सुरक्षाको लागि HTTP हेडरहरू प्रयोग गर्दै

तपाईं HTTP हेडरहरूमा वर्ण इन्कोडिङ पनि निर्दिष्ट गर्न सक्नुहुनेछ। यो एचटीएमएल पृष्ठमा थप गर्नु भन्दा पनि सुरक्षित छ, तर तपाईले सर्भर कन्फिगरेसनमा पहुँच गर्न चाहानुहुन्छ वा .htaccess फाइलहरू, जसको मतलब तपाईले तपाइँको वेबसाइटको होस्टिङ प्रदायकसँग काम गर्न आवश्यक छ कि यो प्रकारको पहुँच प्राप्त गर्न वा तिनीहरूलाई बनाउनु पर्छ। तपाईंको लागि परिवर्तनहरू। पहुँच यहाँ साँच्चै चुनौती हो। परिवर्तन आफै सरल छ, त्यसैले कुनै होस्टिङ प्रदायकले यो परिवर्तन तपाईंको सापेक्ष आरामको लागि सक्षम गर्न सक्दछ।

यदि तपाईं एपस प्रयोग गर्दै हुनुहुन्छ भने, तपाइँ जोडेर आफ्नो सम्पूर्ण साइटको लागि डिफल्ट क्यारेक्टर सेट सेट गर्न सक्नुहुन्छ: AddDefaultCharset UTF-8 लाई तपाईंको root .htaccess फाइलमा। Apache को पूर्वनिर्धारित वर्ण सेट ISO-885 9-1 हो