अंतर्राष्ट्रीयकरण, स्थानीयकरण, एन्कोडिंग, आइसलैंड और एक जापानी कैट फोटो वेबसाइट का अनुवाद

अंतर्राष्ट्रीयकरण अनुवाद

अंतर्राष्ट्रीयकरणजब यह अंतर्राष्ट्रीयकरण, स्थानीयकरण और वेब अनुप्रयोगों के भीतर एन्कोडिंग की बात आती है, तो बहुत सारी जानकारी होती है। एक वेब अनुप्रयोग के लिए प्रत्येक प्रदान करता है के बारे में बहुत गलतफहमी है। यहाँ मेरा ले लो ...

जब कोई वेब ब्राउज़र एक वेब सर्वर से संबंध बनाता है, तो यह काफी कुछ चर पास करता है और अतिरिक्त अनुरोध करता है, यहाँ एक उदाहरण है:

GET / HTTP / 1.1
होस्ट: www.dknewmedia.com
उपयोगकर्ता-एजेंट: मोज़िला / 5.0 (मैकिन्टोश; यू; इंटेल मैक ओएस एक्स; एन-यूएस; आरवी: 1.8.1.3) गेको / 20070309 फ़ायरफ़ॉक्स / 2.0.0.3
स्वीकार करें: HTTP Accept = text / xml, application / xml, application / xhtml + xml, text / html; q = 0.9, text / plain; q = 0.8, image / png, * / *; q = 0.5;
स्वीकार-भाषा: en-us, en; q = 0.5
स्वीकार-एन्कोडिंग: गज़िप, अपस्फीति
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

अंतर्राष्ट्रीयकरण

अंतर्राष्ट्रीयकरण कई चीजों का एक संयोजन है:

  1. स्थानीयकरण: किसी आगंतुक को किस भाषा और स्थान की पहचान करने की क्षमता है। यह HTTP अनुरोधों के माध्यम से किया जाता है, जहां आगंतुक को एक लोकेल द्वारा पहचाना जाता है। मेरे मामले में, यह एन-यू.एस. "En" अंग्रेजी है और "US" संयुक्त राज्य अमेरिका है। यह मेरे ऑपरेटिंग सिस्टम के भीतर एक सेटिंग है।
  2. समय क्षेत्र: समय क्षेत्र के लिए समायोजित करने की क्षमता। यह सामान्य रूप से आपके सर्वर को ग्रीनविच मीन टाइम (GMT) पर सेट करके पूरा किया जाता है और फिर उपयोगकर्ताओं को GMT से अपनी स्थानीय ऑफ़सेट सेट करने की अनुमति देता है।
  3. अक्षरों को सांकेतिक अक्षरों में बदलना: यह भाषा चरित्र सेट को ठीक से प्रदर्शित करने की क्षमता है। यह स्थानीयकरण से अलग है क्योंकि स्थानीयकरण मुझे कंप्यूटर की भाषा और क्षेत्र बता सकता है जो इससे अनुरोध कर रहा है, लेकिन यह नहीं बताएगा कि भाषा क्या है पाठक अनुरोध कर रहा है ... कि पाठक के लिए है!

मेरे HTTP हेडर में सूचना जब ब्राउज़र ने अनुरोध किया, तो उसने सर्वर को बताया कि यह मेरे लोकेल (स्वीकार-भाषा: en-us) का अनुरोध कर रहा था; हालाँकि, यह सर्वर को यह बताने की भी आवश्यकता है कि कैरेक्टर सेट का अनुरोध क्या है (स्वीकार-चारसेट: एक्सेप्ट-चार्सेट: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 और utf; -8 दोनों स्वीकार्य चरित्र सेट हैं।

स्थानीयकरण

इस शानदार मिश्रित दुनिया में, स्थानीयकरण कभी भी भाषा को निर्धारित नहीं करता है। भले ही मैं एन-यूएस में हूं, मैं एक अलग चरित्र सेट का उपयोग करके बिल्कुल अलग भाषा पढ़ सकता हूं ... जब मैं उपयोग करता हूं तो यही होता है गूगल हिंदी (मैं वास्तव में Google हिंदी का उपयोग नहीं करता हूं)। लोकेल और कैरेक्टर सेट के लिए मेरा अनुरोध समान है जब मैं अनुरोध करता हूं गूगल की अंग्रेज़ी पृष्ठ, लेकिन मुझे वास्तव में एक पृष्ठ दिया गया है जिसे मैं नहीं पढ़ सकता क्योंकि मेरे पास चरित्र सेट नहीं है। यह सब सामने आता है ????????????… हालाँकि, मैं उस चरित्र को फ़ायरफ़ॉक्स (फ़ायरफ़ॉक्स> वरीयताएँ> उन्नत> भाषा) में सेट कर सकता हूँ:

फ़ायरफ़ॉक्स लोड भाषा

अगर मैं उस भाषा को लोड करता हूं, तो मैं उसके मूल चरित्र सेट में पेज का अनुरोध कर सकता हूं और अपने कंप्यूटर पर इसे प्रदर्शित कर सकता हूं, भले ही मेरा डिफ़ॉल्ट लोकेल एन-यूएस हो!

इसलिए ... अगर मैं हिंदी का छात्र हूं, तो पर्ड्यू में अंग्रेजी पढ़ रहा हूं और इससे जुड़ा हुआ हूं वीपीएन ऑस्ट्रेलिया में छुट्टी के दिन स्कूल का सर्वर ... 3 अलग-अलग सेटिंग्स हैं जिन्हें सही मायने में अंतर्राष्ट्रीय होने के लिए आवेदन करने की आवश्यकता है - और कोई नहीं दूसरे पर निर्भर हैं।

मेरा स्थान एन-यूएस के रूप में आएगा, लेकिन मेरा टाइमज़ोन ऑस्ट्रेलिया है, लेकिन मैं जिस वेबसाइट से अनुरोध कर रहा हूं वह हिंदी हो सकती है। अगर मुझे अपने आवेदन को बनाने के लिए कार्यक्रम करना था मान्यताओं मेरे कंप्यूटर के स्थान के आधार पर, मैं पूरी तरह से गलत होगा - पूर्वी समय क्षेत्र में व्यक्ति को अंग्रेजी खिलाना। आदर्श रूप में, मैं अपने आवेदन की पेशकश करने के लिए कार्यक्रम करूंगा के छात्रों भाषा और समयक्षेत्र सेटिंग ... लेकिन मैं उन्हें लोकेल के आधार पर नहीं मानूंगा।

आइसलैंड - अंतिम उदाहरण

हम संयुक्त राज्य में बहुभाषी और बहु-स्थानीय चुनौतियों से अनभिज्ञ हैं जहाँ हम हैं सब अंग्रेजी बोलना [व्यंग्य निहित]। कुछ देशों में, जैसे कि आइसलैंड, हालांकि मूल भाषा आइसलैंडिक है, अविश्वसनीय आइसलैंडिक लोग 3 भाषाएं सीखते हुए बड़े होते हैं! चूंकि आइसलैंड यूरोप और उत्तरी अमेरिका के बीच में एक देश है, इसलिए उनकी कंपनियां अपने डेस्कटॉप से ​​कई महाद्वीपों, भाषाओं, भाषाओं की बोलियों और कई टाइमज़ोन में काम करती हैं!

कई आइसलैंडिक वेबसाइट यूएस अंग्रेजी, यूके इंग्लिश, आइसलैंडिक, स्पेनिश, स्पेनिश, फ्रेंच और जर्मन में बनाई गई हैं! जरा सोचिए कि इसका निर्माण कितना चुनौतीपूर्ण होगा Icelandair के वेबसाइट अनुप्रयोगों और टिकटिंग सिस्टम ... वाह!

अस्वीकरण: मैं आइसलैंडिक से ठीक लोगों के साथ काम करने का पूर्ण आनंद लिया है और आपको बता सकता है कि वे सबसे प्रतिभाशाली और मैत्रीपूर्ण पेशेवरों में से कुछ हैं जिनके साथ काम करने का मुझे आनंद मिला है। यह बस एक अद्भुत देश और लोग हैं! यात्रा करें ... आइसलैंडर ले जाएं और यात्रा करना सुनिश्चित करें नील जल परिशोधन कुंड!

भाषा बनाम एनकोडिंग

किसी एक भाषा के भीतर भी अलग-अलग वर्ण एन्कोडिंग हैं जो एक दूसरे के साथ अच्छी तरह से नहीं खेलते हैं! उदाहरण: Shift-JIS में लिखा गया एक जापानी ईमेल एक जापानी व्यक्ति के कंप्यूटर पर अपठनीयता को प्रस्तुत कर सकता है जिसका स्थानीयकरण ja-JP पर सेट है क्योंकि उनका मेल सर्वर केवल EUC-JP को पहचानता है। आदर्श रूप से, एक ग्राहक को यह निर्धारित करने में सक्षम होना चाहिए कि वे किस एन्कोडिंग के साथ-साथ किस भाषा को पसंद करेंगे - बस यह सुनिश्चित करना कि एन्कोडिंग और भाषा ग्राहक के अनुरोध के अनुरूप हैं।

यदि मैं जापानी पढ़ना चाहता हूं, तो मुझे उस भाषा को ठीक से प्रदर्शित करने के लिए एन्कोडिंग के लिए मेरी भाषा के रूप में जापानी और शिफ्ट-जीआईएस दोनों का चयन करना पड़ सकता है। यहाँ मिश्रण में कुछ और भ्रम हैं ... कुछ एन्कोडिंग प्रकार कई भाषाओं का समर्थन करते हैं। UNICODE / UTF8 दर्जनों का समर्थन करता है। रिवर्स भी सच है। कुछ भाषाओं को कई एन्कोडिंग प्रकारों में पढ़ा जा सकता है। अगर यह समझ में नहीं आता है ... मैं माफी माँगता हूँ, यह एक बहुत ही जटिल मुद्दा है।

किसी दिन मुझे विश्वास है (आशा है) यह सब बदल जाएगा। मुझे लगता है कि स्थानीयकरण कोड के मूल डिजाइनरों को उम्मीद थी कि भाषा-देश का कॉम्बो वह सब होगा जिसकी आवश्यकता है ... लेकिन हम कहीं अधिक परिष्कृत हो गए हैं। याद रखें, इंटरनेट के अस्तित्व में आने से पहले इसका बहुत विकास हुआ था। के आगमन के साथ जीआईएस, शायद एक व्यक्ति अपने एन्कोडिंग का चयन कर सकता है और जीआईएस टाइमज़ोन और स्थानीय जानकारी को संभाल लेगा।

अंतर्राष्ट्रीयकरण

वापस अंतर्राष्ट्रीयकरण समर्थन के लिए। यदि आप एक अंतर्राष्ट्रीयकृत आवेदन प्रदान करना चाहते हैं, तो आपको निम्न करने की आवश्यकता है:

  1. कई एन्कोडिंग प्रकारों, भाषाओं का समर्थन करें, और उन अनुवादों को प्रदर्शित करने के लिए अनुवाद फाइलें हैं।
  2. यदि आवश्यक हो तो क्लाइंट को उनकी भाषा और यहां तक ​​कि शायद उनके एन्कोडिंग प्रकार को सेट करने की अनुमति दें।
  3. जीएमटी की तुलना में उपयोगकर्ताओं को अपने समयक्षेत्र को संदर्भित करने की अनुमति देकर समय क्षेत्र का समर्थन करें।
  4. सावधानी के साथ स्थानीयकरण कोड का उपयोग करें ... वे सटीक रूप से यह नहीं दर्शाते हैं कि आपका उपयोगकर्ता वास्तव में क्या अनुरोध कर रहा है और न ही वे क्या पढ़ सकते हैं।

अनुवाद करें

मशीन अनुवाद अभी भी अपनी प्रारंभिक अवस्था में है। वहाँ कई वेबसाइटें हैं (और वर्डप्रेस प्लगइन्स) जो आपकी साइट के मशीन अनुवाद की पेशकश करते हैं। ऐसा करने के लिए परीक्षा न करें ... दो कारण हैं:

  1. यदि मशीनी अनुवाद काम करता है, तो जो उपयोगकर्ता आपकी साइट की जाँच कर रहा है, उसके पास पहले से ही काम करने के लिए एक अनुवादक होगा।
  2. मशीन अनुवाद बेकार है।

मुझे विश्वास नहीं है? यहाँ आपके लिए एक जापानी अनुवाद है:
से पास्ट किया गया Masatsu फ़ाइल - बिल्लियों के चित्रों की एक टन के साथ एक दोस्त:

जापानी ब्लॉग प्रविष्टि

?
- 00:29:35 मासू द्वारा

?????????????????????????????
??????????????????????????

?????????? (?)?

????????????????????????????????????????
???????????????????????????????

??????????????????????????????????? (?)

?????????????????

??????????????
?
?

???????????????????????????????????????

???????????????????????????????

??????????????????????????????????????
??????????????????????????????????
?????????? अग ??????????????

??????????????????????????????????????

मशीन अनुवाद:

?? हन ?????
-00: 29: 35 मात्सु द्वारा

कल के "एक / जानवर मुट्ठी बेड़े" पर दिखाई देने वाले / एक हाथी की मुट्ठी वाले संत का नाम ?? रेंजर ”” ?? हन ???? ” एक / रेडियो अभिनेता के साथ Yutaka Mizushima…।

? (?) जो कटलफिश को आसानी से करता है।

क्योंकि मुट्ठी वाले संत के भी रेडियो अभिनेता, गुरु ????? a / cat नागाई इचिरो की ड्रैगन क्वीन हैं = ड्रैगन बॉल a / ?? के कर्मचारी हैं? रेंजर उन लोगों की तरह दिखता है, जो मजाकिया टिप्पणी करते हैं, आसानी से जानते हैं।

?????? (पसीना) जिसे मैं हर साल सामान्य अभ्यास के "सुपर बेड़े के नाम का रहस्य" इस साल पूरी तरह से भूल रहा था?

?????? अगर मैं इस साल में लिखता हूँ,

??????? धर्मस्थल ??? (कैसे?) हेडलैंड कलियन (?? कट नहीं) फुकामी ?? (या करने में सक्षम है?) ए / है कि यह करता है

?????? के साथ, यह "a / /?" हो जाता है, दूसरे शब्दों में, "कुंग फू", जब लाइन और / a के नाम को बदलते हैं।

?????? हालांकि यह कहा जाता है कि अतिरिक्त दो कथित तौर पर यह किस तरह का नाम हो सकता है।

सत्य को "आयु" कहा जाता है क्योंकि चांदी तत्व का प्रतीक एजी है? हालांकि, "????" का नाम चांदी “तकाओका? तकनीशियन ??????? सोच रहा था कि चरित्र "कहा जाता है?" यदि इसे एक अतिरिक्त सदस्य के साथ कहा जाता है, तो फिल्म को एक सिल्वरस्क्रीन के साथ जोड़ा जाता है?

?????? हालाँकि, मैं स्वार्थी सोच रहा हूं, कि मेरा सिद्धांत असंबंधित नहीं है कि "?" एक / चीनी चरित्र में शामिल है।

मुझे यकीन है कि इस अनुवाद पर ध्रुवीयता को उलटा करने के लिए अंग्रेजी में एक पठनीय रचना होगी। आपने एंट्री को सही समझा?

2 टिप्पणियाँ

  1. 1

    क्या आपका मतलब था पर्ड्यू?
    यकीन है कि एक पसीने से तर बतर रेडियो अभिनेता कुछ खास बातें कहने का सही तरीका सोच रहा था।

तुम्हें क्या लगता है?

यह साइट स्पैम को कम करने के लिए अकिस्मेट का उपयोग करती है। जानें कि आपका डेटा कैसे संसाधित किया जाता है.