अंतर्राष्ट्रीयकरण, स्थानीयकरण, एन्कोडिंग, आइसलैंड और एक जापानी कैट फोटो वेबसाइट का अनुवाद

अंतर्राष्ट्रीयकरण अनुवाद

अंतर्राष्ट्रीयकरणजब वेब अनुप्रयोगों के भीतर अंतर्राष्ट्रीयकरण, स्थानीयकरण और एन्कोडिंग की बात आती है तो वहां बहुत सारी जानकारी होती है। वेब एप्लिकेशन के लिए प्रत्येक क्या प्रदान करता है, इसके बारे में भी बहुत सी गलतफहमी है। यहाँ मेरा लेना है …

जब कोई वेब ब्राउज़र किसी वेब सर्वर से कनेक्शन बनाता है, तो वह कुछ चर पास करता है और अतिरिक्त अनुरोध करता है, यहां एक उदाहरण दिया गया है:

GET / HTTP / 1.1
होस्ट: www.dknewmedia.com
उपयोगकर्ता-एजेंट: मोज़िला / 5.0 (मैकिन्टोश; यू; इंटेल मैक ओएस एक्स; एन-यूएस; आरवी: 1.8.1.3) गेको / 20070309 फ़ायरफ़ॉक्स / 2.0.0.3
स्वीकार करें: HTTP Accept = text / xml, application / xml, application / xhtml + xml, text / html; q = 0.9, text / plain; q = 0.8, image / png, * / *; q = 0.5;
स्वीकार-भाषा: en-us, en; q = 0.5
स्वीकार-एन्कोडिंग: गज़िप, अपस्फीति
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

अंतर्राष्ट्रीयकरण

अंतर्राष्ट्रीयकरण कई चीजों का एक संयोजन है:

  1. स्थानीयकरण: यह पहचानने की क्षमता कि कोई आगंतुक किस भाषा और स्थान का दौरा कर रहा है। यह HTTP अनुरोधों के माध्यम से किया जाता है जहां विज़िटर की पहचान लोकेल द्वारा की जाती है। मेरे मामले में, वह एन-यूएस है। "एन" अंग्रेजी है और "यूएस" संयुक्त राज्य है। यह मेरे ऑपरेटिंग सिस्टम के भीतर एक सेटिंग है।
  2. समय क्षेत्र: समय क्षेत्र के लिए समायोजित करने की क्षमता। यह सामान्य रूप से आपके सर्वर को ग्रीनविच मीन टाइम (GMT) पर सेट करके पूरा किया जाता है और फिर उपयोगकर्ताओं को GMT से अपनी स्थानीय ऑफ़सेट सेट करने की अनुमति देता है।
  3. अक्षरों को सांकेतिक अक्षरों में बदलना: यह भाषा के कैरेक्टर सेट को ठीक से प्रदर्शित करने की क्षमता है। यह स्थानीयकरण से अलग है क्योंकि स्थानीयकरण मुझे कंप्यूटर की भाषा और क्षेत्र बता सकता है जो अनुरोध कर रहा है, लेकिन यह मुझे यह नहीं बताएगा कि कौन सी भाषा पाठक अनुरोध कर रहा है... यह पाठक पर निर्भर है!

मेरे HTTP हेडर में सूचना जब ब्राउज़र ने अनुरोध किया, तो उसने सर्वर को बताया कि यह मेरे लोकेल (स्वीकार-भाषा: en-us) का अनुरोध कर रहा था; हालाँकि, यह सर्वर को यह बताने की भी आवश्यकता है कि कैरेक्टर सेट का अनुरोध क्या है (स्वीकार-चारसेट: एक्सेप्ट-चार्सेट: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 और utf; -8 दोनों स्वीकार्य चरित्र सेट हैं।

स्थानीयकरण

इस शानदार मिश्रित दुनिया में, स्थानीयकरण अब कभी भी भाषा को निर्देशित नहीं करता है। भले ही मैं एन-यूएस में हूं, मैं एक अलग चरित्र सेट का उपयोग करके एक अलग भाषा बिल्कुल पढ़ सकता हूं ... जब मैं इसका उपयोग करता हूं तो यही होता है गूगल हिंदी (मैं वास्तव में Google हिंदी का उपयोग नहीं करता)। लोकेल और कैरेक्टर सेट के लिए मेरा अनुरोध समान है जब मैं अनुरोध करता हूं गूगल की अंग्रेज़ी पृष्ठ, लेकिन मुझे वास्तव में एक पृष्ठ खिलाया गया है जिसे मैं पढ़ नहीं सकता क्योंकि मेरे पास वर्ण सेट नहीं है। यह सब सामने आता है ???????????… हालांकि, मैं उस चरित्र को फ़ायरफ़ॉक्स में लोड कर सकता हूं (फ़ायरफ़ॉक्स> वरीयताएँ> उन्नत> भाषाएँ):

फ़ायरफ़ॉक्स लोड भाषा

अगर मैं उस भाषा को लोड करता हूं, तो मैं उसके मूल चरित्र सेट में पेज का अनुरोध कर सकता हूं और अपने कंप्यूटर पर इसे प्रदर्शित कर सकता हूं, भले ही मेरा डिफ़ॉल्ट लोकेल एन-यूएस हो!

तो ... अगर मैं एक हिंदी छात्र हूं, पर्ड्यू में अंग्रेजी पढ़ रहा हूं और इसके माध्यम से जुड़ा हुआ हूं वीपीएन स्कूल के सर्वर पर, ऑस्ट्रेलिया में छुट्टी पर... 3 अलग-अलग सेटिंग्स हैं जिन्हें वास्तव में अंतर्राष्ट्रीयकृत होने के लिए आवेदन पर लागू करने की आवश्यकता है - और कोई नहीं दूसरे पर निर्भर हैं।

मेरा लोकेल एन-यूएस के रूप में सामने आएगा, लेकिन मेरा टाइमज़ोन ऑस्ट्रेलिया है, लेकिन मैं वेबसाइट से जिस भाषा का अनुरोध कर रहा हूं वह हिंदी हो सकती है। अगर मुझे अपने आवेदन को बनाने के लिए प्रोग्राम करना था मान्यताओं मेरे कंप्यूटर के स्थान के आधार पर, मैं पूरी तरह से गलत होगा - किसी व्यक्ति को पूर्वी समय क्षेत्र में अंग्रेजी खिलाना। आदर्श रूप से, मैं अपने आवेदन को ऑफ़र करने के लिए प्रोग्राम करूंगा के छात्रों भाषा और समय क्षेत्र सेटिंग्स ... लेकिन मैं उन्हें लोकेल के आधार पर नहीं मानूंगा।

आइसलैंड - अंतिम उदाहरण

हम संयुक्त राज्य अमेरिका में बहुभाषी और बहु-स्थानीय चुनौतियों से अनभिज्ञ हैं जहां हम सब अंग्रेजी बोलना [व्यंग्य निहित]। कुछ देशों में, जैसे कि आइसलैंड, हालांकि मूल भाषा आइसलैंडिक है, अविश्वसनीय आइसलैंडिक लोग 3 भाषाएं सीखते हुए बड़े होते हैं! चूंकि आइसलैंड यूरोप और उत्तरी अमेरिका के बीच में एक देश है, इसलिए उनकी कंपनियां अपने डेस्कटॉप से ​​कई महाद्वीपों, भाषाओं, भाषाओं की बोलियों और कई टाइमज़ोन में काम करती हैं!

कई आइसलैंडिक वेबसाइट यूएस अंग्रेजी, यूके इंग्लिश, आइसलैंडिक, स्पेनिश, स्पेनिश, फ्रेंच और जर्मन में बनाई गई हैं! जरा सोचिए कि इसका निर्माण कितना चुनौतीपूर्ण होगा आइसलैंडएयर का वेबसाइट अनुप्रयोगों और टिकटिंग सिस्टम ... वाह!

अस्वीकरण: मुझे आइसलैंड के अच्छे लोगों के साथ काम करने का पूर्ण आनंद मिला है और मैं आपको बता सकता हूं कि वे कुछ सबसे प्रतिभाशाली और मिलनसार पेशेवर हैं जिनके साथ काम करने का मुझे आनंद मिला है। यह बस एक अद्भुत देश और लोग हैं! जाएँ…आइसलैंडेयर ले जाएँ और ज़रूर जाएँ नील जल परिशोधन कुंड!

भाषा बनाम एनकोडिंग

एक ही भाषा में अलग-अलग वर्ण कूटलेखन भी होते हैं जो एक दूसरे के साथ अच्छा नहीं खेलते हैं! उदाहरण: Shift-JIS में लिखा गया एक जापानी ईमेल जापानी व्यक्ति के कंप्यूटर पर ja-JP पर सेट स्थानीयकरण के साथ अपठनीय प्रस्तुत कर सकता है क्योंकि उनका मेल सर्वर केवल EUC-JP को पहचानता है। आदर्श रूप से, एक ग्राहक को यह निर्धारित करने में सक्षम होना चाहिए कि उन्हें कौन सी एन्कोडिंग पसंद है और साथ ही कौन सी भाषा - बस यह सुनिश्चित करना कि एन्कोडिंग और भाषा क्लाइंट के अनुरोध के अनुकूल हैं।

अगर मैं जापानी पढ़ना चाहता हूं, तो मुझे अपनी भाषा के रूप में जापानी और उस भाषा को ठीक से प्रदर्शित करने के लिए शिफ्ट-जेआईएस को एन्कोडिंग के लिए चुनना पड़ सकता है। मिश्रण में जोड़ने के लिए यहां कुछ और भ्रम है... कुछ एन्कोडिंग प्रकार कई भाषाओं का समर्थन करते हैं। UNICODE/UTF8 दर्जनों का समर्थन करता है। उलटा भी सच है। कुछ भाषाओं को कई एन्कोडिंग प्रकारों में पढ़ा जा सकता है। अगर इसका कोई मतलब नहीं है ... मैं क्षमा चाहता हूं, यह एक बहुत ही जटिल मुद्दा है।

किसी दिन मुझे विश्वास है (उम्मीद है) यह सब बदल जाएगा। मुझे लगता है कि स्थानीयकरण कोड के मूल डिजाइनरों को उम्मीद थी कि भाषा-देश संयोजन वह सब होगा जिसकी आवश्यकता है ... लेकिन हम कहीं अधिक परिष्कृत हो गए हैं। याद रखें, इनमें से अधिकतर इंटरनेट के अस्तित्व में आने से पहले विकसित किया गया था। के आगमन के साथ जीआईएस, शायद एक व्यक्ति अपने एन्कोडिंग का चयन कर सकता है और जीआईएस टाइमज़ोन और स्थानीय जानकारी को संभाल लेगा।

अंतर्राष्ट्रीयकरण

वापस अंतर्राष्ट्रीयकरण समर्थन के लिए। यदि आप एक अंतर्राष्ट्रीयकृत आवेदन प्रदान करना चाहते हैं, तो आपको निम्न करने की आवश्यकता है:

  1. कई एन्कोडिंग प्रकारों, भाषाओं का समर्थन करें, और उन अनुवादों को प्रदर्शित करने के लिए अनुवाद फाइलें हैं।
  2. यदि आवश्यक हो तो क्लाइंट को उनकी भाषा और यहां तक ​​कि शायद उनके एन्कोडिंग प्रकार को सेट करने की अनुमति दें।
  3. जीएमटी की तुलना में उपयोगकर्ताओं को अपने समयक्षेत्र को संदर्भित करने की अनुमति देकर समय क्षेत्र का समर्थन करें।
  4. सावधानी के साथ स्थानीयकरण कोड का उपयोग करें ... वे सटीक रूप से यह नहीं दर्शाते हैं कि आपका उपयोगकर्ता वास्तव में क्या अनुरोध कर रहा है और न ही वे क्या पढ़ सकते हैं।

अनुवाद करें

मशीन अनुवाद अभी भी अपनी प्रारंभिक अवस्था में है। वहाँ कई वेबसाइटें हैं (और वर्डप्रेस प्लगइन्स) जो आपकी साइट का मशीनी अनुवाद प्रदान करता है। ऐसा करने के लिए ललचाओ मत... इसके दो कारण हैं:

  1. यदि मशीनी अनुवाद काम करता है, तो जो उपयोगकर्ता आपकी साइट की जाँच कर रहा है, उसके पास पहले से ही काम करने के लिए एक अनुवादक होगा।
  2. मशीन अनुवाद बेकार है।

मेरा विश्वास मत करो? यहाँ आपके लिए एक जापानी अनुवाद है:
से पास्ट किया गया Masatsu फ़ाइल - बिल्लियों के चित्रों की एक टन के साथ एक दोस्त:

जापानी ब्लॉग प्रविष्टि

?
- 00:29:35 मासू द्वारा

?????????????????????????????
??????????????????????????

?????????? (?)?

????????????????????????????????????????
???????????????????????????????

??????????????????????????????????? (?)

?????????????????

??????????????
?
?

???????????????????????????????????????

???????????????????????????????

??????????????????????????????????????
??????????????????????????????????
?????????? अग ??????????????

??????????????????????????????????????

मशीन अनुवाद:

?? हन ?????
-00: 29: 35 मात्सु द्वारा

कल के "ए / द बीस्ट फिस्ट फ्लीट ??" पर दिखाई देने वाले हाथी के मुट्ठी संत का नाम रेंजर" "?? हैन ????" एक / रेडियो अभिनेता युताका मिजुशिमा के साथ…।

? (?) जो कटलफिश को आसानी से करता है।

क्योंकि मुट्ठी वाले संत के भी रेडियो अभिनेता, गुरु ????? a / cat नागाई इचिरो की ड्रैगन क्वीन हैं = ड्रैगन बॉल a / ?? के कर्मचारी हैं? रेंजर उन लोगों की तरह दिखता है, जो मजाकिया टिप्पणी करते हैं, आसानी से जानते हैं।

?????? (पसीना) जिसे मैं हर साल सामान्य अभ्यास के "सुपर बेड़े के नाम का रहस्य" इस साल पूरी तरह से भूल रहा था?

?????? अगर मैं इस साल में लिखता हूँ,

??????? धर्मस्थल ??? (कैसे?) हेडलैंड कलियन (?? कट नहीं) फुकामी ?? (या करने में सक्षम है?) ए / है कि यह करता है

?????? के साथ, यह "a / /?" हो जाता है, दूसरे शब्दों में, "कुंग फू", जब लाइन और / a के नाम को बदलते हैं।

?????? हालांकि यह कहा जाता है कि अतिरिक्त दो कथित तौर पर यह किस तरह का नाम हो सकता है।

सत्य को "आयु" कहा जाता है क्योंकि चांदी तत्व का प्रतीक एजी है, हालांकि "द ????" का नाम है। चांदी "ताकाओका? के तकनीशियन ??????? सोच रहा था कि चरित्र कहा जाता है "?" का उपयोग सिल्वर स्क्रीन? मूवी के संयोजन के साथ किया गया था, यदि वह इसे किसी अतिरिक्त सदस्य के साथ बुलाता है।

?????? हालाँकि, मैं स्वार्थी सोच रहा हूं, कि मेरा सिद्धांत असंबंधित नहीं है कि "?" एक / चीनी चरित्र में शामिल है।

मुझे यकीन है कि इस अनुवाद पर ध्रुवता को उलटने से अंग्रेजी में एक पठनीय शब्द मिलेगा। आप प्रविष्टि को समझ गए, है ना?

2 टिप्पणियाँ

  1. 1

    क्या आपका मतलब था पर्ड्यू?
    यकीन है कि एक पसीने से तर बतर रेडियो अभिनेता कुछ खास बातें कहने का सही तरीका सोच रहा था।

तुम्हें क्या लगता है?

यह साइट स्पैम को कम करने के लिए अकिस्मेट का उपयोग करती है। जानें कि आपका डेटा कैसे संसाधित किया जाता है.