|
யுனிகோட்
அமைப்பில் தனக்குரிய இடத்தைத் தமிழ் பெற்றாலன்றி இணையத்தில் அதன் வளர்ச்சி
வேகமாகச் சாத்தியமில்லை என்கிறார்கள் கணித் தமிழ் நிபுணர்கள்.
(Unicode Consortium)யுனிகோட் கன்சார்டியம் என்பது உலகளவில் கம்ப்யூட்டர்
பயன்பாட்டு முறைகளைச் சீரமைத்து ஒழுங்குபடுத்தும் பன்னாட்டு அமைப்பு என்று
பொதுவாகப் புரிந்து கொள்ளலாம்.சர்வதேசக் கம்ப்யூட்டர் நிபுணர்கள், முன்னணிக்
கம்ப்யூட்டர் நிறுவனங்கள்,அரசுகள்,தன்னார்வலர்கள் எனப் பல தரப்பினரும் அங்கம்
வகிக்கும் அமைப்பு இது. ஆங்கிலத்துக்கு நிகராக இதர மொழிகளைச் சார்ந்தவர்களும்
கம்ப்யூட்டரைக் கையாளும் திறனை எளிமைப்படுத்துவதே இதன் முக்கிய நோக்கம்.இதற்காகக் கம்ப்யூட்டரில் புழங்கும் உலக மொழிகள் ஒவ்வொன்றுக்கும் சர்வதேச
அளவிலான பயன்பாட்டுப் பொதுத்தன்மையை வகுத்தளிக்கும் தலையாய பணியை யுனிகோட்
செய்து வருகிறது.
இந்த யுனிகோட் அமைப்பில் தமிழுக்கு உரிய இடத்தைப் பெறுவதில் என்ன பிரச்சனை?
அதற்கு முன்பு சில ஆதார உண்மைகளை அறிந்து கொள்வது அவசியம்.
0,1 என்ற இரு எண்களைக் கொண்டுதான்(அல்லது இவ்விரு எண்களின் வெவ்வேறு கூட்டணிகளை
கொண்டு)தனக்குள்ளே செலுத்தப்படும் எந்த விசயத்தையும் கம்ப்யூட்டர் பதிவு செய்து
கொள்கிறது.ஒரு மொழியைக் கம்ப்யூட்டரில் பயன்படுத்த வேண்டுமென்றால் அந்த
மொழியின் ஒவ்வொரு எழுத்துக்கும் ஒரு எண்ணை ஒதுக்க வேண்டும். இவ்வாறு ஒவ்வொரு
எழுத்துக்கும் ஒவ்வொரு எண்ணை நிர்ணயிப்பதைத்தான் குறியீட்டு முறை(Encoding)என்கிறார்கள்.எந்த மொழியிலும் எந்த விசயத்தையும் கம்ப்யூட்டரில் சேமிக்க இதுவே
அடிப்படை. சேமித்த விசயத்தை அச்சிட்டு உபயோகப்படுத்த எழுத்து வடிவம் வேண்டும்.அதை Font ன்கிறார்கள்.கம்ப்யூட்டரில் விசயத்தை உட்செலுத்த கீ போர்டு எனப்படும்
விசைப்பலகையும் தேவை.
ஒரு மொழி,கம்ப்யூட்டரிலும் அதன் வழியாக இணையத்திலும் தங்குதடையின்றி
முழுமையாகப் புழங்குவதற்கு வழி வகுப்பவை இவை.துரதிருஷ்டவசமாக இந்த மூன்றிலுமே
தமிழில் ஏகப்பட்ட சிக்கல்கள்.
தமிழக அரசின் தரப்படுத்தப்பட்ட அதிகாரப்பூர்வ விசைப்பலகையாகத் தமிழ்நெட்99அறிவிக்கப்பட்டாலும் இன்னும் புழக்கத்தில் அது பரவலாகவில்லை.தட்டச்சு மற்றும்
ஒலியியல்(பொனடிக்)முறை அடிப்படையிலான விசைப்பலகைகளும் கணித் தமிழர்களிடையே
உபயோகத்தில் உள்ளன.அதுபோல வெவ்வேறு கட்டங்களில் வெவ்வேறு விதமான எழுத்து
வடிவங்களைக் கையாளும் போக்கும் இருக்கிறது.இவற்றுடன் குறியீட்டு முறையிலும்
மாறுபட்ட நிலைப்பாடுகளைக் கொண்ட குழுக்கள் இயங்கி வருகின்றன.இந்தத்
தடைகளையெல்லாம் கடந்தால்தான் ஆங்கிலத்துக்கு நிகராகத் தமிழும் இணையத்தில்
பீடுநடைபோட முடியும்.
யுனிகோட் குறியீட்டு முறை தற்போது 16பிட் அடிப்படையிலானது.ஆங்கில மொழிக்குரிய
அஸ்கி(ASCII-American Standard Code for Information Interchange)குறியீட்டு
முறை 8பிட்டுகள் அடிப்படையிலானது. 8 பிட் என்பதை 1,2,4,8,16,32,64,128 என்ற
விகிதத்தில் குறியீட்டுப் பரப்பு விரிவடைவதைக் குறிக்கும்.16 பிட் என்பது 256,
512என்ற விகிதத்தில் செல்லும். இந்த 16பிட் அடிப்படையிலான குறியீட்டுப்
பரப்பில் உலக மொழிகளுக்கு மொத்தம் 65,000இடங்கள் வரை ஒதுக்கியிருக்கிறது
யுனிகோட்.
தற்போதுள்ள யுனிகோட் ஒதுக்கீட்டில் தமிழுக்கு அளிக்கப்பட்ட இடங்கள் 128.இதிலும்
67இடங்கள் காலியாக உள்ளன. தொலைநோக்குக் கண்ணோட்டத்துடன் பார்த்தால் தமிழுக்கு
இது பெரும் தடையாக இருக்கும்.
எப்படி?
உதாரணத்துக்கு தினமணி என்பது எழுத்து வடிவப் பதிவுப்படி நான்கு குறியீடுகளைக்
கொண்டது.இதுவே இப்போதுள்ள யுனிகோட் 8பிட் குறியீட்டு முறைப்படிப் பார்த்தால்
த் + இ + ன் + அ + ம் + அ + ண் + இ என 8 குறியீடுகளாகப் பதிவாகும்.அதாவது நமது
கண்ணுக்குத் தினமணி என்பது நான்கு எழுத்தாகத் தெரிந்தாலும் கம்ப்யூட்டர் அதைக்
கொண்டு வர 8 குறியீடுகள் தேவை.இது தமிழில் தகவல்களைப் பதிவு செய்வதிலும்
சேமிப்பதிலும் தாமதத்தை ஏற்படுத்தும்.மேலும் சேமிப்பதற்கான இடமும் அதிகம்
தேவைப்படும்.அகர வரிசைப்படுத்துதல் மற்றும் தேடுதலின்போது ஆங்கிலம் போல எளிதாக
அன்றி கூடுதல் நேரம் தேவைப்படும்.இணையம் என்றாலே கண்ணிமைக்கும் வேகத்தில்
தகவல்கள் குவிய வேண்டும்.ஆனால் தமிழின் இப்போதைய குறியீட்டு முறை அத்தகைய
வேகத்தை உறுதி செய்வதாக இல்லை.
யுனிகோட் ஒதுக்கீட்டில் தமிழுக்கு 320 இடங்கள் கேட்க வேண்டும் என்பதே கணித்
தமிழ் அறிஞர்கள்,ஆர்வலர்களின் சமீபத்திய உரத்த குரல்.
யுனிகோட் அமைப்பில் மத்திய அரசு உறுப்பினராக இருக்கிறது.இந்திய மொழிகளுக்கான
ஒதுக்கீட்டுப் பரிந்துரையை முதன் முதலாக யுனிகோட்டிடம் சமர்ப்பிக்கும்போதே 320இடங்கள் கேட்டிருந்தால் எளிதில் கிடைத்திருக்கும்.அவ்வாறு கோராமல் இந்தியை
ஒட்டியே இதர இந்திய மொழிகளும் யுனிகோட் ஒதுக்கீட்டு முறையைப் பெற மத்திய அரசு
ஒப்புக்கொண்டது.
இப்போது யுனிகோட்டின் லேட்டஸ்ட் பதிப்பு (4.0)வந்துவிட்டது.அதில்
தமிழுக்குரிய இடங்கள் பழைய 128மட்டுமே.
சீன, கொரிய மற்றும் ஜப்பான் எழுத்துகள் சித்திர எழுத்துகள்.எண்ணிக்கையில்
தமிழைவிடப் பல மடங்கு அதிகமானவை. கொரிய மொழிக்கு மட்டும் 12,177இடங்களை
யுனிகோட் ஒதுக்கியிருக்கிறது.சீன,கொரிய மற்றும் ஜப்பான் மொழிகளுக்குச்
சேர்த்து சுமார் 25,000இடங்கள் வரை ஒதுக்கப்பட்டிருப்பதாகச் சொல்லப்படுகிறது.(சிங்கள மொழிக்காரர்கள் கூட சளைக்காமல் போராடி 400 இடங்களை வாங்கிவிட்டார்கள்)
அவர்களுக்கெல்லாம் ஆயிரக்கணக்கில் யுனிகோட்டில் இடம் கிடைக்கும்போது தமிழுக்கு
மட்டும் ஏன் சில நூறு கிடைப்பதிலேயே சிக்கல்..?
அவர்களெல்லாம் வருங்காலத்தை முன்கூட்டியே யோசித்து அதற்கேற்பத் தங்களுக்குள்
ஒருமித்த சிந்தனையை உருவாக்கி, விடாமல் போராடித் தங்களுக்குரிய இடத்தைப்
பெற்றுவிட்டார்கள்.தமிழுக்காக அத்தகைய ஒருமித்த குரல் ஒலிக்காததன் விளைவைத்தான்
நாம் இப்போது அனுபவித்துக் கொண்டிருக்கிறோம்.
யுனிகோட் அமைப்பில் மத்திய அரசு தவிர உறுப்பினராக இருக்கும் ஒரேமாநில அரசு
தமிழக அரசுதான்.தமிழுக்குத் தேவையான கூடுதல் இடங்களின் முக்கியத்துவத்தை
மத்திய அரசுக்குப் புரிய வைத்து,கணித் தமிழ் அறிஞர்களிடையேயும் ஒன்றுபட்ட
கருத்தை உருவாக்கி யுனிகோட் அமைப்பிடம் நமக்குரிய இடத்தைப் பெறுவதில் தமிழக
அரசுதான் முழுவீச்சில் இறங்கவேண்டும்.
கடந்த யுனிகோட் கலந்தாய்வுக் கூட்டத்தில் இந்திய அரசின் சார்பாகப் பங்கேற்ற
பிரதிநிதி ஒரு வார்த்தைகூடப் பேசவில்லை என்று விபரம் தெரிந்த கணித் தமிழ்
அறிஞர்கள் ஆதங்கப்படுகிறார்கள்.
தாங்கள் கேட்ட இடத்தை யுனிகோட் தர மறுத்ததால் சீனா அதிரடி வேலையில் இறங்கியது.தங்களுக்கென்று தனியே ஒரு குறியீட்டு முறையை வகுப்பதாகவும் அந்தக் குறியீட்டு
முறையிலான மென்பொருள்களையே இனி சீனாவுக்குள் பன்னாட்டு நிறுவனங்கள் விற்க
முடியும் என்றும் தடாலடியாக அறிவித்தது.அவ்வளவுதான் கோடானுகோடி மதிப்புள்ள
வர்த்தக வாய்ப்பைப் பன்னாட்டு நிறுவனங்கள் தவற விடுமா...?அவர்களும் யுனிகோட்
அமைப்பில் உறுப்பினராகத்தானே இருக்கிறார்கள்.உடனடியாக சீனாவுக்காகப் பேசிக்
காரியத்தை முடித்துவிட்டார்கள்.
உலகத் தமிழர்கள் 9கோடி என்கிறார்கள்.உலகின் தலைசிறந்த கம்ப்யூட்டர்
வல்லுநர்கள் வரிசையைத் தமிழர்கள் அலங்கரிப்பதாகச் சொல்கிறார்கள்.ஆனாலும்
காரியம் நடந்தபாடில்லை.
மைக்ரோசாஃப்ட் நிறுவனத்தில் பணியாற்றிவிட்டு வெளியேறியவர் மைக்கேல் கெப்லான்.இவர் தனியாக ஒரு மென்பொருள் தயாரிப்பு நிறுவனத்தை நடத்தி வருகிறார்.தமிழில்
அபரிமிதமாக ஆர்வம் காட்டுகிறாராம்.இணையத் தமிழ்ச் செயல்பாடுகளை ஒருங்கிணைக்கும்
உத்தமம் அமைப்பில் தன்னார்வலராக அங்கம் வகிக்கிறார்.அதன் வழியாக யுனிகோட்
கலந்தாய்வுக் கூட்டத்திலும் பங்கேற்கிறார்.
தமிழுக்குக் கூடுதல் இடங்கள் வேண்டும் என்று யுனிகோட் கூட்டத்தில் தமிழறிஞர்கள்
குழு வயுறுத்தினால்,மைக்கேல் கெப்லான் கட்டையைப் போடுகிறாராம்.ஏன் வேண்டாம்
என்கிறீர்கள் என்று கேட்டால்,தற்போதுள்ள யுனிகோட் முறைப்படியே முன்னணிப்
பன்னாட்டு நிறுவனங்கள் மென்பொருள்களைத் தயாரித்து வருகின்றன.ஒவ்வொரு
மொழிக்காகவும் இதை மாற்றிக்கொண்டேயிருந்தால் அவர்கள் பாதிக்கப்படுவார்கள்
என்கிறாராம்.இது எப்படி இருக்கு?
உண்மையில் அவர் யாருக்காகக் குரல் கொடுக்கிறார்?என்று பாயும்புலி பண்டார
வன்னியன் ரேஞ்சில் கிள௱ந்தெழுந்து கேட்கிறார்கள் கணித் தமிழ் பொங்கும் இளைஞர்கள்
சிலர்.கேட்பது நியாயம்தானே!
உத்தமம் (INFITT)அமைப்பின் தொழில் நுட்பக் குழு தொடர்ச்சியாக யுனிகோட்டுடன்
உறவாடி வருகிறது.என்றாலும் யுனிகோட்டில் தமிழுக்குக் கூடுதல் இடங்கள் தேவை
என்பதில் மாறுபட்ட கருத்துகளைத் தவிர்த்து,தமிழக மற்றும் அயலகக் கணித்தமிழ்
அறிஞர்கள் ஓரணியில் திரண்டால்தான் அது சாத்தியம்.
தமிழுக்குக் கூடுதல் இடங்கள் அவசியம் என்பதை யுனிகோட்டுக்கு உணர்த்த அதை ஒரு
இயக்கமாகவே நடத்த வேண்டும் என்று வேண்டுகோள் விடுக்கிறார்கணித்தமிழ்ச்
சங்கத்தின் நிர்வாகிகளுள் ஒருவரான சாஃப்ட் வியூ ஆண்டோ பீட்டர்.
நல்லயோசனை.Allot More Space for Tamil என்று யுனிகோட்-டுக்குத் தமிழர்கள்
சரமாரியாக இ-மெயில் அனுப்பலாம். (முக்கியக் கோரிக்கையை வயுறுத்தி குடியரசுத்
தலைவருக்குத் தந்தி அனுப்புவோமல்லவா...அதுமாதிரி)
யுனிகோட் இணையதள முகவரி:
www.unicode.org
தபால் முகவரி: The Unicode Consordium, P.O.Box 391476, Mountain View CA
94039-1476, USA. Phone +1-650-693-3010 Fax: +1-650-693-3921.
யுனிகோட்-டில் தமிழுக்குக் கூடுதல் இடங்கள் ஒதுக்கப்பட்டு அது இறுதி வடிவம்
பெற்று உபயோகத்தில் வர நான்கைந்து ஆண்டுகளாவது பிடிக்கும். அதுவரை இப்போதுள்ள
பயன்பாட்டு முறைகளை நெறிப்படுத்தி இணையத்தில் தமிழின் பரப்பை விரிவுபடுத்த ஒரு
இடைக்கால அல்லது மாற்று ஏற்பாடு தேவை என்கிறார் திண்டுக்கல் கணித்தமிழ் பொறிஞர்
ஆர்.துரைப்பாண்டி. அல்டிமேட் சாப்ட்வேர் சொலுஷன்ஸ் என்ற நிறுவனத்தின் தலைவரான
இவர்,ஆங்கிலத்திருந்து கம்ப்யூட்டரே தமிழில் மொழிபெயர்த்துத் தரும் தமிழ்ப்பொறி
என்ற மென்பொருளை,தமிழ் இணையப் பல்கலைக்கழகத்தின் ஆதரவுடன் தயாரித்தவர்.சமீபத்திய இணைய மாநாட்டை ஒட்டி முதல்வர் ஜெயலலிதா இந்த மென்பொருளை வெளியிட்டது
நினைவிருக்கலாம்.
Translation.com என்றொரு ஆங்கில இணையதளம் இருக்கிறது.அந்த இணைய தளத்தின்
வழியாக ஸ்பானிஷ், ஜெர்மன், பிரெஞ்சு போன்ற எந்த மொழிகளைச் சேர்ந்த இணைய தளத்தை
பிரவுஸ் செய்தாலும் அவற்றை அப்படியே ஆங்கிலத்தில் மொழிபெயர்த்துப் படிப்பதற்கு
ஏதுவாகத் தந்துவிடுகிறதாம். அதைப் போலத் தமிழில் ஒரு மென்பொருள் தயாரிப்பதுதான்
தனது கணித்தமிழ்க் கனவு என்று தாகம் பொங்கச் சொல்கிறார் துரைப்பாண்டி.
கம்பீரமான கனவு! நனவாகட்டும்!
கடந்த பத்தாண்டுகளில் தமிழில் எண்ணற்ற மென்பொருட்கள் வந்துள்ளன. சரியான
மென்பொருளை இனங்கண்டு அதை ஏகமனதாக ஏற்றுக் கொள்ளும் நிலைக்கு இன்னும்
கணித்தமிழ்ச் சமூகம் பக்குவப்படவில்லை.எந்த மென்பொருளாக இருந்தாலும் சரி அதை,உன் பொருளா...என் பொருளா? என்று
யாரிப்பு சார்ந்து பிரித்துப் பார்த்தே
ஏற்பதும் நிராகரிப்பதும் நடக்கிறது.
யுனிகோட் பிரச்சனையில் மட்டுமின்றிப் புதிய மென்பொருள்களை ஏற்றுக்கொள்வதிலும்
உள்ளூர்த் தமிழர்களும் (இங்கேயும் வெவ்வேறு அணிகள் உண்டு) உலகத் தமிழர்களும்-அதாவது அயலகத் தமிழர்களும்-எதிரெதிர் அணியில் நிற்பதாக ஒரு கருத்து நிலவுகிறது.
இன்னும்
|