2007-03-28

കേരളത്തിന്റെ രീതികള് കമ്പ്യൂട്ടറിലേയ്ക്ക്...

വളരെ പ്രധാനപ്പെട്ട വിഷയമാണ് പറയാന്‍ പോകുന്നത്‌. പത്രങ്ങളില്‍ ലേഖനമെഴുതുന്നവര്‍ ഇതിനെ പറ്റി ഒരു ചെറിയ കോളം പറ്റുമെങ്കില്‍ കൊടുക്കുകയും വേണം.

ഏത്‌ മാര്‍ക്കറ്റും വളര്‍ന്നുവരുമ്പോള്‍ ആദ്യം എല്ലാം ഒരേ അച്ചില്‍ വാര്‍ക്കുന്നപരിപാടിയാണ് ചെയ്യുക (globalization). അത്‌ പ്രൊഡക്ഷന്‍ കോസ്റ്റ് കാര്യമായി കുറയ്ക്കുന്നു. എല്ലാവരും അത്‌ ചെയ്യാന്‍ തുടങ്ങിയാല്‍ പിന്നെ, മാര്‍ക്കറ്റ് അടുത്ത ഫേസിലേയ്ക്ക്‌ കടക്കുന്നു - ലോക്കലൈസേഷന്‍. കസ്റ്റമറിന്റെ സംസ്കാരത്തോട് കഴിയാവുന്നത്ര ചേര്‍ന്നു നില്‍ക്കുക എന്നതാണ് അതിന്റെ തത്വം. വിലകുറയ്ക്കാന്‍ ഏത്‌ പോലീസിനും പറ്റും എന്നാല്‍ കസ്റ്റമറിന്‌ കൃത്യം ആവശ്യമുള്ളത്‌ കൊടുക്കാന്‍ കുറച്ചുകൂടി അധ്വാനം വേണം എന്നുതന്നെ.

കമ്പ്യൂട്ടറില്‍ അത്‌ ചെയ്യുന്നതിനെ ഇന്റര്‍നാഷണലൈസേഷന്‍, ലോക്കലൈസേഷന്‍ എന്നീവാക്കുകളാല്‍ പറയാറുണ്ട്‌. അതില്‍ ഉള്‍പ്പെടുന്നവയാണ് ഓരോ സംസ്കാരത്തിനനുസരിച്ച്‌ മാറുന്ന:

* ലിപി: കമ്പ്യൂട്ടറില്‍ ലോകത്തിലെ എല്ലാ ലിപിയും എഴുതുകയും വായിക്കുകയും ചെയ്യാനാവണം. അതു് തന്നെ, ചിലര്‍ ഇടത്തുനിന്ന്‌ വലത്തോട്ടെഴുതുമ്പോള്‍ മറ്റുചിലര്‍ വലത്ത്‌ നിന്നും ഇടത്തോട്ടേയ്ക്കാണ് എഴുതുന്നത്‌.
* കൊലേഷന്‍: ഡിക്ഷ്ണറിയില്‍ വാ‍ക്കുകള്‍ സോര്‍ട്ട് ചെയ്യുന്ന രീതി. അബുഗിഡ എന്ന വിഭാഗത്തില്‍ പെടുന്ന ലിപിയാണ് മലയാളമെങ്കിലും വാക്കുകള്‍ സോര്‍ട്ട് ചെയ്യുമ്പോള്‍ ഫൊണറ്റിക് രീതിയാണ് ഉപയോഗിക്കുന്നത്‌. സ്പാനിഷുകാര്‍ 'ch'-നെ ഒരു അക്ഷരമായി കരുതി സൊര്‍ട്ട് ചെയ്യുന്നു.
* തീയതികള്‍: ഇന്ത്യക്കാര്‍ ഇന്നത്തെ ദിവസം 28/3/2007 എന്നെഴുതുമ്പോള്‍ അമേരിക്കക്കാര്‍ അത്‌ 3/28/2007 എന്നും ജപ്പാന്‍കാര്‍ 2007/3/28 എന്നും എഴുതും.
* കലണ്ടറുകള്‍: എല്ലാവരും ഇന്നത്തെ ഇംഗ്ലീഷ് കലണ്ടര്‍ ഉപയോഗിക്കുന്നവരാണെങ്കിലും, പിറന്നാള്‍ ഉത്സവം എന്നിവയ്ക്ക്‌ മലയാളം കലണ്ടറും നോക്കാറുണ്ടല്ലോ.
* നിറങ്ങള്‍: നമുക്ക്‌ സ്റ്റോക്ക് മാര്‍ക്കറ്റ് പൊങ്ങുന്നത്‌ പച്ചയും താഴുന്നത്‌ ചുവപ്പും ആണെങ്കില്‍, ചൈനക്കാര്‍ക്ക്‌ അത്‌ തിരിച്ചാണ്: ഉയരുന്നത്‌ ചുവപ്പും താഴുന്നത്‌ പച്ചയും.
ഇതുപോലെ, അനവധി കാര്യങ്ങളുണ്ട്‌ - സംഖ്യകളെഴുതുന്ന രീതി, നാണയങ്ങള്‍, ടൈംസോണുകള്‍...

ഇതെല്ലാം ഓരോ സംസ്കാരത്തിനനുസരിച്ച്‌ തരംതിരിച്ചെഴുതിവച്ച്‌ കമ്പ്യൂട്ടറിലെ എല്ലാ അപ്പ്ലിക്കേഷനുകള്‍ക്കും ഉപയോഗിക്കാന്‍ പാകത്തില്‍ ആക്കുക എന്നത്‌ ശ്രമകരമായ ജോലിയാണ്. ഈ കാര്യം ചെയ്യുന്ന യുണീക്കോഡ് കണ്‍സോര്‍ഷ്യത്തിന്റെ സ്റ്റാന്റേഡാണ് CLDR എന്നറിയപ്പെടുന്നത്‌. ഈ ഏപ്രില്‍ 29 വരെയുള്ള കാലയളവില്‍ ഈ വിവരങ്ങളെല്ലാം പൊതുജനങ്ങളില്‍ നിന്നും സ്വീകരിക്കുന്നുണ്ട്‌. അതിനോടനുബന്ധിച്ചിറക്കിയ പത്രക്കുറിപ്പിതാ. ഇതില്‍ നമ്മളോരോരുത്തരും നമുക്കറിയാവുന്നവ എഴുതിയിടേണ്ടതുണ്ട്‌. അത്‌ എങ്ങനെയാണ് എന്നാണ്‌ പറയാന്‍ പോകുന്നത്‌.

ആദ്യം ഈ ലിങ്കില്‍ പോയി, Type of Message എന്നത്‌ CLDR submitter ID എന്നും സബ്ജക്റ്റില്‍ “Request locale ml_IN (Malayalam)“ എന്നും കൊടുത്ത്‌ ഒരു ലോഗിന്‍ സമ്പാദിക്കുക.

അതിനുശേഷം, മലയാളം സെക്ഷനിലേയ്ക്ക്‌ പോവുക. അവിടെയുള്ള ലാംഗ്വേജസ്, സ്ക്രിപ്റ്റുകള്‍ എന്നീ ഏത്‌ ലിങ്കിലും ക്ലിക്ക്‌ ചെയ്ത്‌ പണിതുടങ്ങാം.


ഇതില്‍ ലാംഗ്വേജസില്‍ ക്ലിക്ക് ചെയ്താല്‍ താഴെ കാണുന്ന പേജ്‌ കിട്ടും.

ഇതിലെ മഞ്ഞ ഐക്കണിന്റെ അര്‍ഥം, ആ എന്‍‌റികളില്‍ എന്തോ പ്രശ്നമുണ്ടെന്നാണ്. സത്യത്തില്‍ ഇല്ല. അവയില്‍ ചില്ലക്ഷരം എഴുതാന്‍ ജോയിനര്‍ ഉപയോഗിച്ചതുകൊണ്ടാണ് അങ്ങനെ. ഇന്ന്‌ ജോയിനറുപയോഗിച്ചല്ലാതെ ചില്ലക്ഷരം എഴുതാന്‍ വേറേ വഴിയില്ല. (നാളെ അങ്ങനെയല്ല. പക്ഷെ, അത് നാളെ :) അതുകൊണ്ട്‌ അത്‌ മൈന്‍ഡ് ചെയ്യേണ്ട. ഓരോ ഐക്കണില്‍ ക്ലിക്ക്‌ ചെയ്താലും കൂടുതല്‍ വിവരങ്ങള്‍ കിട്ടും.

ഇടതുവശത്ത്‌ വട്ടമുള്ള ആദ്യത്തെ കോളം ആണ് ഇന്നത്തെ സ്റ്റാന്റേഡില്‍ ഉള്ളത്‌. അത്‌ ചുവന്നിരിക്കുന്നതിന്റെ അര്‍ഥം, അത്‌ ആസപ്റ്റബിള്‍ അല്ല എന്നാണ്. പ്രപോസലാണ് രണ്ടാമത്തെ അതുപോലുള്ള കോളം. ഈ രണ്ട് കോളങ്ങളിലൊന്നാണ് ശരിയെങ്കില്‍ ആ വട്ടത്തില്‍ ക്ലിക്ക് ചെയ്യുക(ഉദാഹരണം: ബംഗാളി). സേവ് ചെയ്യുക. ഇതു് രണ്ടുമല്ല ശരിയെങ്കില്‍ വലത്തെ അറ്റത്തെ കോളത്തില്‍ ശരിയായതെഴുതി സേവ് ചെയ്യുക. (ഉദാ: west frisian).

കൂടുതല്‍ ചോദ്യങ്ങളുണ്ടെങ്കില്‍ ഞാനീ പോസ്റ്റ് അപ്ഡേറ്റ് ചെയ്ത്‌ ഉത്തരമെഴുതാം.

11 comments:

  1. "കേരളത്തിന്റെ രീതികള് കമ്പ്യൂട്ടറിലേയ്ക്ക്"

    ഒരു സഹായഭ്യര്‍ഥന.

    ReplyDelete
  2. പ്രധാനപ്പെട്ട സോഫ്റ്റ്‌വെയര്‍ ഹൌസുകളെല്ലാം ലോക്കലൈസേഷനു CLDR -ല്‍ നിന്നുള്ള ഡാറ്റയാവും സ്വീകരിക്കുക, ഗൂഗിളിലും, ഓപ്പണ്‍ ഓഫീസിലും, ലിനക്സിലും, സണ്‍, ഐ.ബി.എം എന്നീ മറ്റനേകം പ്രമുഖരുടെ സോഫ്റ്റ്‌വെയറുകളിലും നമുക്കു് ഏറ്റവും പരിചിതമായ മലയാളം തന്നെ പ്രത്യക്ഷപ്പെടണമെങ്കില്‍, അതിലേയ്ക്കായുള്ള ശ്രമങ്ങളില്‍ കഴിയുന്നത്ര പങ്കാളിത്തം ഉറപ്പുവരുത്തേണ്ടതു് അത്യന്താപേക്ഷികം തന്നെയാണു്. CLDR പ്രൊജക്റ്റ് ഒരു വിജയമാക്കിക്കൊടുക്കുവാന്‍ ഏവരും ഉത്സാഹിക്കുക.

    ReplyDelete
  3. നല്ല കാര്യം. ഉടനെ ചെയ്തേക്കാം.

    ReplyDelete
  4. സിബൂ, താങ്ക്‌സ് ഫോര്‍ റിമൈന്‍ഡിംഗ്.....

    ReplyDelete
  5. ഞാനും കൂടുന്നുണ്ട്.

    ReplyDelete
  6. സിബുച്ചേട്ടായി രണ്ട് ചോദ്യങ്ങള്‍

    1.സ്ക്രിപിറ്റിംഗും കോഡിംഗും വല്ലതും അറിഞ്ഞിരിക്കണമോ ഇങ്ങനെയുള്ള സംരംഭങ്ങളില്‍ പങ്കു ചേരുവാന്‍ ?

    2.മൈക്രോസോഫ്റ്റ് ഒരു എക്സ്പി മലയാളം എപി ഐ ഉണ്ടാക്കിയ പോലെ ഉള്ള ഒരു സംരംഭത്തിനു വേണ്ടിയാണോ ഈ ഡവലപ്പ്മെന്റ് ?

    ReplyDelete
  7. കിരണ്‍:

    1. സ്ക്രിപ്റ്റിംഗും കോഡിംഗും അറിയേണ്ട കാര്യമില്ല.
    2. മൈക്രോസോഫ്റ്റ് മലയാളം ലാംഗ്വേജ് ഇന്റര്‍ഫേസ് പാക്ക് ഉണ്ടാക്കിയതിനേക്കാള്‍ വളരെ വലിയ സ്കോപ്പാണ്‌ ഇതിനുള്ളത്‌. വ്യത്യാസങ്ങള്‍:

    അ) യുണീ‍കോഡും CLDR-ഉം സ്റ്റാന്റേഡുകളാ‍ണ്. അതനുസരിച്ചാണ് ലോകത്തിലെ ഇനിയുണ്ടാവാനിരിക്കുന്ന എല്ലാ സോഫ്റ്റ്വെയറുകളും ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളും പ്രവര്‍ത്തിക്കുക. ഇതില്‍ ലിനക്സും വിന്‍ഡോസും മാക്കും എല്ലാം ഉള്‍പ്പെടും. ഞാന്‍ പറഞ്ഞ ആ മലയാളം പേജില്‍ വരുന്നവയാണ് ഇനിയുള്ള തലമുറകള്‍ മലയാളികളുടെ സംസ്കാരത്തിന്റെ ഭാഗമായി കാണുക.

    ഇ) സ്റ്റാന്റേഡൂകളുടെ ആയുര്‍ദൈര്‍ഘ്യം അപ്ലീക്കേഷനുകളുടേതിനേക്കാ‍ള്‍ വളരെ കൂടുതലാണ്. അതുപോലെ, സ്റ്റാന്റേഡുകളുടെ തുടക്കത്തില്‍ പിഴവുവരുത്തിയാല്‍ പിന്നീട് അത് തിരുത്തുക വളരെ ബൂദ്ധിമുട്ടുള്ളതാവും. ചിലപ്പോള്‍ തിരുത്താനേ പറ്റാതാവും. ഉദാഹരണത്തിന് യുണീക്കോഡിലെ ജോസ്തോമാസ് പ്രശ്നം.

    ഉ) ഇത്‌ കുറേ സ്റ്റ്രിംഗുകള്‍ വിവര്‍ത്തനം ചെയ്യുന്ന പ്രോജക്റ്റിനേക്കാള്‍ ഉപരിയാണ്. ഉദാഹരണത്തിന് തീയതികളെഴുതുന്ന രീതിയും വിവിധകലണ്ടറുകളും

    ReplyDelete
  8. സിബുച്ചേട്ടായി,സംശയനിവാരണത്തിനു നന്ദി..ഒരു ചോദ്യം കൂടി.ഇതില്‍ പല വിഭാഗങ്ങളിലും 98% വര്‍ക്കുകള്‍ പ്രോപ്പോസ്ഡ് എന്ന കോളത്തില്‍ പറഞ്ഞിരിക്കുന്നത് ശരിയാണ്.അങ്ങനെയെങ്കില്‍ അത് ചേഞ്ച് ചെയ്യാതെ വെറുതെ റേഡിയോ ബട്ടണ്‍ ക്ലിക്ക് ചെയ്ത് സേവ് ചെയ്യുന്നതാണോ നമ്മുടെ സംഭാവന ? അതോ ബാക്കിയുള്ള 2% ശതമാനം വര്‍ക്കുക്കള്‍ക്കാണോ മുന്‍ കൈ എടുക്കേണ്ടത് ?

    ReplyDelete
  9. കിരണ്, തീര്‍ച്ചയായും പ്രപ്പോസ്ഡ് കോളത്തില്‍ ശരിയാണ് എന്ന്‌ തോന്നുന്നവയ്ക്ക്‌ വോട്ട് ചെയ്യുന്നത്‌ പ്രധാനമാണ്. ഏതിന് പ്രയോരിറ്റി കൊടുക്കണം എന്ന്‌ ചോദിച്ചാല്‍ ഒട്ടും ട്രാന്‍സ്‌ലേറ്റ് ചെയ്യപ്പെടാത്തവയ്ക്കായിരിക്കണം. അത്‌ ഇനി 2% കൂടിയേ ഉള്ളൂവെങ്കില്‍ അത്രയും നല്ലത്‌.

    ReplyDelete
  10. ഇനി രണ്ടാഴ്ച്കൂടിയേ ഉള്ളൂ ഡാറ്റ ചേര്‍ക്കാന്‍. നാളെ ചെയ്യാം എന്ന് കരുതിയിരിക്കുന്നവരൊക്കെ ഒന്നുഷാറാവണേ...

    ReplyDelete
  11. ഇടയ്ക്ക് വച്ച്‌ ഇതിന്റെ ഡാറ്റ എന്റ്രി ചെയ്യേണ്ട സമയം രണ്ടാഴ്ചകൂടി നീട്ടിയിരുന്നു. അത്‌ ഈ പതിനഞ്ചാം തീയതി തീരുന്നു. മലയാളത്തില്‍ താത്പര്യമുള്ളവരൊക്കെ ഈ സംരംഭത്തില്‍ പങ്കെടുക്കുമല്ലോ..

    ReplyDelete