മലയാളം നിവേശകരീതികള്‍ ഒരു വിശകലനം

സെബിന്റെ ബ്ലോഗിലെ മലയാളം മലയാളത്തിലെഴുതാന്‍ എന്ന പോസ്റ്റിന്റെ പശ്ചാത്തലത്തില്‍ നിവേശകരീതികളെപ്പറ്റി ഒരു വിശകലനത്തിന് ശ്രമിയ്ക്കുന്നു

മലയാളം എഴുതാന്‍ നല്ലത് ഇന്‍സ്ക്രിപ്റ്റ്, വരമൊഴി എന്നിവയിലേത് ഉപയോഗിയ്ക്കണമെന്ന് വിശകലനം ചെയ്യുന്നത് എവിടെയും എത്താത്ത ഇടുങ്ങിയ വിശകലനമായിരിയ്ക്കും. നിവേശകരീതികളെ ഞാന്‍ വേറൊരു രീതിയിലാണ് തരംതിരിയ്ക്കാനിഷ്ടപ്പെടുന്നത്.

  1. നോണ്‍ഫൊണറ്റിക് – ശബ്ദാത്മകം അല്ലാത്തത്.
  2. ഫൊണറ്റിക് – ശബ്ദാത്മകം നോണ്‍ഫൊണറ്റിക് – ശബ്ദാത്മകം അല്ലാത്തത് ഇംഗ്ലീഷ് അക്ഷരങ്ങള്‍ ഉള്ള ഒരു കീബോര്‍ഡ് ഉപയോഗിയ്ക്കുമ്പോള്‍ ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ ഫൊണറ്റിക് മൂല്യങ്ങളോട് ഒട്ടും ചേരാതെ ഒരു ഭാഷയിലെ അക്ഷരങ്ങളെ മാപ്പ് ചെയ്യുന്ന നിവേശകരീതികളെ ഇങ്ങനെ വിശേഷിപ്പിയ്ക്കാം. ഇന്‍സ്ക്രിപ്റ്റാണ് ഇതിന്റെ നല്ല ഉദാഹരണം. L എന്ന കീയുടെ സ്ഥാനത്ത് ത , ഥ എന്നീ അക്ഷരങ്ങളെ ചേര്‍ക്കുമ്പോള്‍ സംഭവിയ്ക്കുന്നത് , കീബോര്‍ഡില്‍ മലയാളം കട്ടകളാണെന്ന് മനസ്സില്‍ വിചാരിച്ച് ടൈപ്പ് ചെയ്യണം എന്നാണ്. ഈ മാപ്പിങ്ങ് ഇങ്ങനെ മനസ്സില്‍ വിചാരിയ്ക്കാന്‍ പഠിയ്ക്കുന്നതിനെ ഇന്‍സ്ക്രിപ്റ്റ് ടൈപ്പിങ്ങ് പഠനം എന്ന് നമുക്ക് പറയാം. നമുക്കറിയാം ഈ പഠനം സമയമെടുക്കുന്നതിന്റെ കാരണം, L ന്റെ ലയുടെ അടുത്തു വരുന്ന ഫൊണറ്റിക് സവിശേഷത തയുടെയോ , ഥയുടെയോ അടുത്തെവിടെയും വരാത്തതാണ്. ഈ ബുദ്ധിമുട്ടിന്റെ പശ്ചാത്തലമായി മലയാളത്തിന് പൊതുവേ ഭാരതീയ ഭാഷകള്‍ക്കൊക്കെയുള്ള എഴുതുന്നതു പോലെ വായിയ്ക്കുന്നതും , ഒരക്ഷരവും അതിനു മാത്രം സ്വന്തമായ ഉച്ചാരണവുമെന്ന പ്രത്യേകതയുണ്ട്. ഭാഷാവിദഗ്ധര്‍ ഇതിനെ one to one grapheme to phonetic mapping എന്നു പറയും. ഇന്‍സ്ക്രിപ്റ്റ് രൂപകല്പന ചെയ്തിരിയ്ക്കുന്നത് പ്രാഥമികമായി ഭാരതീയ ഭാഷകള്‍ ഉപയോഗിയ്ക്കുന്ന ഒരു ഉപയോക്താവിനെ മനസ്സില്‍ കണ്ടു കൊണ്ടാണ്. ആ ഭാഷ മാത്രമായി ഉപയോഗിയ്ക്കുന്ന ഒരാള്‍ക്ക് ഇംഗ്ലീഷ് കട്ടകള്‍ക്ക് പകരം സ്വന്തം ഭാഷയിലെ അക്ഷരങ്ങളാണ് കീബോര്‍ഡില്‍ വേണ്ടതെന്ന സങ്കല്‍പവും ഉണ്ട്. അക്ഷരങ്ങളെ കീബോര്‍ഡില്‍ വിന്യസിയ്ക്കുമ്പോള്‍ ഇംഗ്ലീഷ് അനുവര്‍ത്തിച്ചിരിയ്ക്കുന്ന ശാസ്ത്രീയതയും അതിനുണ്ട്. ഒരു ഭാഷ ടൈപ്പ് ചെയ്യാന്‍ പഠിച്ചാല്‍ ബാക്കി എല്ലാ ഭാരതീയ ഭാഷകളും വിഷമം കൂടാതെ പഠിയ്ക്കാമെന്നുള്ള പ്രത്യേകതയുണ്ട്. ഇന്‍സ്ക്രിപ്റ്റ് എന്ന സ്റ്റാന്‍ഡേര്‍ഡ് മറ്റു നിവേശകരീതികളെ അപേക്ഷിച്ച് കുറച്ചുകൂടി ഉറച്ചതാണെന്ന് വാദവും ഉണ്ട്.

ഫൊണറ്റിക് – ശബ്ദാത്മകം ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ സാമാന്യമായ ഫൊണറ്റിക് സവിശേഷതകളുടെ സ്വന്തം ഭാഷയിലേയ്ക്കുള്ള പകര്‍ത്തലിലൂടെയുള്ള കീബോര്‍ഡ് വിന്യാസത്തെയാണ് ഇതുകൊണ്ട് അര്‍ത്ഥമാക്കുന്നത്. ഇത്തരം കീ വിന്യാസങ്ങളെ വീണ്ടും രണ്ട് രീതിയില്‍ തരംതിരിയ്ക്കാം.

a) ലിപ്യന്തരണം അടിസ്ഥാനമാക്കിയുള്ളത്: നമ്മുടെ ഭാഷയുടെ ഉച്ചാരണത്തെ ലാറ്റിന്‍ ലിപികള്‍ കൊണ്ട് പ്രതിനിധാനം ചെയ്യിയ്ക്കുന്ന രീതിയാണ് ഇത്. മലയാളം എന്നത് malayaalam എന്ന് എഴുതുന്ന വിദ്യ. ഈ വിധത്തിലുള്ള പൊതുവില്‍ അറിയപ്പെടുന്ന കുറച്ച് നിവേശകരീതികള്‍ പറയാം. ഇത് ഇത്തരംനിവേശകരീതികളുടെ ഒരു മുഴുവന്‍ ലിസ്റ്റല്ല. ഉദാഹരണത്തിന് ചിലത് പറയുന്നുവെന്നു മാത്രം.

  1. വരമൊഴി/മൊഴി കീമാപ്പ്: മലയാളികള്‍ക്ക് ഇതിന് യാതൊരു പരിചയപ്പെടുത്തലിന്റെയും ആവശ്യമുണ്ടെന്ന് തോന്നുന്നില്ല
  2. സ്വനലേഖ : ഗ്നു ലിനക്സ് പ്രവര്‍ത്തക സംവിധാനങ്ങള്‍ക്കായി ഞാന്‍ തന്നെ എഴുതിയ ഫ്ലെക്സിബിള്‍ കീമാപ്പിങ്ങ് ഉള്ള നിവേശകരീതി. ഏറെക്കുറെ മൊഴി കമ്പാറ്റിബിള്‍ ആണ്. കൂടാതെ ടൈപ്പ് ചെയ്യുമ്പോള്‍ എഴുതിയ ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ കോമ്പിനേഷനനുസരിച്ചുള്ള സാധ്യമായ എല്ലാ മലയാളം അക്ഷരങ്ങളും കഴ്സറിനടിയില്‍ മെനുവായി വന്നുകൊണ്ടിരിയ്ക്കും. അതുകൊണ്ട് കൃത്യമായി ട്രാന്‍സ്ലിറ്ററേഷന്‍ നിയമങ്ങള്‍ അറിയണമെന്നില്ല. കോപി പേസ്റ്റ് കൂടാതെ എല്ലാ അപ്ലിക്കേഷനുകളിലും നേരിട്ട് ടൈപ്പ് ചെയ്യാം. മലയാളത്തിന് പുറമേ ബംഗാളി, ഗുജറാത്തി, കന്നഡ, പഞ്ചാബി, ഹിന്ദി, തെലുഗ്, ഒറിയ എന്നി ഭാഷകളിലും ഇത് ടെസ്റ്റിങ് സ്റ്റേജിലുണ്ട്.
  3. ഐട്രാന്‍സ് ITRANS കുറച്ച് വ്യത്യസ്തമായ ലിപ്യന്തരണം ഉപയോഗിയ്ക്കുന്ന നിവേശകരീതി
  4. ബരാഹ IME ഇന്ത്യന്‍ ഭാഷകള്‍ക്ക് ഉള്ള ട്രാന്‍സ്ലിറ്ററേഷന്‍ രീതി. സ്കിം നിവേശകരീതിയായി ഇത് മലയാളത്തിനും ലഭ്യമാണങ്കിലും ആരും ഉപയോഗിച്ചു കണ്ടിട്ടില്ല. മേല്‍പ്പറഞ്ഞവ കൂടാതെ അധികമാരും അറിയപ്പെടാതെ കിടക്കുന്ന വെബ്, പ്രൊപ്രൈറ്ററി നിവേശകരീതികളും ധാരാളം ഉണ്ട്. കുറച്ചു കൂടി ഇന്റലിജന്റ് ആയി ട്രാന്‍സ്ലിറ്ററേഷനില്‍ മെഷീന്‍ ലേണിങ് എന്ന വിദ്യ ഉപയോഗിച്ച് കൊണ്ടുള്ള ഗൂഗിളിന്റെ ട്രാന്‍സ്ലിറ്ററേറ്റ് എന്ന വെബ് അപ്ലിക്കേഷനും ഉണ്ട്. ഗൂഗിള്‍ ട്രാന്‍സ്ലിറ്ററേറ്റിന്റെ എല്ലാ ഫീച്ചറുകളും ഉള്ള ഡെസ്ക്ടോപ്പ് അപ്ലിക്കേഷനായ സുലേഖ എന്ന എഡിറ്റര്‍ തയ്യാറായി വരുന്നുണ്ട്. ട്രാന്‍സ്ലിറ്ററേഷന്‍ എന്നതിന് ആസ്കിയോളം തന്നെ പഴക്കമുണ്ട്. കീബോര്‍ഡിലൊതുക്കാന്‍ പറ്റാവുന്നതിനേക്കാളേത്രയോ അക്ഷരങ്ങളുള്ള ചൈനീസ് , ജപ്പാനീസ് , കൊറിയന്‍ ഭാഷകള്‍ക്ക് ഇത് പണ്ടേ നിലവിലുണ്ടത്രേ. ഈ ഭാഷകള്‍ക്ക് വേണ്ടിയാണ് ഗ്നു ലിനക്സിലെ സ്കിം വന്നതെങ്കിലും ഇപ്പോള്‍ മിക്ക ഭാഷകള്‍ക്കും അത് ഉപയോഗിയ്ക്കുന്നുണ്ട്.

b) ഇന്‍സ്ക്രിപ്റ്റ് രീതിയില്‍ അഴിച്ചുപണി നടത്തിക്കൊണ്ട് അതിന്റെ ഫൊണറ്റിക് മാപ്പിങ്ങ് കറക്ട് ചെയ്തു കൊണ്ടുള്ള കീബോര്‍ഡ് ലേയൗട്ടുകള്‍ : ഹിന്ദിയിലെ ബോല്‍നാഗരി, അതിനെ അടിസ്ഥാനമാക്കിക്കൊണ്ട് മലയാളത്തിലുള്ള ലളിത എന്നിവ ഇതിനുദാഹണം. ലളിതയില്‍ L എന്ന കീ ല, ള എന്നിവയ്ക്ക് മാപ്പ് ചെയ്തിരിയ്ക്കുന്നു.

ഇനി ഇത് ഏത് ഉപയോഗിയ്ക്കണം എന്ന ചര്‍ച്ചയിലേക്ക് കടക്കാം. ഞാനിതിനെ എഴുതുന്നയാള്‍, എഴുതുന്നത് എന്നീ രണ്ട് കോണുകളിലൂടെ നോക്കിക്കാണാന്‍ ശ്രമിയ്ക്കുന്നു

എഴുതുന്നയാള്‍: ഇംഗ്ലീഷ് അക്ഷരങ്ങള്‍ ലേഖനം ചെയ്ത ഒരു കീബോര്‍ഡിന്റെ മുന്നിലിരിയ്ക്കുന്ന ഒരാള്‍ ആരൊക്കെയായിരിയ്ക്കാം?

  1. ഒരു സാദാ മലയാളി. അയാള്‍ക്ക് “ABCD” അറിയാം. Palakkad എന്നത് പാലക്കാട് എന്ന് വായിക്കാനറിയാം. ഇംഗ്ലീഷ് അക്ഷരങ്ങള്‍ പഠിയ്ക്കുമ്പോള്‍ സ്വന്തം പേര് suresh എന്നോ meera എന്നോ എഴുതാന്‍ പഠിച്ചവന്‍(ള്‍). കൂട്ടുകാരുടെ പേരുകള്‍ മലയാളത്തില്‍ പറഞ്ഞാല്‍ ഇംഗ്ലീഷില്‍ എങ്ങനെ എഴുതണമെന്ന് ഏകദേശം പറയാനറിയുന്നവന്‍…കടയിലേക്ക് സാധനങ്ങള്‍ വാങ്ങാന്‍ പോകുമ്പോള്‍ payar, paripp, pappadam എന്നൊക്കെ തുണ്ടു കടലാസില്‍ എഴുതാനറിയുന്നവന്‍ .. കടകളുടെ ബോര്‍ഡില്‍ Maya jwellery എന്ന് കണ്ടാല്‍ വായിക്കാനറിയുന്നവന്‍…5 ഇംഗ്ലീഷ് വാക്കുകള്‍ എഴുതാന്‍ പറഞ്ഞാല്‍ 2 എണ്ണമെങ്കിലും തെറ്റി എഴുതുന്നവന്‍. കമ്പ്യൂട്ടര്‍ ഉപയോഗിയ്ക്കുന്ന ഇത്രയൊക്കെ വിദ്യാഭ്യാസയോഗ്യതയുള്ള ഒരാളെ നമുക്ക് ബേസ് ആയി എടുക്കാം. ബാക്കിയുള്ളവര്‍ എല്ലാം ഇദ്ദേഹത്തിന്റെ പരിഷ്കരിച്ച പുരോഗമിച്ചവര്‍. ഇദ്ദേഹത്തിന് മലയാളം മംഗ്ലീഷ് ഉപയോഗിച്ച് ടൈപ്പ് ചെയ്യാന്‍ ബുദ്ധിമുട്ടാകും എന്ന് ആര്‍ക്കെങ്കിലും തോന്നുണ്ടോ? അതേ സമയം ഇദ്ദേഹത്തിനെ ഇന്‍സ്ക്രിപ്റ്റ് പഠിയ്ക്കാന്‍ മുന്‍പത്തേക്കാളും എളുപ്പം ആയിരിയ്ക്കും എന്ന് ആര്‍ക്കെങ്കിലും തോന്നുണ്ടോ?
  2. മലയാളം നിത്യജീവിതത്തിന്റെ ഭാഗമായി ഉപയോഗിയ്ക്കേണ്ടി വരുന്ന ഒരു ഡി ടി പി സെന്റര്‍ ജോലിക്കാരന്‍ , ഭാഷാഗവേഷണം നടത്തുന്നവര്‍, മലയാളം ടൈപ്പിങ് പാഠ്യപദ്ധതിയുടെ ഭാഗമായി പഠിയ്ക്കുന്ന ഒരു വിദ്യാര്‍ത്ഥി – ഇവര്‍ക്ക് ഇന്‍സ്ക്രിപ്റ്റ് ആണ് ഏറ്റവും യോജിച്ചത്. ഇന്‍സ്ക്രിപ്റ്റ് പഠിയ്ക്കുന്നതിന്റെ മൂല്യ വര്‍ദ്ധനവ് അവര്‍ക്ക് ലഭ്യമാകും, ആയാസരഹിതമായ മലയാളം ഉപയോഗത്തിന് രൂപകല്പന ചെയ്തിരിയ്ക്കുന്ന ഇന്‍സ്ക്രിപ്റ്റ് കീ വിന്യാസത്തിന്റെ ഗുണഫലങ്ങള്‍ അവര്‍ക്ക് കിട്ടുന്നു.
  3. ഒരു ഐടി പ്രൊഫഷണല്‍ – തൊഴിലിന്റെ ഭാഗമായി ധാരാളം ഇംഗ്ലീഷും അതിനിടയ്ക്ക് മലയാളവും ഉപയോഗിക്കേണ്ടി വരുന്ന ഒരാള്‍- പഠിയ്ക്കാന്‍ സമയം മെനക്കെടുത്താന്‍ മനസ്സിലാത്തവന്‍- ഇവര്‍ ഏതുപയോഗിയ്ക്കും.മംഗ്ലീഷ് ഉപയോഗിച്ചാല്‍ ഇംഗ്ലീഷ് ടൈപ്പിങ്ങ് സ്പീഡിന്റെ അതേ വേഗത തന്നെ മലയാളം ടൈപ്പ് ചെയ്യാനും ഉപയോഗിയ്ക്കാമെങ്കില്‍ എന്തിന് മടിയ്ക്കണം?

എഴുതുന്നത്: എഴുതുന്നത് എങ്ങനെയാണെങ്കിലും മലയാളം തന്നെ!. ഇന്‍സ്ക്രിപ്റ്റും ട്രാന്‍സ്ലിറ്ററേഷനും, ഫൊണറ്റികും തമ്മിലുള്ള വേര്‍തിരിവ് അക്ഷരങ്ങളെ മാപ്പ് ചെയ്യുന്നത് സോഫ്റ്റ്‌വെയറോ അതോ നമ്മളോ എതാണ് എന്ന് പറഞ്ഞാല്‍ നിങ്ങള്‍ സമ്മതിയ്ക്കുമോ? ഇംഗ്ലീഷ് കീബോര്‍ഡിന്റെ മുന്നിലിരിയ്ക്കുന്ന നിങ്ങള്‍ L എന്ന കീ അടിച്ചാല്‍ ത വരും എന്ന് തീരുമാനിയ്ക്കുന്നത്/അറിയുന്നത് നിങ്ങളുടെ മനസ്സ് നടത്തുന്ന മാപ്പിങ്ങിലൂടെ . പോട്ടെ, കീകളുടെ മുകളില്‍ മലയാളം എഴുതി ഒട്ടിച്ചു വച്ചുവെന്നിരിയ്ക്കട്ടെ. അപ്പോളും സംഭവിയ്ക്കുന്നതെന്ത്? നിങ്ങള്‍ L അമര്‍ത്തുമ്പോള്‍ സോഫ്റ്റ്‌വെയറിന് കിട്ടുന്നത് ത അല്ലല്ലോ. L ന്റെ കീ കോഡല്ലേ. അത് XKB തുടങ്ങിയവ തയുടെ യുണിക്കോഡിലേയ്ക്ക് മാറ്റുമ്പോളല്ലേ ത വരുന്നത്? അവിടെ നടക്കുന്നതും ഒരു മാപ്പിങ്ങ്! ട്രാന്‍സ്ലിറ്ററേഷനും അത്തരം ഒരു മാപ്പിങ് തന്നെ. അതുകൊണ്ട് മലയാളം ഇംഗ്ലീഷ് ഉപയോഗിച്ച് ടൈപ്പ് ചെയ്താല്‍ മലയാളഭാഷയ്ക്ക് വല്ലതും സംഭവിയ്ക്കും എന്നതിന് ഒരു കഴമ്പുമില്ല. വായിക്കുന്നതും എഴുതുന്നതും മലയാളം തന്നെ. എഴുതാനുള്ള ടൂള്‍ എന്ന് മാത്രം ഇവയെ പരിഗണിച്ചാല്‍ പോരേ? ഇനി കീ സ്ട്രോക്സിന്റെ എണ്ണം കണക്കിലെടുക്കാം. അകാരത്തിലവസാനിയ്ക്കുന്ന (ക, ഖ, ച യ …) അക്ഷരങ്ങള്‍ക്ക് ഫൊണറ്റിക്, ഇന്‍സ്ക്രിപ്റ്റ് എന്നിവയില്‍ ഒരു കീ സ്ട്രോക് മതിയാകുമ്പോള്‍ ട്രാന്‍സ്ലിറ്ററേഷനില്‍ രണ്ട് കീ സ്ട്രോക് വേണം ക(1) -> ka(2) യ(1) -> ya(2) പക്ഷേ ക് (2) -> k(1) വ് (2) -> v(1) ഇ, ഉ, എ, ഒ എന്നീ സ്വരചിഹ്നങ്ങളില്‍ അവസാനിയ്ക്കുന്നവയ്ക്ക് മിക്കപ്പോഴും ട്രാന്‍ലിറ്ററേഷനിലും ഇന്‍സ്ക്രിപ്റ്റ്/ഫൊണറ്റിക് എന്നിവയിലും കീ സ്ട്രോക് എണ്ണം തുല്യമാണെന്ന് കാണാം കി (2) -> ki(2) വി (2) -> vi (2)

കൂട്ടക്ഷരങ്ങളെക്കുറിച്ചും ചില്ല് അനുസ്വാരം തുടങ്ങിയവ അടങ്ങിയ വാക്കുകള്‍ക്ക് എത്ര കീ സ്ട്രോക്ക് വേണം എന്നതിനെ കുറിച്ച് നല്ല ഒരു പഠനം നടത്തേണ്ടിയിരിയ്ക്കുന്നു. ആള്‍ട്ട്, ഷിഫ്റ്റ്, കണ്ട്രോള്‍ എന്നിവ ഉപയോഗിച്ചുള്ള കീബോര്‍ഡ് ലേയൗട്ടുകളില്‍ ഇത്തരം പഠനം നടത്തുമ്പോള്‍ ആ മോഡിഫയര്‍ കീ കൂടി എണ്ണണമെന്നാണ് എന്റെ പക്ഷം. മറ്റുപല കാര്യങ്ങള്‍ കൂടി പരിഗണിയ്ക്കണം. ഉദാഹരണം ക്ക = ക+ ് + ക , kka ഇവിടെ ഒരു കീ രണ്ടു പ്രാവശ്യം ടൈപ്പ് ചെയ്യുന്നതും വ്യത്യസ്തങ്ങളായ രണ്ട് കീ ടൈപ്പ് ചെയ്യുന്നതും ഒരേ പോലെ പരിഗണിയ്ക്കാമോ? ഒരു കീ രണ്ട് തവണ ടൈപ്പ് അടുപ്പിച്ച് ടൈപ്പ് ചെയ്യുന്നത് കൂടുതല്‍ എളുപ്പമല്ലേ?

ചുരുക്കിപ്പറഞ്ഞാല്‍ ഏത് ഉപയോഗിയ്ക്കണമെന്ന് തീരുമാനിയ്ക്കുന്നത് എന്തിനുവേണ്ടി ഉപയോഗിയ്ക്കുന്നു, ആരു് ഉപയോഗിയ്ക്കുന്നു എന്നീ ഘടകങ്ങളെ ആശ്രയിച്ചിരിയ്ക്കുന്നു. ഇവയെ പരിഗണിയ്ക്കാതെ ഏതെങ്കിലും ഒന്നാണ് നല്ലതെന്ന് പറയുന്നത് യുക്തിസഹമല്ല.

പക്ഷേ, വളരെ കണിശമായി ഏത് ഇന്‍പുട്ട് സ്കീം ഉപയോഗിച്ചാലും പരിഗണിയ്ക്കേണ്ട ഒരു ഘടകം എനിയ്ക്ക് ചൂണ്ടിക്കാണിയ്ക്കാനുണ്ട്. അത് എന്‍കോഡിങ് കൃത്യതയാണ്. ഏത് ഇന്‍പുട്ട് സ്കീം ഉപയോഗിച്ചാലും, എന്ത് ലോജിക്ക് ഉപയോഗിച്ചാലും, ഉപയോക്താവിന് എളുപ്പമാവാന്‍ വേണ്ടി എന്ത് സങ്കേതം ഉപയോഗിച്ചാലും അതിന്റെയൊക്കെ ഔട്ട്പുട്ട് ആയി വരുന്ന മലയാളം ഒന്നായിരിയ്ക്കണം. അത് ഇന്‍സ്ക്രിപ്റ്റ് ഉപയോഗിച്ചെഴുതിയ മലയാളത്തിന് തുല്യമാകണം. ഓരോ മലയാളം അക്ഷരത്തിനും യുണിക്കോഡ് അനുശാസിയ്ക്കുന്ന കോഡ് പോയിന്റ് തന്നെ വരണം. ഒന്നും അധികവും കുറവും ആകരുത്. നിര്‍ഭാഗ്യവശാല്‍ വരമൊഴിയുടെയും, മൊഴിയുടെയും എന്‍കോഡിങ്ങ് പിഴവുകള്‍ മൂലം നമ്മുടെ ബ്ലോഗുകളിലെയും വിക്കിപ്പീഡിയയിലെയും ഉള്ളടക്കം പലവാക്കുകളെയും പിശകുള്ളതായിരിക്കുന്നത് അറിഞ്ഞു കാണുമോ? വരമൊഴിയില്‍ എഴുതിയ എന്റെ പേര് ഇന്‍സ്ക്രിപ്റ്റിലെഴുതിയ പേരില്‍ നിന്ന് 24 ബിറ്റ് വ്യത്യാസത്തിലാണ്. ഈ ബഗ്ഗിനെപ്പറ്റി ഞാന്‍ ഇവിടെ എഴുതിയിട്ടുണ്ട്. അതുകൊണ്ട് ഏത് ഇന്‍പുട്ട് മെത്തേഡ് എന്നത് ഒരോരുത്തരുടെയും ഇഷ്ടത്തിന് വിടാം. പക്ഷേ ആ ഇന്‍പുട്ട് മെത്തേഡുകള്‍ ഉണ്ടാക്കുന്ന മലയാളങ്ങള്‍ തമ്മില്‍ യാതൊരു വ്യത്യാസവുമുണ്ടാവരുത്. [ഈ ലേഖനം വളരെ കുറച്ച് സമയം എടുത്ത് എഴുതിയതാണ്. കുറച്ചു കൂടി കാര്യങ്ങള്‍ പിന്നീട് ഉള്‍പ്പെടുത്താം]

comments powered by Disqus