Skip to content


ആണവചില്ലും സ്പൂഫിങ്ങും

ന്‍, ര്‍,ല്‍, ള്‍,ണ്‍ എന്നീ ചില്ലക്ഷരങ്ങള്‍ക്ക് ഇപ്പോളുള്ള യഥാക്രമം ന+ചന്ദ്രക്കല+ZWJ, ര+ചന്ദ്രക്കല+ZWJ ,ല+ചന്ദ്രക്കല+ZWJ ,ള+ചന്ദ്രക്കല+ZWJ ണ+ചന്ദ്രക്കല+ZWJ എന്നീ യൂണിക്കോഡ് എന്‍‌കോഡിങ്ങിനു് പകരം ഒരൊറ്റ കോഡ് പോയിന്റ് മാത്രം ഉപയോഗിക്കുന്നതിനെയാണ് ആണവചില്ലു് അഥവാ അറ്റോമിക് ചില്ലെന്നു പറയുന്നത്. ഈ വസ്തുത എല്ലാവര്‍ക്കുമറിയാമെന്നു വിചാരിക്കുന്നു. ഇതെങ്ങനെ സ്പൂഫിങിന് കാരണമാകും എന്ന് വിശദമാക്കുകയാണ് ഈ ലേഖനത്തിന്റെ വിഷയം. പലര്‍ക്കുമറിയാവുന്ന കാര്യമായിരിയ്ക്കും. എന്നാലും അറിയാത്തവരുടെ അറിവിലേയ്ക്കായി എഴുതുന്നു.

ആദ്യം സ്പൂഫിങ് എന്താണെന്നു് ആദ്യം നോക്കാം
ഒരു പോലെയെന്നു് തോന്നിക്കുന്ന വിലാസം ഉള്ള വ്യാജസൈറ്റുകളുണ്ടാക്കുന്നതിനെയാണു് സ്പൂഫിങ് എന്നതുകൊണ്ട് ഉദ്ദേശിക്കുന്നതു്. ഇതിനെക്കുറിച്ച് വിശദമായി Spoofed URL,Spoofing Attack എന്നീ വിക്കിപ്പീഡിയ പേജുകളില്‍ നിന്നു് മനസ്സിലാക്കാം. ഇത്തരം തട്ടിപ്പുകളിലൂടെ ഉപയോക്താക്കളെ വ്യാജസൈറ്റിലേക്കു് ആ‍കര്‍ഷിച്ചു് പണം തട്ടുന്നത് പതിവാ‍ണു്. ICICI Bank ഉപയോക്താക്കളോട് സ്പൂഫിങ്ങിനെക്കുറിച്ചു് മുന്നറിയിപ്പു നല്‍കുന്ന ഈ പേജ് കാണൂ..

ആണവ് ചില്ലു് വരുമ്പോള്‍ നമ്മുടെ ചില്ലക്ഷരങ്ങളെല്ലാം രണ്ടു് രീതിയില്‍ എന്‍‌കോഡ് ചെയ്യപ്പെടും. യൂണിക്കോഡിന്റെ ബാക്ക്‌വേര്‍ഡ് കമ്പാറ്റിബിലിറ്റി നയമനുസരിച്ചു് നിലവിലുള്ള തരം ചില്ലു് കോഡുകളും, അറ്റോമിക് ചില്ലുകളും വരും. ഇതിലേതു് ഉപയോഗിച്ചാലും കാഴ്ചയില്‍ ഒരു പോലിരിയ്ക്കും. തിരിച്ചറിയാന്‍ പറ്റില്ല.

സര്‍ക്കാര്‍.com എന്ന ഒരു സൈറ്റ് ഉണ്ടെന്നിരിയ്ക്കട്ടെ. ഇതു് 4 പേര്‍ക്കു് രജിസ്റ്റര്‍ ചെയ്യാന്‍ പറ്റും യഥാര്‍ത്ഥ സൈറ്റ് നിലവിലെ ചില്ലുപയോഗിച്ചു് സര്‍ക്കാര്‍.com എന്നു രജിസ്റ്റര്‍ ചെയ്തു എന്നിരിക്കട്ടെ.താഴെപ്പറയുന്നവയാണ് സ്പൂഫ് ചെയ്ത വ്യാജന്മാര്‍
1. സ[അറ്റോമിക് ര്‍]ക്കാ[നിലവിലെ ര്‍].com
2. സ[നിലവിലെ ര്‍]ക്കാ[അറ്റോമിക് ര്‍].com
3. സ[അറ്റോമിക് ര്‍]ക്കാ[അറ്റോമിക് ര്‍].com
കണ്ടാല്‍ ഒരുപോലെയിരിയ്ക്കുന്ന മൂന്നു് വ്യാജന്മാര്‍!
ഇതു പോലെ ഫെഡറല്‍ബാങ്ക് 2 പേര്‍ക്കു രെജിസ്റ്റര്‍ ചെയ്യാം. അങ്ങനെയങ്ങനെ…
ഇതിന്റെ ഒരു ഡെമോണ്‍സ്ട്രേഷന്‍ റാല്‍മിനോവ് ചെയ്തിട്ടുണ്ടു്
site 1: http://റാല്‍മിനോവ്.blogspot.com
site 2: http://റാൽമിനോവ്.blogspot.com [അറ്റോമിക് ചില്ലു്]

വ്യാജന്മാരുടെ ചാകര എന്ന പോസ്റ്റും കാണുക.

Posted in Malayalam.


25 Responses

Stay in touch with the conversation, subscribe to the RSS feed for comments on this post.

  1. അങ്കിള്‍ says

    അപ്പോഴേ സന്തോഷ്‌, ഈ അപകടം ചൂണ്ടി കാണിച്ച്‌ രണ്ടിലേതെങ്കിലും ഒരു തരത്തിലുള്ള ചില്ലുകളേ നടപ്പില്‍ വരുത്താവൂ എന്ന്‌ ആരോടാണ് പറയേണ്ടത്‌, പരഞ്ഞാല്‍ നടപ്പില്‍ വരുത്തൂല്ലേ? Backward compatibility വേണമെങ്കില്‍ നിലവിലുള്ള ചില്ലുകള്‍ ആവശ്യമാണ്. എന്നാല്‍ ആണവ ചില്ല്‌ വേണ്ടെന്നു വച്ചു കൂടേ. ഓ, അപ്പോള്‍ ZWJ ആവശ്യമായി വരുന്നു അല്ലേ.

  2. evuraan says

    സന്തോഷേ,

    ഒരു സംശയം ചോദിച്ചോട്ടെ:

    ഐ.ഡി.എന്. സ്പൂഫിംഗിനുള്ള സാദ്ധ്യത കൂട്ടാന്‌‌ ആണവ ചില്ലുതകും എന്നാണോ? ചില്ലേതായാലും zwnj തരം പോലെ തിരുകികയറ്റിയാലും സ്പൂഫിംഗ്ഗ് ചെയ്യാമല്ലോ? താഴെ കാണുന്ന “സര്ക്കാര്” കാണൂ.

    1) സര്ക്കാര് – U+0D38 U+0D30 U+0D4D U+0D15 U+0D4D U+0D15 U+0D3E U+0D30 U+0D4D
    2) സര്‌‌‌‌ക്കാര് – U+0D38 U+0D30 U+0D4D U+200C U+200C U+200C U+200C U+0D15 U+0D4D U+0D15 U+0D3E U+0D30 U+0D4D
    3)സ‌‌‌‌ര്‌‌‌‌ക്കാര് – U+0D38 U+200C U+200C U+200C U+200C U+0D30 U+0D4D U+200C U+200C U+200C U+200C U+0D15 U+0D4D U+0D15 U+0D3E U+0D30 U+0D4D
    4) സര്‌‌‌‌ക്കാ‌‌‌‌‌‌ര് – U+0D38 U+0D30 U+0D4D U+200C U+200C U+200C U+200C U+0D15 U+0D4D U+0D15 U+0D3E U+200C U+200C U+200C U+200C U+200C U+200C U+0D30 U+0D4D

    യൂ.ആര്,എല്. സ്പൂഫിംഗ് ഒഴിവാക്കേണ്ടത് യൂണീകോഡിന്റ്റെ ബാദ്ധ്യത ആണോ? അല്ല എന്ന് എന്റ്റെ പക്ഷം.

    സ്പൂഫിംഗ്/ ഫിഷിങ്ങ് തുടങ്ങിയതൊക്കെ ഒഴിവാക്കുക എന്നത് ബ്രൗസറുകളുടെയും മറ്റും ബാദ്ധ്യ‌‌തയല്ലേ?

  3. Ralminov റാല്‍മിനോവ് says

    ഏവൂരാനു് കാര്യം മനസ്സിലാകായ്കയില്ല എന്നു് കരുതാം. എന്നാലിതു് വായിക്കാനിടവരുന്ന മറ്റുള്ളവരുടെ അറിവിലേക്കായി:
    ജോയ്നറും നോണ്‍ജോയ്നറും ഇന്നു് എത്രയെണ്ണം ഇട്ടാലും സ്പൂഫിങ് നടക്കില്ല.കാരണം ഐഡിയെന്‍ അവ കളയും. പിന്നെ കാഴ്ചയ്ക്ക് പല സൈറ്റുകളുണ്ടാക്കാം, പക്ഷെ അവയൊക്കെ ഒരു സൈറ്റിലേക്കേ പോകൂ. ഇതിനെ സ്പൂഫിങ് എന്നല്ല പറയുക. നമ്മുടെ വന്യവനിക മറന്നിട്ടില്ലല്ലോ.

    ഏവൂരാന്‍ താങ്കള്‍ കൊടുത്ത കോഡുകള്‍ പ്രകാരം ഒന്നില്‍ കൂടുതല്‍ സൈ​റ്റുകള്‍ റെജിസ്റ്റര്‍ ചെയ്യാന്‍ സാധിക്കില്ല, കാരണം അവയുടെ എല്ലാം Punycode ഒന്നാണു്.എന്നാല്‍ ചില്ലു് വന്നാല്‍ കഥ മാറി. ആണവചില്ലുള്ളവയ്ക്കു് Punycode വേറെയാണു്.

  4. evuraan says

    നന്ദി റാല്മിനോവേ..!

    അറിയായ്ക തന്നെയായിരുന്നു. പ്യൂണീകോഡെന്ന സംഭവത്തെക്കുറിച്ച് താങ്കളുടെ കമന്റ്റിനു മുമ്പ് അറിവില്ലായിരുന്നു.

    നന്ദി. ഐ നൌ സ്റ്റാന്ഡ് കറക്ടഡ്.

  5. Santhosh Thottingal സന്തോഷ് തോട്ടിങ്ങല്‍ says

    അങ്കിള്‍, യൂണിക്കോഡ് റ്റെക്നിക്കല്‍ കമ്മിറ്റിയാണ് തീരുമാനമെടുക്കുന്നതു്. ഇതിനെപ്പറ്റി ധാരാളം എതിര്‍പ്പുകള്‍ യൂണീക്കോഡിന്റെ ഇന്‍ഡിക് മെയിലിങ് ലിസ്റ്റില്‍ വളരെയധികം പേര്‍ ഉന്നയിച്ചിരുന്നു. പക്ഷേ നമ്മുടെ ഭാഷയുടെ ഭാവിയെ നിശ്ചയിക്കുന്ന ഒരു പ്രധാനകാര്യമായിട്ടും ഭാഷാവിദഗ്ദ്ധര്‍ ഈ വിഷയത്തെപറ്റി ബോധവാന്മാരല്ല. സാങ്കേതികജ്ഞാനം ഇല്ല എന്നതാണ് ചൂണ്ടിക്കാണിക്കപ്പെടുന്നത്. ചര്‍ച്ചയില്‍ പങ്കെടുത്തവര്‍ അധികവും സാങ്കേതികരംഗത്തു നിന്നുള്ളവരും.
    അങ്ങനെയുള്ള ഈ തീരുമാനം നിരവധി പരിഹരിക്കപ്പെടാതെയുള്ള പ്രശ്നങ്ങള്‍ അവശേഷിപ്പിച്ചു് കൈക്കൊള്ളുമ്പോള്‍ മലയാളികളില്‍ വളരെയധികം പേര്‍ ഇതിനെപ്പറ്റി അറിയാതിരിക്കുന്നത് വളരെ മോശമല്ലേ? മറ്റു രാജ്യങ്ങളില്‍ നിന്നുള്ള ആളുകളുടെ ഭാഷയെപ്പറ്റിയുള്ള പരിമിത ജ്ഞാനത്തിന്റെ അടിസ്ഥാനത്തില്‍ നമ്മുടെ ഭാഷയുടെ ഭാവി തീരുമാനിക്കപ്പെടുന്നതു് എത്ര ദയനീയമാണു്?
    പ്രവീണ്‍ എഴുതിക്കൊണ്ടിരിക്കുന്ന ഇതിനെപ്പറ്റിയുള്ള ബ്ലോഗ് പോസ്റ്റുകള്‍ വായിക്കുന്നുണ്ടെന്നു വിചാരിക്കുന്നു.
    സംഗതികളുടെ കിടപ്പറിയാന്‍ ഇന്നലെ യൂണിക്കോഡ് മെയിലിങ് ലിസ്റ്റില്‍ പ്രവീണിന്റെ ചോദ്യത്തിന് James Kass എന്നൊരാള്‍ എഴുതിയ മറുപടി നോക്കൂ..
    > 4. But if you can’t forbid the existing sequences what use is the newly
    > added atomic chillus going to serve?

    A. It adds variant spellings, which is not always a good thing.
    B. It offers employment opportunities for people involved in
    file/character conversion.
    C. It offers more employment opportunities for anyone working
    in text processing, search engine technology, text display, and
    so forth because everything will need to be upgraded to support
    the new variant spellings.

  6. Santhosh Thottingal സന്തോഷ് തോട്ടിങ്ങല്‍ says

    ഐസിയുവിന്റെ ഐഡി‌എന്‍ ബ്രൌസര്‍ പേജില്‍ പോയി എങ്ങനെ പ്യൂണീക്കോഡില്‍ വ്യത്യാസം വരുന്നു എന്നു മനസ്സിലാക്കാം.

  7. അങ്കിള്‍ says

    സന്തോഷിനും റാല്‍മിനോവിനും നന്ദി. കാര്യങ്ങള്‍ ഞാനും മനസ്സിലാക്കാന്‍ ശ്രമിക്കുന്നു.

  8. N.J ജോജൂ says

    ഇത്രയും വിവരങ്ങള്‍ക്കു നന്ദി

  9. Sebin Abraham Jacob says

    സന്തോഷെ,

    ബാക്‍വേഡ് കമ്പാറ്റിബിലിറ്റി വേണമെന്നു നിര്‍ബന്ധം പിടിക്കുമ്പോഴല്ലേ, ഈ പ്രശ്നം? ചില്ലക്ഷരം എന്നല്ലേ നമ്മള്‍ പറയാറു്? അപ്പോഴവ ഒറ്റയൊറ്റ അക്ഷരങ്ങള്‍ തന്നെയല്ലേ? മറ്റു ഭാഷകളില്‍​ നിന്നു് വ്യതിരിക്തമായ മലയാളത്തിന്റെ ഒരു സ്വഭാവവും… അതിനെ സെപ്പറേറ്റ് ക്യാരക്ടറായി അംഗീരിക്കുക തന്നെയല്ലേ നല്ലതു്? മുമ്പെഴുതിയ ബ്ലോഗ് പേജുകളുടെയും വിക്കിയ തുടങ്ങിയ വിജ്ഞാന – സാങ്കേതിക പേജുകളുടെയും കാര്യത്തില്‍ വല്ല പാച്ചോ ബോട്ടോ (ഇതൊക്കെ എന്താന്നു് എന്നോടു ചോദിക്കല്ലേ…) ഒക്കെ ഉപയോഗിച്ചു് കറക്ട് ചെയ്യാനുള്ള സംവിധാനം ഒരുക്കാന്‍ മലയാളം കമ്പ്യൂട്ടിംഗു് രംഗത്തു പ്രവര്‍ത്തിക്കുന്നവര്‍ക്കു് കഴിയില്ലെന്നുണ്ടോ?

  10. pravi says

    സെബിനേ, അങ്ങനെയാണെങ്കില്‍ കൂട്ടക്ഷരം എന്നു് നമ്മള്‍ വിളിയ്ക്കുന്നവയോ? അവയും ഒറ്റ അക്ഷരമാണെന്നുണ്ടോ? എല്ലാ കൂട്ടക്ഷരങ്ങളും കൂടി ഉള്‍‌പ്പെടുത്തണമെന്നു് സെബിന്‍ പറയൂമോ?

    അറിയില്ല എന്നു് സെബിന്‍ തന്നെ സമ്മതിച്ച കാര്യം ഒരു കരുതിക്കൂട്ടിയുണ്ടാക്കുന്നൊരു പ്രശ്നത്തിനു് പരിഹാരമായി പറയുന്നതു് കാണുമ്പോള്‍ എനിയ്ക്കു് ശരിയ്ക്കും സങ്കടം വരുന്നു.

    മലയാള ഭാഷയെന്താ എല്ലാവര്‍ക്കും കയറിയിനിരങ്ങാനുള്ളിടമാണോ?

    ഞങ്ങള്‍ കുളമാക്കിത്തരാം, നിങ്ങള്‍ക്കു് കഴിവുണ്ടേല്‍ ശരിയാക്കിക്കോ എന്നാണോ?

  11. Sebin Abraham Jacob says

    പ്രവീണ്‍,

    ക്‌ക എന്നെഴുതിയാലും ക്ക ആണു് ഉദ്ദേശിക്കുന്നതു് എന്നു് മനസ്സിലാക്കാനാവും. കാരണം, രണ്ടു് ക ചേരുന്ന അക്ഷരമാണു് ക്ക. അതുകൊണ്ടാണല്ലോ കൂട്ടക്ഷരം എന്ന പ്രയോഗം.

    എന്നാല്‍ ‘വരമൊഴി മലയാള’ത്തില്‍ പഴക്കമായവര്‍ക്കല്ലാതെ ര്‌ എന്നെഴുതിയാല്‍ അതു് ചില്ലക്ഷരമാണെന്നു് പെട്ടെന്നു് പിടികിട്ടുമോ? ടൈപ്പ് റൈറ്ററില്‍ ആവശ്യത്തിനു് കീ സ്ഥാനങ്ങള്‍ ഇല്ലാഞ്ഞതുകൊണ്ടു് ഭാഷയില്‍ പല കോപ്രായങ്ങളും വരുത്തി. അതു തിരുത്താന്‍ ലഭിക്കുന്ന അവസരം കേവലം ൫൦൦൦ വിക്കി ലേഖനത്തിന്റെ പേരില്‍ ഉപേക്ഷിക്കേണ്ടതുണ്ടോ?

    ടൈപ്പു് ചെയ്യുന്നവരെ സംബന്ധിച്ചു് വ്യജ്ഞനം+്‌+zwj ഒറ്റ കീ അമര്‍ത്തിയാല്‍ കിട്ടാവുന്ന തരത്തില്‍ മാപ് ചെയ്താല്‍ ഈ സീറോവെയ്റ്റ് ക്യാരക്ടര്‍ കടന്നുവരുന്നതു് അറിയില്ല. ദാ, ഞാനിപ്പോളുപയോഗിക്കുന്ന റാല്‍മിനോവിന്റെ ആള്‍ട്ട് മോഡിഫയറുപയോഗിച്ചു വിപുലപ്പെടുത്തിയ ഇന്‍സ്ക്രിപ്റ്റ് കീബോര്‍ഡില്‍ അതാണു് ചെയ്തിരിക്കുന്നതു്. എന്നുവച്ചു്, ആ ലോജിക്‍ – എന്റെ അനുമാനത്തില്‍ തെറ്റായ ലോജിക്‍ – അവിടെ പ്രവര്‍ത്തിക്കാതിരിക്കുന്നില്ലല്ലോ.

    സ്വയമേവ കൂടിച്ചേരാനിടയില്ലാത്ത രണ്ടക്ഷരങ്ങള്‍ നിര്‍ബന്ധമായും കൂട്ടിച്ചേര്‍ക്കാനുള്ള നിര്‍ദ്ദേശം നല്‍കാനായല്ലാതെ zwjയും കൂട്ടക്ഷരമായി സ്വയമേവ മാറുന്ന രണ്ടക്ഷരങ്ങളെ ഞാന്‍ ഈ കമന്റിന്റെ തുടക്കത്തില്‍ ചെയ്തതുപോലെ നിര്‍ബന്ധമായും രണ്ടുതുണ്ടമായി നിര്‍ത്തേണ്ടിവരുന്ന അവസരങ്ങളിലൊഴികെ zwnj / nj ചന്ദ്രക്കല യും ഉപയോഗിക്കേണ്ടാത്ത അവസ്ഥയാണു് അഭികാമ്യം. വെറുതെ രേഖാഭാരം (ഫയല്‍ സൈസിനു് അങ്ങനെ പറയാമോ?) കൂട്ടാന്‍ ഇടയാക്കുന്ന ഈ അദൃശ്യസ്ഥാനഭേദികളെ എന്തിനു് സകലയിടത്തും വലിച്ചിടണം?

    പിന്നെ ള്‍, ല്‍, ര്‍, ക്‍, ന്‍, ണ്‍ എന്നിങ്ങനെ ആറുചില്ലുകളല്ലേ ഉപയോഗത്തിലുള്ളൂ? അതില്‍ തന്നെ ക്‍ വളരെ പരിമിതമായാണു് ഉപയോഗിക്കുന്നതു്. മ, യ തുടങ്ങിയ അക്ഷരങ്ങള്‍ക്കും ചില്ലുണ്ടാകാം എന്ന വാദം വെറുതെ വാദത്തിനു വേണ്ടിയുള്ള വാദമായാണു് എനിക്കു തോന്നുന്നതു്. ഇങ്ങനെ വെറും ആറക്ഷരങ്ങള്‍ കൂടി യൂണിക്കോഡ് മലയാളം അക്ഷരമാലയില്‍ സ്ഥാനംപിടിക്കുന്നതുകൊണ്ടു് ആരുടെ ഈഗോയാണു് താഴെപ്പോകുന്നതു്?

  12. pravi says

    സെബിന്‍,
    ഞാന്‍ ആണവ ചില്ലിന്റെ വിപത്തുകളെപ്പറ്റി പല പോസ്റ്റുകളായി എന്റെ ബ്ലോഗിലെഴുതിയിട്ടുണ്ടു്. അതെല്ലാമൊന്നു് വായിച്ചതിനു് ശേഷം സെബിന്‍ ഇപ്പോ പറഞ്ഞ കാര്യം ഒന്നു് കൂടി വായിച്ചു് നോക്കാമോ?

    “ചില്ലക്ഷരവും അതിന്റെ അടിസ്ഥാന അക്ഷരവും തമ്മിലുള്ള ബന്ധം നശിപ്പിയ്ക്കുന്നതു് കൊണ്ടാണു് ആണവ ചില്ലുകള്‍ സ്വീകാര്യമല്ലാത്തതു്.”

    ചില്ലക്ഷരങ്ങള്‍ അടിസ്ഥാനാക്ഷരങ്ങളല്ല എന്നതു് തന്നെയാണവ വേറെയാക്കാതിരിയ്ക്കാനുള്ള കാരണം.

    ഇനി ‘ന്‍’ എന്ന അക്ഷരത്തിനു് ‘ന’ എന്ന അക്ഷരത്തോടൊരു ബന്ധവുമില്ലെന്നാണോ? സെബിന്റെ വിശ്വാസമതാണെങ്കില്‍ ഇനി കൂടുതല്‍ പറഞ്ഞിട്ടൊരു കാര്യവുമില്ല.

  13. pravi says

    സെബിന്റെ വാക്കുകള്‍ ഇനിയും വിലയ്ക്കെടുക്കണമെങ്കില്‍ ആദ്യം ഒരു പാച്ചെന്താണു് ഒരു ബോട്ടെന്താണെന്നു് പഠിച്ചിട്ടു് വരൂ. ഇവിടെ ചില്ലക്ഷരങ്ങളെ എതിര്‍ക്കുന്ന ഓരോരുത്തരും കാര്യങ്ങള്‍ പഠിച്ചും പ്രശ്നങ്ങള്‍ മനസ്സിലാക്കിയുമാണു് പ്രതികരിയ്ക്കുന്നതു്. ഇത്രയും നിരുത്തരവാദവപരമായൊരു പെരുമാറ്റം സെബിനെങ്ങനെ ന്യായീകരിയ്ക്കാന്‍ പറ്റു?

  14. Sebin Abraham Jacob says

    പ്രവീണ്‍,

    ഇക്കാര്യത്തില്‍ പ്രവീണ്‍ പുതുതായെഴുതിയ രണ്ടുപോസ്റ്റുകളും വായിച്ചിരുന്നു. പഴയ പോസ്റ്റുകള്‍ ഉടനെ നോക്കാം. പാച്ചും ബോട്ടും എന്താണെന്നു് പഠിക്കുകയും ചെയ്യാം. ബോട്ടിനെ കുറിച്ചൊക്കെ വായിച്ചതു് മലയാളം യൂണിക്കോഡ് വിവാദം വിശദീകരിക്കുന്ന വിക്കിയ താളില്‍ നിന്നാണു്. അതില്‍ പറഞ്ഞിരിക്കുന്ന കാര്യങ്ങളില്‍ വിയോജിക്കാന്‍ യുക്തിഭദ്രമായ കാരണം കണ്ടില്ല. ഞാന്‍ സാങ്കേതിക വിദഗ്ദ്ധന്റെ കോട്ടിട്ടുകൊണ്ടല്ല, ഭാഷാ സ്നേഹിയുടെ കുപ്പായമിട്ടുകൊണ്ടാണു് സംസാരിച്ചതു്. തെറ്റുബോദ്ധ്യപ്പെട്ടാല്‍ തിരുത്താന്‍ തയ്യാറുമാണു്.

    ചില്ലക്ഷരങ്ങള്‍ക്കു് അടിസ്ഥാന രൂപങ്ങളില്ലെന്ന വാദമൊന്നും എനിക്കില്ല. എന്നാല്‍ ല്‍ എന്ന ചില്ലിന്റെ അടിസ്ഥാന രൂപം ത ആണോ ല ആണോ എന്ന തര്‍ക്കം കോഴി – മുട്ട തര്‍ക്കം പോലെ തുടരുകയാണു്. അതു് എന്തുമാകട്ടെ, ചില്ലുകള്‍ വ്യത്യസ്തമായ ഒരു ചിഹ്നമാണെന്നും നമ്മുടെ അക്ഷരവ്യവസ്ഥയില്‍ അതിനു് സവിശേഷ സ്ഥാനമുണ്ടെന്നും ഉള്ള കാര്യത്തില്‍​തര്‍ക്കമുണ്ടാവില്ലല്ലോ. ചന്ദ്രക്കല, പുള്ളി, കെട്ടുപുള്ളി, വള്ളി, കെട്ടുവള്ളി, ദീര്‍ഘം എന്നിവ പോലെ സ്വതന്ത്രമായ നിലനില്‍പ്പില്ലാത്തതും എന്നാല്‍ വ്യജ്ഞനാക്ഷരങ്ങളോടു ചേര്‍ന്നു് സ്വരസ്ഥാനം ഉത്പാദിപ്പിക്കുന്നതുമായ കേവല ചിഹ്നവുമല്ല, ചില്ല്. അതു് മറ്റൊരക്ഷരത്തോടും ചേരുന്നില്ല. സ്വതന്ത്രമായി തന്നെയാണു് നില്‍പ്പു്. ഒട്ടുപിരിച്ചെഴുതി കാട്ടാനുമാവില്ല എന്നാണു് ഞാന്‍ മനസിലാക്കിയിട്ടുള്ളതു്. ണ്‌ എന്നെഴുതിയാല്‍ ണ്‍ ആവില്ലല്ലോ.
    (ശ്ശൊ, ഇതു് ബ്ലോഗര്‍ കമന്റിലും ജിമെയിലിലും എങ്ങനെയാണാവോ കാണിക്കുക? യൂണിക്കോഡില്‍ സ്ഥിതനായിരിക്കുന്ന … എന്ന പ്രാര്‍ത്ഥനയില്‍ നിന്റെ ചില്ലുകള്‍ തെളിയേണമേ എന്ന വരി വീണ്ടും വീണ്ടും ചൊല്ലാന്‍ തോന്നുന്നു!)

    ഇതില്‍ വ്യാകരണപ്പിശകുണ്ടെങ്കില്‍ കയ്യോടെ തിരുത്തിക്കൊള്ളാം. ആരെങ്കിലും വ്യക്തമായി വിശദീകരിച്ചു തരേണ്ട കാര്യമേയുള്ളൂ.

  15. Sebin Abraham Jacob says

    പിന്നെ ZWJ, ZWNJ, NJ ചന്ദ്രക്കല എന്നിവയുടെ അനാവശ്യ ഉപയോഗം ഒഴിവാക്കുക എന്നതു് ചെറിയ കാര്യമാണോ? അതേക്കുറിച്ചു് എന്റെ അഭിപ്രായം മുന്‍ കമന്റില്‍ പറഞ്ഞിരുന്നു.

  16. Sebin Abraham Jacob says

    തുടര്‍ കമന്റുകള്‍ക്കു ക്ഷമാപണം.

    സ്പൂഫിംഗു് ഒഴിവാക്കാന്‍ ആണവ ചില്ലിനെ മാത്രം അംഗീകരിക്കുക എന്നതല്ലേ നല്ലതു്? എഴുത്തുരീതിയെക്കുറിച്ചുള്ള എന്റെ അഭിപ്രായം പ്രവിയുടെ ജേണലില്‍ ഞാന്‍ ചോദിച്ചിരുന്നു, അതിവിടെയും ആവര്‍ത്തിക്കുകയാണു്.

    റാല്‌മിനോവ് എന്നെഴുതുന്നതു് റാ+ല+nj ചന്ദ്രക്കല+മി+… എന്നല്ലേ?
    റാല്മിനോവ് എന്നെഴുതുന്നതു് റാ+ല+സാധാചന്ദ്രക്കല+മി+… എന്നല്ലേ?
    റാൽമിനോവ് എന്നെഴുതേണ്ടതു് റാ+ൽ+മി+… എന്നല്ലേ?
    അല്ലാതെ ഇപ്പോഴുള്ളതു പോലെ റാ+ല+ചന്ദ്രക്കല+zwj+മി … എന്നാണോ?
    അതെങ്ങനെ മലയാളമാകും?
    യന്ത്രത്തെ ഭാഷയ്ക്കു് വഴക്കിയെടുക്കണം, അല്ലാതെ ഭാഷയെ യന്ത്രത്തിനല്ല എന്നു തോന്നുന്നു.

  17. Ralminov റാല്‍മിനോവ് says

    സെബിന്‍,
    പ്രശ്നം താങ്കള്‍ ഉദ്ദേശിക്കുന്നതു് പോലെ നിസ്സാരമല്ല ബാക്ക്​വേര്‍ഡ് കംപാറ്റിബിലിറ്റി എന്നതാണു്. ഇപ്പോഴത്തെ ചില്ല് സീക്വന്‍സ് വളരെക്കാലം കൂടി തുടരും (ഒരുപക്ഷെ അനന്തമായി തന്നെ).
    റാല്‍മിനോവ് എന്നെഴുതാന്‍ മൂന്നു് സ്പെല്ലിങ് കണ്ടു. ഇപ്പോഴത്തെ സ്ഥിതിയില്‍ ഒരു പേരു് രെജിസ്റ്റര്‍ ചെയ്താല്‍ എനിക്കു് മൂന്നു് സ്പെല്ലിങും ഉപയോഗിക്കാം. ആണവചില്ല് വന്നാല്‍ രണ്ട് സ്പെല്ലിങ് ഞാന്‍ രെജിസ്റ്റര്‍ ചെയ്യേണ്ടി വരും, സ്പൂഫിങ് തടയാന്‍.
    ആണവചില്ലിനു് ഇപ്പോഴത്തെ സീക്വന്‍സുമായി ഒരു മാപ്പിങ് കൊടുത്താല്‍ പ്രശ്നം കുറെയൊക്കെ പരിഹരിക്കാം.
    അപ്പര്‍ ലോവര്‍ കേസ് പോലെയൊക്കെ പരിഗണിച്ച് ഒപ്പിച്ചെടുക്കാം.
    ചില്ല് എന്നതു് അക്ഷരത്തിന്റെ ഒരു കാരക്റ്ററാണു്. കായ്​കറികള്‍ എന്നെഴുതുമ്പോള്‍ യ യ്ക്ക് ഉള്ളതു് പോലെ. പാഴ്​വാക്കു് എന്നതില്‍ ഴ. ഇവയ്ക്കൊന്നു് പ്രത്യേക അക്ഷരങ്ങള്‍ നിലവിലില്ലെങ്കിലും അവ റാല്‍മിനോവിലെ ല്‍ പോലെതന്നെ “ചില്ലിങ്” കാരക്റ്ററുള്ളതാണു്. പ്രത്യേക അക്ഷരങ്ങള്‍ക്കൊക്കെ കോഡ്പോയന്റ് നല്‍കണമെങ്കില്‍ മ്പ, ങ്ക , ​്യ, ്ര, ്ല , ്വ എന്നിവയ്ക്കൊക്കെ ആവാം. ഫയല്‍ സൈസൊക്കെ ഇവിടെയും ലാഭിക്കാമല്ലോ.
    എന്നാലോ ഇപ്പോഴും ജോയ്നറില്ലാതെ അമ്മായ‍്യേ എന്നു് വിളിക്കാനും പറ്റില്ല.

    മലയാളത്തെ ഡിപ്രിക്കേറ്റ് ചെയ്യാന്‍ മാത്രം പറയാതിരുന്നാല്‍ നന്നു്.

  18. pravi says

    റാല്‍മിനോവിന്റെ അഭിപ്രായങ്ങള്‍ വായിച്ചു് കാണും എന്നു് കരുതുന്നു. നിങ്ങള്‍ പറയുന്നതു് പോലെ zwj/zwnj എന്നിവയുടെ ഉപയോഗം ഒഴിവാക്കാനാണു് ഈ ആണവ ചില്ലെന്നു് സിബു പോലും പറയില്ല കാരണം ആണവ ചില്ലു് വന്നാലും ഇവയില്ലാതെ മലയാളം ഓടില്ല. ഇനി റാല്‍മിനോവ് പറഞ്ഞ പോലെ, മലയാളം തന്നെയങ്ങ് ഡിപ്രിക്കേറ്റ് ചെയ്തോളൂ എന്നാണോ?

    നാണമുണ്ടോ ഫയല്‍ സൈസ് ലാഭിയ്ക്കാം എന്നൊക്കെ ഇപ്പോഴും പറഞ്ഞു നടക്കാന്‍ (ആണവ ചില്ലിനെ അനുകൂലിയ്ക്കുന്നവര്‍ പോലും കളിയാക്കും ഇതു് പോലുള്ള വാദങ്ങളിറക്കിയാല്‍) ഫ്ലോപ്പി ഡിസ്കിന്റേയും ടൈപ്റൈറ്ററിന്റേയും കാലമൊക്കെ കഴിഞ്ഞു. ഇവിടെ പ്രശ്നം ആണവ ചില്ലു് വന്നാല്‍ ഡിജിറ്റല്‍ യുഗത്തില്‍ മലയാളത്തിനു് നേരിടേണ്ട പ്രശ്നങ്ങളാണു്. യന്ത്രത്തിനു് വേണ്ടി ഭാഷയെ വളയ്ക്കുക എന്നു് സെബിന്‍ നേരത്തെ പറഞ്ഞില്ലേ അത്തരത്തിലുള്ളൊരു വാദമാണു് സെബിനിപ്പറഞ്ഞതും. ഇതേ വാദമല്ലേ കൂട്ടക്ഷരങ്ങള്‍ നിര്‍ദാക്ഷിണ്യം വെട്ടിമുറിയ്ക്കാനും ഉപയോഗിച്ചതു്? പക്ഷേ അന്നാണെങ്കില്‍ അതു് ടൈപ്റൈറ്റരില്‍ കൊള്ളില്ലായിരുന്നു വേറെ വഴിയില്ലായിരുന്നു എന്നെങ്കിലും പറയാം. ഒരു ബ്ലോഗ് പോസ്റ്റില്‍ സെബിന്‍ എത്ര കണ്ടു് വലിപ്പം ലാഭിയ്ക്കുമെന്നാലോചിച്ചിട്ടുണ്ടോ?

    ഉദാഹരണത്തിനു് അങ്കിളിന്റെ ആദ്യത്തെ അഭിപ്രായം നോക്കുക. ആറു് ചില്ലക്ഷരമാണതിലുപയോഗിച്ചിരിയ്ക്കുന്നതു്. പന്ത്രണ്ടു് ബൈറ്റ് സെബിന്‍ ലാഭിയ്ക്കും അതില്‍. ഇനി നൂറു ചില്ലുകളുപയോഗിയ്ക്കുമ്പോള്‍ സെബിന്‍ ലാഭിയ്ക്കുന്നതു് ഇരുനൂറു് ബൈറ്റ്. ഒരു ഫ്ലോപ്പിയില്‍ കൊള്ളുന്നത്രയും സ്ഥലം ലാഭിയ്ക്കണമെങ്കില്‍ എത്ര ബോഗ് പോസ്റ്റുകള്‍ വേണമെന്നു് ചിന്തിയ്ക്കുക. യുട്യൂബിലെ ഒരു വീഡിയോയുടെ വലിപ്പമുള്ളത്രേം സ്ഥലം ലാഭിയ്ക്കാന്‍ എത്ര ആണവ ചില്ലു് വേണമെന്നു് കണക്കു് കൂട്ടിനോക്കൂ. അപ്പോഴറിയാം എത്ര ബാലിശമാണു് ഫയല്‍ വലിപ്പത്തിന്റെ വാദമെന്നു്. ചെരിപ്പിനനുസരിച്ചു് കാല്‍ മുറിച്ചോളൂ എന്നാണോ?

    സെബിന്‍ ഝ എന്നതു് ത ചന്ദ്രക്കല ധ എന്നല്ലേ എന്നു് ചോദിയ്ക്കാത്തതു് ഭാഗ്യം. ഇനി സെബിന്‍ പറഞ്ഞതു് പോലെ ല്‍ എന്നതു് ല യുടേയും ത യുടേയും ചില്ലു് തന്നെയാണെന്നു് വയ്ക്കുക. ആണവ ചില്ലു് വന്നാല്‍ അകാരാദിക്രമത്തില്‍ തരം തിരിയ്ക്കുമ്പോള്‍ (sorted in alphabetical order) അതിനെ എവിടെ വയ്ക്കും. സെബിനെ ബ്ലോഗും അച്ചടിയും കഴിഞ്ഞും പലതും ചെയ്യാനാകും കമ്പ്യൂട്ടറില്‍ എന്നാദ്യം മനസ്സിലാക്കുക. ഇതിനെപ്പറ്റിയൊന്നു് ആലോചിയ്ക്കുകയോ ഉത്തരം പറയാതിരിയ്ക്കുകയോ ചെയ്യുന്നവര്‍ മലയാള ഭാഷയെയാണു് ദ്രോഹിയ്ക്കുന്നതെന്നോര്‍ക്കുക.

    പിന്നെ പാച്ചും ബോട്ടും പഠിയ്ക്കാമെന്നു് പറഞ്ഞതില്‍ സന്തോഷം. സിബു വരെ ആ വാദം നിര്‍ത്തി എന്നു് സെബിനറിയുമോ? മഹേഷ് ടി പൈ വരെ പഴയ ചില്ലുകള്‍ സംരക്ഷിയ്ക്കണമെന്നാണു് പറയുന്നതു്. സെബനെ ഇപ്പോ പറഞ്ഞതു് പറഞ്ഞു, ഇനിയും പാച്ച്, ബോട്ട് എന്നൊക്കെ പറഞ്ഞാല്‍ സിബു പോലും പിന്തുണയ്ക്കില്ല.

    zwj, zwnj എന്നിവയുടെ അനാവശ്യ ഉപയോഗത്തെപ്പറ്റി. ഇന്‍ഡിക് പേര്‍ഷ്യന്‍ ഭാഷകളുടെ പ്രത്യേകതകളെ പിന്തുണയ്ക്കാണിവ കൊണ്ടുവന്നതെന്നു് സെബിനറിയുമോ?

    റാല്‍മിനോവ് പറഞ്ഞ കായ്‌കറികള്‍, താഴ്‌വാരം എന്നീ വാക്കുകളെപ്പറ്റി എന്തു് പറയുന്നു.

  19. Santhosh Thottingal സന്തോഷ് തോട്ടിങ്ങല്‍ says

    ഗൂഗിളെടുത്തു് malayalam bloggers are fools എന്നു കൊടുത്തു് ഞാന്‍ ഭാഗ്യവാനാണെന്നു പറഞ്ഞാല്‍ കുറച്ചു കാര്യങ്ങളറിയാനുള്ള ഭാഗ്യം നിങ്ങള്‍ക്കു ലഭിക്കുന്നതാണു്…!

  20. Benny says

    ക്യാരക്ടറുകളെല്ലാം ഇന്‍‌ഡിപെന്റന്റായി നില്‍ക്കുന്ന ലാറ്റിന്‍ ഭാഷകളുടെ കാര്യത്തില്‍ ക്യാകര്‍ക്ടറുകളുടെ “ലിംഗ്വിസ്റ്റിക് റപ്രസെന്റേഷന്‍” പ്രശ്നമല്ലാതിരിക്കാം. എന്നാല്‍ ഒട്ടേറെ സങ്കീര്‍ണ്ണതകളുള്ള മലയാളം പോലുള്ള ഭാഷകളിലെ ക്യാരക്ടറുകള്‍ക്ക് “ലിംഗ്വിസ്റ്റിക് റപ്രസെന്റേഷന്‍” നോക്കിയേ പറ്റൂ. യൂണീക്കോഡ് കണ്‍‌സോര്‍ഷ്യത്തിന്റെ ബൈലോയില്‍ അങ്ങനെ പറയുന്നില്ലായിരിക്കാം. യൂണീക്കോഡ് കണ്‍‌സോര്‍ഷ്യത്തിനായി നമ്മുടെ ഭാഷ എന്നല്ല, നമ്മുടെ ഭാഷയ്ക്കായി യൂണീക്കോഡ് കണ്‍‌സോര്‍ഷ്യം എന്നായിരിക്കണം നമ്മുടെ രാഷ്ട്രീയം. ഞാന്‍ പറഞ്ഞ് മടുത്തു. നമ്മുടെ സര്‍ക്കാരില്‍, ഭാഷയുടെ കമ്പ്യൂട്ടേഷണല്‍ പ്രശ്നങ്ങള്‍ മനസ്സിലാവുന്ന ഒരൊറ്റ ഉദ്യോഗസ്ഥനും ഇല്ലേ എന്റെ ദൈവമേ? – ബെന്നി

  21. Anivar says

    സെബിനേ, പ്രവീണേ

    സെബിന്റേത് നിര്‍ദ്ദോഷമായ ഒരു ചോദ്യമാണ്. യൂണിക്കോഡ് ഇന്‍ഡിക് ലിസ്റ്റിലെ ഡിസ്കഷന്റെ ചൂടൊന്നും ഇവിടെ വേണ്ട. സെബിന്‍ പ്രവീണ്‍ ചര്‍ച്ച ചെയ്ത് അല്പം ചൂടായതാണ് . ക്ഷമിക്കുക.
    ഇന്നുള്ള എല്ലാ സോഫ്റ്റ്‌വെയറുകളും മലയാളമുല്‍പ്പാദിച്ചുകൊണ്ടേയിരിക്കും. അവ ഇപ്പോള്‍ യൂണിക്കോഡ് 5.0 കംപാറ്റിബിള്‍ ആന്. അവര്‍ എല്ലാവരും യൂണിക്കോഡ് സ്റ്റാന്‍ഡേര്‍ഡിനനുസരിച്ചു പരിഷ്കരിക്കണമെന്നില്ല. പരിഷ്കരിച്ചാല്‍ തന്നെ എല്ലാ ഉപഭോക്താക്കളും അപ്‌ഡേഠ്ട് ചെയ്യണമെന്നില്ല. അതുപോലെ ഇന്നുള്ള മലയാളം (യൂണിക്കോഡ് 5.0 അനുസരിക്കുന്നത്) വരും കാലത്ത് ശരിക്കുകാണിക്കുന്നതിന് ( ഡിജിറ്റല്‍ ഡാറ്റയ്ക്ക് മരണമില്ലല്ലോ) എല്ലാ ഫോണ്ടുകളും വീണ്ടും ഈ രണ്ടുസ്കീമുകളേയും പിന്തുണയ്ക്കും. (യൂണിക്കോഡിന് സ്റ്റെബിലിറ്റി പൊളിസിയുണ്ടെന്ന് മറക്കല്ലേ) ഇതൊന്നും ബോട്ടോടിച്ച് തീര്‍ക്കാവുന്ന പ്രശ്നമല്ല. അപ്പോ എന്തിനാണ് ആണവ ചില്ലന്‍ വരുന്നതെന്ന ചോദ്യം വീണ്ടും വരുന്നു. അഞ്ചാറെണ്ണമല്ലേ ഉള്ളൂ എന്‍കോഡ് ചെയ്തുകളയാം എന്ന ന്യായമാണ് ഈ നീക്കത്തിനു പുറകില്‍ .

    കണ്‍വീനിയന്‍സും സെക്യൂരിറ്റിയും ഒരു ആവശ്യത്തിനു പുറകില്‍ വരുമ്പോള്‍ കമ്പ്യൂട്ടിങ്ങ് അറിയുന്ന ആരും പ്രാധാന്യം കൊടുക്കുക സെക്യൂരിറ്റി പ്രശ്നത്തിനാണ്. അതാണ് നമ്മള്‍ ചെയ്യുന്നതും. അതുപോലെ ഭാഷാപരമായ സാധുതയ്ക്കും ഊന്നല്‍ നല്‍കിയില്ലെങ്കില്‍ മലയാളം കമ്പ്യൂട്ടിങ്ങ് കുട്ടിച്ചോറാവുകയാണ്. ന്‍ ആണവനാകുമ്പോള്‍ അതിന് ന എന്ന അക്ഷരവുമായുള്ള ബന്ധം നഷ്ടപ്പെടുകയാണ്. ര്‍ ആണവനാകുമ്പോള്‍ അതിനും ഭാഷാശാസ്ത്രപരമായ സാധുത നഷ്ടപ്പെടുകയാണ്. അല്ലെങ്കില്‍ നമ്മളാവശ്യപ്പെട്ട cannonical equivalence വേണം. ആണവന്‍ = വ്യഞ്ജനം+ചന്ദ്രക്കല+ZWJ എന്ന നിര്‍വചനം യൂണിക്കോഡ് പറയണം. (Implimentation ഓപ്പറേറ്റിങ്ങ് സിസ്റ്റം ലെവലിലാനെങ്കിലും)

    കമ്പ്യൂട്ടിങ്ങിന്റെ ആവശ്യം മലയാളം ടൈപ്പ് ചെയ്യലോ , കീബോര്‍ഡ് സൌകര്യമോ മാത്രമല്ല സെബിനേ, സോര്‍ട്ടിങ്ങ്, സെര്‍ച്ചിങ്ങ് തുടങ്ങി നിരവധിയനവധി കമ്പ്യൂട്ടിങ്ങ് ഓപ്പറേഷന് ഭാഷയെ പ്രാപ്തമാക്കണമെങ്കില്‍ അതിന്റെ ലോജിക്കല്‍ നിലനില്‍പ്പ് അത്യാവശ്യമാണ്. അത് Exeptional റൂളുകളുടെ കുത്തരങ്ങാക്കാനെ പുതിയ പരിഷ്കാരം കൊണ്ട് സാധിക്കൂ. മലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ ഭാവി നിങ്ങളുടെ കയ്യിലാണ് , യൂണിക്കോഡ് 5.1 നെപ്പറ്റി ഇനി അഭിപ്രായം രേഖപ്പെടുത്താന്‍ 8-10 മണിക്കൂറുകള്‍ മാത്രം . വേഗമാകട്ടെ.

  22. Santhosh Thottingal സന്തോഷ് തോട്ടിങ്ങല്‍ says

    സെബിന്‍,
    ബാക്ക് വേര്‍ഡ് കമ്പാറ്റിബിലിറ്റി അങ്ങെടുത്തു കളഞ്ഞാല്‍ എന്തു സംഭവിക്കുമെന്ന് നല്ല ബോധമുള്ളതുകൊണ്ടാണ് യൂണിക്കോഡ് ദാ ഇങ്ങനെ ഒരു സാധനം എഴുതി വച്ചിട്ടുള്ളത്.

  23. സുറുമ || suruma says

    മഹേഷ് പൈയുടെ വക ഒരു തമാശ പങ്കുവയ്ക്കട്ടെ.

    സ്പൂഫിങ് തടയാനായി മൂപ്പര്‍ പറഞ്ഞ ഉപായം input method-ല്‍ മാറ്റം വരുത്തിയാല്‍ മതി എന്നാണു്.അതായതു് കക്കാന്‍ വരുന്നവന്‍ ഗേറ്റില്‍ പൂട്ടുകണ്ടു് മടങ്ങിപ്പോയ്ക്കോളും എന്നു പറയുന്നതു പോലെ!

  24. Sebin Abraham Jacob says

    അനിവര്‍,

    പ്രവീണ്‍ അങ്ങനെ സംസാരിച്ചതില്‍ എനിക്കു് പരിഭവമൊന്നുമില്ല. വിഷയത്തിന്റെ extremeല്‍ നില്‍ക്കുന്നതുകൊണ്ടാണു് പ്രവീണ്‍ അങ്ങനെ പറഞ്ഞതെന്നു് എനിക്കു മനസ്സിലാക്കാനാവും. കാരണം ഞാനും എനിക്കു് വ്യക്തമായി അറിയാവുന്ന കാര്യങ്ങളില്‍ ഇതേപോലൊക്കെ മുമ്പു് സംസാരിച്ചിട്ടുണ്ടു്. ഒരു കാര്യത്തില്‍ വ്യക്തമായ ധാരണയും അറിവുമുള്ള ഒരാള്‍ക്കു് അതേ വിഷയത്തില്‍ പരിമിതമായ അറിവും പക്ഷപാതവുമുള്ള മറ്റൊരാളുടെ‍ ‘വിവരക്കേടു്’ സഹിക്കാനാവില്ലല്ലോ.

    പക്ഷെ ഞാന്‍ വെറുതെ എതിര്‍ക്കാന്‍ വരികയായിരുന്നില്ല. പ്രശ്നം പഠിക്കുകയായിരുന്നു ഉദ്ദേശ്യം. ഇന്നലെ സാങ്കേതിക കാര്യങ്ങളില്‍ അറിവുള്ള കുറേയേറെ പേരോടു് ഞാന്‍ ഇതേക്കുറിച്ചൊക്കെ സംസാരിച്ചു. അങ്ങനെ ലഭിച്ച ചില ഉള്‍ക്കാഴ്ചകളുടെ വെളിച്ചത്തില്‍ എന്റെ നിലപാടിനു് ചില മാറ്റങ്ങളും വന്നിട്ടുണ്ടു്. അതു് ആണവ ചില്ലിനെ പൂര്‍ണ്ണമായും നിരാകരിക്കുന്ന രീതിയിലല്ല, എന്നാല്‍ canonical equivalence വേണം എന്നതിലാണു് വന്നെത്തി നില്‍ക്കുന്നതു്. അങ്ങനെയെങ്കില്‍ പിന്നെ ആണവ ചില്ലെന്തിനു് എന്ന മറുചോദ്യം വരുമെന്നറിയാം. അതിനുള്ള മറുപടി നേരത്തെ ഞാന്‍ തന്നു കഴിഞ്ഞു എന്നു് കരുതട്ടെ. ഭാഷയുടെ സ്വഭാവത്തിനു് നന്നു് അതാണെന്ന ധാരണയാണു് അതിനു കാരണം.

    യൂണിക്കോഡില്‍ ബായ്ക്ക്‌വേഡ് കമ്പാറ്റിബിലിറ്റി ഉറപ്പാക്കുന്നതു് നല്ല ഉദ്ദേശ്യത്തോടെയാണെന്നു് തിരിച്ചറിയുന്നു. പക്ഷെ എന്തുകൊണ്ടോ, ഒരിക്കല്‍ തെറ്റായ എന്‍കോഡിംഗു് നടന്നാല്‍ അതു് എല്ലാക്കാലത്തേക്കും അങ്ങനെ നിലനില്‍ക്കും എന്ന അപകടം പതിയിരിക്കുന്നു. അതില്‍ അസ്വാഭാവികമായി ഒന്നുമില്ല. യൂണിക്കോഡിന്റെ പ്രശ്നമല്ല, ഭാഷയുടെ പരിമിതിയാണു് മലയാളം അഭിമുഖീകരിക്കുന്നതു്. ചരിത്രത്തെ തിരുത്താനുമാവില്ലല്ലോ.

    സേര്‍ച്ചിംഗു്, സോര്‍ട്ടിംഗു് തുടങ്ങി ഒട്ടേറെ പ്രശ്നങ്ങള്‍ വേറെയുമുണ്ടെന്നും സെക്യൂരിറ്റി മാത്രമല്ല ഇവിടെ വിഷയമെന്നും എനിക്കു് വ്യക്തമായി. മലയാളത്തിന്റെ പ്രശ്നം CJK ഭാഷകള്‍ പോലെ അക്ഷരവൈപുല്യമല്ല, വ്യാകരണ നിയമങ്ങളിലെ ചില അവ്യവസ്ഥകളാണു് എന്നു് ഇപ്പോളെനിക്കു് തോന്നുന്നു. അറബിയിലെ ചില മുഖമില്ലാത്ത ക്യാരക്ടറുകളെ കൈകാര്യം ചെയ്യുന്ന അതേ രീതിയില്‍ മലയാളത്തില്‍ അവയെ കൈകാര്യം ചെയ്യാനാവാത്തതു് അതുകൊണ്ടാണെന്നും തോന്നുന്നു.

    ല്‍ തയില്‍ നിന്നാണോ ല യില്‍ നിന്നാണോ എന്നതുപോലെ തന്നെ ര്‍ രയില്‍ നിന്നോ റയില്‍ നിന്നോ എന്നും തര്‍ക്കമുണ്ടല്ലോ. ഇതും സോര്‍ട്ടിംഗില്‍ പ്രയാസമുണ്ടാക്കുന്ന കാര്യം തന്നെ. ര്‍ രണ്ടില്‍ നിന്നും ഉണ്ടാവുന്നെണ്ടെന്നു് പറഞ്ഞാല്‍ പോലും ഒരു പ്രത്യേക വാക്കില്‍ അതു് ഏതില്‍ നിന്നാണു് ഉണ്ടായതെന്നു് കമ്പ്യൂട്ടറിനെ എങ്ങനെ മനസ്സിലാക്കിക്കും എന്നതു തന്നെ പ്രശ്നം. ഇതു് ആറ്റോമിക്‍ ചില്ലു് വന്നാലും ഇല്ലെങ്കിലും നിലനില്‍ക്കുന്ന പ്രശ്നമാണു്. അല്ലെങ്കില്‍ നിഘണ്ടുക്കള്‍ ചെയ്തതുപോലെ കണ്ണുമടച്ചു് രയ്ക്ക് അനുകൂലമായി ഒരു തീര്‍പ്പുകല്‍പ്പിക്കേണ്ടി വരും. അതേപോലെ തന്നെയാണു് ‘പ്ര’യുടെ കാര്യവും. ഇവിടെയും വിവിധ വാക്കുകളില്‍ പ്രയ്ക്ക് ര ശബ്ദവും റ ശബ്ദവും വരുന്നുണ്ടു്.

    ഇതൊക്കെ, മലയാളം ഉച്ചരിക്കുന്നതു പോലെ എഴുതുന്ന ഭാഷയായിരിക്കെ തന്നെ പല സന്ദര്‍ഭങ്ങളിലും ഒന്നിലേറെ ശബ്ദങ്ങള്‍ക്കു് വെവ്വേറെ അക്ഷരം ഇല്ലാത്തതിനാല്‍ വരുന്ന പ്രശ്നമാണു്. മലയാളം മാതൃഭാഷയായവര്‍ക്കു് ഇതു പ്രശ്നമല്ലെങ്കിലും ഇതിനു് കൃത്യമായ നിയമം പറഞ്ഞുകൊടുക്കാന്‍ പ്രയാസമായതിനാല്‍ മറ്റുഭാഷക്കാര്‍ക്കും യന്ത്രത്തിനും ബുദ്ധിമുട്ടുണ്ടാക്കുന്നു.

    പിന്നെയും ചില വാക്കുകളില്‍ മാത്രമായി ‘ലളയോ നഭേദഃ’ എന്ന നിയമവുമുണ്ടു്. ലയുടെ സ്ഥാനത്തു് ളയും മറിച്ചും ഉപയോഗിക്കാം എന്നു സാരം. എന്നാല്‍ ഇതു് universal law അല്ല. ‘ഴ’യും ‘ള’യും ഇതേപോലെ മാറിമാറി ഉപയോഗിക്കാറുണ്ടു്.

    ‘മ്പ’ ശബ്ദം കൊണ്ടു് ‘മ’യുടെയും ‘പ’യുടെയും സന്ധിയാണെങ്കിലും ‘ന’യും ‘പ’യും ചേരുന്ന ചില വാക്കുകള്‍ക്കു് ‘ന്‍പ’ ശബ്ദവും ‘മ്പ’ശബ്ദവും​ ഒരേ സമയം പ്രയോഗിക്കാറുണ്ടു്. എന്നാല്‍ മ്പയുടെ കാര്യത്തില്‍ കാനോനിക്കല്‍ ഈക്വലന്‍സ് വിലപ്പോവില്ല. ശബ്ദതാരാവലിയും ശ്രീകണ്ഠേശ്വരവും മറിച്ചു പറഞ്ഞാല്‍ പോലും അതു് മയും പയും തന്നെയാണു്. അന്‍പു്, അമ്പു് എന്നീ വാക്കുകള്‍ പരിഗണിക്കുമ്പോള്‍ ശബ്ദവ്യത്യാസം അര്‍ത്ഥവ്യത്യാസമുണ്ടാക്കുന്നതു് വ്യക്തമായി കാണാം. എന്നാല്‍ പിമ്പട തുടങ്ങിയ വാക്കുകളില്‍ ‘ന’യല്ലേ എന്ന ചോദ്യമുണ്ടാകാം. ഇവിടെ പിന്‍പട എന്നും പിമ്പട എന്നും പറയുമെന്നു കൂടി അറിഞ്ഞാലോ? അപ്പോള്‍ ന്‍പയുടെ സ്ഥാനത്തു് ചില വാക്കുകളില്‍ മ്പ ഉപയോഗിച്ചാലും അക്ഷരപ്പിശകല്ല, ശരിയായ രൂപമാണു് എന്നു വരുന്നു. അവിടെ ന്‍പയ്ക്കു് പകരം ഉപയോഗിക്കാവുന്ന അക്ഷരസങ്കരമാണു് മ്പ. അല്ലാതെ നയും പയും ചേര്‍ന്നു് മ്‌പ ആകുകയല്ല എന്നാണു് എനിക്കു തോന്നുന്നതു്.

    ഇതേ പോലെ ഉറപ്പില്ലാത്ത ഒട്ടധികം നിയമങ്ങളുണ്ടു്. ചില വാക്കുകളില്‍ ‘ക’യും ‘വ’യും മാറി മാറി ഉപയോഗിക്കാറുണ്ടു്. ഇതിനൊക്കെ സാധൂകരണം കണ്ടെത്താന്‍ പ്രയാസമാകും. അപ്പോള്‍ പിന്നെ സോര്‍ട്ടിംഗില്‍ ഈ വിഷയം എങ്ങനെ പരിഹരിക്കും?

    ‘ന’ വേറൊരു വില്ലനാണു്. നനയുക എന്ന വാക്കില്‍ രണ്ടു് ശബ്ദവുമുണ്ടല്ലോ. കന്നന്തരം എന്നിടത്തു് നനയുക എന്നതിലെ രണ്ടാമത്തെ നയുടെ ഇരട്ടിപ്പാണു്. ചെന്നായ എന്നിടത്തു് ആദ്യത്തെ നയുടേതും. ഇരട്ടിപ്പിലും രണ്ടു ശബ്ദവും വരുന്നുണ്ടു്. എന്നാല്‍ കന്നി എന്ന പദത്തെ രണ്ടു ശബ്ദം ഉപയോഗിച്ചും വായിക്കാം. രണ്ടും പ്രയോഗ സാധുത ഉള്ളതു തന്നെ. നെറ്റി എന്ന അര്‍ത്ഥത്തില്‍ ചെന്നി എന്നെഴുതുമ്പോള്‍ രണ്ടാമത്തെ നയും ചെന്നിറങ്ങി എന്നെഴുതുമ്പോള്‍ ആദ്യത്തെ നയും വരുന്നു. മലയാളം സങ്കീര്‍ണ്ണമായ ഭാഷ തന്നെ.

    ഇനി റാല്‍മിനോവു് പറഞ്ഞ ഴ, യ എന്നിവയുടെ കാര്യം. കായ്, പാഴ് എന്നീ വാക്കുകളില്‍ വരുന്നതു് ചില്ലിന്റെ സ്വഭാവമാണെന്ന വാദത്തോടു് പൂര്‍ണ്ണമായും യോജിക്കുമ്പോഴും ഇവയ്ക്കു് പ്രത്യേക ചിഹ്നങ്ങള്‍ ഉപയോഗിക്കുന്നില്ലെന്നതു് ശ്രദ്ധിക്കുക. ഇവിടെ സംവൃതോകാരം ഉപയോഗിക്കാതെയാണു് ആ സ്വഭാവം പ്രകടമാക്കുന്നതു്. അങ്ങനെ വരുമ്പോള്‍ ശരിയായ മലയാളം എഴുതണമെങ്കില്‍ സംവൃതോകാരം നിര്‍ബന്ധമാണെന്നു് വരുന്നു. അതുപയോഗിക്കാത്തവര്‍ ഉടന്‍ ഉപയോഗിച്ചു തുടങ്ങൂ എന്നേ അതേക്കുറിച്ചു് പറയാനുള്ളൂ. നിലവില്‍ ചിഹ്നങ്ങളില്ലാത്ത രൂപങ്ങള്‍ക്കു് ചിഹ്നങ്ങളുണ്ടാക്കുക എന്നതു് യൂണിക്കോഡിന്റെ പണിയല്ലല്ലോ. അതങ്ങനെ തന്നെ തുടരട്ടെ എന്നാണു് കൂട്ടിച്ചേര്‍ക്കാനുള്ളതു്.

    ഫയല്‍ ഭാരത്തെ കുറിച്ചു് ഞാന്‍ പറഞ്ഞതു് തീര്‍ത്തും ബാലിശമായിരുന്നുവെന്നു് പ്രവീണിന്റെ വിശദീകരണത്തില്‍ നിന്നു് മനസ്സിലായി. നന്ദി.

  25. Santhosh Thottingal സന്തോഷ് തോട്ടിങ്ങല്‍ says

    സെബിന്‍ കാര്യങ്ങള്‍ മനസ്സിലാക്കാന്‍ ശ്രമിച്ചതിനു നന്ദി.
    ഭാഷയില്‍ നിലനില്‍ക്കുന്ന ആശയക്കുഴപ്പങ്ങള്‍ ഏതൊക്കെ യുണിക്കോഡിന്റെ പരിധിയില്‍ വരും ഏതൊക്കെ അതുപയോഗിക്കുന്നവരുടെ പരിധിയില്‍ വരും എന്നതും പ്രധാനമാണു്.
    വേണം നമുക്ക് ഏകീകൃതമായ ഒരെഴുത്തുരീതി., ചരിത്രത്തെ വീണ്ടെടുക്കുക
    എന്നിവ വായിച്ചിട്ടുണ്ടാകുമെന്നു കരുതുന്നു.



Some HTML is OK

or, reply to this post via trackback.

Powered by WP Hashcash