Aspell Malayalam Spelling checker Version 0.01-1 Released

മലയാളത്തിന് സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ തിരുവോണ സമ്മാനം: ആസ്പെല്‍ മലയാളം സ്പെല്ലിങ്ങ് ചെക്കര്‍(version 0.01-1)

1,37,348 മലയാളം വാക്കുകളടങ്ങിയ മലയാളം സ്പെല്ലിങ്ങ് ചെക്കറിന്റെ ആദ്യ ലക്കം മലയാളത്തിന് സമര്‍പ്പിക്കുന്നു. സ്വതന്ത്ര ഡെസ്ക്ടോപ്പുകളായ ഗ്നോം, കെഡിഇ എന്നിവയില്‍ ഉപയോഗിക്കാവുന്ന ഈ സ്പെല്ലിങ്ങ് ചെക്കര്‍ ഗ്നു ആസ്പെല്‍ എന്ന പ്രശസ്ത സോഫ്റ്റ്‌വെയര്‍ അടിസ്ഥാനമാക്കിയാണ് വികസിപ്പിച്ചിരിക്കുന്നത്.
1,37,348 മലയാളം വാക്കുകളും സ്വയം അക്ഷരത്തെറ്റു പരിശോധിച്ചതാണ്. സമയക്കുറവ്, ശ്രദ്ധക്കുറവ്, വിവരക്കുറവ് എന്നീ കാരണങ്ങളാല്‍ ചില പിഴവുകള്‍ ഇതിലുണ്ടാവാം. ഈ സോഫ്റ്റ്‌വെയര്‍ ഉപയോഗിക്കുമ്പോള്‍ അത്തരം തെറ്റുകള്‍ കാണുകയാണെങ്കില്‍ ദയവായി എന്നെ അറിയിക്കുക.

ഇത് ഇന്‍സ്റ്റാള്‍ ചെയ്യാന്‍ https://savannah.nongnu.org/task/download.php?file_id=13811 എന്നിടത്തു നിന്ന് ഡൗണ്‍ലോഡ് ചെയ്ത് extract ചെയ്യുക. അതിനു ശേഷം README ഫയലില്‍ വിവരിച്ചിരിക്കുന്ന പോലെ ചെയ്യുക.

മലയാളത്തിന്റെ പ്രത്യേകതയായ,ഒന്നിലധികം വാക്കുകള്‍ കൂടിച്ചേര്‍ന്ന് പുതിയ വാക്കുകളുണ്ടാകുന്ന സവിശേഷത കൂടി കൈകാര്യം ചെയ്താല്‍ മാത്രമേ സ്പെല്ലിങ്ങ് ചെക്കര്‍ പൂര്‍ണ്ണമാവുകയുള്ളൂ. അല്ലെങ്കില്‍ പദസഞ്ചയത്തിന്റെ വലിപ്പം വളരെയധികമായിരിക്കും(ഇപ്പോള്‍ തന്നെ ഇന്ത്യയിലെ ഏറ്റവും വലിയ സ്പെല്ലിങ്ങ് ചെക്കര്‍ പദസഞ്ചയമാണിത്.). സന്ധി സമാസം നിയമങ്ങള്‍ ഈ ലക്കത്തില്‍ ഉള്‍ക്കൊള്ളിച്ചില്ലാത്തതിനാല്‍ മേല്‍പ്പറഞ്ഞ തരത്തിലുള്ള വാക്കുകള്‍പരിശോധിക്കാന്‍ ഈ സോഫ്റ്റ്‌വെയറിന് കഴിയില്ല. അതായത് മഴക്കാലം, മേഘങ്ങള്‍, എല്ലാം, ഇരുണ്ട്, കൂടി എന്നിവയെല്ലാം പരിശോധിക്കാമെങ്കിലും “മഴക്കാലമേഘങ്ങളെല്ലാമിരുണ്ടുകൂടി” എന്ന വാക്ക് പരിശോധിക്കാന്‍ ഇതിന് കഴിഞ്ഞെന്നു വരില്ല. ഇത് അടുത്ത ലക്കത്തില്‍ ഉള്‍പ്പെടുത്താന്‍ ശ്രമിക്കുന്നുണ്ട്.

ഇത്രയും വലിയ പദസഞ്ചയം ശേഖരിക്കാന്‍ എന്നെ സഹായിച്ച ഹുസ്സൈന്‍ സാറിനോട് കടപ്പാട് അറിയിച്ചുകൊള്ളുന്നു. മലയാളം വിക്കിപീഡിയ, വിവിധ ബ്ലോഗുകള്‍ എന്നിവയില്‍ നിന്നും വാക്കുകള്‍ ശേഖരിച്ചിട്ടുണ്ട്. സാങ്കേതിക സഹായങ്ങള്‍ക്ക് കെവിന്‍ അറ്റ്കിന്‍സണ്‍(ആസ്പെല്‍ രചയിതാവ്), ഗോര മൊഹന്തി(ആസ്പെല്‍ ഹിന്ദി,ഒറിയ സ്പെല്‍ ചെക്കര്‍) എന്നിവരോട് നന്ദി രേഖപ്പെടുത്തുന്നു.

ഈ പദസഞ്ചയത്തിലില്ലാത്ത വാക്കുകള്‍ പരിശോധിക്കുമ്പോള്‍, നിങ്ങള്‍ക്കത് പദസഞ്ചയത്തിലേയ്ക്ക് കൂട്ടിച്ചേര്‍ക്കാം. ഇങ്ങനെ നിങ്ങള്‍ ചേര്‍ക്കുന്ന വാക്കുകള്‍ നിങ്ങളുടെ ഹോം ഡയറക്ടറിയില്‍ .aspell.ml.pws എന്ന hidden ഫയലില്‍ ശേഖരിക്കപ്പെടും. നിങ്ങള്‍ ചേര്‍ത്ത പുതിയ വാക്കുകള്‍ മറ്റുള്ളവര്‍ക്കും ഉപകാരപ്പെടണമെന്നാഗ്രഹമുണ്ടെങ്കില്‍ ആ ഫയല്‍ എനിക്കയച്ചു തരിക. പുതിയ ലക്കങ്ങളില്‍ ആ വാക്കുകള്‍ പ്രധാന പദസഞ്ചയത്തില്‍ ചേര്‍ക്കാം.

സഹായങ്ങള്‍ക്കോ സംശയങ്ങള്‍ക്കോ ഈ മെയിലിങ്ങ് ലിസ്റ്റിലേക്കെഴുതുക.
ഈ സോഫ്റ്റ്‌വെയറിനു വേണ്ടി ഉപയോഗിച്ച പദസഞ്ചയം മറ്റു ഭാഷാഗവേഷണങ്ങള്‍ക്കുമുപയോഗിക്കാവുന്നതാണ്. ആവശ്യമുള്ളവര്‍ ബന്ധപ്പെടുക.

ചില്ലും മലയാളം കമ്പ്യൂട്ടിങ്ങും

മലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ മുകളില്‍ തലനാരിഴയില്‍ ഒരു വാള്‍ തൂങ്ങിക്കിടപ്പാണ്. ചില്ലു കൊണ്ടുള്ള ഒരു വാള്‍. വാള്‍ വീണാല്‍ മലയാളം രണ്ട് കഷണമാകും. ഒന്നാമത്തേത് നിങ്ങള്‍ വായിച്ചു കൊണ്ടിരിക്കുന്ന ഈ മലയാളം. രണ്ടാമത്തേത് അറ്റോമിക് ചില്ലുകള്‍ ഉപയോഗിച്ചുള്ള വേറൊരു മലയാളം…

“ഞങ്ങള്‍ തീരുമാനിച്ചു കഴിഞ്ഞു. നല്ലതോ ചീത്തയോ അതു നിങ്ങള്‍ അനുഭവിക്കുക” ഇത് അറ്റോമിക് ചില്ലുവാദികളുടെ മുദ്രാവാക്യത്തിന്റെ മലയാളപരിഭാഷ. ഇവിടെ ജയിക്കുന്നതാരുമാകട്ടെ തോല്ക്കുന്നത് ഭാഷ തന്നെയെന്നുറപ്പ്.

ഖരാക്ഷരം + വിരാമം + ZWJ എന്ന ഇപ്പോഴുള്ള ചില്ലക്ഷരത്തിന്റെ എന്‍കോഡിങ്ങിനു പകരം ഒറ്റ ഒരു യുണിക്കോഡ് വേണമെന്ന ആവശ്യം വളരെക്കാലമായി ഒരു വിഭാഗം മലയാളികള്‍ക്കിടയില്‍ ഉയര്‍ന്നു തുടങ്ങിയിട്ട്. അപ്പോള്‍ നിങ്ങള്‍ ചോദിച്ചേക്കാം ഇപ്പോഴുള്ള രീതിക്ക് എന്താണ് പ്രശ്നമെന്ന്. അതിനുള്ള ഉത്തരം എനിക്കിതേവരെ മനസ്സിലായിട്ടില്ല. മലയാളം ബ്ലോഗുകള്‍, വിക്കിപീഡിയ, മലയാളം സോഫ്റ്റ്​വെയറുകള്‍, പ്രാദേശികവത്കരിക്കപ്പെട്ട ഓപ്പറേറ്റിങ്ങ് സിസ്റ്റങ്ങള്‍, ഈയുള്ളവന്‍ തയ്യാറാക്കിക്കൊണ്ടിരിക്കുന്ന ഗ്നു ആസ്പെല് spelling checker (ഇപ്പോള്‍ ഒരു ലക്ഷത്തി മുപ്പതിനായിരത്തിലധികം മലയാളം വാക്കുകളുണ്ട്) ഇവയെല്ലാം ഇതിന് തെളിവുകള്‍ മാത്രം. ജീമെയിലില്‍ ചില്ലക്ഷരം വരുന്നില്ലെങ്കില്‍ അത് ജീമെയിലിന്റെ പിഴവാണ്. ബ്രൗസറില്‍ ചില്ലക്ഷരം വരുന്നില്ലെങ്കില്‍ അത് ബ്രൗസറിന്റെ അല്ലെങ്കില്‍ ചിത്രീകരണസംവിധാനത്തിന്റെ പിഴവാണ്. ഭാഷയുടേതല്ല. ഭാഷയെ മാറ്റലല്ല അതിനുള്ള പ്രതിവിധി. സോഫ്റ്റ്​വെയറിന്റെ പിഴവുകള്‍ ഭാഷകളുടെ നിലനില്പിനൊരിക്കലും വെല്ലുവിളിയാകരുത്.

സാങ്കേതികതയുടെ പേരില്‍ ഭാഷയോടുള്ള ഈ അതിക്രമം മലയാളത്തിന് പുത്തരിയല്ല. ടൈപ്പ്റൈറ്ററിന്റെ കാലത്ത് ലിപി പരിഷ്കാരത്തിന്റെ പേരില്‍ ലിപിയെ വെട്ടിമുറിക്കാന്‍ നമ്മുടെ പണ്ഡിതര്‍ തുനിഞ്ഞിരുന്നു. ആയുര്‍ബലം ഉള്ളതുകൊണ്ട് അകാലചരമമടയാതെ ഭാഷ രക്ഷപ്പെട്ടു. പ്രബുദ്ധരായ മലയാളികള്‍ ആ പരിഷ്കാരത്തെ അവഗണിച്ചു. ടൈപ്പ്റൈറ്ററിന്റെ സാങ്കേതികത്തികവില്ലായ്മ കമ്പ്യൂട്ടര്‍ പരിഹരിച്ചു. ഡിജിറ്റല്‍ ലോകത്തില്‍ മലയാളം അതിന്റെ ബാല്യദശയിലേക്ക് കടന്നു. ചരിത്രം വീണ്ടും ആവര്‍ത്തിക്കുന്നു. ഇത്തവണയും ഇതിനു മുന്നിട്ടിറങ്ങിയിരിക്കുന്നത് മലയാളികള്‍ തന്നെ. ഇതു വരെയുള്ള ഡിജിറ്റല്‍ മലയാളം കണ്ടെന്റ് മൊത്തം അസാധുവാക്കാനുള്ള ഒരു ശ്രമം. എനിക്കുറപ്പുണ്ട്, ഇതും ഒരു തുഗ്ളക്ക് പരിഷ്കാരമായി അവശേഷിക്കും. മലയാളത്തിന്റെ ഡിജിറ്റല്‍ പുരോഗതി വീണ്ടും അതിന്റെ ശൈശവം മുതല്‍ തുടങ്ങുകയോ?!.

എന്തു മാറ്റം വന്നാലും ഇപ്പോഴുള്ള സോഫ്റ്റ്​വെയറുകള്‍ നിലവിലുള്ള മലയാളം തന്നെ ഉത്പാദിപ്പിച്ചു കൊണ്ടിരിക്കും. ഉപയോക്താക്കള്‍ ഉപയോഗിച്ചു കൊണ്ടിരിക്കുന്ന ഇന്സ്ക്രിപ്റ്റ്, സ്വനലേഖ, വരമൊഴി എന്നീ നിവേശക രീതികളെല്ലാം നിലവിലുള്ള രീതി തന്നെ തുടരും. ചിത്രീകരണ സംവിധാനങ്ങള്‍ നിലവിലുള്ള രീതിയില്‍ തന്നെ റെന്‍ഡര്‍ ചെയ്യും. അങ്ങനെ കൂടുതല്‍ മലയാളം ഡിജിറ്റല്‍ ലോകത്തില്‍ നിറയും. ആ ലോകത്തിലേക്ക് അറ്റോമിക് ചില്ലെന്ന അപരന്‍ വന്നാല്‍ വാക്കുകള്‍ തിരിച്ചറിയാനാകാതെ ഡിജിറ്റല്‍ സംവിധാനങ്ങള്‍ അലങ്കോലമാകും. cons+virama+zwj = atomic Chillu എന്ന സമസ്യ എല്ലാ സോഫ്റ്റ്​വെയറുകളും മനസ്സിലാക്കേണ്ടി വരും. Dual Encoding എന്നത് തീരാശാപമായി മലയാളത്തെ പിന്തുടരും. എത്രകാലത്തേക്ക്? ഡിജിറ്റല്‍ വിവരങ്ങള്‍ക്ക് മരണമില്ലാത്തതു കൊണ്ട് അനന്തതയോളം…

ഇന്‍ഡിക് മെയിലിങ്ങ് ലിസ്റ്റില്‍( indic@unicode.org ) ചര്‍ച്ചകള്‍ ചൂടുപിടിക്കുകയാണ്. അറ്റോമിക് ചില്ല് എന്തിന്?, അതു കൊണ്ട് മാത്രമേ പരിഹരിക്കാന്‍ പറ്റൂ എന്നുള്ള എന്ത് പ്രശ്നമാണ് മലയാളത്തിനുള്ളത് എന്ന ചോദ്യങ്ങള്‍ക്ക് കൃത്യമായ ഉത്തരം നല്കാതെ ഒഴിഞ്ഞു മാറി നടക്കുകയാണ് അറ്റോമിക് ചില്ലുവാദികള്‍. ചിലരുടെ വ്യക്തിപരമായ പ്രശസ്തിക്കു വേണ്ടി മലയാളത്തിനെ കുരുതി കൊടുക്കണോ? ചരിത്രപരമായ മറ്റൊരു മണ്ടത്തരത്തിന് മലയാളം ഇരയാവല്ലേ എന്നു നമുക്കു പ്രാര്‍ത്ഥിക്കാം. നിരവധി ആക്രമണങ്ങളെ അതിജീവിച്ച മലയാളം ഇതും അതിജീവിക്കുമെന്നു പ്രതീക്ഷിക്കാം.