Aspell Malayalam Spelling checker Version 0.01-1 Released

മലയാളത്തിന് സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ തിരുവോണ സമ്മാനം: ആസ്പെല്‍ മലയാളം സ്പെല്ലിങ്ങ് ചെക്കര്‍(version 0.01-1)

1,37,348 മലയാളം വാക്കുകളടങ്ങിയ മലയാളം സ്പെല്ലിങ്ങ് ചെക്കറിന്റെ ആദ്യ ലക്കം മലയാളത്തിന് സമര്‍പ്പിക്കുന്നു. സ്വതന്ത്ര ഡെസ്ക്ടോപ്പുകളായ ഗ്നോം, കെഡിഇ എന്നിവയില്‍ ഉപയോഗിക്കാവുന്ന ഈ സ്പെല്ലിങ്ങ് ചെക്കര്‍ ഗ്നു ആസ്പെല്‍ എന്ന പ്രശസ്ത സോഫ്റ്റ്‌വെയര്‍ അടിസ്ഥാനമാക്കിയാണ് വികസിപ്പിച്ചിരിക്കുന്നത്.
1,37,348 മലയാളം വാക്കുകളും സ്വയം അക്ഷരത്തെറ്റു പരിശോധിച്ചതാണ്. സമയക്കുറവ്, ശ്രദ്ധക്കുറവ്, വിവരക്കുറവ് എന്നീ കാരണങ്ങളാല്‍ ചില പിഴവുകള്‍ ഇതിലുണ്ടാവാം. ഈ സോഫ്റ്റ്‌വെയര്‍ ഉപയോഗിക്കുമ്പോള്‍ അത്തരം തെറ്റുകള്‍ കാണുകയാണെങ്കില്‍ ദയവായി എന്നെ അറിയിക്കുക.

ഇത് ഇന്‍സ്റ്റാള്‍ ചെയ്യാന്‍ https://savannah.nongnu.org/task/download.php?file_id=13811 എന്നിടത്തു നിന്ന് ഡൗണ്‍ലോഡ് ചെയ്ത് extract ചെയ്യുക. അതിനു ശേഷം README ഫയലില്‍ വിവരിച്ചിരിക്കുന്ന പോലെ ചെയ്യുക.

മലയാളത്തിന്റെ പ്രത്യേകതയായ,ഒന്നിലധികം വാക്കുകള്‍ കൂടിച്ചേര്‍ന്ന് പുതിയ വാക്കുകളുണ്ടാകുന്ന സവിശേഷത കൂടി കൈകാര്യം ചെയ്താല്‍ മാത്രമേ സ്പെല്ലിങ്ങ് ചെക്കര്‍ പൂര്‍ണ്ണമാവുകയുള്ളൂ. അല്ലെങ്കില്‍ പദസഞ്ചയത്തിന്റെ വലിപ്പം വളരെയധികമായിരിക്കും(ഇപ്പോള്‍ തന്നെ ഇന്ത്യയിലെ ഏറ്റവും വലിയ സ്പെല്ലിങ്ങ് ചെക്കര്‍ പദസഞ്ചയമാണിത്.). സന്ധി സമാസം നിയമങ്ങള്‍ ഈ ലക്കത്തില്‍ ഉള്‍ക്കൊള്ളിച്ചില്ലാത്തതിനാല്‍ മേല്‍പ്പറഞ്ഞ തരത്തിലുള്ള വാക്കുകള്‍പരിശോധിക്കാന്‍ ഈ സോഫ്റ്റ്‌വെയറിന് കഴിയില്ല. അതായത് മഴക്കാലം, മേഘങ്ങള്‍, എല്ലാം, ഇരുണ്ട്, കൂടി എന്നിവയെല്ലാം പരിശോധിക്കാമെങ്കിലും “മഴക്കാലമേഘങ്ങളെല്ലാമിരുണ്ടുകൂടി” എന്ന വാക്ക് പരിശോധിക്കാന്‍ ഇതിന് കഴിഞ്ഞെന്നു വരില്ല. ഇത് അടുത്ത ലക്കത്തില്‍ ഉള്‍പ്പെടുത്താന്‍ ശ്രമിക്കുന്നുണ്ട്.

ഇത്രയും വലിയ പദസഞ്ചയം ശേഖരിക്കാന്‍ എന്നെ സഹായിച്ച ഹുസ്സൈന്‍ സാറിനോട് കടപ്പാട് അറിയിച്ചുകൊള്ളുന്നു. മലയാളം വിക്കിപീഡിയ, വിവിധ ബ്ലോഗുകള്‍ എന്നിവയില്‍ നിന്നും വാക്കുകള്‍ ശേഖരിച്ചിട്ടുണ്ട്. സാങ്കേതിക സഹായങ്ങള്‍ക്ക് കെവിന്‍ അറ്റ്കിന്‍സണ്‍(ആസ്പെല്‍ രചയിതാവ്), ഗോര മൊഹന്തി(ആസ്പെല്‍ ഹിന്ദി,ഒറിയ സ്പെല്‍ ചെക്കര്‍) എന്നിവരോട് നന്ദി രേഖപ്പെടുത്തുന്നു.

ഈ പദസഞ്ചയത്തിലില്ലാത്ത വാക്കുകള്‍ പരിശോധിക്കുമ്പോള്‍, നിങ്ങള്‍ക്കത് പദസഞ്ചയത്തിലേയ്ക്ക് കൂട്ടിച്ചേര്‍ക്കാം. ഇങ്ങനെ നിങ്ങള്‍ ചേര്‍ക്കുന്ന വാക്കുകള്‍ നിങ്ങളുടെ ഹോം ഡയറക്ടറിയില്‍ .aspell.ml.pws എന്ന hidden ഫയലില്‍ ശേഖരിക്കപ്പെടും. നിങ്ങള്‍ ചേര്‍ത്ത പുതിയ വാക്കുകള്‍ മറ്റുള്ളവര്‍ക്കും ഉപകാരപ്പെടണമെന്നാഗ്രഹമുണ്ടെങ്കില്‍ ആ ഫയല്‍ എനിക്കയച്ചു തരിക. പുതിയ ലക്കങ്ങളില്‍ ആ വാക്കുകള്‍ പ്രധാന പദസഞ്ചയത്തില്‍ ചേര്‍ക്കാം.

സഹായങ്ങള്‍ക്കോ സംശയങ്ങള്‍ക്കോ ഈ മെയിലിങ്ങ് ലിസ്റ്റിലേക്കെഴുതുക.
ഈ സോഫ്റ്റ്‌വെയറിനു വേണ്ടി ഉപയോഗിച്ച പദസഞ്ചയം മറ്റു ഭാഷാഗവേഷണങ്ങള്‍ക്കുമുപയോഗിക്കാവുന്നതാണ്. ആവശ്യമുള്ളവര്‍ ബന്ധപ്പെടുക.

ചില്ലും മലയാളം കമ്പ്യൂട്ടിങ്ങും

മലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ മുകളില്‍ തലനാരിഴയില്‍ ഒരു വാള്‍ തൂങ്ങിക്കിടപ്പാണ്. ചില്ലു കൊണ്ടുള്ള ഒരു വാള്‍. വാള്‍ വീണാല്‍ മലയാളം രണ്ട് കഷണമാകും. ഒന്നാമത്തേത് നിങ്ങള്‍ വായിച്ചു കൊണ്ടിരിക്കുന്ന ഈ മലയാളം. രണ്ടാമത്തേത് അറ്റോമിക് ചില്ലുകള്‍ ഉപയോഗിച്ചുള്ള വേറൊരു മലയാളം…

“ഞങ്ങള്‍ തീരുമാനിച്ചു കഴിഞ്ഞു. നല്ലതോ ചീത്തയോ അതു നിങ്ങള്‍ അനുഭവിക്കുക” ഇത് അറ്റോമിക് ചില്ലുവാദികളുടെ മുദ്രാവാക്യത്തിന്റെ മലയാളപരിഭാഷ. ഇവിടെ ജയിക്കുന്നതാരുമാകട്ടെ തോല്ക്കുന്നത് ഭാഷ തന്നെയെന്നുറപ്പ്.

ഖരാക്ഷരം + വിരാമം + ZWJ എന്ന ഇപ്പോഴുള്ള ചില്ലക്ഷരത്തിന്റെ എന്‍കോഡിങ്ങിനു പകരം ഒറ്റ ഒരു യുണിക്കോഡ് വേണമെന്ന ആവശ്യം വളരെക്കാലമായി ഒരു വിഭാഗം മലയാളികള്‍ക്കിടയില്‍ ഉയര്‍ന്നു തുടങ്ങിയിട്ട്. അപ്പോള്‍ നിങ്ങള്‍ ചോദിച്ചേക്കാം ഇപ്പോഴുള്ള രീതിക്ക് എന്താണ് പ്രശ്നമെന്ന്. അതിനുള്ള ഉത്തരം എനിക്കിതേവരെ മനസ്സിലായിട്ടില്ല. മലയാളം ബ്ലോഗുകള്‍, വിക്കിപീഡിയ, മലയാളം സോഫ്റ്റ്​വെയറുകള്‍, പ്രാദേശികവത്കരിക്കപ്പെട്ട ഓപ്പറേറ്റിങ്ങ് സിസ്റ്റങ്ങള്‍, ഈയുള്ളവന്‍ തയ്യാറാക്കിക്കൊണ്ടിരിക്കുന്ന ഗ്നു ആസ്പെല് spelling checker (ഇപ്പോള്‍ ഒരു ലക്ഷത്തി മുപ്പതിനായിരത്തിലധികം മലയാളം വാക്കുകളുണ്ട്) ഇവയെല്ലാം ഇതിന് തെളിവുകള്‍ മാത്രം. ജീമെയിലില്‍ ചില്ലക്ഷരം വരുന്നില്ലെങ്കില്‍ അത് ജീമെയിലിന്റെ പിഴവാണ്. ബ്രൗസറില്‍ ചില്ലക്ഷരം വരുന്നില്ലെങ്കില്‍ അത് ബ്രൗസറിന്റെ അല്ലെങ്കില്‍ ചിത്രീകരണസംവിധാനത്തിന്റെ പിഴവാണ്. ഭാഷയുടേതല്ല. ഭാഷയെ മാറ്റലല്ല അതിനുള്ള പ്രതിവിധി. സോഫ്റ്റ്​വെയറിന്റെ പിഴവുകള്‍ ഭാഷകളുടെ നിലനില്പിനൊരിക്കലും വെല്ലുവിളിയാകരുത്.

സാങ്കേതികതയുടെ പേരില്‍ ഭാഷയോടുള്ള ഈ അതിക്രമം മലയാളത്തിന് പുത്തരിയല്ല. ടൈപ്പ്റൈറ്ററിന്റെ കാലത്ത് ലിപി പരിഷ്കാരത്തിന്റെ പേരില്‍ ലിപിയെ വെട്ടിമുറിക്കാന്‍ നമ്മുടെ പണ്ഡിതര്‍ തുനിഞ്ഞിരുന്നു. ആയുര്‍ബലം ഉള്ളതുകൊണ്ട് അകാലചരമമടയാതെ ഭാഷ രക്ഷപ്പെട്ടു. പ്രബുദ്ധരായ മലയാളികള്‍ ആ പരിഷ്കാരത്തെ അവഗണിച്ചു. ടൈപ്പ്റൈറ്ററിന്റെ സാങ്കേതികത്തികവില്ലായ്മ കമ്പ്യൂട്ടര്‍ പരിഹരിച്ചു. ഡിജിറ്റല്‍ ലോകത്തില്‍ മലയാളം അതിന്റെ ബാല്യദശയിലേക്ക് കടന്നു. ചരിത്രം വീണ്ടും ആവര്‍ത്തിക്കുന്നു. ഇത്തവണയും ഇതിനു മുന്നിട്ടിറങ്ങിയിരിക്കുന്നത് മലയാളികള്‍ തന്നെ. ഇതു വരെയുള്ള ഡിജിറ്റല്‍ മലയാളം കണ്ടെന്റ് മൊത്തം അസാധുവാക്കാനുള്ള ഒരു ശ്രമം. എനിക്കുറപ്പുണ്ട്, ഇതും ഒരു തുഗ്ളക്ക് പരിഷ്കാരമായി അവശേഷിക്കും. മലയാളത്തിന്റെ ഡിജിറ്റല്‍ പുരോഗതി വീണ്ടും അതിന്റെ ശൈശവം മുതല്‍ തുടങ്ങുകയോ?!.

എന്തു മാറ്റം വന്നാലും ഇപ്പോഴുള്ള സോഫ്റ്റ്​വെയറുകള്‍ നിലവിലുള്ള മലയാളം തന്നെ ഉത്പാദിപ്പിച്ചു കൊണ്ടിരിക്കും. ഉപയോക്താക്കള്‍ ഉപയോഗിച്ചു കൊണ്ടിരിക്കുന്ന ഇന്സ്ക്രിപ്റ്റ്, സ്വനലേഖ, വരമൊഴി എന്നീ നിവേശക രീതികളെല്ലാം നിലവിലുള്ള രീതി തന്നെ തുടരും. ചിത്രീകരണ സംവിധാനങ്ങള്‍ നിലവിലുള്ള രീതിയില്‍ തന്നെ റെന്‍ഡര്‍ ചെയ്യും. അങ്ങനെ കൂടുതല്‍ മലയാളം ഡിജിറ്റല്‍ ലോകത്തില്‍ നിറയും. ആ ലോകത്തിലേക്ക് അറ്റോമിക് ചില്ലെന്ന അപരന്‍ വന്നാല്‍ വാക്കുകള്‍ തിരിച്ചറിയാനാകാതെ ഡിജിറ്റല്‍ സംവിധാനങ്ങള്‍ അലങ്കോലമാകും. cons+virama+zwj = atomic Chillu എന്ന സമസ്യ എല്ലാ സോഫ്റ്റ്​വെയറുകളും മനസ്സിലാക്കേണ്ടി വരും. Dual Encoding എന്നത് തീരാശാപമായി മലയാളത്തെ പിന്തുടരും. എത്രകാലത്തേക്ക്? ഡിജിറ്റല്‍ വിവരങ്ങള്‍ക്ക് മരണമില്ലാത്തതു കൊണ്ട് അനന്തതയോളം…

ഇന്‍ഡിക് മെയിലിങ്ങ് ലിസ്റ്റില്‍( indic@unicode.org ) ചര്‍ച്ചകള്‍ ചൂടുപിടിക്കുകയാണ്. അറ്റോമിക് ചില്ല് എന്തിന്?, അതു കൊണ്ട് മാത്രമേ പരിഹരിക്കാന്‍ പറ്റൂ എന്നുള്ള എന്ത് പ്രശ്നമാണ് മലയാളത്തിനുള്ളത് എന്ന ചോദ്യങ്ങള്‍ക്ക് കൃത്യമായ ഉത്തരം നല്കാതെ ഒഴിഞ്ഞു മാറി നടക്കുകയാണ് അറ്റോമിക് ചില്ലുവാദികള്‍. ചിലരുടെ വ്യക്തിപരമായ പ്രശസ്തിക്കു വേണ്ടി മലയാളത്തിനെ കുരുതി കൊടുക്കണോ? ചരിത്രപരമായ മറ്റൊരു മണ്ടത്തരത്തിന് മലയാളം ഇരയാവല്ലേ എന്നു നമുക്കു പ്രാര്‍ത്ഥിക്കാം. നിരവധി ആക്രമണങ്ങളെ അതിജീവിച്ച മലയാളം ഇതും അതിജീവിക്കുമെന്നു പ്രതീക്ഷിക്കാം.

Matrix Digital Rain Screensaver In Malayalam!!!

മലയാള നാട്ടില്‍ മഴ തിമര്‍ത്തു പെയ്യുകയാണ്. കഴിഞ്ഞയാഴ്ച ഞാനൊരു മഴയുണ്ടാക്കാനുള്ള ശ്രമത്തിലായിരുന്നു. സാധാരണ മഴയല്ല. ഡിജിറ്റല്‍ മഴ!!!. അക്കഥയിങ്ങനെ:
1999 ല്‍ പുറത്തിറങ്ങിയ ഹോളിവുഡ് സൂപ്പര്‍ഹിറ്റ് ചലച്ചിത്രമായ മെട്രിക്സില്‍ അവതരിപ്പിക്കപ്പെട്ട കമ്പ്യൂട്ടര്‍ കോഡിന്റെ മായിക ദൃശ്യാവിഷ്കാരം – കറുത്ത സ്ക്രീനില്‍ ഉതിര്‍ന്നു വീഴുന്ന പച്ച അക്ഷരങ്ങള്‍, വളരെയേറെ ശ്രദ്ധപിടിച്ചു പറ്റുകയുണ്ടായി. മെട്രിക്സ് പരമ്പരയിലെ ചലച്ചിത്രങ്ങളില്‍ അവതരിപ്പിക്കപ്പെട്ട ഈ ഡിജിറ്റല്‍ മഴയുടെ അനുകരണമായി ധാരാളം സ്ക്രീന്‍ സേവറുകള്‍ പുറത്തിറങ്ങുകയുണ്ടായി. മിക്കതും കമ്പ്യൂട്ടര്‍ പ്രേമികളുടെ ഇഷ്ടപ്പെട്ട സ്ക്രീന്‍ സേവറുകളായി. ഗ്നു ലിനക്സിലും xscreensaver എന്ന സ്ക്രീന്‍സേവര്‍ പാക്കേജിന്റെ കൂടെ glmatrix എന്ന പേരില്‍ ഒരു കിടിലന്‍ സ്ക്രീന്‍സേവറുണ്ട്. എനിക്കേറെ ഇഷ്ടപ്പെട്ട ഒരു സ്ക്രീന്‍സേവറാണത്.
മെട്രിക്സ് സ്ക്രീന്‍സേവറില്‍ കാണിക്കുന്ന അക്ഷരങ്ങള്‍ റോമന്‍ , കാടകാന, അറബിക് എന്നിവയാണ്. ഈ അക്ഷരങ്ങള്‍ക്ക് പകരം നമ്മുടെ സ്വന്തം മലയാളം അക്ഷരങ്ങള്‍ ഉതിര്‍ന്നു വീണാലെങ്ങനെയുണ്ടാവും? ഇങ്ങനെയൊരു ആശയവുമായി ഞാന്‍ glmatrix ന്റെ കോഡ് ഡാണ്‍ലോഡ് ചെയ്തു വായിച്ചു നോക്കി.
എന്നിട്ട് ഞാനതങ്ങ് മലയാളത്തിലാക്കി . താഴെ കൊടുത്തിരിക്കുന്ന പടങ്ങള്‍ കണ്ടോ? എങ്ങനെയുണ്ട്?


ഈ സ്ക്രീന്സേവര്‍ ഇന്സ്റ്റാള്‍ ചെയ്യാന്‍ വേണ്ടി:
Gnome 2.14 version(Debian Etch,Ubuntu 6.06) ;
https://savannah.nongnu.org/task/download.php?file_id=13434
Gnome 2.18 version(Ubuntu 7.04) ;
https://savannah.nongnu.org/task/download.php?file_id=13435

Above given versions will add the screensaver to gnome-screensaver group of screensavers.
If you want to add the screensaver to xscreensaver, after installing any of the package,
Add the following line to the .xscreensaver file in your home directory. Refer the glmatrix entry in that file for reference
– GL: mlmatrix -root \n\

Other gnu/Linux distros:
Download https://savannah.nongnu.org/task/download.php?file_id=13436
Extract it, copy the mlmatrix to /usr/lib/xscreensaver, copy mlmatrix.xml to /usr/share/xscreensaver/config folder
Add the following line to the .xscreensaver file in your home directory. Refer the glmatrix entry in that file for reference
– GL: mlmatrix -root \n\

For the technical details of this application, pls contact me at santhosh00 at gmail.com

മലയാളം സ്പെല്ലിങ്ങ് ചെക്കര്‍ പണിപ്പുരയില്‍

zwj,zwnj പ്രശ്നങ്ങള്‍ കെവിന്റെയും ഗോരയുടെയും സഹായത്തോടെ പരിഹരിച്ചു തീര്‍ന്നപ്പോള്‍ Aspell മലയാളം സ്പെല്ലിങ്ങ് ചെക്കര്‍ വികസനപ്രവര്‍ത്തങ്ങള്‍ വീണ്ടും സജീവമായി.
വിവിധ ബ്ളോഗുകളില്‍ നിന്നും wikipedia യില്‍ നിന്നും ശേഖരിച്ച 25000 വാക്കുകളുടെ പരിശോധന നടത്തിക്കൊണ്ടിരിക്കുകയാണ് ഇപ്പോള്‍. ഇതുവരെ 15000 വാക്കുകള്‍ അക്ഷരത്തെറ്റു പരിശോധന കഴിഞ്ഞു. ആദ്യവട്ട ടെസ്റ്റിങ്ങ് കഴിഞ്ഞപ്പോള്‍ ഒരു കാര്യം ബോധ്യമായി. 25000 വാക്കുകളെന്നത് മലയാളത്തെ സംബന്ധിച്ചിടത്തോളം ഒന്നുമല്ല. തിരഞ്ഞെടുത്ത ഒരു പാരഗ്രാഫ് പരിശോധിക്കാന്‍ കൊടുത്തപ്പോള്‍ 25% വാക്കുകള്‍ മാത്രമേ സ്പെല്ലിങ്ങ് ചെക്കറിന്റെ പക്കലുണ്ടായിരുന്നുള്ള. ഒരു ലക്ഷം വാക്കുകള്‍ എങ്കിലും ഉണ്ടെങ്കിലേ നല്ല പ്രവര്‍ത്തനക്ഷമത കൈവരിക്കാന്‍ കഴിയൂ. യുണിക്കോഡ് ഫോര്‍മാറ്റിലുള്ള ഒരു പുസ്തകത്തിന്റെ പകര്‍പ്പ് കിട്ടാന്‍ ശ്രമിച്ചുകൊണ്ടിരിക്കുകയാണ്. അതുകിട്ടിയാല്‍ കുറേകൂടി വാക്കുകള്‍ ചേര്‍ക്കുവാന്‍ കഴിഞ്ഞേക്കും.
മൂലപദങ്ങളോടു ഒന്നോ അതിലധികമോ വാക്കുകള്‍ ചേര്‍ത്ത് വേറൊരു വാക്കുകളുണ്ടാക്കുന്ന മലയാളത്തിന്റെ സവിശേഷത(Agglutination) സ്പെല്ലിങ്ങ് ചെക്കറിനൊരു വന്‍വെല്ലുവിളിയാണ്. 10 വാക്കുകള്‍ വരെ കൂട്ടിച്ചേര്‍ത്ത് ഒരൊറ്റ വാക്കുണ്ടാക്കാം. ഇതു പരിഹരിക്കാന്‍ 2 വഴികളാണുള്ളത്. ഇങ്ങനെയുള്ള മിക്കവാറും എല്ലാ വാക്കുകളും ഉള്‍ക്കൊള്ളുന്ന ഒരു വലിയ worlist ഉണ്ടാക്കുകയാണ് ഒന്നാമത്തെ പരിഹാരം. മലയാളത്തിന്റെ സന്ധി-സമാസം നിയമങ്ങളെ കമ്പ്യൂട്ടറിന്റെ ലോജിക്കിലേക്കു മാറ്റുക എന്ന ഭഗീരഥയത്നമാണ് സ്ഥിരമായ പരിഹാരം. ഇതെത്ര മാത്രം പ്രായോഗികമാണെന്നു എനിക്കറിയില്ല. ഒരു subset ചെയ്യാന്‍ പറ്റിയാലും തെറ്റില്ല. നിയമങ്ങളിലെ അപവാദങ്ങള്‍ അപ്പോള്‍ പ്രശ്നമുണ്ടാക്കും. കേരളപാണിനീയം പഠിക്കുക എന്നൊരു കടമ്പ അതിനു മുമ്പു കടക്കേണ്ടതുണ്ട്.
എന്തായാലും ആദ്യത്തെ പടിയായി കഴിയുന്ന രീതിയില്‍ ഏറ്റവും വലിയ ഒരു wordlist ഉണ്ടാക്കാന്‍ തീരുമാനിച്ചു. സന്ധി സമാസം പിന്നത്തേക്കു നീട്ടി വക്കാം.

സ്വനലേഖയുടെ പുതിയ പതിപ്പ് പുറത്തിറങ്ങി.

സ്വനലേഖയെക്കുറിച്ചും വരമൊഴിയെക്കുറിച്ചും ഇവിടെ നടന്ന ചര്‍ച്ച കണ്ടു. ഡിഫാള്‍ട്ട് റൂളുകള്‍ മൊഴി തന്നെയായിരിക്കണമെന്ന സിബുവിന്റെ അഭിപ്രായത്തോടു എനിക്ക് യോജിപ്പില്ല. ഉപയോക്താക്കള്‍ക്ക് നിയമങ്ങളല്ലല്ലോ വേണ്ടത്? അവര്‍ക്ക് വേണ്ടത് കൂടുതല്‍ സൗകര്യങ്ങളല്ലേ ? ട എന്നെഴുതാന്‍ Ta എന്നെഴുതണമെന്നു നിയമമുണ്ടാക്കുന്നതിനേക്കാള്‍ നല്ല​ത്, ട എന്നെഴുതാന്‍ ta, da, Ta എന്നിവയിലേതെങ്കിലും ഉപയോഗിക്കാനുള്ള സൗകര്യ​മുണ്ടാക്കുന്നതല്ലേ? സാങ്കേതികമായി സ്കിമ്മിന് ഒരു ഡിഫാള്‍ട്ട് റൂള്‍ വേണമെന്നത് ശരിയാണ്. അതിനായി മൊഴി നിയമങ്ങളുടെ പരിഷ്കരിച്ച ഒരു രീതിയാണ് ഉപയോഗിച്ചത്. കൂടുതല്‍ ഉപയോഗക്ഷമതക്കു വേണ്ടി കുറച്ചു മാറ്റങ്ങള്‍ വരുത്തിയിട്ടുണ്ട്. വരമൊഴി ഉപയോഗിക്കുന്നവരോടും മറ്റു ചിലവിദഗ്ധരോടും ചോദിച്ചാണ് അതുചെയ്തത്. ഞാനുമൊരു മൊഴി ഉപയോക്താവായിരുന്നു. ആ നിയമങ്ങളുടെ ആള്‍ട്ടര്‍നേറ്റ് ആയി മൊഴി നിയമങ്ങളുമുണ്ട്. ഉപയോക്താക്കള്‍ക്ക് അവര്‍ക്കിഷ്ടമുള്ള രീതി ഉപയോഗിക്കാം. ചില്ലക്ഷരങ്ങള്‍ ഇതിനൊരുദാഹരണം മാത്രം. ചുരുക്കിപറഞ്ഞാല്‍ നിയമങ്ങളുടെ ഭാരം ഉപയോക്താവില്‍ നിന്നൊഴിവാക്കുന്നു എന്നതാണ് സ്വനലേഖയുടെ പ്രത്യേകത. അതുകൊണ്ട് ഏതെങ്കിലും സ്കീം ആയിരിക്കണം ഡിഫാള്‍ട്ട് റൂള്‍ എന്നു പറയുന്നതില്‍ അര്‍ത്ഥമൊന്നുമില്ല.
സ്വനലേഖ എന്ന പേരു നിര്‍ദ്ദേശിച്ച ഹുസ്സൈന്‍ സാറോടും പി പി രാമചന്ദ്രന്‍ സാറോടും കടപ്പാട് അറിയിച്ചുകൊള്ളുന്നു. ഇംഗ്ളീഷ് പേര് Phonetic എന്നുതന്നെ.
സ്വനലേഖയുടെ പുതിയ പതിപ്പില്‍ (0.0.4) കൂടുതല്‍ സൂചനകള്‍ ഉള്‍പ്പെടുത്തിയിട്ടുണ്ട്. ലുക്ക് അപ് ടേബിളിന്റെ കാര്യക്ഷമത കൂട്ടാന്‍ ഇതു സഹായിക്കും. nga=ങ എന്നതിനു പകരം nga=ങ്ങ , Nga=ങ എന്ന പുതിയ മാറ്റം കൊണ്ടു വന്നു. ങയുടെ ഉപയോഗം ങ്ങയുടെ ഉപയോഗത്തെ അപേക്ഷിച്ച് വളരെ കുറവാണെന്നതാണിതിനു കാരണം. ങ്ങ എന്നു ടൈപ്പ് ചെയ്യാന്‍ ngnga എന്നതിനു പകരം nga എന്നെഴുതിയാല്‍ മതി. ഉദാ:- ഞങ്ങള്‍ = njangaL~
ae=ഏ എന്ന പുതിയ ഒരു മാപ്പിങ്ങ് ചേര്‍ത്തു. ഈ ആശയങ്ങള്‍ക്ക് ഹുസ്സൈന്‍ സാറോട് കടപ്പാട്.
Debian packaging ല് ചെറിയ മാറ്റം വരുത്തിയിട്ടുണ്ട്(Added scim-gtk-immodule dependency). icon ഉം ചെറുതായി മാറ്റി. അടുത്ത പതിപ്പിനുശേഷം upstream ഇല്‍ commit ചെയ്യാമെന്നു തോന്നുന്നു.
സ്വനലേഖയുടെ m17n പതിപ്പും ഉടന്‍ പുറത്തിറങ്ങും. സ്വനലേഖയുടെ കന്നട പതിപ്പ് (scim-ka-phonetic) എന്റെ ഒരു സുഹൃത്ത് എഴുതിക്കൊണ്ടിരിക്കുന്നു.
For download: https://savannah.nongnu.org/task/download.php?file_id=13226

Scim malayalam phonetic input method With Lookup table!!!

Added a new feature to SCIM malayalam phonetic input method. It can give spelling suggestions while typing!!!. Cool right?
See the below screenshot from my system. I am editing some text in GEDIT. For typing വിള, I have to type viLa according to the IM Scheme. But as every body does, I typed vila. Now hint menu comes with two suggestions. ള and ല. I press arrow keys and it becomes വിള.

An extract from the documentation:
മലയാളം ശബ്ദാത്മക നിവേശകരീതിക്ക് ഉപയോക്താവ് എഴുതിക്കൊണ്ടിരിക്കുമ്പോള്‍ സൂചനകള്‍ കൊടുക്കാന്‍ കഴിയും. ഇത് മലയാളം വളരെപ്പെട്ടെന്ന് തെറ്റ് കൂടാതെ എഴുതാന്‍ സഹായിക്കുന്നു. ചില്ല​ക്ഷരങ്ങള്‍, കൂട്ടക്ഷരങ്ങള്‍ എന്നിവ എഴുതുമ്പോള്‍ ഇത് വളരെ ഫലപ്രദമാണ്. മലയാളികളുടെ സവിശേഷമായ മംഗ്ളീഷ് ഉപയോഗത്തിന്റെ അടിസ്ഥാനത്തിലാണ് ഇതു രൂപകല്പനചെയ്തിരിക്കുന്നത്.

ഉദാഹരണത്തിന് അടിപൊളി എന്നെഴുതാന്‍ പലപ്പോഴും നാം ഉപയോഗിക്കുന്നത് adipoli എന്നാണ്. പക്ഷെ മലയാളം ശബ്ദാത്മക നിവേശകരീതിയിലതെഴുതുന്നത് atipoLi എന്നാണല്ലൊ?. ചിലര്‍​ക്കെങ്കിലുമുണ്ടാകുന്ന ഈ തടസ്സം ഒഴിവാക്കുന്നതിന് സൂചനാപ്പട്ടിക ഉപകരിക്കും. adipoli എന്നെഴുതിക്കൊണ്ടിരിക്കുമ്പോള്‍ di എന്നെഴുതുമ്പോള്‍ സൂചനാപ്പട്ടിക ദി എന്നും ടി എന്നും 2 സൂചനകള്‍ നല്‍കുന്നു. അതുപോലെ ളി എന്നതിനുവേണ്ടി Li ക്കുപകരം li എന്നെഴുതുമ്പോള്‍ പട്ടിക ലി എന്നും ളി എന്നും 2 സൂചനകള്‍ നല്കുന്നു.

ഇതിന്റെ വേറൊരു ഉപയോഗം പേരുകളുടെ കൂടെയുള്ള initials എഴുതുമ്പോള്‍ ആണ്. ഉദാഹരണത്തിന് ലീല പി കെ എന്നെഴുതാന്‍ ശരിക്കും ഉപയോഗിക്കേണ്ടത് leela pi ke എന്നാണ്. പക്ഷെ നാം leela p k എന്നു തന്നെ എഴുതാന്‍ ഇഷ്ടപ്പെടുന്നു. നാം P അല്ലെങ്കില്‍ p എന്നെഴുതുമ്പോള്‍ സൂചനാപ്പട്ടിക പി എന്നൊരു സൂചനകൂടി തരും!.

കെ എസ് ആര്‍ ടി സി എന്നെഴുതാന്‍ K S R T C തന്നെ ഉപയോഗിക്കണമെന്നുണ്ടോ? സൂചനാപ്പട്ടികയുടെ സഹായത്തോടെ നിങ്ങള്ക്ക് K S R T C എന്നു തന്നെ എഴുതാം.

“അടിപൊളി അല്ലേ?!!!”
Now look at this

Note: I decided not to use mozhi scheme as such for the better usability.But I tried to give some compatibility to that scheme by giving alternative patterns in some places.

Scim malayalam phonetic input method : Key mapping

This is the key mapping for scim malayalam phonetic keyboard

സ്വരങ്ങള്‍
a aa A i ii I ee u uu U oo RR
ി
അം അഃ
e E ai ei o O au ou a~ aM ~ aH
വ്യഞ്ജനങ്ങള്‍
ങ്ക ന്റെ
k kh K g gh G ng nk nte
റ്റ ക്ഷ
ch Ch j jh J nj TT x
ക്യു വൈ
t T D Dh N q Y
ക്യൂ ഞ്ച
th thh d dh n Q nch
p f ph b bh B m
y r l v w S z sh s h
L zh R
ചില്ലുകള്‍
ന്‍ ല്‍ ള്‍ ര്‍
n~ l~ L~ r~ R~
ഉദാഹരണങ്ങള്‍
മലയാളം malayaaLaM malayAla~
സരിഗമപധനി sarigamapadhani
പൊന്പീലി ponpiili
മങ്ക manka
കുടുംബം kutu~ba~ kutu~baM
അവന്‍ avan~
ചക്ഷുശ്രവണഗളസ്ഥമാം chaxuSravanagalasThamaa~ chaxuSravanagalasThamaa~ chakshuSravanagalasThamaa~
പ്രകൃതി prakRthi
കൃഷ്ണന്‍ kRshNan~
പാലക്കാട് paalakkaat pAlakkAt
അക്ഷരം axaraM

Please post your comments in smc-discuss@googlegroups.com

Dhvani rewrite

I started a re-write on Dhvani architecture, keeping the algorithm same. This is based on Kiss principle. Instead of client server architecture a single executable is my plan. This will help me to integrate it with KTTS, kate etc. Now I know how to integrate Dhvani with KTTS.
Studied autoconf and automake for this…
More and more items in my TODO list…