സ്വനലേഖയുടെ പുതിയ പതിപ്പ് പുറത്തിറങ്ങി.

സ്വനലേഖയെക്കുറിച്ചും വരമൊഴിയെക്കുറിച്ചും ഇവിടെ നടന്ന ചര്‍ച്ച കണ്ടു. ഡിഫാള്‍ട്ട് റൂളുകള്‍ മൊഴി തന്നെയായിരിക്കണമെന്ന സിബുവിന്റെ അഭിപ്രായത്തോടു എനിക്ക് യോജിപ്പില്ല. ഉപയോക്താക്കള്‍ക്ക് നിയമങ്ങളല്ലല്ലോ വേണ്ടത്? അവര്‍ക്ക് വേണ്ടത് കൂടുതല്‍ സൗകര്യങ്ങളല്ലേ ? ട എന്നെഴുതാന്‍ Ta എന്നെഴുതണമെന്നു നിയമമുണ്ടാക്കുന്നതിനേക്കാള്‍ നല്ല​ത്, ട എന്നെഴുതാന്‍ ta, da, Ta എന്നിവയിലേതെങ്കിലും ഉപയോഗിക്കാനുള്ള സൗകര്യ​മുണ്ടാക്കുന്നതല്ലേ? സാങ്കേതികമായി സ്കിമ്മിന് ഒരു ഡിഫാള്‍ട്ട് റൂള്‍ വേണമെന്നത് ശരിയാണ്. അതിനായി മൊഴി നിയമങ്ങളുടെ പരിഷ്കരിച്ച ഒരു രീതിയാണ് ഉപയോഗിച്ചത്. കൂടുതല്‍ ഉപയോഗക്ഷമതക്കു വേണ്ടി കുറച്ചു മാറ്റങ്ങള്‍ വരുത്തിയിട്ടുണ്ട്. വരമൊഴി ഉപയോഗിക്കുന്നവരോടും മറ്റു ചിലവിദഗ്ധരോടും ചോദിച്ചാണ് അതുചെയ്തത്. ഞാനുമൊരു മൊഴി ഉപയോക്താവായിരുന്നു. ആ നിയമങ്ങളുടെ ആള്‍ട്ടര്‍നേറ്റ് ആയി മൊഴി നിയമങ്ങളുമുണ്ട്. ഉപയോക്താക്കള്‍ക്ക് അവര്‍ക്കിഷ്ടമുള്ള രീതി ഉപയോഗിക്കാം. ചില്ലക്ഷരങ്ങള്‍ ഇതിനൊരുദാഹരണം മാത്രം. ചുരുക്കിപറഞ്ഞാല്‍ നിയമങ്ങളുടെ ഭാരം ഉപയോക്താവില്‍ നിന്നൊഴിവാക്കുന്നു എന്നതാണ് സ്വനലേഖയുടെ പ്രത്യേകത. അതുകൊണ്ട് ഏതെങ്കിലും സ്കീം ആയിരിക്കണം ഡിഫാള്‍ട്ട് റൂള്‍ എന്നു പറയുന്നതില്‍ അര്‍ത്ഥമൊന്നുമില്ല.
സ്വനലേഖ എന്ന പേരു നിര്‍ദ്ദേശിച്ച ഹുസ്സൈന്‍ സാറോടും പി പി രാമചന്ദ്രന്‍ സാറോടും കടപ്പാട് അറിയിച്ചുകൊള്ളുന്നു. ഇംഗ്ളീഷ് പേര് Phonetic എന്നുതന്നെ.
സ്വനലേഖയുടെ പുതിയ പതിപ്പില്‍ (0.0.4) കൂടുതല്‍ സൂചനകള്‍ ഉള്‍പ്പെടുത്തിയിട്ടുണ്ട്. ലുക്ക് അപ് ടേബിളിന്റെ കാര്യക്ഷമത കൂട്ടാന്‍ ഇതു സഹായിക്കും. nga=ങ എന്നതിനു പകരം nga=ങ്ങ , Nga=ങ എന്ന പുതിയ മാറ്റം കൊണ്ടു വന്നു. ങയുടെ ഉപയോഗം ങ്ങയുടെ ഉപയോഗത്തെ അപേക്ഷിച്ച് വളരെ കുറവാണെന്നതാണിതിനു കാരണം. ങ്ങ എന്നു ടൈപ്പ് ചെയ്യാന്‍ ngnga എന്നതിനു പകരം nga എന്നെഴുതിയാല്‍ മതി. ഉദാ:- ഞങ്ങള്‍ = njangaL~
ae=ഏ എന്ന പുതിയ ഒരു മാപ്പിങ്ങ് ചേര്‍ത്തു. ഈ ആശയങ്ങള്‍ക്ക് ഹുസ്സൈന്‍ സാറോട് കടപ്പാട്.
Debian packaging ല് ചെറിയ മാറ്റം വരുത്തിയിട്ടുണ്ട്(Added scim-gtk-immodule dependency). icon ഉം ചെറുതായി മാറ്റി. അടുത്ത പതിപ്പിനുശേഷം upstream ഇല്‍ commit ചെയ്യാമെന്നു തോന്നുന്നു.
സ്വനലേഖയുടെ m17n പതിപ്പും ഉടന്‍ പുറത്തിറങ്ങും. സ്വനലേഖയുടെ കന്നട പതിപ്പ് (scim-ka-phonetic) എന്റെ ഒരു സുഹൃത്ത് എഴുതിക്കൊണ്ടിരിക്കുന്നു.
For download: https://savannah.nongnu.org/task/download.php?file_id=13226

Scim malayalam phonetic input method With Lookup table!!!

Added a new feature to SCIM malayalam phonetic input method. It can give spelling suggestions while typing!!!. Cool right?
See the below screenshot from my system. I am editing some text in GEDIT. For typing വിള, I have to type viLa according to the IM Scheme. But as every body does, I typed vila. Now hint menu comes with two suggestions. ള and ല. I press arrow keys and it becomes വിള.

An extract from the documentation:
മലയാളം ശബ്ദാത്മക നിവേശകരീതിക്ക് ഉപയോക്താവ് എഴുതിക്കൊണ്ടിരിക്കുമ്പോള്‍ സൂചനകള്‍ കൊടുക്കാന്‍ കഴിയും. ഇത് മലയാളം വളരെപ്പെട്ടെന്ന് തെറ്റ് കൂടാതെ എഴുതാന്‍ സഹായിക്കുന്നു. ചില്ല​ക്ഷരങ്ങള്‍, കൂട്ടക്ഷരങ്ങള്‍ എന്നിവ എഴുതുമ്പോള്‍ ഇത് വളരെ ഫലപ്രദമാണ്. മലയാളികളുടെ സവിശേഷമായ മംഗ്ളീഷ് ഉപയോഗത്തിന്റെ അടിസ്ഥാനത്തിലാണ് ഇതു രൂപകല്പനചെയ്തിരിക്കുന്നത്.

ഉദാഹരണത്തിന് അടിപൊളി എന്നെഴുതാന്‍ പലപ്പോഴും നാം ഉപയോഗിക്കുന്നത് adipoli എന്നാണ്. പക്ഷെ മലയാളം ശബ്ദാത്മക നിവേശകരീതിയിലതെഴുതുന്നത് atipoLi എന്നാണല്ലൊ?. ചിലര്‍​ക്കെങ്കിലുമുണ്ടാകുന്ന ഈ തടസ്സം ഒഴിവാക്കുന്നതിന് സൂചനാപ്പട്ടിക ഉപകരിക്കും. adipoli എന്നെഴുതിക്കൊണ്ടിരിക്കുമ്പോള്‍ di എന്നെഴുതുമ്പോള്‍ സൂചനാപ്പട്ടിക ദി എന്നും ടി എന്നും 2 സൂചനകള്‍ നല്‍കുന്നു. അതുപോലെ ളി എന്നതിനുവേണ്ടി Li ക്കുപകരം li എന്നെഴുതുമ്പോള്‍ പട്ടിക ലി എന്നും ളി എന്നും 2 സൂചനകള്‍ നല്കുന്നു.

ഇതിന്റെ വേറൊരു ഉപയോഗം പേരുകളുടെ കൂടെയുള്ള initials എഴുതുമ്പോള്‍ ആണ്. ഉദാഹരണത്തിന് ലീല പി കെ എന്നെഴുതാന്‍ ശരിക്കും ഉപയോഗിക്കേണ്ടത് leela pi ke എന്നാണ്. പക്ഷെ നാം leela p k എന്നു തന്നെ എഴുതാന്‍ ഇഷ്ടപ്പെടുന്നു. നാം P അല്ലെങ്കില്‍ p എന്നെഴുതുമ്പോള്‍ സൂചനാപ്പട്ടിക പി എന്നൊരു സൂചനകൂടി തരും!.

കെ എസ് ആര്‍ ടി സി എന്നെഴുതാന്‍ K S R T C തന്നെ ഉപയോഗിക്കണമെന്നുണ്ടോ? സൂചനാപ്പട്ടികയുടെ സഹായത്തോടെ നിങ്ങള്ക്ക് K S R T C എന്നു തന്നെ എഴുതാം.

“അടിപൊളി അല്ലേ?!!!”
Now look at this

Note: I decided not to use mozhi scheme as such for the better usability.But I tried to give some compatibility to that scheme by giving alternative patterns in some places.

Scim malayalam phonetic input method : Key mapping

This is the key mapping for scim malayalam phonetic keyboard

സ്വരങ്ങള്‍
a aa A i ii I ee u uu U oo RR
ി
അം അഃ
e E ai ei o O au ou a~ aM ~ aH
വ്യഞ്ജനങ്ങള്‍
ങ്ക ന്റെ
k kh K g gh G ng nk nte
റ്റ ക്ഷ
ch Ch j jh J nj TT x
ക്യു വൈ
t T D Dh N q Y
ക്യൂ ഞ്ച
th thh d dh n Q nch
p f ph b bh B m
y r l v w S z sh s h
L zh R
ചില്ലുകള്‍
ന്‍ ല്‍ ള്‍ ര്‍
n~ l~ L~ r~ R~
ഉദാഹരണങ്ങള്‍
മലയാളം malayaaLaM malayAla~
സരിഗമപധനി sarigamapadhani
പൊന്പീലി ponpiili
മങ്ക manka
കുടുംബം kutu~ba~ kutu~baM
അവന്‍ avan~
ചക്ഷുശ്രവണഗളസ്ഥമാം chaxuSravanagalasThamaa~ chaxuSravanagalasThamaa~ chakshuSravanagalasThamaa~
പ്രകൃതി prakRthi
കൃഷ്ണന്‍ kRshNan~
പാലക്കാട് paalakkaat pAlakkAt
അക്ഷരം axaraM

Please post your comments in smc-discuss@googlegroups.com

Dhvani rewrite

I started a re-write on Dhvani architecture, keeping the algorithm same. This is based on Kiss principle. Instead of client server architecture a single executable is my plan. This will help me to integrate it with KTTS, kate etc. Now I know how to integrate Dhvani with KTTS.
Studied autoconf and automake for this…
More and more items in my TODO list…

Only Aspell, no space for others…

It seems that our work on our own spell checker doesnot have any importance other than learning. Aspell is light years ahead of us.There are ispell, myspell also. But we learned a lot about the approximate string comparison, fast search on a big wordlist, candidate list generation etc.. Gora Mohanty gave valuable insights to me on Aspell and how to create the Aspell word list for Malayalam.But still problems on compound words of malayalam.. “Sandhi & Samasam” and the infinite number of words that can be created by that in malayalam is a big hurdle for us..
Can we create a dictionary with all those words?
Can we code that large set of rules?!!
Wait and See 😉

A myth called the Indian programmer

“Most software professionals in India are not programmers, they are mere coders,”
http://timesofindia.indiatimes.com/Opinion/Sunday_Specials/Review/A_myth_called_the_Indian_programmer/articleshow/msid-1633868,curpg-1.cms

I completely agree with this article. We should make ourself different from others.
Software engineers are becoming dump users. Assemblers of pieces of code that even high school students can do. Are we using anything that we studied in our Computer Science courses in the engineering college?
Are we showing any creativity in this field? (There are exemptions, I agree, but in general)
Read http://fci.wikia.com/wiki/Challenges also…

Spell checker and Late night coding..

It was a wonderful week end. Myself and Benzi were working on the spell checker for Malayalam. In April we had done lot of research on this. We did the coding for the dictionary representation in the Binary Retrieval tree (TRIE). Saturday night we did the candidate list generation coding. It is a wonderful experience to code in the late night – one laptop and two persons to code!!!. Every thing worked fine. When we finished the coding, we realized that the application can be tuned to a universal(?) spell checker. So sunday we tested it using a 3 lakh english words.. Worked fine!!. We compared the spelling options generated with aspell. Ours was giving more options since our dictionary is bigger than aspell’s.
We want it to be called as bspell :-). But qns….
Why bspell? what is the extra/less features that bspell has compared to aspell
how to make it language independent?
How to rank the spelling suggestions?
How to make it work with Office suits/Editors?

Answer is “study Aspell”

Plus meet May 2007 at Tippus Fort , Palakkad

Anivar, Praveen, Hiran, Sujith and myself reached the fort at 10.15 AM. Anivar, Praveen, Hiran and Sujith were wearing T-Shirts with Debian Logo.
Riyas has reached already.Meeting started at 11 AM.
Around 20 members participated in the meeting. Meeting place was FREE and OPEN as you have seen in the pictures.
We sat under the tree in the form of a ring. Students from MES kuttippuram, GEC Sreekrishnapuram and GEC Thrissur participated.
First item was introduction. Every body introduced themself, distros used/using etc.
Hiran introduced Riyaz and himself. Meanwhile Riyaz started burning Debian DVDs.
Hiran gave an introduction to Plus to the participants.
Praveen explained the Debian, apt, its difference between Ubuntu, its release cycle etc. The discussion on Freedom concerns and Ubuntu reached in the discussion of
GPL version 3.We discussed the new features of GPLv3: Internationalized terms in the GPLv3, DRM, Microsoft Novell Deal,GPL violation etc.
We watched the “Truth Happens” video.
Participants asked questions about Mp3 patent, LGPL, BSD, Apache license etc.

Praveen has bought chocolates from US. GSOC participants sponsored the lunch for all.

After lunch break, we discussed the future programs of PLUS. We decided to increase the participation of students from engg and arts colleges in Palakkad
GSOC mentors/students updated the status of the projects.
Anivar introduced SMC to the participants.
Praveen explained the translation process.

Photos:
http://picasaweb.google.co.in/santhosh00/Plus_May_07
http://picasaweb.google.co.in/hiran.v/Plus_may