മലയാളം നിവേശകരീതികള്‍ ഒരു വിശകലനം

സെബിന്റെ ബ്ലോഗിലെ മലയാളം മലയാളത്തിലെഴുതാന്‍ എന്ന പോസ്റ്റിന്റെ പശ്ചാത്തലത്തില്‍ നിവേശകരീതികളെപ്പറ്റി ഒരു വിശകലനത്തിന് ശ്രമിയ്ക്കുന്നു മലയാളം എഴുതാന്‍ നല്ലത് ഇന്‍സ്ക്രിപ്റ്റ്, വരമൊഴി എന്നിവയിലേത് ഉപയോഗിയ്ക്കണമെന്ന് വിശകലനം ചെയ്യുന്നത് എവിടെയും എത്താത്ത ഇടുങ്ങിയ വിശകലനമായിരിയ്ക്കും. നിവേശകരീതികളെ ഞാന്‍ വേറൊരു രീതിയിലാണ് തരംതിരിയ്ക്കാനിഷ്ടപ്പെടുന്നത്. നോണ്‍ഫൊണറ്റിക് – ശബ്ദാത്മകം അല്ലാത്തത്. ഫൊണറ്റിക് – ശബ്ദാത്മകം നോണ്‍ഫൊണറ്റിക് – ശബ്ദാത്മകം അല്ലാത്തത് ഇംഗ്ലീഷ് അക്ഷരങ്ങള്‍ ഉള്ള ഒരു കീബോര്‍ഡ് ഉപയോഗിയ്ക്കുമ്പോള്‍ ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ ഫൊണറ്റിക് മൂല്യങ്ങളോട് ഒട്ടും ചേരാതെ ഒരു ഭാഷയിലെ അക്ഷരങ്ങളെ മാപ്പ് ചെയ്യുന്ന നിവേശകരീതികളെ ഇങ്ങനെ വിശേഷിപ്പിയ്ക്കാം. ഇന്‍സ്ക്രിപ്റ്റാണ് ഇതിന്റെ നല്ല ഉദാഹരണം. L എന്ന കീയുടെ സ്ഥാനത്ത് ത , ഥ എന്നീ അക്ഷരങ്ങളെ ചേര്‍ക്കുമ്പോള്‍ സംഭവിയ്ക്കുന്നത് , കീബോര്‍ഡില്‍ മലയാളം കട്ടകളാണെന്ന് മനസ്സില്‍ വിചാരിച്ച് ടൈപ്പ് ചെയ്യണം എന്നാണ്. [Read More]

കേള്‍വി ഒരു കല, സംഭാഷണം സംഗീതവും

“കേള്‍വി ഒരു കലയാണ്. നാക്ക് നമ്മുടെ ചെവിയിലായിരുന്നെങ്കില്‍ ശബ്ദത്തെ രുചിയ്ക്കാമായിരുന്നു” ഫോസ്.ഇന്‍ പരിപാടിയ്ക്കിടയില്‍ ഉണ്ടായ ഒരു സംഭാഷണമദ്ധ്യേ പ്രശസ്ത ഡിസൈനറും കോളമിസ്റ്റൂം സ്വതന്ത്ര സോഫ്റ്റ്‌വെയര്‍ പ്രചാരകനുമായ നിയാം ഭൂഷണ്‍ എന്നോടു പറഞ്ഞു. ഫോസ്.ഇന്‍ പരിപാടിയില്‍ എന്റെ ഭാരതീയ ഭാഷാ സംഭാഷണവിശ്ലേഷിണിയെപ്പറ്റിയുള്ള(Speech Synthesizer) അവതരണത്തില്‍ നിയാം ഭൂഷണും ശ്രോതാവായി വന്നിരുന്നു. വാക്കുകളെ ശബ്ദമാക്കുമ്പോള്‍ ശാസ്ത്രം അഭിമുഖീകരിയ്ക്കുന്ന ഒരു വെല്ലുവിളിയാണ് വായിക്കുന്നതിന്റെ താളഭംഗിയും അതിന്റെ സ്വാഭാവികതയും. ധ്വനി എന്ന എന്റെ സോഫ്റ്റ്‌വെയര്‍ തികച്ചും യാന്ത്രികമായിട്ടാണ് 8 ഭാഷകള്‍ വായിക്കുന്നത്. കേട്ടാല്‍ മനസ്സിലാവുമെങ്കിലും അതിന്റെ റോബോട്ടിക് സംസാരശൈലി പലപ്പോഴും അരോചകമാണെന്നത് സത്യമാണ്. ശബ്ദങ്ങളെ കൂട്ടിയിണക്കിയുള്ള സംസാരവിശ്ലേഷിണികളാണ് ഏറെയും പ്രചാരത്തിലുള്ളത്. അവയില്‍ താളവും സ്വാഭാവികതയും കൊണ്ടു വരുന്നതിനെപ്പറ്റിയുള്ള ഗവേഷണങ്ങള്‍ ഇപ്പോളും പൂര്‍ണ്ണവിജയത്തിലെത്തിയിട്ടില്ല. [Read More]

Sulekha: Transliteration Based Indic Texteditor

Learning how to type in our own Mother tongue is always a problem for newbies. Usually we will just use English as “yeh kya hey” while chatting/mailing. It is because of this reason the transliteration based input methods are more popular than the Inscript in some languages. Google recently released their Indic transliterate service, a web based text editor which will take English words and convert to Indic languages with the help of some machine learning. [Read More]
hack  SMC  sulekha 

ഇതാ വരുന്നൂ, സുലേഖ

ഗൂഗിള്‍ ഈയിടെ പുറത്തിറക്കിയ ഗൂഗിള്‍ ട്രാന്‍സ്ലിറ്ററേറ്റ് എന്ന സേവനത്തില്‍ നിന്ന് പ്രചോദനമുള്‍‌ക്കൊണ്ട് സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് അവതരിപ്പിയ്ക്കുന്നു, പുതിയ സ്വതന്ത്ര സോഫ്റ്റ്‌വെയര്‍ സംരംഭം: “സുലേഖ ” എന്താണ് സുലേഖ? സുലേഖ gtk യില്‍ തീര്‍ത്ത ഒരു GUI ടെക്സ്റ്റ് എഡിറ്ററാണ്. വരമൊഴി, സ്വനലേഖ തുടങ്ങിയവ ഓരോ അക്ഷരത്തിനെയും ലിപ്യന്തരണം ചെയ്യുമ്പോള്‍ പദാനുപദ ലിപ്യന്തരണമാണ് സുലേഖ ചെയ്യുന്നത്. ഓരോ വാക്കും കഴിഞ്ഞ് സ്പേസ് അടിയ്ക്കുമ്പോള്‍ തൊട്ടുമുമ്പ് ടൈപ്പ് ചെയ്ത മംഗ്ലീഷ് മലയാളമായി മാറുന്നു. എഴുതിയ മംഗ്ലീഷ് ആശയക്കുഴപ്പമില്ലാതെ ഒരു മലയാളം വാക്കിന് തത്തുല്യമാണെങ്കില്‍ ആ മലയാളം വാക്ക് വരുന്നു. അല്ലെങ്കില്‍ മംഗ്ലീഷിന്റെ ഏകദേശ ലിപ്യന്തരണം നടത്തി, ആ വാക്ക് ഒരു ചുവപ്പ് അടിവരയോടു കൂടി കാണിയ്ക്കുന്നു. [Read More]
SMC  sulekha 

Hacking the GLMatrix screensaver

I am sure that many of you are fans of “The Matrix” series. And many of you might be using the Matrix Screensavers in your system. But did you ever think like this: “Why cant that glowing green glyphs that rains in black screen be Indic ?” Well, Not a bad Idea. Right? Ok, Shall we try to hack the glmatrix screen saver? Here you go! Download the xscreensaver sourcecode from http://www. [Read More]
hack  Indic  matrix 

വരമൊഴിയിലും മൊഴി കീമാനിലും എന്‍കോഡിങ്ങ് ബഗ്ഗുകള്‍

വരമൊഴിയിലും മൊഴി കീമാനിലും ( Tavultesoft keyboard) എന്‍കോഡിങ്ങ് പിശകുകള്‍. മലയാളം വിക്കിപ്പീഡിയയിലുള്ള മൊഴി കീമാപ്പിലും ഈ പിശക് ഉണ്ട്. വാക്കുകളുടെ യൂണിക്കോഡ് കോഡ് മൂല്യങ്ങളുടെ വിന്യാസത്തിലാണ് പിശക്. അനാവശ്യമായ ZWNJ ആണ് പ്രശ്നം കുറച്ച് ഉദാഹരണങ്ങളിലൂടെ ഇത് വിശദമാക്കാം. മൊഴി പൊന്‍നിലാവ് (pon_nilaav): ഈ വാക്കിന്റെ ആന്തരിക യൂണിക്കോഡ് റെപ്രസന്റേഷന്‍ എന്താണെന്നറിയാന്‍ പൈത്തണ്‍ പ്രോഗ്രാമ്മിങ്ങ് ഭാഷ ഉപയോഗിക്കാം. str=u”പൊന്‍‌നിലാവ്” print repr(str) u’\u0d2a\u0d4a\u0d28\u0d4d\u200d\u200c\u0d28\u0d3f\u0d32\u0d3e\u0d35\u0d4d’ \u200c(ZWNJ) എന്ന കോഡ് ഇവിടെ അനാവശ്യമാണ്. പൊന്‍നിലാവ് എന്ന വാക്കിന്റെ യഥാര്‍ത്ഥ യൂണിക്കോഡ് ശ്രേണി ഇതാണ്: u’\u0d2a\u0d4a\u0d28\u0d4d\u200d\u0d28\u0d3f\u0d32\u0d3e\u0d35\u0d4d’ ഇത്തരത്തിലുള്ള മറ്റു ചില വാക്കുകളിതാ:(മൊഴി കീമാന്‍ ഉപയോഗിച്ചെഴുതിയത്)- വാക്കുകള്‍ക്കിടയില്‍ ചില്ലക്ഷരം വരുന്നവ: മുന്‍‌തൂക്കം, എന്‍‌കോഡിംഗ്, ചാരന്‍‌മാരാണ് ,നന്‍‌മ,പാന്‍‌ഗോ,പിന്‍‌താങ്ങുന്നുവെന്നു,പിന്‍‌തിരിയണമെന്നും,പിന്‍‌പക്കത്തില്‍,പിന്‍‌വലിഞ്ഞു ,പൊന്‍‌വീണ,പൗരന്‍‌മാര്‍,മന്‍‌മോഹന്‍,മുന്‍‌കൂട്ടി,മുന്‍‌കൈ, [Read More]

സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ്, GSOC Mentor Summit ല്‍ പങ്കെടുക്കുന്നു.

2007 ലെ ഗൂഗിള്‍ സമ്മര്‍ ഓഫ് കോഡ് പരിപാടിയുടെ ഭാഗമായി കാലിഫോര്‍ണിയയില്‍ ഒക്ടോബര്‍ ആറിന് ഗൂഗിള്‍ ഹെഡ് ക്വാര്‍ട്ടേഴ്സില്‍ നടക്കുന്ന Google summer of code Mentors Summit പരിപാടിയില്‍ SMC യുടെ പ്രതിനിധിയായി പ്രവീണ്‍ പങ്കെടുക്കുന്നു. GSOC 2007 ല്‍ പങ്കെടുത്ത മെന്റര്‍മാരുടെ സമ്മേളനമാണിത്. ഈ വര്‍ഷം ഇന്ത്യയില്‍ നിന്ന് ഈ പരിപാടിക്ക് തെരഞ്ഞെടുക്കപ്പെട്ട ഏക സ്വതന്ത്ര കൂട്ടായ്മ SMC ആയതു കൊണ്ട് SMC ഇന്ത്യയെക്കൂടി ഈ പരിപാടിയില്‍ പ്രതിനിധാനം ചെയ്യുന്നു. പ്രവീണിന് യാത്രാമംഗളങ്ങള്‍ നേരുന്നു. വിദ്യാര്‍ത്ഥികളെ സ്വതന്ത്ര സോഫ്റ്റ്‌വെയര്‍ വികസനരീതികള്‍ പരിചയപ്പെടുത്തുന്നതിനും അവരുടെ സര്‍ഗ്ഗാത്മകമായ സോഫ്റ്റ്‌‌വെയര്‍ സംരംഭ ആശയങ്ങളെ പ്രോത്സാഹിപ്പിക്കുന്നതിനും വേണ്ടി എല്ലാ വര്‍ഷവും ഗൂഗിള്‍ ലോകമെങ്ങും നടത്തുന്ന പരിപാടിയാണ് ഗൂഗിള്‍ സമ്മര്‍ ഓഫ് കോഡ്. [Read More]
google  gsoc  SMC 

കമ്പ്യൂട്ടറിന് മലയാളം പറഞ്ഞാല്‍ മനസ്സിലാകുമോ?

“വൈകീട്ടെന്താ പരിപാടി ?” ഇങ്ങനെ കമ്പ്യൂട്ടറിനോടു ചോദിച്ചാല്‍ അത് ഉത്തരം പറയും.. ഇങ്ങനെയായിരുന്നു കേരള കൗമുദിയുടെ സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ സോഫ്റ്റ്‌വെയര്‍ സ്വാതന്ത്ര്യദിന പരിപാടികളുടെ 15-ാം തിയ്യതിയിലെ റിപ്പോര്‍ട്ട് ആരംഭിച്ചത്. വായനക്കാര്‍ക്ക് കൗതുകം തോന്നിക്കാണും. മലയാളം കേട്ടാല്‍ മനസ്സിലാവുന്ന കമ്പ്യൂട്ടറോ ഏയ്… ഇവര്‍ വെറുതേ പറയുന്നതാ… മലയാളത്തിലുള്ള ആജ്ഞകള്‍ക്ക് കാതോര്‍ത്തിരിക്കുന്ന കമ്പ്യൂട്ടര്‍… മുന്നിലിരിക്കുന്നയാള്‍ പറയുന്നതിനനുസരിച്ച് പ്രവര്‍ത്തിക്കുന്ന അപ്ലിക്കേഷനുകള്‍…. പാട്ട് പാടാന്‍ പറയാന്‍ പറയുമ്പോള്‍ പാടുന്ന കമ്പ്യൂട്ടര്‍.(ആരവിടെ, ആ പാട്ടൊന്നു വയ്ക്കൂ 🙂 ) .. അത്യാവശ്യ വിവരങ്ങള്‍ മലയാളത്തില്‍ ചോദിച്ചാല്‍ മലയാളത്തില്‍ തന്നെ തിരിച്ചു മറുപടി പറയുന്ന കമ്പ്യൂട്ടര്‍….ടൈപ്പ് ചെയ്യുന്നതിന് പകരം മലയാളത്തില്‍ പറഞ്ഞു കൊടുത്താല്‍ എഴുതി തരുന്ന കമ്പ്യൂട്ടര്‍… മലയാളം ഫയലുകള്‍ വായിച്ചു തരുന്ന കമ്പ്യൂട്ടര്‍…. [Read More]

മലയാളത്തിന് സ്വന്തമായി ഒരു വേര്‍ഡ് പ്രൊസസ്സര്‍

പരിപൂര്‍ണ്ണ മലയാളം പിന്തുണയുമായി സ്വതന്ത്ര വേര്‍ഡ് പ്രൊസസ്സര്‍ അബിവേര്‍ഡ് വരുന്നു. പാംഗോ ചിത്രീകരണ സംവിധാനത്തിന്റെ പിന്‍ബലത്തോടെ ഗ്നു ലിനക്സ് പ്രവര്‍ത്തക സംവിധാനത്തില്‍ ഉപയോഗിക്കാവുന്ന ഇതിന്റെ സോഴ്സ് കോഡ് കമ്പൈല്‍ ചെയ്തെടുത്ത ചില ചിത്രങ്ങളിതാ..

അബിവേര്‍ഡ് വികസിപ്പിച്ചെടുത്തവര്‍ക്ക് അഭിവാദ്യങ്ങള്‍….

ഗ്നോം 2.20 ലക്കത്തില്‍ മലയാളം ഔദ്യോഗികമായി ചേര്‍ക്കപ്പെട്ടു.

സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ കിരീടത്തില്‍ ഒരു പൊന്‍തൂവല്‍ കൂട്. ഗ്നോം 2.20 ലക്കത്തില്‍ മലയാളം ഔദ്യോഗികമായി ചേര്‍ക്കപ്പെട്ടു.

GNOME 2.20 offers support for 45 languages (at least 80 percent of strings translated).

മറ്റൊരു സന്തോഷ വാര്‍ത്ത കൂടി . ഗ്നു ആസെല്‍ മലയാളം സ്പെല്‍ ചെക്കര്‍ ഡെബിയന്‍ ഗ്നു ലിനക്സില്‍ ചേര്‍ക്കപ്പെട്ടു, കാണുക http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=440295

സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് ഇതു വരെ വികസിപ്പിച്ച് സോഫ്ട്‌വെയറുകള്‍ പൊതുജനങ്ങള്‍ക്കായി പ്രദര്‍ശിപ്പിക്കുന്നു. കാണുക http://fci.wikia.com/wiki/SFD/SMC