മലയാളത്തിന്റെ ഡിജിറ്റൽ സൗന്ദര്യം - പ്രഭാഷണം

ഡോ. പുതുശ്ശേരി രാമചന്ദ്രൻ അനുസ്മരണ ദേശീയസെമിനാറും പുരസ്കാരവിതരണവും 2024 ഫെബ്രുവരി 26, 27, 28 തിയതികളിൽ കേരളയൂണി. കേരളപഠനവിഭാഗം സെമിനാർഹാൾ, കാര്യവട്ടം കാമ്പസിൽ നടന്നു. “നവസാങ്കേതികയും സർഗ്ഗാത്മകസാധ്യതകളും " എന്നതായിരുന്നു സെമിനാർ വിഷയം. “മലയാളത്തിന്റെ ഡിജിറ്റൽ സൗന്ദര്യം” എന്ന വിഷയം ഞാൻ അവതരിപ്പിച്ചു. അവതരണം ഒന്നരമണിക്കൂർ ഉള്ള ഈ പ്രഭാഷണം നിരവധി ചിത്രങ്ങളുടെയും വീഡിയോകളുടെയും ഇല്ലസ്ട്രേഷനുകളുടെയും സഹായത്തോടെയുള്ളതാണ്. ഇരുനൂറ്റമ്പത് കൊല്ലത്തെ മലയാളത്തിന്റെ അച്ചടി ചരിത്രത്തിൽ അക്ഷരങ്ങളുടെ സൗന്ദര്യത്തിൽ വന്ന മാറ്റങ്ങൾ, ആ മാറ്റങ്ങൾക്ക് സാങ്കേതികവിദ്യ, അധികാരവ്യവസ്ഥ എന്നിവ എങ്ങനെ കാരണമായി? ആ മാറ്റങ്ങളുടെ സവിശേഷതകൾ, നാൾവഴികൾ എന്ത്? ഇന്നത്തെ കാലത്തെ അക്ഷരങ്ങളുടെ സൗന്ദര്യാവിഷ്കാരം ഫോണ്ടുകൾ വഴിയാണെന്നതുകൊണ്ട് മലയാളത്തിന്റെ സൗന്ദര്യത്തെ എങ്ങനെ ഫോണ്ടുകൾ ആവിഷ്കരിക്കുന്നു? [Read More]

നിർമിതിബുദ്ധി മാതൃകകളിലെ മലയാളം - പ്രഭാഷണം

നിർമിതബുദ്ധിമാതൃകകളിലെ മലയാളം എന്ന വിഷയത്തിൽ ശ്രീശങ്കരാചാര്യ കാലടി സംസ്കൃതസർവകലാശാലയുടെ തിരുനാവായ പ്രാദേശിക കേന്ദ്രത്തിൽ ജനുവരി ആറിന് പ്രഭാഷണം നടത്തി.

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിൽ മലയാളം ഒരു ഭാഷ എന്ന നിലയിൽ എവിടെ എത്തിനിൽക്കുന്നു, ഭാഷയുടെ പ്രത്യേകതകൾ എങ്ങനെയാണ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകൾ പ്രവർത്തിക്കുന്നത്, മറ്റുഭാഷകളെ അപേക്ഷിച്ച് എന്തൊക്കെ വെല്ലുവിളികളാണ് മലയാളത്തിനുള്ളത് തുടങ്ങിയ വിഷയങ്ങളാണ് അവതരിപ്പിച്ചത്. slides

Video recording is given below:

ആം ചിഹ്നം ഫോണ്ടുകളിൽ

ഏറെക്കാലമായി പലരും ചോദിക്കുന്ന ഒരു സംശയമാണ് അക്കങ്ങളുടെ കൂടെ ആം ചിഹ്നം എഴുതുമ്പോൾ വരുന്ന കുത്തുവട്ടം എങ്ങനെ കളയാമെന്ന്. 16-ാം, 18ാം തുടങ്ങിയ ഉദാഹരണങ്ങൾ. ഒട്ടുമിക്ക അപ്ലിക്കേഷനുകളുടെ പുതിയ പതിപ്പുകളിലും ഈ പ്രശ്നം കാണില്ല. ലിബ്രെഓഫീസിൽ പക്ഷേ ഈ പ്രശ്നം തുടരുന്നുണ്ട്. ഇതിനു പരിഹാരമായി ഫോണ്ടുകളിൽ ഒരു ചെറിയ പുതുക്കൽ നടത്തിയിട്ടുണ്ട്. മഞ്ജരി, ഗായത്രി, ചിലങ്ക, നൂപുരം ഫോണ്ടുകളുടെ പുതിയ പതിപ്പുപയോഗിച്ചാൽ ഈ പ്രശ്നം ഒഴിവാകും. പുതിയ പതിപ്പുകൾ smc.org.in/fonts എന്ന പേജിൽ നിന്നെടുക്കാം.

Using Manjari as new orthography Malayalam font

Manjari is a traditional orthography font for Malayalam. It has large set of ligatures, vowel signs like /u/ get attached to its corresponding consonants to form ligatures. But, sometimes there are requirements to illustrate new orthography Malayalam content in Manjari. Recently, Manjari was used to typeset an academic book related to Malayalam script and it was required to show some content in new orthography with detached vowel signs and detached reph signs. [Read More]

Tesseract OCR web interface

I prepared a web frontend for Tesseract OCR to do optical character recognition for Malayalam - https://ocr.smc.org.in

Ya, Ra signs producing same rendering irrespective of order in data.

This application uses Tesseract.js, Javascript port of Tesseract.

You can use images with English or Malayalam content. Use the editor and the spellchecker for proofreading the text recognized.

Your image does not leave your browser since the recognition is done in browser and does not use any remote servers.

Source code: https://gitlab.com/smc/tesseract-ocr-web

Fixing a bug in Malayalam ya, ra, va sign rendering

In Malayalam, the Ya, Va and Ra consonant signs when appeared together has an interesting problem. The Ra sign(്ര also known as reph) is prebase sign, meaning, it goes to left side of the consonant or conjunct to which it applies. The Ya sign(്യ) and Va sign(്വ) are post base, meaning it goes to the right side of consonant or conjunct to which it applies. So, after a consonant or conjunct, if Ra sign and Ya sign is present, Ra sign goes to left and Ya sign remain to the right. [Read More]

English Malayalam Translation using OpusMT

SMC had started a machine translation service at translate.smc.org.in for English-Malayalam. This system uses huggingface transformers with OpusMT language models for translation. OPUS MT provides pre-trained neural translation models trained on OPUS data. These models can seamlessly run with the OPUS-MT transation servers that can be installed from our OPUS-MT github repository. The translation service is powered by Marian Neural MT engine The quality of the machine translation depends on the availability of parallel corpus. [Read More]

Web application for learning Malayalam writing

In my previous blog post, I wrote about an experiment of using SVG path animation to help learn malayalam letter writing. That prototype application was well received by many people and that encouraged me to host it as a proper application. Now, the Malayalam learning application is available at https://learn.smc.org.in Source code: https://gitlab.com/smc/mlmash I added all letters of Malayalam there. Added a few common ligatures too. Kavya helped to record and add pronunication of these letters with couple of examples. [Read More]

Animated SVGs for learning Malayalam writing

I wanted to make an educational typeface with writing directions in each glyphs. Something like this: But considering the effort it takes I was bit confused whether it is really necessary to have a typeface or just images like this will suffice. Recently, I read about SVG path animations and I thought animating the path inside each letters will be more helpful than static image with drawing directions. The Chilanka and Manjari typefaces I designed have SVG images with strokes as master designs and in most of the cases, the stroke path directions are the writing directions. [Read More]

Gayathri – New Malayalam typeface

Swathanthra Malayalam Computing is proud to announce Gayathri – a new typeface for Malayalam. Gayathri is designed by Binoy Dominic, opentype engineering by Kavya Manohar and project coordination by Santhosh Thottingal. This typeface was financially supported by Kerala Bhasha Institute, a Kerala government agency under cultural department. This is the first time SMC work with Kerala Government to produce a new Malayalam typeface. Gayathri is a display typeface, available in Regular, Bold, Thin style variants. [Read More]