ആം ചിഹ്നം ഫോണ്ടുകളിൽ
Posted on October 4, 2023
| Santhosh Thottingal
ഏറെക്കാലമായി പലരും ചോദിക്കുന്ന ഒരു സംശയമാണ് അക്കങ്ങളുടെ കൂടെ ആം ചിഹ്നം എഴുതുമ്പോൾ വരുന്ന കുത്തുവട്ടം എങ്ങനെ കളയാമെന്ന്. 16-ാം, 18ാം തുടങ്ങിയ ഉദാഹരണങ്ങൾ. ഒട്ടുമിക്ക അപ്ലിക്കേഷനുകളുടെ പുതിയ പതിപ്പുകളിലും ഈ പ്രശ്നം കാണില്ല. ലിബ്രെഓഫീസിൽ പക്ഷേ ഈ പ്രശ്നം തുടരുന്നുണ്ട്. ഇതിനു പരിഹാരമായി ഫോണ്ടുകളിൽ ഒരു ചെറിയ പുതുക്കൽ നടത്തിയിട്ടുണ്ട്. മഞ്ജരി, ഗായത്രി, ചിലങ്ക, നൂപുരം ഫോണ്ടുകളുടെ പുതിയ പതിപ്പുപയോഗിച്ചാൽ ഈ പ്രശ്നം ഒഴിവാകും. പുതിയ പതിപ്പുകൾ smc.org.in/fonts എന്ന പേജിൽ നിന്നെടുക്കാം.
Introducing Nupuram, new Malayalam typeface
Posted on October 5, 2022
| Santhosh Thottingal
I am happy to introduce Nupuram, a new Malayalam typeface that I have been designing and developing for several months. The typeface is not ready for a stable release, but pre-release versions are available for early testing.
Nupuram is a superfamily typeface. Nupuram variable font Taking full advantage of variable font technology, Nupuram offers an unprecedented level of flexibility, all from a single font file. Nupuram has 4 variation axes: Weight, Width, Slant and Softness.
[Read More]
Gayathri 1.20 released
Posted on May 14, 2022
| Santhosh Thottingal
A new version of Gayathri typeface is available now. Version 1.20 comes with a few bugfixes and glyph additions.
New version is available at SMC website for preview and download.
Changes Fix the size issue of fullstop and comma Add 0D7B+0D4D+0D31 based ന്റ Improve kerning for latin Add 22 latin glyphs Fix spacing issues for quote signs Flatten the nested components Update build dependencies and CI The latest version is not yet available at Google fonts.
[Read More]
ലിപിപരിഷ്കരണം 2022
Posted on April 23, 2022
| Santhosh Thottingal
മലയാളലിപി പരിഷ്കരിക്കാനായി സർക്കാർ രൂപീകരിച്ച വിദഗ്ദ്ധസമിതിയുടെ നിർദ്ദേശങ്ങൾ അംഗീകരിച്ചെന്നും ഉ ചിഹ്നങ്ങൾ മാത്രം വിട്ടെഴുതുന്ന പഴയലിപി സമിതി നിർദ്ദേശിച്ചുവെന്നുമുള്ള വാർത്തകളുടെ അടിസ്ഥാനത്തിൽ ചില പ്രതികരണങ്ങളും ചിന്തകളും പങ്കുവെയ്ക്കുന്നു.
ഫോണ്ടുകളും ലിപിപരിഷ്കരണവും നിലവിൽ പേന/ബ്രഷ് കൊണ്ടല്ലാത്ത എല്ലാത്തരം അച്ചടിയും അക്ഷരങ്ങളുടെ ചിത്രീകരണവും നടക്കുന്നത് ഫോണ്ടുകൾ എന്ന സോഫ്റ്റ്വെയർ വഴിയാണ്. അതുകൊണ്ടുതന്നെ ഒരു ഭാഷയിലെ ലിപിരൂപങ്ങളെക്കുറിച്ചുള്ള ഏതൊരുമാറ്റത്തിനും ഇന്ന് ഒരു സോഫ്റ്റ്വെയർ റിലീസ് സൈക്കിളിനോട് സാമ്യമുണ്ട്. പക്ഷേ പൂർണ്ണാർത്ഥത്തിൽ ഒരു സോഫ്റ്റ്വെയർ അതിന്റെ ഫീച്ചറുകളിൽ മാറ്റം വരുത്തി പുതിയ പതിപ്പായി ഇറക്കുന്നപോലെയല്ല ഫോണ്ടുകളുടെ റിലീസ്. ഫോണ്ടുകളിൽ ടെക്നോളജിയുടെ ഒപ്പം തന്നെ അക്ഷരങ്ങളുടെ കലാപരമായ ചിത്രീകരണം കൂടി ഉള്ളതുകൊണ്ട് ഒരിക്കൽ ഒരു ഫോണ്ട് പുറത്തുവന്നാൽ അതിന്റെ രൂപകല്പനയും ഘടനയും മാറ്റിപ്പണിത് പുറത്തിറക്കാറില്ല.
[Read More]
ബഹുവചനമില്ലാത്ത ദേശാഭിമാനി
Posted on February 21, 2022
| Santhosh Thottingal
New version of Malayalam morphology analyser
Posted on March 20, 2021
| Santhosh Thottingal
In the previous blog post I explained my efforts to modernize SFST. Since I published SFST python binding and modernized to make it compile in all operating systems, next step was to drop HFST dependency of mlmorph and use the new version of SFST 1.5.0.
mlmorph 1.3.0 has no dependency on HFST and all installation problems in different operating systems and python versions are solved now.
Latest version is also available in pypi.
[Read More]
New version of Manjari Typeface released
Posted on March 19, 2021
| Santhosh Thottingal
A new version of Manjari Malayalam typeface is available now. Version 2.000 comes with a few bugfixes and glyph additions. Most of the changes are based on a review by Google fonts team.
New version is available at SMC website for preview and download.
Changes Design correction for Malayalam number 10 to better match the attestations (0d6b0fc2) Avoid glyphs that use components that are components themself (6fe9b35d) Add ligatures glyphs for ൻ + ് + റ version of nta (2c39ae08) Review and update diacritics alignment (c498245d) Rename License.
[Read More]
Tesseract OCR web interface
Posted on November 14, 2020
| Santhosh Thottingal
I prepared a web frontend for Tesseract OCR to do optical character recognition for Malayalam - https://ocr.smc.org.in
This application uses Tesseract.js, Javascript port of Tesseract.
You can use images with English or Malayalam content. Use the editor and the spellchecker for proofreading the text recognized.
Your image does not leave your browser since the recognition is done in browser and does not use any remote servers.
Source code: https://gitlab.com/smc/tesseract-ocr-web
Fixing a bug in Malayalam ya, ra, va sign rendering
Posted on November 13, 2020
| Santhosh Thottingal
In Malayalam, the Ya, Va and Ra consonant signs when appeared together has an interesting problem. The Ra sign(്ര also known as reph) is prebase sign, meaning, it goes to left side of the consonant or conjunct to which it applies. The Ya sign(്യ) and Va sign(്വ) are post base, meaning it goes to the right side of consonant or conjunct to which it applies. So, after a consonant or conjunct, if Ra sign and Ya sign is present, Ra sign goes to left and Ya sign remain to the right.
[Read More]
English Malayalam Translation using OpusMT
Posted on November 1, 2020
| Santhosh Thottingal
SMC had started a machine translation service at translate.smc.org.in for English-Malayalam. This system uses huggingface transformers with OpusMT language models for translation.
OPUS MT provides pre-trained neural translation models trained on OPUS data. These models can seamlessly run with the OPUS-MT transation servers that can be installed from our OPUS-MT github repository. The translation service is powered by Marian Neural MT engine
The quality of the machine translation depends on the availability of parallel corpus.
[Read More]