മലയാളത്തിന്റെ ഡിജിറ്റൽ സൗന്ദര്യം - പ്രഭാഷണം
നിർമിതിബുദ്ധി മാതൃകകളിലെ മലയാളം - പ്രഭാഷണം
നിർമിതബുദ്ധിമാതൃകകളിലെ മലയാളം എന്ന വിഷയത്തിൽ ശ്രീശങ്കരാചാര്യ കാലടി സംസ്കൃതസർവകലാശാലയുടെ തിരുനാവായ പ്രാദേശിക കേന്ദ്രത്തിൽ ജനുവരി ആറിന് പ്രഭാഷണം നടത്തി.
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിൽ മലയാളം ഒരു ഭാഷ എന്ന നിലയിൽ എവിടെ എത്തിനിൽക്കുന്നു, ഭാഷയുടെ പ്രത്യേകതകൾ എങ്ങനെയാണ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകൾ പ്രവർത്തിക്കുന്നത്, മറ്റുഭാഷകളെ അപേക്ഷിച്ച് എന്തൊക്കെ വെല്ലുവിളികളാണ് മലയാളത്തിനുള്ളത് തുടങ്ങിയ വിഷയങ്ങളാണ് അവതരിപ്പിച്ചത്. slides
Video recording is given below:
ആം ചിഹ്നം ഫോണ്ടുകളിൽ
ഏറെക്കാലമായി പലരും ചോദിക്കുന്ന ഒരു സംശയമാണ് അക്കങ്ങളുടെ കൂടെ ആം ചിഹ്നം എഴുതുമ്പോൾ വരുന്ന കുത്തുവട്ടം എങ്ങനെ കളയാമെന്ന്. 16-ാം, 18ാം തുടങ്ങിയ ഉദാഹരണങ്ങൾ. ഒട്ടുമിക്ക അപ്ലിക്കേഷനുകളുടെ പുതിയ പതിപ്പുകളിലും ഈ പ്രശ്നം കാണില്ല. ലിബ്രെഓഫീസിൽ പക്ഷേ ഈ പ്രശ്നം തുടരുന്നുണ്ട്. ഇതിനു പരിഹാരമായി ഫോണ്ടുകളിൽ ഒരു ചെറിയ പുതുക്കൽ നടത്തിയിട്ടുണ്ട്. മഞ്ജരി, ഗായത്രി, ചിലങ്ക, നൂപുരം ഫോണ്ടുകളുടെ പുതിയ പതിപ്പുപയോഗിച്ചാൽ ഈ പ്രശ്നം ഒഴിവാകും. പുതിയ പതിപ്പുകൾ smc.org.in/fonts എന്ന പേജിൽ നിന്നെടുക്കാം.
Using Manjari as new orthography Malayalam font
Tesseract OCR web interface
I prepared a web frontend for Tesseract OCR to do optical character recognition for Malayalam - https://ocr.smc.org.in
This application uses Tesseract.js, Javascript port of Tesseract.
You can use images with English or Malayalam content. Use the editor and the spellchecker for proofreading the text recognized.
Your image does not leave your browser since the recognition is done in browser and does not use any remote servers.
Source code: https://gitlab.com/smc/tesseract-ocr-web