<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Santhosh Thottingal &#187; Malayalam</title>
	<atom:link href="http://thottingal.in/blog/category/malayalam/feed/" rel="self" type="application/rss+xml" />
	<link>http://thottingal.in/blog</link>
	<description>/home/santhosh</description>
	<lastBuildDate>Sat, 10 Mar 2012 13:27:54 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.2</generator>
		<item>
		<title>New version of Malayalam fonts released</title>
		<link>http://thottingal.in/blog/2012/03/10/new-version-of-malayalam-fonts-released/</link>
		<comments>http://thottingal.in/blog/2012/03/10/new-version-of-malayalam-fonts-released/#comments</comments>
		<pubDate>Sat, 10 Mar 2012 13:24:05 +0000</pubDate>
		<dc:creator>Santhosh</dc:creator>
				<category><![CDATA[Community]]></category>
		<category><![CDATA[Malayalam]]></category>
		<category><![CDATA[Projects]]></category>
		<category><![CDATA[SMC]]></category>
		<category><![CDATA[fonts]]></category>
		<category><![CDATA[webfonts]]></category>
		<category><![CDATA[wikipedia]]></category>

		<guid isPermaLink="false">http://thottingal.in/blog/?p=390</guid>
		<description><![CDATA[Swathanthra Malayalam Computing project announced the release of new version of Malayalam unicode fonts this week. In this version, there are many improvements for popular Malayalam fonts Rachana and Meera. Dyuthi font has some bug fixes. I am listing the changes below. Meera font was small compared to other fonts. This was not really a [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://smc.org.in" target="_blank">Swathanthra Malayalam Computing</a> project<a href="http://lists.smc.org.in/pipermail/discuss-smc.org.in/2012-March/013428.html" target="_blank"> announced the release</a> of new version of Malayalam unicode fonts this week. In this version, there are many improvements for popular Malayalam fonts Rachana and Meera. Dyuthi font has some bug fixes. I am listing the changes below.</p>
<ol>
<li>Meera font was small compared to other fonts. This was not really a problem in Gnome environment since <a href="http://www.freedesktop.org/software/fontconfig/" target="_blank">fontconfig</a> allows you to define a scaling factor to match other font size. But it was an issue in Libreoffice, KDE and mainly in Windows where this kind of scaling feature does not work. Thanks to<a href="http://suruma.freeflux.net/" target="_blank"> P Suresh</a> for a rework on glyphs and fixing this issue.</li>
<li>Rachana, Meera and Dyuthi had wrong glyphs used as placeholder glyphs. <a href="https://savannah.nongnu.org/bugs/?35098" target="_blank">Bugs</a> <a href="http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=661898" target="_blank">like</a> these are fixed.</li>
<li>Virama 0D4D had a wrong LSB that cause the cursor positioning and glyph boundary go wrong. Fixed that <a href="https://bugzilla.redhat.com/show_bug.cgi?id=616324" target="_blank">bug</a><br />
<a href="http://thottingal.in/blog/wp-content/uploads/2012/03/meera-virama-cursor.png"><img class="alignnone size-full wp-image-393" title="meera-virama-cursor" src="http://thottingal.in/blog/wp-content/uploads/2012/03/meera-virama-cursor.png" alt="" width="147" height="63" /></a></li>
<li>Atomic Chilu code points introduced in Unicode 5.1 was missing in all the fonts that SMC maintained because of the controversial decision by Unicode and SMC&#8217;s stand against that. Issues still exist, but content with code point is present, to avoid any difficulties to users, added those characters to Meera and Rachana fonts.<br />
<a href="http://thottingal.in/blog/wp-content/uploads/2012/03/chillus.png"><img class="alignnone size-full wp-image-394" title="chillus" src="http://thottingal.in/blog/wp-content/uploads/2012/03/chillus.png" alt="" width="439" height="68" /></a></li>
<li>Rupee Symbols added to Meera and Rachana. Thanks to <a href="http://hiran.in" target="_blank">Hiran</a> for designing Sans and Serif glyphs for Rupee.<br />
<a href="http://thottingal.in/blog/wp-content/uploads/2012/03/rupee-meera.png"><img class="alignnone size-full wp-image-392" title="rupee-meera" src="http://thottingal.in/blog/wp-content/uploads/2012/03/rupee-meera.png" alt="" width="181" height="55" /></a></li>
<li>Dot Reph(0D4E) &#8211; The glyphs for this was already present in Meera but unmapped to any unicode point. GSUB Lookup tables added to the glyphs according to unicode specification.<br />
<a href="http://thottingal.in/blog/wp-content/uploads/2012/03/dotrepha.png"><img class="alignnone  wp-image-391" title="dotrepha" src="http://thottingal.in/blog/wp-content/uploads/2012/03/dotrepha.png" alt="" width="635" height="119" /></a></li>
</ol>
<p>For a more detailed change description see <a href="http://lists.smc.org.in/pipermail/discuss-smc.org.in/2012-February/013317.html " target="_blank">this</a> mail thread. There are some minor changes as well.</p>
<p>Thanks to Hussain K H (designer of both Meera and Rachana) , P Suresh, Hiran for their valuable contribution. And thanks to SMC community and font users for using the fonts and reporting bugs. We hope that we can bring this new version in your favorite GNU/Linux distros soon. Wikimedia&#8217;s <a href="https://www.mediawiki.org/wiki/Extension:WebFonts" target="_blank">WebFonts</a> extension uses Meera font and the font will be updated there soon. Next release of <a href="http://www.gnu.org/software/freefont/sources/" target="_blank">GNU Freefont </a>is expected to update Malayalam glyphs using Meera and Rachana for freefont-sans and freefont-serif font respectively. We plan to update other fonts we maintain also with these changes in next versions. There are still some glyphs missing in these fonts with respect to the latest unicode version.</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://thottingal.in/blog/2012/03/10/new-version-of-malayalam-fonts-released/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Malayalam Wikisource Offline version</title>
		<link>http://thottingal.in/blog/2011/06/11/malayalam-wikisource-offline-version/</link>
		<comments>http://thottingal.in/blog/2011/06/11/malayalam-wikisource-offline-version/#comments</comments>
		<pubDate>Sat, 11 Jun 2011 09:11:38 +0000</pubDate>
		<dc:creator>Santhosh</dc:creator>
				<category><![CDATA[Community]]></category>
		<category><![CDATA[Indic]]></category>
		<category><![CDATA[Malayalam]]></category>
		<category><![CDATA[Misc]]></category>
		<category><![CDATA[Projects]]></category>
		<category><![CDATA[wikipedia]]></category>

		<guid isPermaLink="false">http://thottingal.in/blog/?p=358</guid>
		<description><![CDATA[Malayalam Wikisource community today released the first offline version of Malayalam wikisource during the 4th annual wiki meetup of Malayalam wikimedians. To the  best of our knowledge, this is the first time a wikisource project release its offline version. Malayalam wiki community had released the first version of Malayalam wikipedia one year back. Releasing the [...]]]></description>
			<content:encoded><![CDATA[<p>Malayalam Wikisource community today released the first offline version of <a href="http://ml.wikisource.org" target="_blank">Malayalam wikisource</a> during the 4th annual wiki meetup of Malayalam wikimedians. To the  best of our knowledge, this is the first time a wikisource project release its offline version. Malayalam wiki community <a href="http://thottingal.in/blog/2010/04/17/mlwikioncd/" target="_blank">had released</a> the first version of Malayalam wikipedia one year back.</p>
<p>Releasing the offline version of a wikisource is a challenging project. The technical aspects of the project was designed and implemented by myself. So let me share the details of the project.</p>
<p>As you know a Wikisource contains lot of books, and each book varies in its size, it is divided to chapters or sections. There is no common pattern for books. Each having its own structure. A novel presentation is different from a collection of poems from a Poet. Wikisource also has religious books like Bible, Quran, Bhagavat Geeta, Ramayana etc.  Since books are for continuous reading for a long time, the readabilty and how we present the lengthy chapters in screen also matters. Offline wikipedia tools for example, <a href="http://www.kiwix.org/" target="_blank">Kiwix</a> does not do any layout modification of the content and present as it is shown in wikipedia/wikisource. <a href="https://github.com/santhoshtr/wiki2cd" target="_blank">The tool</a> we wrote last year for Malayalam wikipedia offline version also present scrollable vertical content in the screen. Both are not configurable to give different presentation styles depending on the nature of the book.</p>
<p>What we wanted is a book reader kind of application interface.  Readers should be able to easily navigate to books, chapters. The chapter content will be very lengthy. For a long time reading of this content,  a lengthy vertically scrolled text is not a good idea. We also need to take care of the width of the lines.  If each line spans 80-90% of the screen, especially for a wide screen monitor, it is a strain for neck and eyes.</p>
<p>&nbsp;</p>
<div id="attachment_361" class="wp-caption aligncenter" style="width: 405px"><a href="http://thottingal.in/blog/wp-content/uploads/2011/06/2011-06-09-19-29-211.png"><img class="size-large wp-image-361" title="2011-06-09-19-29-21" src="http://thottingal.in/blog/wp-content/uploads/2011/06/2011-06-09-19-29-211-1024x455.png" alt="" width="395" height="175" /></a><p class="wp-caption-text">Screenshot of Offline version. Click to enlarge</p></div>
<p style="text-align: center;"><a href="http://thottingal.in/blog/wp-content/uploads/2011/06/2011-06-09-19-29-21.png"><br />
</a></p>
<p>The selection of books for the offline version was done by the active wikimedians at Wiksource. Some of the selected books was proof read by many volunteers within the last  2 weeks.</p>
<p>The tools used for extracting htmls were adhoc and adapted to meet the good presentation of each book. So there is nothing much to reuse here. Extracting the html and then taking the content part alone using pyquery and removing some unwanted sections from html- basically this is what our scripts did. The content is added to predefined HTML templates with proper CSS for the UI. CSS3 multicolumn feature was used for book like interface. Since IE did not implement this standard even in IE9, for that browser the book like interface was not provided. Chrome browser with version less than 12 could not support, because of these bugs: <a href="http://code.google.com/p/chromium/issues/detail?id=45840">http://code.google.com/p/chromium/issues/detail?id</a><a href="http://code.google.com/p/chromium/issues/detail?id=45840">=45840</a> and <a href="http://code.google.com/p/chromium/issues/detail?id=78155">http://code.google.com/p/chromium/issues/detail?id</a><a href="http://code.google.com/p/chromium/issues/detail?id=78155">=78155</a>. For easy navigation, mouse wheel support and page navigation buttons provided. For solving non-availability of required fonts, webfonts were integrated with a selection box  to select favorite font. Reader can also select the font size to make the reading comfortable.</p>
<p>Why static html? The variety of platforms and other versions we need to support, necessity to have webfonts, complex script rendering, effort to develop and customize UI, relatively small size of the data, avoiding any installation of software in users system etc made us to choose static html+ jquery + css as the technology choice. The downside is we could not provide full text search.</p>
<p>Apart from the wikisource, we also included a collection of copyleft of images from wikimedia commons. Thanks to <a href="http://nishan-naseer.blogspot.com/" target="_blank">Nishan Naseer</a>, for preparing a gallery application using jquery. We selected 4 categories from Commons which are related to Kerala. We hope everybody will like the pictures and it will give  a small introduction to Wikimedia Commons.<br />
<a href="http://thottingal.in/blog/wp-content/uploads/2011/06/2011-06-11-09-22-06.png"><img class="aligncenter size-large wp-image-364" title="2011-06-11 09-22-06" src="http://thottingal.in/blog/wp-content/uploads/2011/06/2011-06-11-09-22-06-1024x474.png" alt="" width="453" height="209" /></a><br />
Even though the python scripts are not ready to reuse in any projects, if anybody want to have a look at it, please mail me. I am not putting it in public since the script does not make sense outside the context of each book and its existing presentation in Malayalam wikisource.</p>
<p>The CD image is available for download <a href="http://www.mlwiki.in/cdimage/mlwikisource.iso" target="_blank">here</a> and one can also browse the CD content <a href="http://www.mlwiki.in/wikisrccd" target="_blank">here</a>.</p>
<p>Thanks to Shiju Alex for coordinating this project. And thanks to all Malayalam wikisource volunteers for making this happen.  We have included poems, folk songs, devotional songs, novel, grammar book, tales, books on Hinduism, Islam-ism, Christianity, Communism, Philosophy. With this release, it becomes the biggest offline digital archive of Malayalam books.</p>
]]></content:encoded>
			<wfw:commentRss>http://thottingal.in/blog/2011/06/11/malayalam-wikisource-offline-version/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>Identifiers In Indic Languages</title>
		<link>http://thottingal.in/blog/2011/01/08/identifiers-in-indic-languages/</link>
		<comments>http://thottingal.in/blog/2011/01/08/identifiers-in-indic-languages/#comments</comments>
		<pubDate>Sat, 08 Jan 2011 11:27:00 +0000</pubDate>
		<dc:creator>Santhosh</dc:creator>
				<category><![CDATA[Indic]]></category>
		<category><![CDATA[Malayalam]]></category>
		<category><![CDATA[CDAC]]></category>
		<category><![CDATA[icann]]></category>
		<category><![CDATA[idn]]></category>
		<category><![CDATA[python]]></category>
		<category><![CDATA[standards]]></category>
		<category><![CDATA[zwj]]></category>
		<category><![CDATA[zwnj]]></category>

		<guid isPermaLink="false">http://thottingal.in/blog/?p=314</guid>
		<description><![CDATA[Recently, while preparing a critique for  IDN Policy for Malayalam language prepared by CDAC,  I noticed that ICANN does not allow control characters in the domain names.  Sometime back I noticed Python 3 identifiers also does not allow control characters in the Identifiers. This blog post attempts to analyze the issue by looking at the [...]]]></description>
			<content:encoded><![CDATA[<p>Recently, while preparing a critique for  <a href="http://wiki.smc.org.in/CDAC-IDN-Critique" target="_blank">IDN Policy for Malayalam </a>language prepared by CDAC,  I noticed that ICANN does not allow control characters in the domain names.  Sometime back I noticed Python 3 identifiers also does not allow control characters in the Identifiers. This blog post attempts to analyze the issue by looking at the Unicode and ICANN specifications about these special characters.</p>
<p>Apart from the existing characters in Indic languages,  <a href="http://en.wikipedia.org/wiki/Zero-width_joiner" target="_blank">Zero width Joiner</a> and <a href="http://en.wikipedia.org/wiki/Zero-width_non-joiner" target="_blank">Zero width non joiners</a> are widely used in Indic languages to control how the ligatures are formed. For some samples on how they are used, refer the wikipedia links. Being control characters and invisible characters, they are often removed while doing normalization , particularly before doing a string comparison, or collation (sort).</p>
<p>Identifiers, the strings that uniquely represent some data often has a policy on what kind of characters it can contain. For example, email address is an identifier, which unambiguously defines somebody&#8217;s email address, does not allow &#8216;space&#8217; characters in between. Some examples for this kind of identifiers are: email ids, web domain address, variables in programming languages etc.</p>
<p>Gone are the days where identifiers can be represented only using English characters. Python 3.0+ allows  you to define a variable in program using any words that can be represented in Unicode. For more details on this Python feature read <a href="http://www.python.org/dev/peps/pep-3131/" target="_blank">PEP 3131 &#8211; Supporting Non Ascii Identifiers</a> . Some samples : <a href="http://wiki.python.org/moin/MalayalamLanguage" target="_blank">Program written in Malayalam.</a> <a href="http://wiki.python.org/moin/TamilLanguage" target="_blank">In tamil</a> , and <a href="http://wiki.python.org/moin/HindiLanguage" target="_blank">In Hindi </a></p>
<p>Same is the case of Web addresses. With the advent of Internationalized Domain Names(IDN) that allows you register web addresses in your own languages, the English only web address scene is changing.</p>
<p>But this change brings some issues in the definition of &#8216;Identifiers&#8217; &#8211; just like English, what are the characters allowed in using a domain name or programming language identifier that can be used? Standards and specifications are being drafted on this for each language. For Internationalized domain names in Indian languages,<a href="http://cdac.in/" target="_blank"> CDAC</a> is drafting the policy. For python, the PEP 3131 has specification.</p>
<p>As a general rule, Unicode standard and the standards based on Unicode does not allow you use Unicode control characters such as zwj and zwnj in identifiers. Based on that <a href="http://icann.org/" target="_blank">The <em>Internet Corporation for Assigned Names and Numbers</em> (<em>ICANN</em>)</a> , in <a href="http://tools.ietf.org/html/rfc3454#page-12" target="_blank">RFC 3454</a> , it prohibits a list of control characters. RFC 3454 is used as a specification for converting a Unicode encoded domain name to its <a href="http://en.wikipedia.org/wiki/Punycode" target="_blank">Punicode </a>version for doing the validation.  For example,Thottingal, in Malayalam- തോട്ടിങ്ങല്‍ (0D24 0D4B 0D1F 0D4D 0D1F 0D3F 0D19 0D4D 0D19 0D32 0D4D 200D), when converted to punicode becomes xn--fwcaqax2g2d7dtadc . This conversion excludes the zwj at the end of the word. If I do a reverse conversion from xn--fwcaqax2g2d7dtadc to unicode what I get is തോട്ടിങ്ങല് (0D24 0D4B 0D1F 0D4D 0D1F 0D3F 0D19 0D4D 0D19 0D32 0D4D). Note that codepoint 200D &#8211; ZWJ is removed. That means I cannot register my domain thottingal.in in Malayalam properly. You can verify this using <a href="http://demo.icu-project.org/icu-bin/idnbrowser?t=%E0%B4%A4%E0%B5%8B%E0%B4%9F%E0%B5%8D%E0%B4%9F%E0%B4%BF%E0%B4%99%E0%B5%8D%E0%B4%99%E0%B4%B2%E0%B5%8D%E2%80%8D" target="_blank">ICU online converter</a>.  Now another example, Tamilnadu &#8211; in Malayalam തമിഴ്‌നാട് (0D24 0D2E 0D3F 0D34 0D4D 200C 0D28 0D3E 0D1F 0D4D) becomes xn--lwcjmx4a2de7id. When I do a reverse conversion, I getതമിഴ്നാട് (0D24 0D2E 0D3F 0D34 0D4D 0D28 0D3E 0D1F 0D4D) . Now ZWNJ(200C) is missed. Try yourself using <a href="http://demo.icu-project.org/icu-bin/idnbrowser?t=%E0%B4%A4%E0%B4%AE%E0%B4%BF%E0%B4%B4%E0%B5%8D%E2%80%8C%E0%B4%A8%E0%B4%BE%E0%B4%9F%E0%B5%8D" target="_blank">the converter </a>. This means one cannot register a website with Tamilnadu written in Malayalam properly. The IDN policies for Indic languages are based on this exclusion rules for zwj, zwnj.</p>
<p>For python 3.0+ ,  you cannot have an identifier in programming language with zwj, zwnj  or any control character in it. See this bug report for more details:<a href="http://bugs.python.org/issue5358" target="_blank"> Issue 5358 </a></p>
<p>All of the above issues are because of the assumption that zwj,zwnj is prohibited from Identifiers for all cases. But that is not true. Look at the <a href="http://unicode.org/reports/tr31" target="_blank">Unicode Standard Annex 31</a> &#8211; &#8220;Unicode Identifier and Pattern Syntax&#8221;(TR31). TR31 is based on <a href="http://unicode.org/review/pr-96.html" target="_blank">Public Review 96</a> &#8211; &#8220;Allowing Special Characters in Identifiers&#8221;</p>
<blockquote><p><em>This annex describes specifications for recommended defaults for the        use of Unicode in the definitions of identifiers and in pattern-based syntax.        It also supplies guidelines for use of normalization with identifiers. [...]</em></p>
<p><em>default-ignorable characters are normally        excluded from Unicode identifiers. However, visible distinctions created        by certain format characters (particularly the </em><em>Join_Control characters)        are necessary  in certain languages. A        blanket exclusion of these characters makes it impossible to create        identifiers with the correct visual appearance for common words or phrases in those languages.        Identifier systems that attempt to provide more natural representations        of terms in modern, customary use should allow these        characters in input and display, but limit them to contexts in which they are necessary. [...]</em></p></blockquote>
<p>But since the characters are invisible, to meet the security considerations,  It should be clearly defined where and all we can use them. What if a domain is registered with 5 zwnj  continuously in it? It will look same to a string with 4 zwnjs. So TR31 defines 3 valid cases where zwnj and zwj can be used in an Identifier.</p>
<ul>
<li>Allow ZWNJ in breaking a cursive connection</li>
<li>Allow ZWNJ in a conjunct context (example:  തമിഴ്‌നാട് , ദൃക്‌സാക്ഷി)</li>
<li>Allow ZWJ in a conjunct context (examples:  ന + ് + zwj -&gt; ന്‍ , <big> क+  ् +  zwj -&gt; </big> <big>क्‍</big> )</li>
</ul>
<p>These 3 cases covers all zwj,zwnj usage patterns in our languages.</p>
<p>So now it is clear that Unicode standard allows them in Identifiers. In that case, there should not be a conflict between Unicode Identifier policy and ICANN policy or any other identifier policy such as PEP 3131. Blanket exclusion of these characters are not allowed. So RFC 3454 should be compatible with TR31. The IDN policy of Indic languages should be based on that new specification and not based on the existing RFC 3454. Since CDAC is responsible of Indic Domain policy, they should take responsibility for bringing this change.</p>
<p>For making a change in PEP 3131, myself and <a href="http://www.muthukadan.net/" target="_blank">Baiju M</a> started a wiki page explaining what change need to be done. <a href="http://wiki.python.org/moin/ZwjAndZwnjAsIdentifiers" target="_blank">Read it from here</a>.</p>
<p>Having said that, is it desirable to have  two domains,  one with a valid zwj/zwnj usage and another without them? Of course, they will be visually different, avoiding any possibilities for spoofing. Now the question is whether those  two words represent two words in the language?</p>
<p>As far as Malayalam is concerned there are three cases here:</p>
<ol>
<li>Missing ZWJ is considered as a spelling mistake &#8211; തമിഴ്‌നാട് (correct), തമിഴ്നാട് (incorrect) pair is an example for that.  Should we allow both domains ? I don&#8217;t know any case where a missing ZWNJ form another valid word with different meaning.</li>
<li>Missing ZWJ means , the word is a different word with different meaning. This is very rare &#8211; വന്‍യവനിക , വന്യവനിക pair is often cited an example for this. But many people argues this is not a valid case.</li>
<li>Missing ZWJ never means a spelling mistake, but just a writing style. There are many examples for this. നന്‍മ-നന്മ is one obvious one.</li>
</ol>
<p>So the question is whether a domain differing by a valid zwj/zwnj use  to an existing registered domain to be allowed or not? I would suggest to use existing policy for domain comparison for this. ie, If the collation weights of existing domain and to-be registered domains are same ,  don&#8217;t register the new one. ZWJ, ZWNJ are characters with zero collation weight and in collation or string comparison they are ignored.</p>
<div id="_mcePaste" style="overflow: hidden; position: absolute; left: -10000px; top: 10px; width: 1px; height: 1px;">http://www.python.org/dev/peps/pep-3131/PEP</div>
]]></content:encoded>
			<wfw:commentRss>http://thottingal.in/blog/2011/01/08/identifiers-in-indic-languages/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Dictionary Jabber Buddy Bots</title>
		<link>http://thottingal.in/blog/2010/11/20/dictionary-jabber-buddy-bots/</link>
		<comments>http://thottingal.in/blog/2010/11/20/dictionary-jabber-buddy-bots/#comments</comments>
		<pubDate>Sat, 20 Nov 2010 17:24:05 +0000</pubDate>
		<dc:creator>Santhosh</dc:creator>
				<category><![CDATA[Indic]]></category>
		<category><![CDATA[Malayalam]]></category>
		<category><![CDATA[Projects]]></category>
		<category><![CDATA[SMC]]></category>
		<category><![CDATA[bots]]></category>
		<category><![CDATA[dictionary]]></category>
		<category><![CDATA[python]]></category>
		<category><![CDATA[xmpp]]></category>

		<guid isPermaLink="false">http://thottingal.in/blog/?p=308</guid>
		<description><![CDATA[Recently we released two Jabber buddy bots for dictionary lookup. By adding eng.mal.dict@gmail.com as a chat contact one can ask for the meaning of an English word in Malayalam by just sending a chat message. Similarly for English-Hindi or Hindi-English dictionary, we have another bot eng.hin.dict@jabber.org. Both of these dictionaries use Dict databases based on  [...]]]></description>
			<content:encoded><![CDATA[<p>Recently we released two Jabber buddy bots for dictionary lookup. By adding eng.mal.dict@gmail.com as a chat contact one can ask for the meaning of an English word in Malayalam by just sending a chat message. Similarly for English-Hindi or Hindi-English dictionary, we have another bot eng.hin.dict@jabber.org. Both of these dictionaries use Dict databases based on  <a title="DICT" href="http://en.wikipedia.org/wiki/DICT" target="_blank">DICT protocol</a>.</p>
<p>Both of these bots were well received  by the users. We have 8000+ users for English-Malayalam Dictionary.  Online blogs/media also gave good publicity. Thanks a lot!.</p>
<p><a title="Swathanthra Malayalam Computing" href="http://smc.org.in" target="_blank">SMC </a>developers Rajeesh Nambiar, Ershad, Ragsagar, and  Sarath Lakshman had helped in improving the program. You can get the source code from <a href="http://git.savannah.gnu.org/cgit/smc.git/tree/bots" target="_blank">here</a>. It is a small program written using python XMPP library.</p>
<p>We had written this programs one year back, 2009 december itself. We could not launch them for public since we did not had a server to host them.  Usually webhosting providers wont allow to run programs like this in their servers. Recently <a href="netdotnet.com" target="_blank">netdotnet.com</a> provided a VPS server for SMC and we could launch them from that server.</p>
<p>English-Hindi dictionary is reasonably big, but English-Malayalm is very small with only ~10k words. So we just added a Malayalam Wiktionary backend for the bot.</p>
<p>Here is a video on how to use English-Hindi bot prepared by  <a href="http://varunverma.org/blogs/translate-inside-your-google-chat-window/" target="_blank">Varun Verma </a></p>
<p><object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="425" height="350" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="src" value="http://www.youtube.com/v/1znJAHisf5M&amp;feature" /><embed type="application/x-shockwave-flash" width="425" height="350" src="http://www.youtube.com/v/1znJAHisf5M&amp;feature"></embed></object></p>
<ul>
<li>An article about English Malayalam bot in Epathram.com <a href="http://epathram.com/column-itsit/11/03/225654-english-malayalam-dictionary-in-google-chat.html" target="_blank">here. </a></li>
<li>A blog post by Sailesh in Hindi <a href="http://emadad.hindyugm.com/2010/10/know-hindi-meanings-while-chatting.html" target="_blank">http://emadad.hindyugm.com/2010/10/know-hindi-meanings-while-chatting.html</a></li>
</ul>
<p>We can start this kind of bot for other languages too, if we have dictionaries with Free S/w compatible licenses. If interested, please contact me.</p>
]]></content:encoded>
			<wfw:commentRss>http://thottingal.in/blog/2010/11/20/dictionary-jabber-buddy-bots/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Malayalam Wikipedia releases selected articles on CD</title>
		<link>http://thottingal.in/blog/2010/04/17/mlwikioncd/</link>
		<comments>http://thottingal.in/blog/2010/04/17/mlwikioncd/#comments</comments>
		<pubDate>Sat, 17 Apr 2010 05:03:47 +0000</pubDate>
		<dc:creator>Santhosh</dc:creator>
				<category><![CDATA[Malayalam]]></category>
		<category><![CDATA[Projects]]></category>
		<category><![CDATA[wikipedia]]></category>

		<guid isPermaLink="false">http://thottingal.in/blog/?p=250</guid>
		<description><![CDATA[As part of Malayalam Wikipedia Meetup 2010 , today  Malayalam wikipedia releases 500 selected articles on a CD ROM. This is the first time in India, a Wikipedia on local language releasing its articles for offline usage. I handled the technology part  of the project. The idea was to get the selected articles in static [...]]]></description>
			<content:encoded><![CDATA[<p>As part of <a href="http://ml.wikipedia.org/wiki/Meetup-2010_April" target="_blank">Malayalam Wikipedia Meetup 2010</a> , today  Malayalam wikipedia releases 500 selected articles on a CD ROM. This is the first time in India, a Wikipedia on local language releasing its articles for offline usage. I handled the technology part  of the project.</p>
<p>The idea was to get the selected articles in static form to the CD. But this is not easy as we imagine. It is not like saving each  page from browser to the local machine. Following were the challenges:</p>
<ul>
<li>Automate the process of getting the page and the images in it. Wikipedia articles changes frequently. So we need the program to fetch the latest article from wiki whenever it is executed.</li>
<li>Fix all the links, css, javascript, image references so that all resolves within CD itself</li>
<li>Provide an categorized index of the articles for easily locating the article.</li>
<li>Provide a search in the article titles.</li>
<li>ISO 9660 filesystem of CD/DVD has lots of limitations. There are restrictions on unicode names of the files, length of the file names, directory depth, special characters in filenames etc. Wikipedia has its article and image names with unicode, special characters and most of the time they exceeds the filename length. To avoid all these, we should rename most of the files and then fix the cross references in all files.</li>
<li>It should work on all Operating systems. All the content should be presented with HTML, Javascript and CSS. Being the content in Malayalam, even if the user does not have required fonts in her/his machine, there should not be any problem for reading the content(font embedding required).</li>
</ul>
<p>Manually solving all these challenges is not the way to go. So I wrote a program, which just takes the article titles and does all the above tasks and finally creates a repository ready for burning to CD ROM.</p>
<p>Wget disappointed me in fetching the content from wiki. There is an <a href="http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=411290" target="_blank">open bug</a> in wget which make the download of non-latin URLs impossible.</p>
<p>Have a look at the CD content we created : <a href="http://thottingal.in/projects/mlwikioncd/wiki/" target="_blank">Malayalam Wikipedia Selected 500 Articles</a> . <a href="http://hiran.in" target="_blank">Hiran</a> helped me with the artworks.</p>
<p><a href="http://thottingal.in/blog/wp-content/uploads/2010/04/mlwikioncd.png"><img class="aligncenter size-medium wp-image-257" title="mlwikioncd" src="http://thottingal.in/blog/wp-content/uploads/2010/04/mlwikioncd-300x291.png" alt="The CD cover image designed by Hiran" width="300" height="291" /></a></p>
<p>Since entire process is automated, the program can be used for any other language.  I am releasing the program for the benefit of everybody. You can get the program from <a href="http://github.com/santhoshtr/wiki2cd" target="_blank">here</a>. It is written on Python. Jquery was used for the UI.  For details on the usage, customization etc read the <a href="http://wiki.github.com/santhoshtr/wiki2cd/" target="_blank">wiki page</a> of the project.</p>
<p>For those who can&#8217;t read Malayalam, here is a <a href="http://thottingal.in/projects/wiki2cd/samplewiki/" target="_blank">sample wiki </a>created  by the wiki2cd program from English wikipedia by selecting 10 articles.</p>
<p>Malayalam Wikipedia Community  hope that this is a big step to reach the majority of the people who does not have internet access. If printed, this 500 articles will be at least 5000 pages. CDROM also includes information about commonly used free software based tools for Malayalam computing. Some writing tools and fonts are distributed in the same CD ROM.</p>
<p>Thanks to Malayalam Wikipedia for giving this great opportunity to wok on this project.</p>
<p>The ISO image of the CD is available <a href="http://www.mlwiki.in/mlwikicd/img/MLWikipediaCD-2010.iso" target="_blank">here</a> for download.</p>
]]></content:encoded>
			<wfw:commentRss>http://thottingal.in/blog/2010/04/17/mlwikioncd/feed/</wfw:commentRss>
		<slash:comments>20</slash:comments>
		</item>
		<item>
		<title>&#8220;ക്ടാവ്&#8221; Slang converter തയാറാവുന്നു</title>
		<link>http://thottingal.in/blog/2009/03/31/slang-converter/</link>
		<comments>http://thottingal.in/blog/2009/03/31/slang-converter/#comments</comments>
		<pubDate>Wed, 01 Apr 2009 02:05:00 +0000</pubDate>
		<dc:creator>Santhosh</dc:creator>
				<category><![CDATA[Malayalam]]></category>
		<category><![CDATA[Projects]]></category>

		<guid isPermaLink="false">http://thottingal.in/blog/2009/03/31/%e0%b4%95%e0%b5%8d%e0%b4%9f%e0%b4%be%e0%b4%b5%e0%b5%8d-slang-converter-%e0%b4%a4%e0%b4%af%e0%b4%be%e0%b4%b1%e0%b4%be%e0%b4%b5%e0%b5%81%e0%b4%a8%e0%b5%8d%e0%b4%a8%e0%b5%81/</guid>
		<description><![CDATA[ചങ്ങാതിമാരേ, കേരളത്തിലെ രസകരമായ പ്രാദേശിക ഭാഷാ ഭേദങ്ങളെക്കുറിച്ചു് നിങ്ങള്‍ക്കെല്ലാമറിയാമല്ലോ? തിരുവനന്തപുരം, കോട്ടയം, തൃശ്ശൂര്‍, ഷൊര്‍ണ്ണൂര്‍, പാലക്കാട്, കോഴിക്കോട് കണ്ണൂര്‍, വയനാട് തുടങ്ങി നമുക്കു് വ്യത്യസ്തങ്ങളായ മലയാളത്തിന്റെ രൂപഭേദങ്ങളുണ്ടു്. അച്ചടി മലയാളത്തില്‍ നിന്നും വളരെയേറെ വ്യത്യസ്തമാണു് അവ. അച്ചടി മലയാളം കൊടുത്തു് സ്ഥലത്തിന്റെ പേരു കൊടുത്താല്‍ ആ പ്രദേശത്തെ മലയാളത്തിന്റെ രീതിയിലേക്കു അതിനെ മാറ്റിത്തരുന്ന ഒരു സോഫ്റ്റ്‌വെയര്‍ രസകരമാവില്ലേ? അത്തരത്തിലൊരു ശ്രമമാണു് &#8220;ക്ടാവ്&#8221; Slang converter എന്നു പേരിട്ടിരിക്കുന്ന പ്രൊജക്ട്. ഇതിന്റെ കൂടെ കൊടുത്തിരിക്കുന്ന സ്ക്രീന്‍ഷോട്ട് നോക്കൂ. ഡെവലപ്മെന്റ് [...]]]></description>
			<content:encoded><![CDATA[<div class="separator" style="clear: both; text-align: left;"><a href="http://4.bp.blogspot.com/_yXi4s2T6Sz4/SdLLcgwdFEI/AAAAAAAAAIQ/ALCTNXIIOoM/s1600-h/slangConvertor.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="http://4.bp.blogspot.com/_yXi4s2T6Sz4/SdLLcgwdFEI/AAAAAAAAAIQ/ALCTNXIIOoM/s400/slangConvertor.png" /></a></div>
<p>ചങ്ങാതിമാരേ, <br />കേരളത്തിലെ രസകരമായ പ്രാദേശിക ഭാഷാ ഭേദങ്ങളെക്കുറിച്ചു് നിങ്ങള്‍ക്കെല്ലാമറിയാമല്ലോ?  തിരുവനന്തപുരം, കോട്ടയം, തൃശ്ശൂര്‍, ഷൊര്‍ണ്ണൂര്‍, പാലക്കാട്, കോഴിക്കോട്  കണ്ണൂര്‍, വയനാട്  തുടങ്ങി നമുക്കു് വ്യത്യസ്തങ്ങളായ മലയാളത്തിന്റെ രൂപഭേദങ്ങളുണ്ടു്. അച്ചടി മലയാളത്തില്‍ നിന്നും വളരെയേറെ വ്യത്യസ്തമാണു് അവ. അച്ചടി മലയാളം കൊടുത്തു് സ്ഥലത്തിന്റെ പേരു  കൊടുത്താല്‍ ആ പ്രദേശത്തെ മലയാളത്തിന്റെ രീതിയിലേക്കു അതിനെ മാറ്റിത്തരുന്ന ഒരു സോഫ്റ്റ്‌വെയര്‍ രസകരമാവില്ലേ?</p>
<p>അത്തരത്തിലൊരു ശ്രമമാണു് &#8220;ക്ടാവ്&#8221; Slang converter എന്നു പേരിട്ടിരിക്കുന്ന പ്രൊജക്ട്. ഇതിന്റെ കൂടെ കൊടുത്തിരിക്കുന്ന സ്ക്രീന്‍ഷോട്ട് നോക്കൂ. ഡെവലപ്മെന്റ് പതിപ്പിന്റെ ചിത്രമാണതു്. കുറച്ചു നിയമങ്ങളുടെ അടിസ്ഥാനത്തില്‍ Natural Language Processing ന്റെ പുതിയ ശാഖയായ AMP(Ambiguous Language Processing)   എന്ന വിദ്യ ഉപയോഗിച്ചാണു് ഇതു ചെയ്തിരിക്കുന്നതു്. Qt/C++ ആണു് കോഡ്. UI ചെയ്യാന്‍ Qt Creator ഉപയോഗിച്ചു.</p>
<p>ഒരു മലയാളം ഫയലില്‍ പല സ്ലാങ്ങില്‍ തിരയാനുള്ള സംവിധാനവും തയ്യാറാക്കാന്‍ പദ്ധതിയുണ്ടു് . അതായതു് ഗഡി എന്നു തിരഞ്ഞാല്‍ സുഹൃത്തു് , ചങ്ങാതി എന്നൊക്കെ കിട്ടണം. പിന്നെ ഗഡി എന്നു സ്പെല്ലിങ്ങ് തെറ്റിച്ചെഴുതിയാല്‍ സുഹൃത്ത്, ചങ്ങാതി എന്നൊക്കെ സ്പെല്‍ചെക്കറില്‍ സൂചന വരാനുള്ള ഫീച്ചറും നമുക്കു് ചെയ്യണം. GPL V3 ലൈസന്‍സിലുള്ള ഈ അപ്ലിക്കേഷനു് ഇതിന്റെ നിയമങ്ങള്‍ വിപുലപ്പെടുത്താനും ടെസ്റ്റ് ചെയ്യാനും വിവിധ ജില്ലകളില്‍ താമസിക്കുന്നവരില്‍ നിന്നുള്ള സഹായം ആവശ്യമുണ്ടു്.</p>
<p>സഹകരിക്കുമല്ലോ.</p>
<p>അഭിപ്രായങ്ങളറിയിക്കുക.</p>
]]></content:encoded>
			<wfw:commentRss>http://thottingal.in/blog/2009/03/31/slang-converter/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>മലയാളം അകാരാദിക്രമം</title>
		<link>http://thottingal.in/blog/2009/01/01/malayalam-locale/</link>
		<comments>http://thottingal.in/blog/2009/01/01/malayalam-locale/#comments</comments>
		<pubDate>Thu, 01 Jan 2009 15:49:00 +0000</pubDate>
		<dc:creator>Santhosh</dc:creator>
				<category><![CDATA[Indic]]></category>
		<category><![CDATA[Malayalam]]></category>
		<category><![CDATA[glibc]]></category>
		<category><![CDATA[locale]]></category>

		<guid isPermaLink="false">http://thottingal.in/blog/2009/01/01/%e0%b4%ae%e0%b4%b2%e0%b4%af%e0%b4%be%e0%b4%b3%e0%b4%82-%e0%b4%85%e0%b4%95%e0%b4%be%e0%b4%b0%e0%b4%be%e0%b4%a6%e0%b4%bf%e0%b4%95%e0%b5%8d%e0%b4%b0%e0%b4%ae%e0%b4%82/</guid>
		<description><![CDATA[സ്വതന്ത്ര പ്രവര്‍ത്തകസംവിധാനങ്ങള്‍ക്കായി തയ്യാറാക്കിയ glibc (Gnu C Library ) അകാരാദിക്രമത്തിന്റെ(Collation) വിശദവിവരങ്ങള്‍ താഴെക്കൊടുക്കുന്നു. അഭിപ്രായങ്ങള്‍ അറിയിക്കുക. താഴെപ്പറയുന്ന നിയമങ്ങളുടെ അടിസ്ഥാനത്തിലാണു് മലയാളം അകാരാദിക്രമം തയ്യാറാക്കിയിരിക്കുന്നതു്. അക്ഷരമാലാക്രമം പിന്തുടരുക. അനുസ്വാരം മയുടെ സ്വരസാന്നിദ്ധ്യമില്ലാത്ത രൂപമായി പരിഗണിച്ചു് മയുടെ തൊട്ടുമുന്നില്‍ ക്രമീകരിയ്ക്കുക. പംപ &#60; പമ്പ എന്ന പോലെ . ഓരോ വ്യഞ്ജനവും അതിന്റെ സ്വരസാന്നിദ്ധ്യമില്ലാത്ത രൂപത്തിന്റെ കൂടെ അകാരം ഉള്ള രൂപമായി കണക്കാക്കുക. അതായതു് ത എന്നതു് ത് എന്ന സ്വരസാന്നിദ്ധ്യമില്ലാത്ത വ്യഞ്ജനത്തിന്റെ കൂടെ അകാരം ഉള്ള [...]]]></description>
			<content:encoded><![CDATA[<p>സ്വതന്ത്ര പ്രവര്‍ത്തകസംവിധാനങ്ങള്‍ക്കായി   തയ്യാറാക്കിയ glibc (Gnu C Library ) അകാരാദിക്രമത്തിന്റെ(Collation) വിശദവിവരങ്ങള്‍ താഴെക്കൊടുക്കുന്നു. അഭിപ്രായങ്ങള്‍ അറിയിക്കുക. </p>
<p>
<p>താഴെപ്പറയുന്ന നിയമങ്ങളുടെ അടിസ്ഥാനത്തിലാണു് മലയാളം അകാരാദിക്രമം തയ്യാറാക്കിയിരിക്കുന്നതു്.
<ol>
<li>അക്ഷരമാലാക്രമം പിന്തുടരുക.</li>
<p>
<li>അനുസ്വാരം മയുടെ സ്വരസാന്നിദ്ധ്യമില്ലാത്ത രൂപമായി പരിഗണിച്ചു് മയുടെ തൊട്ടുമുന്നില്‍ ക്രമീകരിയ്ക്കുക. പംപ &lt; പമ്പ എന്ന പോലെ .</li>
<p>
<li>ഓരോ വ്യഞ്ജനവും അതിന്റെ സ്വരസാന്നിദ്ധ്യമില്ലാത്ത രൂപത്തിന്റെ കൂടെ അകാരം ഉള്ള രൂപമായി കണക്കാക്കുക.  അതായതു് ത എന്നതു് ത് എന്ന സ്വരസാന്നിദ്ധ്യമില്ലാത്ത വ്യഞ്ജനത്തിന്റെ കൂടെ അകാരം ഉള്ള രൂപമാണു്.  ത = ത് + അ . താ = ത് + ആ എന്നിങ്ങനെ. ഇതില്‍ നിന്നും ത് &lt; ത എന്നു വ്യക്തമാകുന്നു. അതുകൊണ്ടു് ത എന്നതു് ത് കഴിഞ്ഞേ വരൂ. അത് &lt;  അതല്ല  &lt;  അതാണു്.  അതേസമയം അത്ഭുതം &gt; അതഭ. കൂട്ടക്ഷരങ്ങള്‍ അതിലെ ആദ്യത്തെ അക്ഷരത്തില്‍ സ്വരചിഹങ്ങള്‍ ചേര്‍ന്ന രൂപങ്ങളെല്ലാം കഴിഞ്ഞേ വരൂ. <br/> ത്ഭ = ത + ് + ഭ + ് + അ <br/> തഭ = ത + ്  + അ + ഭ + ് + അ <br/> ആദ്യത്തെ രണ്ടക്ഷരങ്ങള്‍ തുല്യമായതുകൊണ്ടു്, ഇതിനെ നമുക്കു്    <br/> ഭ + ് + അ <br/>    അ + ഭ + ് + അ <br/> എന്നെഴുതാം. ഭ   &gt;   അ ആണല്ലോ. അതുകൊണ്ടു് അത്ഭുതം എന്നതു് അതഭ എന്നതിനു ശേഷമേ വരൂ. </li>
<p>
<li>ചില്ലക്ഷരങ്ങള്‍ അതാതിന്റെ വ്യഞ്ജങ്ങളുടെ സ്വരമില്ലാത്ത രൂപങ്ങളായതിനാല്‍ മേല്‍പറഞ്ഞപോലെ ക്രമീകരിക്കപ്പെടും.  അതായതു് ര്‍ &lt;  ര . ഉദാഹരണം:<br/>  അവര് <br/><br />അവര്‍ <br/><br />അവര</li>
<p>
<li>സംവൃതോകാരം ഉകാരത്തിനു തൊട്ടു പിന്നില്‍ വരും. അതു്  &lt;  അതു </li>
<p>
<li>മലയാളം അക്കങ്ങള്‍ അവയുടെ അറബി ലിപികളുടെ കൂടെ തന്നെ വരും. <br/> 1<br/> <br />१०<br/> <br />2<br/> <br />൨<br/> <br />3<br/> <br />३० <br/>  എന്ന രീതിയില്‍</li>
<p>
<li>കൌ, കൗ എന്നിവ തുല്യങ്ങളായി കണക്കാക്കപ്പെടും. <br/> കൗ<br/> <br />കൌ <br/> എന്ന രീതിയില്‍</li>
<p>
<li>ഒ, ഓ, ഔ എന്നിവയുടെ സ്വരചിഹനങ്ങള്‍ യഥാക്രമം  ൊ ,  ോ , ൌ എന്നോ െ+ ാ , േ+ ാ ,  െ+ ൗ എന്നോ എഴുതിയാലും തുല്യമായി കണക്കാക്കും(Canonical Equivalence)  </li>
<p></ol>
<p></p>
<p>ഈ വിഷയത്തെപ്പറ്റി നടന്ന ചര്‍ച്ചയും കൂടുതല്‍ വിവരങ്ങളും  <a href="http://groups.google.com/group/smc-discuss/browse_thread/thread/b7590b7628321139">ഇവിടെ </a>. പ്രത്യേകിച്ചു പ്രശ്നങ്ങളൊന്നുമില്ലെങ്കില്‍ <a href="http://unicode.org/charts/collation/chart_Malayalam.html">യൂണിക്കോഡ് കൊളേഷന്‍</a> തിരുത്തി ശരിയാക്കാന്‍ ഇതു് അടിസ്ഥാനമാക്കാം.</p>
]]></content:encoded>
			<wfw:commentRss>http://thottingal.in/blog/2009/01/01/malayalam-locale/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>Geo-visualisation, the FOSS way</title>
		<link>http://thottingal.in/blog/2008/09/04/geo-visualisation-the-foss-way/</link>
		<comments>http://thottingal.in/blog/2008/09/04/geo-visualisation-the-foss-way/#comments</comments>
		<pubDate>Fri, 05 Sep 2008 05:07:00 +0000</pubDate>
		<dc:creator>Santhosh</dc:creator>
				<category><![CDATA[Community]]></category>
		<category><![CDATA[Malayalam]]></category>
		<category><![CDATA[foss]]></category>

		<guid isPermaLink="false">http://thottingal.in/blog/?p=50</guid>
		<description><![CDATA[My friend Jaisen Nedumpala has been developing a Geo-visualisation system for Cheruvannoor Grama Panchayath(Page in ml_IN) of Kerala. The system, developed using FOSS tools is available here &#8220;Development of effective geo-visualisation based decision support system (DSS) involved primarily data compilation from collateral sources, setting up appropriate hardware configuration, design of database and design of a [...]]]></description>
			<content:encoded><![CDATA[<p>My friend Jaisen Nedumpala has been developing a Geo-visualisation system for <a href="http://cheruvannur.web4all.in/">Cheruvannoor Grama Panchayath(Page in ml_IN)</a> of Kerala. The system, developed using FOSS tools is available <a href="http://cheruvannur.web4all.in/resources/">here</a></p>
<blockquote><p>
&#8220;Development of effective geo-visualisation based decision support system (DSS) involved primarily data compilation from collateral sources, setting up appropriate hardware configuration, design of database and design of  a spatial DSS. &#8221;
</p></blockquote>
<p>Jaisen used softwares like GRASS, UMN MapServer and ka-Map. He has written a detailed <a href="http://cheruvannur.web4all.in/visualisation_methodology/">documentation(English)</a> on how he developed this and what are all the tools used.</p>
]]></content:encoded>
			<wfw:commentRss>http://thottingal.in/blog/2008/09/04/geo-visualisation-the-foss-way/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>മലയാളം, യൂണീകോഡ് 5.1, ഫോണ്ടുകള്‍&#8230;</title>
		<link>http://thottingal.in/blog/2008/05/13/malayalam-unicode-51/</link>
		<comments>http://thottingal.in/blog/2008/05/13/malayalam-unicode-51/#comments</comments>
		<pubDate>Tue, 13 May 2008 17:20:00 +0000</pubDate>
		<dc:creator>Santhosh</dc:creator>
				<category><![CDATA[Malayalam]]></category>

		<guid isPermaLink="false">http://thottingal.in/blog/2008/05/13/%e0%b4%ae%e0%b4%b2%e0%b4%af%e0%b4%be%e0%b4%b3%e0%b4%82-%e0%b4%af%e0%b5%82%e0%b4%a3%e0%b5%80%e0%b4%95%e0%b5%8b%e0%b4%a1%e0%b5%8d-5-1-%e0%b4%ab%e0%b5%8b%e0%b4%a3%e0%b5%8d%e0%b4%9f%e0%b5%81%e0%b4%95/</guid>
		<description><![CDATA[യൂണിക്കോഡ് 5.1 പുറത്തിറങ്ങിയ വിവരവും, അതില്‍ മലയാളത്തിലെ ഇപ്പോള്‍ ചില്ലുകള്‍ ഉപയോഗിക്കുന്ന രീതിയ്ക്കു പകരം അറ്റോമിക് ചില്ലുകള്‍ ഉള്ളതും അറിഞ്ഞിരിക്കുമല്ലോ. ഇല്ലെങ്കില്‍ അതിനേപ്പറ്റി ഇവിടെ നിന്നു വായിക്കുക. അറ്റോമിക്‍ ചില്ലു് യൂണിക്കോഡില്‍ ഉള്‍പ്പെടുത്തുന്നതിനെപ്പറ്റിയുള്ള ചര്‍ച്ചകളില്‍ സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് ഉന്നയിച്ച വിയോജിപ്പുകളില്‍ ഇപ്പോഴും ഉറച്ചു നില്‍ക്കുന്നു. സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് UTC യ്ക്ക് സമര്‍പ്പിച്ച ഈ ഡോക്യുമെന്റില്‍ വിയോജിപ്പുകള്‍ പറഞ്ഞിട്ടുണ്ടു്. ഇതിനെപ്പറ്റി നടന്ന ചര്‍ച്ചകളുടെ ലിങ്കുകള്‍ ചിലതു് ഇവിടെ നിന്നും വായിക്കാം. മലയാളത്തെ ഡുവല്‍ എന്‍കോഡിങ്ങിലേയ്ക്കും സുരക്ഷാപ്രശ്നങ്ങളിലേയ്ക്കും [...]]]></description>
			<content:encoded><![CDATA[<p>യൂണിക്കോഡ് 5.1 പുറത്തിറങ്ങിയ വിവരവും, അതില്‍ മലയാളത്തിലെ ഇപ്പോള്‍ ചില്ലുകള്‍ ഉപയോഗിക്കുന്ന രീതിയ്ക്കു പകരം അറ്റോമിക് ചില്ലുകള്‍ ഉള്ളതും അറിഞ്ഞിരിക്കുമല്ലോ. ഇല്ലെങ്കില്‍ അതിനേപ്പറ്റി <a href="http://www.unicode.org/versions/Unicode5.1.0/#Malayalam_Chillu_Characters">ഇവിടെ നിന്നു</a> വായിക്കുക.  അറ്റോമിക്‍ ചില്ലു് യൂണിക്കോഡില്‍ ഉള്‍പ്പെടുത്തുന്നതിനെപ്പറ്റിയുള്ള ചര്‍ച്ചകളില്‍ <a href="http://smc.org.in">സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ്</a>  ഉന്നയിച്ച വിയോജിപ്പുകളില്‍ ഇപ്പോഴും ഉറച്ചു നില്‍ക്കുന്നു. </p>
<p>സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് UTC യ്ക്ക് സമര്‍പ്പിച്ച ഈ <a href="http://fci.wikia.com/wiki/Image:SMC_Unicode_5.1.pdf">ഡോക്യുമെന്റില്‍ </a>വിയോജിപ്പുകള്‍ പറഞ്ഞിട്ടുണ്ടു്. ഇതിനെപ്പറ്റി നടന്ന ചര്‍ച്ചകളുടെ ലിങ്കുകള്‍ ചിലതു് <a href="http://fci.wikia.com/wiki/%E0%B4%B8%E0%B5%8D%E0%B4%B5%E0%B4%A4%E0%B4%A8%E0%B5%8D%E0%B4%A4%E0%B5%8D%E0%B4%B0_%E0%B4%AE%E0%B4%B2%E0%B4%AF%E0%B4%BE%E0%B4%B3%E0%B4%82_%E0%B4%95%E0%B4%AE%E0%B5%8D%E0%B4%AA%E0%B5%8D%E0%B4%AF%E0%B5%82%E0%B4%9F%E0%B5%8D%E0%B4%9F%E0%B4%BF%E0%B4%99%E0%B5%8D%E0%B4%99%E0%B5%8D/%E0%B4%86%E0%B4%A3%E0%B4%B5_%E0%B4%9A%E0%B4%BF%E0%B4%B2%E0%B5%8D%E0%B4%B2%E0%B4%BF%E0%B4%A8%E0%B5%8D%E0%B4%B1%E0%B5%86_%E0%B4%AA%E0%B5%8D%E0%B4%B0%E0%B4%A4%E0%B5%8D%E0%B4%AF%E0%B4%BE%E0%B4%98%E0%B4%BE%E0%B4%A4%E0%B4%99%E0%B5%8D%E0%B4%99%E0%B4%B3%E0%B5%8D%E2%80%8D">ഇവിടെ</a> നിന്നും വായിക്കാം.</p>
<p>മലയാളത്തെ ഡുവല്‍ എന്‍കോഡിങ്ങിലേയ്ക്കും സുരക്ഷാപ്രശ്നങ്ങളിലേയ്ക്കും തള്ളിവിടുന്ന ഒരു സ്റ്റാന്‍ഡേഡ് അനുസരിക്കേണ്ട ബാദ്ധ്യത സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങിനില്ല. സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് ഭാഷയ്ക്കു വേണ്ടിയാണു്, യൂണിക്കോഡിനു വേണ്ടിയല്ല നിലകൊള്ളുന്നതു്. അതുകൊണ്ടു തന്നെ ഉന്നയിച്ച പ്രശ്നങ്ങള്‍ക്കു് പരിഹാരമാവാതെ 5.0 പതിപ്പില്‍ നിന്നു 5.1 പതിപ്പിലേയ്ക്കു് സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് പ്രൊജക്ടുകള്‍ മാറില്ല. പക്ഷേ ഒരു സ്റ്റാന്‍ഡേഡ് എന്ന നിലയ്ക്ക് ആര്‍ക്കും യൂണിക്കോഡ് 5.1 അപ്ലിക്കേഷനുകളില്‍ പ്രയോഗിക്കാന്‍ സ്വാതന്ത്ര്യവുമുണ്ടു്. പക്ഷേ സ്വതന്ത്ര മലയാളം കമ്പ്യുട്ടിങ്ങ് മെയിന്റെയിന്‍ ചെയ്യുന്ന/വികസിപ്പിച്ചെടുത്ത ഫോണ്ടുകളായ മീര, രചന, ദ്യുതി, തുടങ്ങിയ ഫോണ്ടുകളിലൊന്നും അറ്റോമിക് ചില്ലു് ഉണ്ടാവില്ല. അതുപോലെത്തന്നെ ഗ്നു/ലിനക്സിലെ നിവേശകരീതികളിലും മറ്റു സംരംഭങ്ങളിലും ഇവ അടുത്തൊന്നും ഉണ്ടാവില്ല. പ്രമുഖ ഗ്നു/ലിനക്സ് വിതരണങ്ങളുടെ മലയാളം ഫോണ്ടുകളുടെയും നിവേശകരീതികളുടെയും Upstream സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് ആയതുകൊണ്ടു് അവയിലും അറ്റോമിക് ചില്ലുണ്ടാവില്ല. </p>
<p>ഇപ്പോള്‍ അറ്റോമിക് ചില്ലു് നിലവിലുള്ളതു് അഞ്ജലി ഫോണ്ടിലും, വരമൊഴി/മൊഴി എന്നിവയുടെ പുതിയ പതിപ്പിലും മാത്രമാണു്. അവയുടെ പുതിയ പതിപ്പുകള്‍ ഉപയോഗിച്ചെഴുതിയ ചില ബ്ലോഗുകള്‍ അഞ്ജലിയൊഴികെയുള്ള ഫോണ്ടുകള്‍ കൊണ്ടു് വായിക്കാന്‍ ബുദ്ധിമുട്ടാകുന്നപ്രശ്നം നിലവിലുണ്ടു്.  ചില്ലക്ഷരങ്ങള്‍ക്കു പകരം വട്ടത്തിനകത്ത് R എന്ന അക്ഷരമാവും കാണുക. ഏവൂരാന്‍ജി അതിനുവേണ്ടി രഘുമലയാളം എന്ന ഫോണ്ടിനെ മാറ്റിയെടുക്കാന്‍ ശ്രമം <a href="http://chithrangal.blogspot.com/2008/05/51.html">നടത്തുകയുണ്ടായി</a> . </p>
<p>പക്ഷേ തെറ്റായ സ്റ്റാന്‍ഡേഡിനുവേണ്ടി ഫോണ്ടുകളെ മാറ്റാതെത്തന്നെ പുതിയ ചില്ലുകളുള്ള ബ്ലോഗുകള്‍ പ്രശ്നമൊന്നുമില്ലാതെ കാണാന്‍ വേണ്ടി, സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് ഫയര്‍ഫോക്സ് ഉപയോഗിക്കുന്നവര്‍ക്കു വേണ്ടി ഒരു extension ഉണ്ടാക്കിയിട്ടുണ്ടു്. നിഷാന്‍  നസീര്‍ നിര്‍മ്മിച്ച <a href="http://download.savannah.gnu.org/releases/smc/fix-ml.xpi">fix-ml എന്ന extension ഡൗണ്‍ലോഡ് ചെയ്ത് </a> ഇന്‍സ്റ്റാള്‍ ചെയ്താല്‍ ആണവചില്ലും ഏതു ഫോണ്ടും ഉപയോഗിച്ചു് വായിക്കാന്‍ കഴിയും. ഗ്രീസ് മങ്കി ഉപയോഗിക്കുന്നവരാണെങ്കില്‍ ഈ extension തന്നെ <a href="http://userscripts.org/scripts/show/26434"> ഗ്രീസ് മങ്കി സ്ക്രിപ്റ്റായി ഇവിടെ നിന്നു ഡൌണ്‍ലോഡ് ചെയ്തു്</a> ഉപയോഗിയ്ക്കാം.</p>
<p>സംശയങ്ങള്‍ ഇവിടെ കമന്റായോ, സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ <a href="http://groups.google.com/group/smc-discuss">മെയിലിങ്ങ് ലിസ്റ്റിലോ</a>,  irc.freenode.net ല്‍ ഉള്ള #smc-project എന്ന IRC ചാനലിലോ ചോദിയ്ക്കാം<br />മെയിലിങ്ങ് ലിസ്റ്റിലെ <a href="http://groups.google.com/group/smc-discuss/browse_thread/thread/8513a44660e66dab/dd9ed52da28b386c?#dd9ed52da28b386c">ഈ ത്രെഡും കാണുക.</a></p>
]]></content:encoded>
			<wfw:commentRss>http://thottingal.in/blog/2008/05/13/malayalam-unicode-51/feed/</wfw:commentRss>
		<slash:comments>21</slash:comments>
		</item>
		<item>
		<title>Open Letter to Mammootty from Free Software Community</title>
		<link>http://thottingal.in/blog/2008/04/19/open-letter-to-mammootty-from-free-software-community/</link>
		<comments>http://thottingal.in/blog/2008/04/19/open-letter-to-mammootty-from-free-software-community/#comments</comments>
		<pubDate>Sun, 20 Apr 2008 03:33:00 +0000</pubDate>
		<dc:creator>Santhosh</dc:creator>
				<category><![CDATA[Community]]></category>
		<category><![CDATA[Malayalam]]></category>
		<category><![CDATA[foss]]></category>

		<guid isPermaLink="false">http://thottingal.in/blog/?p=39</guid>
		<description><![CDATA[Microsoft will be signing up Malayalam movie star Mammootty as one of the brand ambassadors for the Computer Literacy programme that is to be organized soon in Kerala. FOSS community writes an open letter to Mammootty to Reconsider Promotion of Microsoft and their Proprietary Softwares. It is available here: An open letter to Mammootty. I [...]]]></description>
			<content:encoded><![CDATA[<p>Microsoft will be signing up Malayalam movie star Mammootty as one of the brand ambassadors for the Computer Literacy programme that is to be organized soon in Kerala. FOSS community writes an open letter to Mammootty to Reconsider Promotion of Microsoft and their Proprietary Softwares.</p>
<p>It is available here: <a href="http://fci.wikia.com/wiki/Open_Letter_To_Mammootty">An open letter to Mammootty</a>. I request all to endorse Open letter to Mammooty by adding your name there.</p>
<p>A nice post on ILUG-TVM on the issue: <a href="http://www.ilug-tvm.org/content/another-ms-dirty-tactics"> Another of M$&#8217;s dirty tactics</a></p>
]]></content:encoded>
			<wfw:commentRss>http://thottingal.in/blog/2008/04/19/open-letter-to-mammootty-from-free-software-community/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
<!-- WP Super Cache is installed but broken. The path to wp-cache-phase1.php in wp-content/advanced-cache.php must be fixed! -->
