Skip to content


കേള്‍വി ഒരു കല, സംഭാഷണം സംഗീതവും

“കേള്‍വി ഒരു കലയാണ്. നാക്ക് നമ്മുടെ ചെവിയിലായിരുന്നെങ്കില്‍ ശബ്ദത്തെ രുചിയ്ക്കാമായിരുന്നു” ഫോസ്.ഇന്‍ പരിപാടിയ്ക്കിടയില്‍ ഉണ്ടായ ഒരു സംഭാഷണമദ്ധ്യേ പ്രശസ്ത ഡിസൈനറും കോളമിസ്റ്റൂം സ്വതന്ത്ര സോഫ്റ്റ്‌വെയര്‍ പ്രചാരകനുമായ നിയാം ഭൂഷണ്‍ എന്നോടു പറഞ്ഞു.
ഫോസ്.ഇന്‍ പരിപാടിയില്‍ എന്റെ ഭാരതീയ ഭാഷാ സംഭാഷണവിശ്ലേഷിണിയെപ്പറ്റിയുള്ള(Speech Synthesizer) അവതരണത്തില്‍ നിയാം ഭൂഷണും ശ്രോതാവായി വന്നിരുന്നു. വാക്കുകളെ ശബ്ദമാക്കുമ്പോള്‍ ശാസ്ത്രം അഭിമുഖീകരിയ്ക്കുന്ന ഒരു വെല്ലുവിളിയാണ് വായിക്കുന്നതിന്റെ താളഭംഗിയും അതിന്റെ സ്വാഭാവികതയും. ധ്വനി എന്ന എന്റെ സോഫ്റ്റ്‌വെയര്‍ തികച്ചും യാന്ത്രികമായിട്ടാണ് 8 ഭാഷകള്‍ വായിക്കുന്നത്. കേട്ടാല്‍ മനസ്സിലാവുമെങ്കിലും അതിന്റെ റോബോട്ടിക് സംസാരശൈലി പലപ്പോഴും അരോചകമാണെന്നത് സത്യമാണ്. ശബ്ദങ്ങളെ കൂട്ടിയിണക്കിയുള്ള സംസാരവിശ്ലേഷിണികളാണ് ഏറെയും പ്രചാരത്തിലുള്ളത്. അവയില്‍ താളവും സ്വാഭാവികതയും കൊണ്ടു വരുന്നതിനെപ്പറ്റിയുള്ള ഗവേഷണങ്ങള്‍ ഇപ്പോളും പൂര്‍ണ്ണവിജയത്തിലെത്തിയിട്ടില്ല. പലരും അങ്ങനെയൊരു സംരംഭം പൂര്‍ണ്ണവിജയം കാണില്ലെന്ന് വാദിയ്ക്കുന്നുണ്ടു താനും. ഈ ഗവേഷണം ലാറ്റിന്‍ ഭാഷകളില്‍ ഏറെക്കുറെ പുരോഗതി നേടിയിട്ടുണ്ട്. ഫെസ്റ്റിവല്‍ എന്ന സോഫ്റ്റ്‌വെയര്‍ ഇംഗ്ലീഷിനു വേണ്ടി ഉപയോഗിച്ചു നോക്കിയാല്‍ ഇതു മനസ്സിലാക്കാന്‍ പറ്റും. രണ്ട് പ്രശ്നങ്ങളാണ് ഈ ഗവേഷണങ്ങള്‍ക്ക് മുന്നിലുള്ളത്.
1. എപ്പോളൊക്കെയാണ് സംസാരം നീട്ടിയോ താളത്തിലോ നമ്മള്‍ പറയുന്നത്?
2. ഒന്നാമത്തെ ചോദ്യത്തിനുത്തരം ലഭിച്ചുകഴിഞ്ഞാല്‍ എങ്ങനെയാണ് കൃത്രിമമായി അത്തരം നീട്ടിക്കുറുക്കലുകള്‍ സംസാരത്തില്‍ കൊണ്ടു വരുന്നത്?
രണ്ടാമത്തെ ചോദ്യത്തിനുത്തരം ഡി എസ് പി അഥവാ ഡിജിറ്റല്‍ സിഗ്നല്‍ പ്രൊസസ്സിങ്ങ് എന്ന ടെക്നോളജി എന്ന വാക്കിലൊതുക്കാമെങ്കിലും, ഇതു വരെ നടന്നിട്ടുള്ള ഗവേഷണങ്ങള്‍ സൂചിപ്പിയ്ക്കുന്നതു് നാം എത്രത്തോളം ഡി എസ് പി പ്രൊസസ്സിങ്ങ് ഒരു ശബ്ദതരംഗത്തിനുമേല്‍ നടത്തുന്നുവോ അത്രത്തോളം അതിന്റെ സ്വാഭാവികതയ്ക്കു് കുറവു് വരുന്നു എന്നാണു്. അതുകൊണ്ടു തന്നെയാണു്, നേരത്തെ ശേഖരിച്ചു് മനുഷ്യസംസാരശകലങ്ങളെ കൂടിയിണക്കുന്നതുനു് പകരം കൃത്രിമമായി ശബ്ദതരംഗങ്ങളെ സൃഷ്ടിയ്ക്കുന്ന സങ്കേതങ്ങള്‍ വേണ്ടത്ര വിജയിക്കാത്തതും.
എന്റെ അവതരത്തിനിടയില്‍ നിയാം ഭൂഷണ്‍ പറഞ്ഞത്, സംസാരം എന്നത് ഒരുതരത്തില്‍ സംഗീതം തന്നെയാണെന്നാണ്. താളക്രമങ്ങളുടെ ഏറ്റക്കുറച്ചിലുകള്‍ കുറവായിരിയ്ക്കുന്ന ഒരു സംഗീതത്തെ സംഭാഷണമാണെന്ന് കണക്കാക്കാമത്രെ. നിയാം സംഗീതത്തെക്കുറിച്ചും വിശിഷ്യാ ശബ്ദത്തിന്റെ വിവിധ രൂപഭാവങ്ങളെയും കുറിച്ച് ദീര്‍ഘകാലമായി ഗവേഷണം നടത്തുന്ന വ്യക്തിയാണു്. എന്റെ അവതരണത്തിനു ശേഷം ഈ വിഷയത്തി‌ല്‍ അദ്ദേഹവുമായി ഒരു മണിക്കൂറിലേറെ സമയം ഞാന്‍ ഇക്കാര്യങ്ങള്‍ ചര്‍ച്ച ചെയ്തു. 20Hz നും 20KHz നും ഇടയില്‍ മാത്രമല്ല, അതില്‍ കുറഞ്ഞ ആവൃത്തിയിലുള്ള ശബ്ദവും നമുക്ക് കേള്‍ക്കാന്‍ പറ്റില്ലെങ്കിലും സംവേദനക്ഷമമാണ് . കാതുകളല്ലാതെ നമ്മുടെ ശരീരത്തിന്റെ ഓരോ അവയവത്തിനും ഇത്തരം ശബ്ദത്തിനെ മനസ്സിലാക്കാന്‍ കഴിവുണ്ട്. ഇത് തെളിയിക്കാന്‍ വേണ്ടി നിയാം എന്റെ തലയില്‍ രണ്ട് കൊട്ടുകൊട്ടിയിട്ട് അതിന്റെ ശബ്ദം ചെവി ഉപയോഗിച്ചാണോ ശ്രവിച്ചതെന്ന് ചോദിച്ചു. അതുപോലെ തന്നെ തണുപ്പുകാലത്ത് നമ്മുടെ പല്ലുകള്‍ കൂട്ടിമുട്ടുമ്പോഴും…കൊച്ചുകുട്ടികളുടെ ശ്രവണശേഷിയ്ക്ക് കുറഞ്ഞ ആവൃത്തിയുള്ള ശബ്ദങ്ങള്‍ സംവേദനക്ഷമമാണത്രേ..കൊച്ചുകുട്ടികള്‍ അമ്മയെ വിളിയ്ക്കുമ്പോള്‍ തുടങ്ങുമ്പോള്‍ ഉപയോഗിയ്ക്കുന്നത് മകാരത്തിന്റെ രൂപഭേദങ്ങളാണെന്നതിന് ശാസ്ത്രീയമായ ചിലകാരണങ്ങളുണ്ടത്രേ. അതുപോലെ അച്ഛനെ വിളിയ്ക്കാനുപയോഗിയ്ക്കുന്ന പകാരത്തിനും. പയും മയും ഒരേ വര്‍ഗ്ഗാക്ഷരങ്ങളുമാണല്ലോ.. ശബ്ദത്തിന്റെയും മനുഷ്യന്റെ സംഭാഷണശേഷിയുടെയും ഇത്തരം അടിസ്ഥാനവസ്തുകളെക്കുറിച്ച് കൂടുതല്‍ പഠിയ്ക്കുന്നത് ധ്വനിയുടെയും ശ്യാം വികസിപ്പിച്ച് കൊണ്ടിരിയ്ക്കുന്ന ശാരിക എന്ന മലയാളം സംസാരസംശ്ലേഷിണിയുടെയും(Speech Recognizer) പ്രോഗ്രാമ്മിങ്ങിനു് ഉപകാരപ്രദമായിരിയ്ക്കുമെന്ന് അദ്ദേഹം പറഞ്ഞു.

ശബ്ദമലിനീകരണം കൊണ്ടും ഒരേ ശബ്ദം പലയാവര്‍ത്തി ശ്രവിയ്ക്കുന്നതിലൂടെയും നമ്മുടെ ശ്രവണശേഷിയ്ക്ക് തകരാറു് പറ്റാറുണ്ടു്. ഈ പേജില്‍ നിയാം എങ്ങനെ കേള്‍വിയ്ക്കുണ്ടാകുന്ന ഇത്തരം പ്രശ്നങ്ങളെ അതിജീവിയ്ക്കാമെന്നു് വിശദീകരിയ്ക്കുന്നുണ്ടു്. ശബ്ദത്തിന്റെ അതിന്റെ ഒച്ചക്കൂടുതല്‍ കൊണ്ടുണ്ടാകുന്ന വിപത്തുകളെക്കുറിച്ചും വളരെ വിശദമായൊരു ലേഖനം ഇവിടെയുണ്ടു്. കേള്‍വി എന്നത് ഒരു കലയാണെങ്കില്‍ അതാസ്വദിയ്ക്കാന്‍ നമ്മുടെ കാതുകളെ സംരക്ഷിക്കേണ്ടത് അത്യാവശ്യമാണു്.
മാതൃഭൂമി ആഴ്ചപ്പതിപ്പു് ഡിസംബര്‍ 2-8(ലക്കം 40 – പേജ് 60) ല്‍ വന്ന “നമ്മുടെ ആയുസ്സില്‍ ശബ്ദത്തിന്റെ സ്വാധീനം” എന്ന ജീവന്‍ ജോബ് തോമസിന്റെ ശാസ്ത്രലേഖനവും ഇതേ വിഷയത്തിലുള്ളതാണു്.

ശബ്ദത്തെക്കുറിച്ചും നമ്മുടെ ശബ്ദസംവേദന ശേഷി വര്‍ദ്ധിപ്പിയ്ക്കാനും കാതുകളെ പരിശീലിപ്പിയ്ക്കാനുമുള്ള സ്വതന്ത്ര സോഫ്റ്റ്‌വെയറാണു് ഗ്നു സോല്‍ഫേജ്

സംഗീതം ഒരു മഹാസാഗരമാണെങ്കില്‍ സംഭാഷണവും അങ്ങനെത്തന്നെ!!!

കുറിപ്പ്: എന്റെ http://santhoshtr.livejournal.com എന്ന ബ്ലോഗ് പ്ലാനറ്റ് ഫ്ലോസ് ഇന്ത്യ എന്ന സ്വതന്ത്ര സോഫ്റ്റ്‌വെയര്‍ പ്രവര്‍ത്തകരുടെ ബ്ലോഗ് അഗ്രഗേറ്റര്‍ സബ്‌‌സ്ക്രൈബ് ചെയ്യുന്നത് കൊണ്ട്, അതില്‍ ഇനി ഇംഗ്ലീഷില്‍ മാത്രമേ എഴുതുള്ളൂ.

Posted in Misc.


2 Responses

Stay in touch with the conversation, subscribe to the RSS feed for comments on this post.

  1. പ്രവീണ്‍|Praveen aka j4v4m4n says

    ധ്വനിയും ശാരികയും കൂടുതല്‍ മുന്നേറാന്‍ ഫോസ്.ഇന്‍ സഹായകമാകുമെന്നു് പ്രതീക്ഷിയ്ക്കുന്നു. നിയാമിന്റെ നീരീക്ഷണങ്ങളും സഹായവും ഇവയെ ഒന്നു കൂടി മെല്ലപ്പെട്ടതാക്കാന്‍ സഹായിയ്ക്കുമെന്നു് കൂടി പ്രതീക്ഷിയ്ക്കുന്നു. ഇനിയും മുന്നോട്ടു് മുന്നോട്ടു് …

    അവസാന വാചകമെഴുതിയപ്പോഴാണു് ഒരാശയം വന്നതു്. എടാ നമുക്കു് പണ്ടത്തെ സാക്ഷരതാ പ്രചാരണത്തിനുപയോഗിച്ചിരുന്നതു് പോലുള്ള നാടന്‍ പാട്ടുകളെഴുതാന്‍ പറ്റുമോ സ്വതന്ത്ര സോഫ്റ്റുവെയര്‍ പ്രചാരണത്തിനു്?

  2. keralafarmer says

    :)



Some HTML is OK

or, reply to this post via trackback.

Powered by WP Hashcash