Sunday, August 24, 2003

மொழியியற் பார்வையில் தமிழ் குறியீடு

இது காலையில் நடந்திருக்க வேண்டியது. முனைவர் இராம.கி யின் தாள். நடத்துனர்கள் இதைச் சம்பந்தா சம்பந்தமில்லாது கடைசியாக ஏதோ ஒரு அமர்வில் போட்டதோடு மட்டுமில்லாமல், இதன் தலைவராக இருந்த இராசேந்திரன் என்பவர் ஒரேயடியாக பிளேடு போட்டு ஒரு 45 நிமிடத்திற்கும் மேலாக அறுத்துத் தள்ளி விட்டாராம். பக்கத்து அறையிலிருந்து நான் அவசர அவசரமாக கடைசியாக இருக்கும் இந்தப் பேச்சைக் கேட்க ஓடிவர உள்ளே இருந்தவர்கள் இன்னும் தலைவர் (பிளேடு) உரையே முடியவில்லை என்று சொல்ல மீண்டும் அடுத்த அறைக்கு ஓடி அங்கு நடந்த கேள்வி பதில்களில் கலந்து கொண்டு பின்னர் 30 நிமிடங்களுக்குப் பின்னர் மீண்டும் வந்தேன்.

நான் கவனித்தவை:

* இப்பொழுதுள்ள யூனிகோடில் உயிரும், அகரமேறிய உயிர்மெய்யும் உள்ளது. மெய்யே இல்லை.
* இது மொழியியல் பார்வையில் தவறானது
* கணினியில் சேமித்து வைக்க மெய்யும், உயிரும் தனித்தனியே இருந்தால் போதுமானது
* நாம் காண்பதற்கு மட்டுமே உயிர்மெய் எனப்படும் குறியீடு தேவைப்படுகிறது
* இதற்கு தனி lookup table வைத்து திரையில் காண்பிக்க மட்டும் வைத்துக் கொள்ளலாம்

அப்பொழுது பின்னால் அமர்ந்திருந்த பார்வையற்றவரான முனைவர் ஜெயச்சந்திரன் என்பவர் பார்வையற்றோருக்கான தமிழ் braille முறையில் வெறும் 31 குறியீடுகளே (12 உயிர், 18 மெய், ஆய்தம்) என்றும், அதுவே அவர்களுக்குப் போதுமானது என்றும் சொன்னார்.

இராம.கியும் இவ்வாறு செய்கையில் மொழியியல் முறையில் 'அப்பால்' என்னும் சொல்லைத் தேடுகையில் 'அவனுக்கப்பால்' என்ற சொல்லின் 'அப்பால்' என்பதும் சரியாக வரும், என்றும் இப்பொழுதுள்ள குறியீட்டு முறையில் அது சரியாக வராது என்றும் குறிப்பிட்டார். (வரவேண்டுமென்றால் மென்பொருள் இன்னும் காம்பிளெக்ஸாக இருக்க வேண்டும்).

நேரம் நிறைய ஆனதால், இந்த அமர்வும் அவசரமாக முடிக்கப்பட்டு அனைவரும் காப்பியும், தேநீரும் அருந்தப் புறப்பட்டனர்.

இதன் பிறகு அண்ணா பல்கலைக் கழகத்தில் நிறைவு விழாவிற்கு அனைவரும் சென்று விட்டனர்.

தொழில்நுட்பமும் பயன்பாடும்

அன்பரசன், ஆப்பிள்சாஃப்ட் என்னும் நிறுவனத் தலைவர் மைக்ரோசாஃப்ட் OSகளைத் தமிழாக்குவது பற்றிப் பேசினார். இவருகும் தமிழக அரசு நிதி உதவி செய்துள்ளது. அதன் மூலம் 'ஜனனி' என்னும் மென்பொருளை உருவாக்கியுள்ளார். (நிதி உதவி 5 லட்சம் ரூபாய்கள்)

மென்பொருள்களை லோக்கலைஸ் செய்வதில் மூன்று முறைகள் கடைப்பிடிக்கப் படுகின்றனவாம்.
* மூலத்தின் உள்ளேயே தமிழைப் புகுத்தி அதை மீண்டும் கம்பைல் செய்வது. இது ஓப்பன் சோர்ஸ் வகையைச் சார்ந்ததில்தான் முடியும்
* கம்பைல் செய்யப்பட்ட எக்ஸிகியூட்டபிலை மாற்றுவது
* மூன்றாவது ரன் டைம் முறையில், இயங்கும் போதே திரையில் தமிழ் மெனுக்கள், தமிழிலே செய்திகள் என்று செய்வது

ஜனனி இந்த ரன் டைம் முறையில் இயங்குவதாம். இது இப்பொழுது தமிழ்நாடு அரசிடம் வழங்கப்பட்டுள்ளதாகவும் அவர்கள்தான் இனி இதை என்ன செய்வது என்று தீர்மானிக்க வேண்டும் என்றும் சொன்னார். இவர் தன் எழுதிய சோர்ஸ் கோடை அரசிடம் கொடுக்கப் போவதில்லை என்றும், அவ்வாறு கொடுத்தால் அந்த சோர்ஸை அரசு சரியாகக் காப்பாற்றுமா என்று தனக்கு நம்பிக்கையில்லை என்றும், அது பிறர் கைக்குப் போய் அவர்கள் தனி லாபமடையலாம் என்று தான் நினைப்பதாகவும் சொன்னார்.

அதே நேரத்தில் தான் மற்றுமொறு செயலி செய்வதாகவும் (அதன் பெயர் லோக்கலைசர்) அது யூனிகோடிலும் இயங்கும் என்றும் ஜனனியில் உள்ள ஒரு சில தொல்லைகளைக் களையும் என்றும் அதை எவ்வாறு சந்தைக்குக் கொண்டு வருவது என்று இன்னும் முடிவு செய்யவில்லை என்றும் சொன்னார்.

தொழில்நுட்பமும் பயன்பாடும்

மதிய உணவு இடைவேளைக்குப் பின்னர் நிகழ்ந்த இந்த நிகழ்ச்சியில் எழுத்தாளர் சுஜாதா பங்கேற்றார். தனக்கே உரிய குத்தல் நகைச்சுவை பாணியில் "தமிழ்க்கணினி - சில சிந்தனைகள்" பேசினார். இது ஒன்றுதான் லினக்ஸ் சம்பந்தமான தாள்.

sujathaபேசுகையில் குடியரசுத் தலைவர் அப்துல் கலாம் உரையிலிருந்து கீழுள்ளவற்றை மேற்கோள் காட்டினார்.
- தேடு இயந்திரத்திற்கான தரவு தளங்கள் தமிழில் இருக்க வேண்டும்
- open source முறையைப் பயன்படுத்தி தமிழில் மென்பொருள்கள் செய்ய வேண்டும்
- தமிழில் தேடுவதற்கு ஏற்புடைய இணைய பக்கங்கள் வேண்டுமெனில் நாம் யூனிகோடு எழுத்துருவை நடைமுறைக்குக் கொண்டுவரவேண்டும்
- பிற மொழி இணையப் பக்கங்கள் தானாகவே தமிழில் வருமாறு செய்ய வேண்டும்

இவையெல்லாம் தான் பேசவிருந்த விஷயங்களோடு ஒத்துப்போவதாகச் சொன்னார்.

அவர் சொன்னது:

* இந்திய மொழியிலேயே தமிழில்தான் உள்ளிடுவதற்குப் பல முறைகள், அதிக பட்ச குறியீடுகள்
* இனிமேல் எதாவது ஒரு குறியீடு கொண்டுவந்தால் அவர்களை அல்-உம்மா, பஜ்ரங்க தல் ஆகியோரிடம் விட்டு விடுவோம். அல்லது போடா சட்டத்தில் இரவோடு இரவாக உள்ளே போடுவோம் (புரியாதவர்களுக்கு: இது ஜோக்)
* யூனிகோடில் தொல்லைகள் உள்ளது, மாற்றும் முயற்சிகள் எடுத்துக் கொண்டாலும், இப்பொழுதே இருக்கும் யூனிகோடுக்கு மாறுவது நல்லது. மாற்றங்கள் ஏற்படும் போது அதை உள்ளடக்கிக் கொள்ளலாம்.
* இப்பொழுதிருக்கும் பல உள்ளீடு முறைகளில் இரண்டு மட்டும் பிழைத்து, அதுவும் பின்பு ஒன்றாக மாறிவிடும்
* இப்பொழுது முழுமையான இயங்கு தளத்தை உருவாக்கும் முயற்சி ரெட் ஹாட் இந்திய மற்றும் தமிழ் இணைய பல்கலைக் கழகத்தின் உதவியோடு செயல்பட்டுக் கொண்டிருகிறது (தமிழ் இணையப் பல்கலைக் கழகம் நிதியுதவி செய்துள்ளது)

* இப்பொழுது பல ஆர்வலர்கள் செய்திருக்கும் KDE மொழிமாற்றத்தில் பல தவறுகள் உள்ளன. அது போல பாரதீய ஓப்பன் ஆஃபீஸிலும் மொழியாக்கம் முழுமையாக முடிக்கப்படவில்லை.
* முதலில் செய்து முடிக்க வேண்டியது முழுக் கலைச்சொல்லாக்கம். அதில்தன் முழுமஈயக ஈடுபட்டுள்ளதாகச் சொன்னார்.

இணையத்தில் நடந்து கொண்டிருக்கும் முயற்சிகளில் நேரிடையான பங்கு இல்லாததால் அதைப்பற்றி எதுவும் பேசவில்லை.

உலகில் வெவ்வேறு பாகங்களில் நடைபெறும் தமிழ் லினக்ஸ் முயற்சிகள் ஒருங்கிணைக்கப் பட வேண்டும்.

தொழில்நுட்பமும் பயன்பாடும்

தமிழில் சொல்-திருத்தி, syntactic parser, text analyser மற்றும் context-free grammar பற்றிய நான்கு தாள்கள் இந்த அமர்வில் படிக்கப்பட்டன. நான் உள்ளே வருவதற்கு நிறைய நேரம் ஆகி விட்டது. அப்பொழுது தொல்காப்பியரின் வெண்பாவுக்கான இலக்கணத்தை நோம் சோம்ஸ்கியின் natural language processing பற்றியவைகளோடு ஒப்பிட்டு ஒரு மென்பொருளையும் எழுதி அதன் மூலம் வெண்பாக்களை அசை, சீர் என்று பிரித்து அவை சரியான தளைகளில் அமைந்துள்ளதா என்று சரி பார்க்க முடியும் என்றனர். இதை எழுதியது பாலசுந்தர ராமன், ஈஷ்வர், சஞ்சீத் குமார் ரவிந்திரநாத் ஆகிய IIIT பெங்களூர் காரர்கள்.

இதன் அடுத்த படியாக மற்ற பாக்கள், பின் அதிலிருந்து உரைநடை ஆகியவற்றுக்கு syntax, semantics analyserகளை எழுதி அதன் மூலம் இலக்கண விதிகளுக்குள் இருக்கிறதா என்று கண்டு பிடிப்பது. இது கணினிக்குள் எழுதி உள்ளிடுவதை வெறும் மின் அகராதி மூலம் சொல்-திருத்துவது மட்டுமல்லாது முழு வரிகளையும் திருத்த முடியும்.

இது பற்றிய கட்டுரைகள் நான் மேலேற்றிய கோப்பிலிருக்கும். எனக்கு இதைப் பற்றி மேலே எழுதுவது விஷய ஞானம் இல்லாத காரணத்தால் இயலாதது.

தமிழ் மென்பொருட்கள்

16 பிட் குறியீடு விவாதம் நடக்கையில் அதே நேரம் மென்பொருள் பற்றிய மற்றொரு கருத்தரங்கு நடந்து விட்டது. இரண்டும் ஒன்றுக்கடுத்தது ஒன்றாக நடப்பதாகத்தான் முதலில் இருந்தது. இதனால் அருள் குமரன் போன்றோர் பேசியதைக் கேட்க முடியாது போய் விட்டது. அவருக்கும் வருத்தம் (பெருந்தலைகள் எல்லாம் 16 பிட் சண்டைக்குப் போய்விட்டன, சொன்னதைக் கேட்க சரியான ஆளில்லை என்று), எனக்கும் வருத்தம்.

இனி மதியம், இந்த மாநாட்டின் ஒரே ஒரு லினக்ஸ் பற்றிய கட்டுரை. எழுத்தாளர் சுஜாதா வழங்குவது. பின்னர் மற்றுமொரு கருத்தரங்கில் இராம.கி பேசுவது. இவற்றைப் பற்றித்தான் நான் எழுத முடியும்.

மீண்டும் சந்திப்போம்.

16 bit குறியீடு பற்றிய விவாதம்

விவாதம் சூடு பறக்க ஆரம்பித்தது. ஆப்பிள்சாஃப்ட் நிறுவனத்தின் அன்பரசன் மிகக் காட்டமாக கிருஷ்ணமூர்த்தியின் முடிவுகளை எதிர்த்தார். மேலும் மேலும் இடம் கேட்டால் கொடுக்க யூனிகோடிடம் இடம் இல்லாமல், 16bit என்பது 32bitக்குப் போய் விடும் (ஏற்கனவே விட்டது!) எனவே 33% இடம் குறையும் என்பது போய் யூனிகோட் வேண்டுமென்றால் 4 மடங்கு இடம் அதிகமாகும் என்ற நிலை வரும் என்றார்.

மேலும் "efficiency" என்ற காரணத்தைக் காட்டி அதிகமாக இடம் கேட்டால் யூனிகோட் கன்சார்ஷியம் கொடுக்காது என்றும், இப்பொழுதுள்ள தமிழ் யூனிகோட் வேலை செய்யவில்லை, உடைந்திருக்கிறது என்றால்தான் அவர்கள் மாற்ற அனுமதிப்பார்கள் என்றார்.

இந்த மூன்றாவது குறியீடு ஏற்கனவே யூனிகோட் கன்சார்ஷியத்திடம் கொடுக்கப்பட்டதாகவும், அவர்கள் இதை நிராகரித்து விட்டனர் என்றும் தன்னிடம் சொல்லப்பட்டது என்று முத்து நெடுமாறன் கூறினார். அதைத் தொடர்ந்து விவாதம் மேலும் வலுத்தது. மாலன் எதற்காக ஏற்கனவே நிராகரிக்கப்பட்ட ஒன்றை மீண்டும் கன்சார்ஷியத்திடம் கொண்டு செல்ல வேண்டுமென்று கேட்டார். கிருஷ்ணமூர்த்தி அதப் பற்றித் தனியாக என்னிடம் பேசுகையில் ஒரு முறை நிராகரித்தார்கள் என்பதற்காக அதை விட்டு விட முடியாது. சரியாக இன்னொருமுறை கேட்டுப் பார்ப்போமே என்றார்.

ஏன் நாம் தமிழக அரசிடம் இந்த மூன்றாவது குறியீட்டினைப் பரிந்துரைக்கக் கூடாது என்று கேட்கையில் அருண் மகிழ்நன் (உத்தமம் நிர்வாக இயக்குனர்) எவ்வாறு உத்தமம் இயங்குகிறது என்பதைப் பற்றி விளக்கி, முதலில் இது ஒரு working groupஇல் ஆலோசிக்கப்பட்டு, அவர்கள் பரிந்துரை செய்த பின்னர், executive committeeஇல் எடுத்துச் செல்லப்பட்டு பின்னர்தான் அரசுக்குப் பரிந்துரை செய்யப்படும் என்றும், இப்பொழுது பேசப்பட்ட குறியீடு இன்னும் சரியாக working groupக்கு வழங்கப்படவில்லை என்றார்.

ஆகவே இந்த விவாதங்கள் இன்னும் நடக்கும். அதுவரையில் யூனிகோடில் இன்னும் சில மென்பொருட்கள், செயலிகள், வலைப்பதிவுகள் மற்றும் பல இணைய தளங்கள் வந்துவிடும்.

கிருஷ்ணமூர்த்தி சொல்வதில் பல நல்லதுகள் இருந்தாலும் அவை எப்பொழுது, எப்படி செயலுக்கு வரும் என்பது புரியவில்லை.

மதியம் முனைவர் இராம.கி இப்பொழுதுள்ள குறியீட்டில் உள்ள தவறுகளைப் பற்றிப் பேசப் போகிறார். அது பற்றி பின்னர்.

16 bit குறியீடுகளில் மாற்றங்கள்

அடுத்து பேச வந்த முனைவர் கிருஷ்ணமூர்த்தி தான் தமிழ் இணையப் பல்கலைக்கழகத்தின் சார்பில் பேசுவதாகத் தெரிவித்தார்.

முதலிலேயே இப்பொழுதுள்ள யூனிகோட் தமிழில் எல்லாமே செய்ய முடியும் என்றும் அதில் உள்ள குறைபாடுகள் என்ன என்பதைப் பற்றியும், மாற்றுக் குறியீடுகளால் என்ன சாதிக்க முடியும் என்பதைப் பற்றி மட்டும்தான் பேசப் போவதாகவும் தெரிவித்தார். "சண்டை போடப் போவதுமில்லை, உடனடியாக முடிவெடுக்க வேண்டிய கட்டாயமும் இல்லை" என்றும் தெரிவித்தார்.

மூன்று குறியீடுகளைப் பற்றி ஒப்பு நோக்கினார். முதலாவது இப்பொழுது இருக்கும் குறியீடு. இரண்டாவது சில மாற்றங்கள் செய்யப்பட்ட, அதாவது இப்பொழுதிருக்கும் அகர மெய்க்கு பதில் வெறும் மெய், மற்றும் ஒரி சில சிறு திருத்தங்கள், மூன்றாவது உள்ள அத்தனை 247 எழுத்துக்களுக்கும் தனி இடம் என்று. இவற்றில் மூன்றாவதற்கு 128க்கு மேல் இடம் தேவைப்படுவதால் 3x128=384 இடம் (அதை 512 என்று கேட்டு வாங்கி, தேவையில்லாவிட்டால் 128ஐ திருப்பிக் கொடுத்து விடலாம் என்றார்).

இவ்வாறு மூன்று குறியீட்டை வைத்து ஒரு சில சோதனைகள் செய்து அதன் முடிவுகளைக் காண்பித்தார். அதன்படி

* மூன்றாவது குறியீட்டில் கிட்டத்தட்ட 33% கோப்புகளில் இடம் குறைகிறது.
* கணினி கோப்புகளைப் படிக்கையில் 33% வேகமாகச் செய்கிறது. எழுத்துக்களைத் திரையில் காண்பிப்பது வெறும் 4% நேரத்துக்குள் முடிகிறது (முதல் குறியீட்டை நோக்குகையில்)
* கோப்பிற்குள் தேடி மாற்றுவது 40% நேரத்துக்குள் முடிவடைகிறது
* கோப்புகளை குறுக்கி (compress) வைப்பதில் பெரிய சேமிப்பு ஒன்றும் இல்லை. இரண்டும் ஒரே மாதிரிதான்.
* database storage no change, indexing 33% improvement
* Morphological database - noun search 80% improvement

16 bit குறியீடுகள்

முதலில் பேச வந்தவர் முத்து நெடுமாறன். இவர் முரசு அஞ்சல் மென்பொருள் கொடுத்தவர். தற்போதைய யூனிகோட் மூலம் என்னவெல்லாம் செய்ய முடியும் என்பது பற்றிப் பேசினார்.

* யூனிகோட் வி.3.0 இல் மொத்தம் 49,194 எழுத்துக்கள் (எழுத்து, மற்ற குறியீடு) உள்ளது.
* Windows, Linux, MacOS, Palm OS, WIN CE, Symbian ஆகியவை தற்போது யூனிகோட் மற்றும் இண்டிக் ஆகியவற்றைப் புரிந்து கொள்கிறது
* இணைய தளங்கள் இயங்கத் தேவையான HTML 4.0, XML, Java, Javascript போன்றவை யூனிகோடைப் புரிந்து கொள்கின்றன
* MS Office, Open Office, IE (மற்றும் Mozilla கூட) ஆகிய மென்பொருட்கள் யூனிகோடைப் புரிந்து கொள்கின்றன

யூனிகோடைப் பற்றி சற்று விளக்கம் கூறினார். எழுத்துக் குறியீட்டை எவ்வாறு வைக்கின்றனர், அதிலிருந்து திரையில் தோன்றும் வரி வடிவம் (glyph) எவ்வாறு செயல்படுத்தப் படுகிறது (GSUB, GPOS) என்று விளக்கினார்.

TNC வெங்கட ரங்கன் இணையத்தில் நேரிடையாக எவ்வாறு யூனிகோட் மூலம் இணையப் பக்கங்களைத் தேடுவது, கணினியில் கோப்பில் எழுதுவது, சேமிப்பது, ஒரு கோப்பில் உள்ள சொற்களைத் தேடுவது என்றெல்லாம் விளக்கினார்.

கடைசியாக தனது முடிவுகளை முத்து நெடுமாறன் வைத்தார்.

* இப்பொழுதுள்ள தமிழ் யூனிகோடைப் பயன்படுத்த வேண்டும்
* எழுத்து வடிவங்கள் தயாரிப்பவர்கள் தங்களது fontகளை யூனிகோடுக்கு மாற்றித் தரவேண்டும், அதற்கான இலவச மென்பொருட்கள் கிடைக்கின்றன.
* ஒரு சில சிறு மாற்றங்கள் தேவை. அவற்றை உத்தமம் wg02 குழு மூலம் பரிந்துரை செய்து யூனிகோட் கன்சார்ஷியம் இடம் தெரிவிக்க வேண்டும் (இவை பெரிதான அளவில் எந்த மாற்றமும் இல்லை)

Saturday, August 23, 2003

திசைகள் - குறுந்தகட்டில்

சொல்ல மறந்து விட்டேனே. மாலன் குறுந்தகட்டில் திசைகள் மின்னிதழின் முதல் ஐந்து பதிப்புகள் (மார்ச் 2003 முதல் ஜூலை 2003 வரை) பதித்தது கொடுத்தார்.

முத்து நெடுமாறனும் முதல் நாள் சந்தித்த போது எவ்வாறு ஜப்பான், மலேசியா, இந்தியா ஆகிய நாடுகளில் இருந்து கொண்டு இணையத்தின் மூலமாகவே இந்தக் குறுந்தகட்டினைத் தயாரித்தனர் என்றும் விளக்கினார்.

சிறு இலக்கிய, சமுதாய இதழ்கள் இணையத்தையும், குறுந்தகட்டையும் நன்கு பயன்படுத்த வேண்டும். திசைகள் அதற்கு முன்னோடி. ஆ, இன்று (தாளில் அச்சிட்ட) சொல்புதிது இதழும் தபாலில் வந்துள்ளது...

பொதுமக்களுக்கோர் நற்செய்தி

தமிழ் இணையம் 2003 கருத்தரங்கிற்கு அனுப்பப்பட்ட கட்டுரைகள் எல்லாவற்றையும் தொகுத்து ஒரு புத்தகமும், அதன் கூட ஒரு குறுந்தகடும் வெளியிடப்பட்டுள்ளது உங்களுக்குத் தெரிந்திருக்கலாம்.

அந்தக் கட்டுரைகள் அனைத்தும் - அய்யகோ - ஒரே கோப்பாக, 10MB ஆக வெளியிடப்பட்டுள்ளது. ஆயினும், உங்களுக்காக அதனை இங்கு வைத்துள்ளேன். நினைவில் இருக்கட்டும், இது PDF கோப்பு, 10MB அளவானது. ஒரு சில பிழைகள் திருத்தப்பட்டு அவையும் இங்கு உள்ளன.

முனைவர்கள் கல்யாணசுந்தரமும், கிருஷ்ணமூர்த்தியும் தொகுத்துள்ளனர். கல்யாண் விரைவில் ஒவ்வொரு கட்டுரையும் ஒரு தனி PDF கோப்பாக INFITT (உத்தமம்) இணைய தளத்தில் இடப்படும் என்று தெரிவித்துள்ளார்.

தொழில்நுட்பமும் பயன்பாடும்

கணினிவழிக் கல்வியில் நேரத்தைச் செலவிட்டதால் இதன் கடைசிப் பகுதிக்குத்தான் வர முடிந்தது. முதலில் உப்புச் சப்பில்லாத 'Tamil Chatterbox' என்னும் தலைப்பில் பேசிக் கொண்டிருந்ததால் அதனை விடுத்து அடுத்த அறையினுள் நுழைந்தேன். திரும்பி வருகையில் 'ஸ்வரம்' (swaram) என்னும் தமிழ் programming language பற்றிய பேச்சு முடிந்திருந்தது. பின்னர் பேசிய கணேஷ் குமார் என்பவர் டி.கல்லுப்பட்டி, மதுரை கிராமத்தைச் சேர்ந்தவர். அங்கிருந்து வந்து அருமையாகப் பேசியதற்காகவே அவருக்கு ஒரு பரிசு கொடுக்க வேண்டும்.

கணேஷ் குமார் 'python' என்னும் open source மொழியைத் தமிழில் செய்துள்ளார். 'pytham' என்று பெயர் வைத்துள்ளார். பித்தம் என்று படித்தால் நன்றாக இல்லை! எனக்கு அவ்வளவாகப் புரியாத விஷயம். இது பற்றிய விவாதம் ஒன்று tamilinix குழுவில் நடைபெற்றது.

மொத்தத்தில், கணேஷ் குமார் செய்ததன் உட்காரணம் வெகு நல்லது. தமிழ் கிராமங்களில் உள்ள மாணவர்கள் தமிழறிவு தவிர வேறு ஏதும் இல்லாதவர்கள் தமிழில் எழுதக்கூடிய வகையில் ஒரு கணினிமொழி இருந்தால் லாஜிக்கைக் கற்றுக் கொள்ள ஏதுவாக இருக்கும், அதன் பிறகு அவர்கள் எது வேண்டுமானாலும் செய்து கொள்ளலாம் என்பது கணேஷ் குமாரின் வாதம். பக்கத்தில் அமர்ந்திருந்த நண்பர் மனோஜ் (சென்னை கவிகள்) இதை ஆமோதித்தார். விஷயம் தெரிந்தவர், மென்பொருள் எழுதுபவர், எனவே அவர் சொன்னால் சரிதான். பின்னர் மணிவண்ணனும் இதை வெகுவாக ஆமோதித்தார்.

ஸ்வரம்... கேள்வி பதிலில் சற்றும் அலுங்காது தனது மென்பொருள் compiler ஜாவா virtual machine ஐ விட சிறந்தது என்பது மாதிரி பேசினார். ஜாவா மாதிரியே இது எழுதியுள்ள புரோகிராமை பைட் கோடுக்கு மாற்றி, தன் வர்ச்சுவல் மெசினுள் இயங்க வைக்கிறதாம். ஆனால் சன் மைக்ரோசிஸ்டம் எத்தனை பொறியியலாளர்களை வேலைக்கு வைத்து மென்பொருள் உருவாக்குகிறது?

இந்த கோடுகளையெல்லாம் மற்ற கணினி அறிஞர் பார்வைக்கு வைக்க வேண்டும். அப்பொழுதுதான் இது எத்தனை சிறந்தது, பயன்படக் கூடியதா என்பது தெரிய வரும். கொடுத்திருக்கும் குறுந்தகட்டில் இது ஏதும் இல்லையென்று தோன்றுகிறது.

மாநாட்டில் சந்தித்தவர்கள்

முனைவர் சந்திரபோஸ், கிரிக்கெட் வர்ணனையாளர் அப்துல் ஜப்பார் (இணையத்தின் ஆசிப் மீரான் இவரது மகன்), நாக இளங்கோவன் ஆகியோர் கண்ணில் மாட்டியவர்கள்.

இணைய வழித் தமிழ்க் கல்வி - இலக்கப்பாடி - digital village

subaசுபாஷினி கனகசுந்தரம் தனது 'இலக்கப்பாடி' என்னும் திட்டத்தைப் பற்றி விரிவாகப் பேசினார். கணினிக் கல்வியைக் குறிப்பிடுகையில் அதைத் தான் மூன்றாகப் பார்ப்பதாகச் சொன்னார்:
* கணினி வழிப் (பிற) கல்வி (வரலாறு, இயல்பியல், வேதியியல், புவியியல் போன்றவை)
* கணினிக் கல்வி (கணினி பற்றிய கல்வி)
* கணினி வழி மொழிக் கல்வி (கணினி மூலம் தமிழைப் பயிற்றுவிப்பது)

மேலை நாடுகளில் செய்வதை விட ஆசிய நாடுகளில் செயல்படுத்தப்பட்டுள்ள திட்டங்களை நாம் இந்தியாவில், தமிழகத்தில் செயல்படுத்துவது எளிதாயிருக்கும் என்றார். வரலாற்றைச் சொல்லிக் கொடுக்கையில் மற்ற பலவற்றையும் கூட சேர்த்து சொல்லிக் கொடுப்பது (இராஜராஜ சோழன் காலத்தைப் பற்றிப் பேசுகையில் அந்த காலத் தமிழ் மொழி, புவியியல் என்று மற்றவற்றையும்) கற்பவரை விரைவாக முழுமையாக்கும் என்றார். கல்வி என்பது
- தனி மனிதத் திறனை வளர்க்கக் கூடியதாக இருக்க வேண்டும்
- சுயமாக சிந்திக்கும் சமுதாயம் உருவாக்க வேண்டும்
- பொது மக்களைப் பள்ளிக்கூடங்களில் ஈடுபாடு கொள்ள வைக்க வேண்டும்
என்றார். பாடத்திட்டம், கல்வி முறை, தேர்வு முறை, கற்றல் கருவிகள் மாற வேண்டும் என்று சற்று புரட்சிகரமான கருத்துகளைப் பற்றிப் பேசினார். கல்வி கற்பிக்கையில் பத்து வயதுக் குழந்தைகளுக்கு ரோபாடிக்ஸ் போன்ற இயந்திரவியல், பொறியியல் எல்லாவற்றையும் சொல்லிக் கொடுக்க ஆரம்பிக்க வேண்டும் என்றார். இது பற்றி திசைகள் இதழிலும் எழுதியுள்ளார். தனது இணைய தளத்தில் ரோபோடிக்ஸ் பற்றிய பாடங்கள், செயல்முறை விளக்கங்கள் எல்லாம் தமிழிலேயே கொடுத்திருப்பதாகவும் சொன்னார்.

குறிப்பாகத் தமிழகத்தில் எவ்வாறு இலக்கப்பாடிகளை அமைப்பது என்று ஒரு வழி சொன்னார். முதலில் ஒரு ஊரில் இரண்டு பள்ளி வீதம் தேர்ந்தெடுத்து, ஒவ்வொரு பள்ளியிலும் ஒரு கணினி server, மற்றும் கணினி அறை அமைத்து, இதனை மற்ற பள்ளிகளில் இருக்கும் கணினிகளோடு இணைத்து ஒரு வலையத்தை உருவாக்க வேண்டும், பின்னர் இந்த அமைப்பினை விஸ்தாரப்படுத்திக் கொண்டே போகலாம் என்றார். இதில் உள்ள பிரச்சினைகளையும் எடுத்துச் சொன்னார் - பொருளாதாரம், திட்ட உருவாக்கம், தொழில்நுட்ப வசதிகள், தகுதியான ஆசிரியர்கள் ஆகிய இந்தப் பிரச்சினைகளுகுத் தீர்வு காணுதல் அவசியம்.

இணைய வழித் தமிழ்க் கல்வி

siva pillaiமுதலில் பேசிய திரு சிவப் பிள்ளை, லண்டன் கோல்டுஸ்மித்ஸ் காலேஜ், எப்படி சிறாருக்கு கணினி வழியே தமிழைப் பாடமாகக் கற்பிப்பது என்பது பற்றி மிக அருமையாக ராக்கெட் வேகத்தில் பொழிந்து தள்ளினார். தன் நகைச்சுவையால் அவையோரை அவ்வப்பொழுது சிரிக்கவும் வைத்துக் கொண்டிருந்தார். பிரித்தனில் பல மொழிகளுக்குத் தனக்கென பாடத்திட்டம் இருப்பதாகவும், தமிழுக்கு மட்டும் இல்லையென்றும், அதனால் தானே ஒரு பாடத்திட்டம் தயாரித்து வழங்கியிருப்பதாகவும், அதற்கு அனுமதி கிடைக்குமா என்று தெரியவில்லை என்றும் சொன்னார்.

நிச்சயமாக அனுமதி கிடைக்க வேண்டும் என்பதே நமது விருப்பம். தாய்மொழி என்பதற்கு நல்ல விளக்கமும் அளித்தார். தாய்மொழி என்பது தாயின் மொழி அல்ல; வீட்டில் பரவலாகப் பேசப்படும் மொழியே என்றார். ஜெருமனியில், ஃபிரான்ஸில் உள்ள தமிழர்கள் (முக்கால்வாசி புலம் பெயர்ந்த இலங்கைத் தமிழர்கள்) ஜெர்மன் மற்றும் ஃபிரெஞ்சு தெரியாத காரணத்தால் வீட்டில் தமிழிலே பேசுவதால் தமிழ் இன்னும் ஓடிக் கொண்டிருக்கிறது என்றும் பிரித்தனில் உள்ள தமிழர்கள் நுனிநாக்கு ஆங்கிலம் பேசுவதால் தன்னிடம் பாடம் படிக்கும் குழந்தைகள் தமிழை வீட்டிலே பேசுவதில்லை என்றும் குறை பட்டுக் கொண்டார். ஓரத்தில் அமர்ந்திருந்த இராம.கி ஐயா சென்னையிலும் இதே கதைதான் என்று சற்று உரக்கவே சொன்னது அவையில் உள்ள அனைவர் காதிலும் விழுந்திருக்கலாம்.

அவைத்தலைவர் கொடுமுடி சன்முகம் (எழுத்துச் சீர்மை பற்றி புத்தகம் எழுதியிருக்கிறாராம்), இதைப் பற்றிப் பேசுகையில் காட்டான்குளத்தூராக இருந்தாலும் நம்மூரில் முதல் மொழி ஆங்கிலமாக உள்ளது, தமிழ் இரண்டாம் பட்சம்தான் என்றார். முதல் வரிசையில் அமர்ந்திருந்த முன்னாள் அமைச்சர் தமிழ்க்குடிமகன் சற்றே வீராவேசமாக அதை இடைமறிக்க, ஐயா சன்முகம் சடாரென்று பின்வாங்கி மேலே ஏதும் தகராறில் போய் முடியாதவாறு காத்தார்.

தொழில் நுட்பமும் பயன்பாடும்

navanithanகோவை பி.எஸ்.ஜி கல்லூரிப் பேராசிரியர் பி.நவநீதன், தனது மாணவர்களோடு இரண்டு கட்டுரைகளை வழங்கினார். 'பண்டிதம்' என்னும் கட்டமைப்பு (framework) மூலம் பலமொழிகளை ஒரே படிவத்தில், கோப்பில் கொடுப்பது, பின்னர் அந்த கட்டமைப்பைப் பயன்படுத்தி பல்வேறு மென்பொருட்களை உருவாக்குவது என்பது இவர்களது வழி. இந்தப் பண்டிதம் என்னும் கட்டுக்கோப்பு தனக்கென ஒரு எழுத்துக் குறியீட்டினைப் பயன்படுத்துகிறது. இதுவே இவர்களுக்கு இடையூறாக வரலாம்.

மின்புறா என்னும் பல்மொழி அஞ்சல் அனுப்பி மற்றும் நிர்வகிக்கும் செயலி; திரவியம் எனும் விற்பனை நிர்வகிக்கும் செயலி ஆகிய இரண்டு செயலிகளைப் பற்றிப் பேசியும், செயல்பாட்டு முறையிலும் காண்பித்தனர்.

இரண்டும் திறம்பட செய்யப்பட்டிருந்தது. இதில் மின்னஞ்சல் முறையில் கடுமையான எதிர்ப்பு இருக்கலாம். இதைப் பயன்படுத்த எல்லோருடைய மின் அஞ்சல் செயலிகளும் பண்டிதம் கட்டுக்கோப்பில் இருக வேண்டும். இந்த மாற்றம் எல்லோராலும் ஏற்றுக் கொள்ளப்படாது. இன்னும் ஒரு எழுத்துக் குறியீட்டை ஏற்றுக் கொள்வதிலேயே ஒருமனது ஆகவில்லை.

திரவியம் - தனியாகச் செயல்படக் கூடியது. அதனால் தேவை வேண்டி தமிழகக் கடைகள் இதனை வாங்கிப் பயன்படுத்திக் கொள்ளலாம்.

தொழில் நுட்பமும் பயன்பாடும்

maniamதலைமை வகித்தவர் முனைவர் 'பொன்விழி' கிருஷ்ணமூர்த்தி. மொத்தம் நான்கு கட்டுரைகள் அளிக்கப்பட்டது. சிங்கை மணியம் இணைய முகவரிகளை ஆங்கிலம் விடுத்து பல்மொழியாக்கல் பற்றிப் பேசினார். இணையம் நாளாக, நாளாக ஆங்கிலம் அல்லாதோர் புழக்கம் அதிகரித்தலாலும், கொரியா, சீனா போன்ற நாடுகளில் வலையுலாவி அந்தந்த மொழிகளிலேயே உள்ளதாலும் இணைய தள முகவரி மட்டும் ஆங்கிலத்திலேயே இருப்பது கடினமானதால் அதை 1998 முதற்கொண்டே மணியம் வேலை பார்க்கும் நிறுவனம் அந்தந்த மொழிகளிலேயே தருகிறது என்பதைப் பற்றிப் பேசினார்.

இதன்படி .com, .org, .net என்பனவற்றை முறையே .வணி, .அமை, .வலை என்று வழங்கிச் செல்லலாம் என்று குறிப்பிட்டார். (.gov, .edu என்னவாகும்? .அரசு, .படி ? annauniv.edu என்பது அண்ணாபல்கலை.படி என்று ஆகும். vikatan.com என்பது விகடன்.வணி என்று ஆகும். நா.கணேசன் .படி க்குப் பதில் .கல்வி எனலாம் என்கிறார். நான் வினைச்சொல்லாக்கம் செய்ய நினைத்தேன். .அரசு க்குப் பதில் கூட .ஆள் என்றால் குழம்புமோ? எனினும் அறிஞர்கள் சொல்வதைச் செய்வது நலமே)

கொரியா, சீனா ஆகிய இடங்களில், 300,000க்கும் மேற்பட்ட தளங்கள் இந்த மாதிரி இயங்குகின்றன என்ற வியக்கும் செய்தினையும் சொன்னார்.

அடுத்துப் பேச வந்த அண்ணா பல்கலைக் கழக மாணவி தீபாதேவி தமிழில் ஒரு தேடல் தளம் அமைத்திருப்பதைப் பற்றிப் பேசினார். 'பவனி' என்று பெயரிட்டுள்ளனர். பல்வேறு தமிழ் எழுத்துக் குறியீடுகளை ஒரு குறிக்கு (தமிழக அரசின் tab) மாற்றி, ஊர்வான் (crawler) மூலம் தளங்களைத் தேடி அடுக்கிக் கொள்கின்றனர். பின்னர் தேடப்படும் சொல்லின் பகுதிகளைப் பிரித்து ஆதாரச் சொல்லினைத் தேடி அது வந்திருக்கும் தளங்களைத் தருகின்றனர்.

இந்தத் தொழில்நுட்பம் இந்திய நடுவண் அரசின் பண உதவியுடன் செயல்படுத்தப்பட்டுள்ளது. இந்த மற்றும் முதல் நாள் சொல்லப்பட்ட தமிழ் இணைய அகராதி (25,000 சொற்கள் உள்ளன என்கிறார்கள்) ஆகியவை இன்னும் ஓரிரு மாதங்களில் பொதுமக்கள் பயனுக்கு இணையத்தில் போடப்படும் என்றும் சொல்கிறார்கள். ஆவலுடன் எதிர்பார்ப்போம்.

இணையவழித் தமிழ்க் கல்வி

முனைவர் இராஜபாண்டியன் இணையத் தமிழ்ப் பல்கலைக்கழகம் (Tamil Virtual University) இல் தமிழ்க் கல்வியை எவ்வாறு இணையம் வழியாக சொல்லிக் கொடுக்கிறார்கள் என்பது பற்றிப் பேசினார்.

தஞ்சாவூர்த் தமிழ்ப் பல்கலைக் கழகம் பாடத்திட்டத்தை நிர்வகித்து, தமிழ் இணையப் பல்கலைக் கழகம் மூலம் சொல்லிக் கொடுக்கிறார்கள். தேர்வுகள் இணையப் பல்கலைக் கழகம் மூலமாகச் செயல்படுத்தப் படுகிறது. பட்டம் அளிப்பது தமிழ்ப் பல்கலைக் கழகம்.

இவர்களது இணையத் தளம் ஒரு இணைய நூலகத்தை உள்ளடக்கி உள்ளது. இங்கு தொல்காப்பியம், அதற்கான உரை என்று ஆரம்பித்து, எட்டுத்தொகை, பத்துப்பாட்டு என்றெல்லாம் அனைத்தையும் உள்ளடக்கியுள்ளது. மற்றும் தற்கால இலக்க்கியங்கள், சிற்றிலக்கியம் போன்று பலவும் உள்ளிடப் பட்டுள்ளன.

மழலைக் கல்வி முதல் மேல்நிலைக் கல்வி வரையிலான பாடங்கள் வெறும் எழுத்துக்களாக மட்டுமில்லாமல் அசையும் படங்களாகவும் (animated pictures), ஒலி சேர்க்கப்பட்டும் மிகவும் தரமாக வழங்கப்பட்டுள்ளன.

உலகெங்கிலும் மாணவர்கள் இதில் சேர்ந்து படித்துத் தேர்வ்வும் எழுதலாம். பல நாடுகளில் உள்ள நிறுவனங்களுடன் சேர்ந்து தேர்வுகளை நிர்ணயிக்க உள்ளூரிலேயே ஏற்பாடுகள் செய்து வருகின்றனர். 25% க்கான மதிப்பெண்களுக்கு இணையத்திலேயே விடை தேர்ந்தெடுக்கும் முறையில் (multiple choice) தேர்வு வழங்கப்படுகிறது. மீதம் 75%க்கும் தேர்வு வினாக்கள் இணையம் மூலமாகவே வினா வைப்பகம் மூலம் வழங்கப்படுகிறது. தேர்வு வழங்குபவர் அந்த நாள் காலையில் இணையம் மூலமாகத் தேர்வுத் தாளைக் கீழிறக்கி, அச்சிட்டு மாணவருக்கு வழங்கலாம்.

சந்தேகம் வந்தால் அந்தந்த பாட இயக்குனரிடம் இணையம் மூலமாகவே தொடர்பு கொள்ளலாம். பதில் எல்லா மாணவருக்கும் போய்ச் சேரும். இந்த முயற்சி மூலம் மழலையர் மொழிக் கல்வி, பயனர் கல்வி மற்றும் தமிழில் முனைவர் பட்டம் பெருமளவிற்கும் இணையம் மூலமாகவே முடியும் என்று செயல்படுகிறது தமிழ் இணையப் பல்கலைக்கழகம்.

பாராட்டுக்கள்.

ஒளிவகை எழுத்து உணரி (OCR) மற்றும் எழுத்திலிருந்து பேச்சு (TTS)

Ramakrishnanஅடுத்துப் பேசியது பேரா. ராமகிருஷ்ணன் - IISC பெங்களூர். இவர் ஒ.எ.உ க்கு மேல் ஒரு படி சென்று பார்வையற்றோருக்கான ஒரு படிப்பான் செய்வது பற்றிப் பேசினார்.

எழுத்துக்களை உணர்ந்தபின்னர், அடுத்து சீர்களாகப் பிரித்து அதை சரியாக உச்சரிக்கும் வகையை செய்வது பற்றிப் பேசினார். தன் மென்பொருளை open source முறைக்குக் கொண்டு வர இருப்பதாகவும், தமிழ் மொழி அறிவாளர்கள் செய்ய வேண்டிய வேலை அதிகம் இருக்கிறது என்றும் சொன்னார்.

ஒரு பெயர்ச்சொல் அகராதியும், அந்தச் சொற்களின் உச்சரிப்புக்கான தொகுப்பும் தேவை என்பதையும் வலியுறுத்தினார்.

நேற்றைய, மற்றும் இன்றைய இதுவரையிலான தொழில்நுட்பம் பற்றியவைகளைப் பார்க்கையில் நமக்குத் தேவை எனப்படுவது

- கணினித் தமிழ் அகராதி, இணையம் மூலம் தேடும் வசதி
- ஒளிவகை எழுத்து உணரியில் உள்ள இன்னும் ஒருசில கடினங்களைத் தவிர்த்தல்
- தேர்மையான சொல் திருத்தி
- தமிழ் மொழி உச்சரிப்பு விதிகள்
- பெயர்ச்சொற்களின் கணினி உச்சரிப்புத் தொகுதி

இவையனைத்தும் இருந்தால், நமக்குக் கிடைப்பது
* ஒளி வகை எழுத்து உணரி (OCR - optical character recognition)
* சொல் திருத்தி (Spell checker)
* எழுத்திலிருந்து பேச்சு (TTS - Text to Speech)

இதன் மூலம்
* அச்சுப் புத்தகத்திலிருக்கும் செல்வங்களைக் காக்க முடியும்.
* பார்வையற்றோரும் கணினி மூலம் படித்துப் புரிந்து கொள்ள முடியும்
* புலம் பெயர்ந்த தமிழர்கள் பேச மட்டும் தெரிந்தவர்கள் தமிழ் இணைய தளங்களிலும், புத்தகங்களிலும் உள்ளதைப் புரிந்து கொள்ளுதல் முடியும்

ஒளிவகை எழுத்து உணரி (OCR) மற்றும் எழுத்திலிருந்து பேச்சு (TTS)

சனிக்கிழமைக் காலை "தொழில்நுட்பமும் பயன்பாடும் - 3" கருத்தரங்கு மிகவும் பயனுள்ளதாக இருந்தது.

இதைத் தலைமை தாங்கியது 'மயிலை' கல்யாணசுந்தரம். இவர் வேதியியற் துறை முனைவர் என்பது குறிப்பிடத் தக்கது.

முதலாவதாக IIT சென்னையைச் சேர்ந்த அபர்ணா மற்றும் சக்கரவர்த்தி வழங்கிய கட்டுரை. படித்தவர் அபர்ணா. இவர் தமிழ்ப் பத்திரிக்கைகளை முழுவதும் மனித ஈடுபாடு இல்லாமலேயே ஓ.எ.உ செய்வது எப்படி என்பது பற்றித் தாங்கள் செய்த மென்பொருள் பற்றிப் பேசினார்.

இரண்டாவதாகப் பேசிய பேரா. கிருஷ்ணமூர்த்தி தமிழ் எழுத்து உணரி மென்பொருள் 'பொன்விழி' ஐச் செய்து அது விற்பனைக்கும் வந்துள்ளது.

இதை மேற்கொண்டு மற்ற இந்திய மொழிகளுக்கும் இதை நீட்டிப்பதில் உள்ள கடினங்களைப் பற்றிப் பேசினார். சொல்லப்போனால் ஆங்கிலத்துக்கு அடுத்ததாக தமிழில்தான் ஒ.எ.உ செய்வது எளிது என்று தோன்றுகிறது. தெலுங்கு வரிவடிவத்தில் பல அடுக்குகள் உள்ளன (நான்கு அடுக்குகள் வரை உள்ளனவாம் - தமிழில் இரண்டுதான் - புள்ளி). ஹிந்தி வரிவடிவத்தில் பக்கவாட்டில் அடுக்கிக்கொண்டே போகிறது.

தமிழிலேயே நன்றாக அச்சிடப்பட்ட தாள்களை மிகவும் எளிதாக, துல்லியமாக உணர முடியும். ஆனால் எழுத்துக்கள் ஒன்றொடு ஒன்று ஒட்டிக் கொண்டிருந்தால், அதற்கும் இப்பொழுது விடை கண்டு கொண்டிருப்பதாகச் சொன்னார்.

எழுத்துக்களைப் பிரிப்பது, எழுத்துக்களை அடையாளம் காண்பது, மற்றும் சொற்களை சரியாக்க சொல்-திருத்தி ஆகிய இவை மூன்றும்தான் ஒ.எ.உ க்கு முக்கியத் தேவை என்றார். தனக்கு முன் பேசிய அபர்ணா அவர்களின் ஒ.எ.உ முறை தன்னுடையதிலிருந்து வித்தியாசப்பட்டிருப்பதாகவும், அதிலும் பல நல்லது உண்டென்றும், எல்லா தொழில்நுட்பமும் ஒன்று சேரும்போது முடிவு நல்லதாக இருக்கும் என்றும் சொன்னார்.

சிஃபி தமிழ் - தமிழ் இணையம் 2003 பற்றிய தொகுப்பு

நண்பர் வெங்கடேஷ் சிஃபி டாட் காமிற்காக தமிழ் இணையம் 2003 நிகழ்ச்சிகளைத் தொகுத்து வழங்குகிறார்.

இவற்றைக் காண இந்த சுட்டிக்குச் செல்லவும்.

மேக்ரோமீடியா அருள் குமரன், சிங்கை மணியம்

சிங்கப்பூரில் இருந்து வந்திருக்கும் "மேக்ரோமீடியா" அருள் குமரன் மற்றும் சிங்கை மணியம் ஆகியோரை நேற்று பல இடங்களில் சந்தித்தேன். இன்று அல்லது நாளை படமாக்கிப் போடுகின்றேன்.

அருளின் வலைப்பக்கம் சென்று பார்க்கவும். இவர் மேக்ரோமீடியா நிறுவனத்தாரின் Flash தொழில்நுட்பம் கொண்டு தன்னிறைவு பெற்ற தமிழ் வலைப்பதிவுகள், பக்கங்களைத் தயாரிக்க முடியும் என்று உறுதியாக நம்புகிறார். இவரிடம் மேற்கொண்டு பேசி இது பற்றி அதிகம் அறிய வேண்டும்.

Friday, August 22, 2003

கலை நிகழ்ச்சி, இரவு விருந்து

இரவு, முதல்வர் ஜெயலலிதா மாநாட்டிற்கு வந்திருக்கும் அனைவருக்கும் ஒரு விருந்தும், கலை நிகழ்ச்சியும் அளித்தார். அமைச்சர் ஜெயக்குமார் மேற்பார்வையில் நடந்தது. இந்நிகழ்ச்சி தாஜ் கன்னிமராவில் நடைபெற்றது. தாஜ் கொரமாண்டலில் இலங்கைப் பிரதமர் ரணில் விக்கிரமசிங்கே வந்திருந்ததால் பயங்கரக் கெடுபிடி வேறு. (இவர் வந்தது தமிழ் மாநாட்டுக்காக அல்ல; எம்.எஸ்.சுவாமினாதன் ஆய்வு மையம் சம்பந்தப்பட்ட ஒரு விழாவுக்காக.)


புஷ்பவனம் குப்புசாமி, அவரது மனைவி அனிதா அவர்களின் நாட்டுப்புறப் பாடல்கள். மிக நன்றாக இருந்தது. இது பற்றி விளக்கமாகப் பின்னர் எழுதுகிறேன். குறிப்பிட்டுச் சொல்வதென்றால் புஷ்பவனம் பாடிய 'காலம் மாறிப்போச்சு' என்னும் நகைச்சுவைப் பாடல். கலக்கி விட்டார் மனுஷன்.

சீனியர் அமைச்சர் பொன்னையன், மற்றும் அவைத்தலைவர் காளிமுத்து, மற்றும் பல பெயர், முகம் தெரியாத அமைச்சர்கள் வந்திருந்தனர்.

ஒன்பது பாடல்கள் பாடிய பின்னர், பத்தாவதாக ஒன்று ஆரம்பிக்க இடை மறித்த அமைச்சர் பெருமக்கள், நீண்ட நன்றியுரைக்குப் பின்னர் ஆளுக்கொரு பொன்னாடையை ஆளுக்கொன்றாகப் போர்த்தினர். மீண்டும் பத்தாவது பாடல் தொடங்க, மணியும் 21.30 ஆனது, உணவு பரிமாறல் தொடங்கியது. அனைவரும் பந்திக்குப் போனாலும் பாடல் தொடர்ந்தது. நேரம் நிறைய ஆனதாலும், மறுநாள் கருத்தரங்குக்குச் செல்ல வேண்டிய காரணத்தாலும் நான் கிளம்பி வர வேண்டியதயிற்று.

பொன்விழி கிருஷ்ணமூர்த்தி

krishnamoorthyபொன்விழி OCR மென்பொருளை உருவாக்கிய பேராசிரியர் கிருஷ்ணமூர்த்தியை சந்தித்துப் பேசினேன். நாளை அவர் OCR - எழுத்து உணரியை உருவாக்குவதில் உள்ள கடினங்களைப் பற்றிப் பேசுகிறார்.

நாளை தமிழ் எழுத்து உணரி பற்றி ஒரு கருத்தரங்கு நடக்கிறது. இது எனக்குப் பிடித்தமான பகுதி. இது பற்றி நாளை பார்ப்போம்.

லோகசுந்தரம் பேச்சு

லோகசுந்தரம் பெரிய ஆங்கிலக் கட்டுரையைப் படிக்க ஆரம்பித்தார். நேரம் வேண்டி நான் மீண்டும் வெளிநடக்க நேரிட்டது. எளிதாகத் தான் சொல்ல வந்ததைச் சொல்ல சில பேருக்குத்தான் தெரிகிறது.

திரு சுந்தரமூர்த்திக்கும் இந்த விஷயத்தில் நிறையக் கருத்துக்கள் உள்ளது. அதனால் அதிகமாகப் பேசிக் கொண்டிருந்தார். செயல்பாடு எப்படி இருக்கப் போகிறது என்று தெரியவில்லை.

எனக்கு குழந்தைசாமியின் கருத்துக்கள் மிகத் தெளிவாகப் புரிந்தது. அவர் சொல்வது அனைத்தும் சரி என்றும் தோன்றியது. அவர் சொல்லும் வகையில் எழுத்துச் சீர்மை செய்வது வெகு அவசியம். அவரது முழுக் கட்டுரையும் இணையத்தில் சீக்கிரம் கிடைக்கும். படித்துப் பார்த்து, இதைச் செவ்வனே செய்யுமாறு நாம் அனைவரும் துணை நிற்க வேண்டும்.

சின்னதுரை ஸ்ரீவாஸ், அரவிந்தன்

ஸ்ரீவாஸின் கட்டுரையை வழங்க வந்தவர் அரவிந்தன். குழந்தைசாமியின் பேச்சுக்குப் பிறகு சற்று எடுபடாமல் இருந்தது இது. தவறு ஸ்ரீவாஸ் வராததுதான் - ஆனால் அவருக்கு வரமுடியாத நிலையாயிருக்கலாம்.

எனக்குப் புரிந்தது இவ்வளவே:

- ஒற்றைக் கொம்பு, இரட்டைக் கொம்பு ஆகியவற்றைக் குதர்க்க எழுத்துக்கள் என்றும் இந்தக் குழப்பத்தை நீக்க வேண்டும் என்றும் சொல்கிறார்.
- குழந்தைசாமி போன்று இகர, ஈகார, உகர, ஊகாரக் குழப்பங்களை நீக்க வேண்டும் என்கிறார்
- diacritics ஐப் பயன்படுத்தி உச்சரிப்புகளை விளக்க வேண்டும் என்கிறார். இது சர்ச்சைக்குரிய விஷயம்
- கி.பி/கி.மு எழுத்து வடிவம் (குழந்தைசாமி போன்று) காண்பித்து, தொல்காப்பிய காலத்து எழுத்து விஞ்ஞானபூர்வமாக உள்ளது என்கிறார்.
- யூனிகோட் உயிர்மெய்யை சரியாகச் செய்துள்ளது (உயிருக்கு அடுத்து மெய் வந்து)

கட்டுரையை நிதானமாகப் படிக்க வேண்டும்.

குழந்தைசாமி பேச்சு

- வரி வடிவம் நிரந்தரமானதல்ல, ஒலி வடிவம்தான் நிரந்தரம்
- காலக்கணக்கில் பல்வேறு மாற்றங்கள் ஏற்பட்டுள்ளன
- கி.பி. 2ஆம் நூற்றாண்டில் உள்ள வரிவடிவம் படம் காண்பிக்கிறார் - மிகவும் எளிதாக இருந்திருக்கிறது. ஆனால் பிற்காலத்தில்தான் கடினமாக ஆகியுள்ளது.
- பழங்கால செப்பேடுகளைப் பார்க்கையில் எழுத்துக்கள் எளிமையாக உள்ளன
- கிரந்தக் குறியீடு - உகர, ஊகாரத்துக்கு எளிதானது என்கிறார். ஆனால் தமிழ் விரும்புவோர் கிரந்தம் என்றாலே ஓடி விடுகிறார்கள்!

- முடிவு: மாற்றங்கள் தேவை, 1978க்குப் பிறகு பல முயற்சிக்குப் பிறகும் ஒன்றும் நடக்கவில்லை. இனியாவது நடக்கும் என்று எதிர்பார்ப்போம்.

குழந்தைசாமி பேச்சு

- தமிழ் கற்கும் இடத்தில் ஆங்கிலம், மற்றும் ஃபிரெஞ்சைப் பார்க்கையில் தமிழ் கற்பது பிரமிப்பாக இருக்கிறது, ஏனெனில் அந்த மொழிகளில் எழுத்துக்கள் குறைவு
- இகர, ஈகார, உகர, ஊகார உயிர்மெய்களை வெறும் நான்கு குறியீட்டை வைத்துச் செய்ய வேண்டும்
- சண்டை சச்சரவு இல்லாமல் இந்த நான்கு வரிசைகளையும், நான்கு குறியீடுகளினால் எழுதுவோம் என்ற கொளகையை மற்றும் ஏற்றுக் கொள்வோம். எந்த குறிகளைக் கொண்டு வருவது என்பது பற்றி அறிஞர் குழு ஒன்றின் மூலம் முடிவு செய்யலாம்.
- இதன் மூலம் குழந்தைகளுக்குக் கற்றுக் கொடுப்பது எளிதாகிறது, அவர்களுக்கும் தமிழ் கற்பதில் அச்சம் இல்லாது இருக்கும்
- இதனையும் விட குறைக்கலாம், ஆனால் தமிழ் உலகம் ஒப்புக் கொள்ளாது என்பதால் அதைப்பற்றி இப்பொழுது பேசப்போவதில்லை

- இகர, ஈகார குறியீடுகள் (எழுத்தைச் சார்ந்து வரும் கொம்பு) படிக்கக் கடினமில்லை.
- உகர, ஊகாரம் கொஞ்சம் கடினமாக இருக்கலாம்

குழந்தைசாமி பேச்சு

- தமிழ் பன்னாட்டு மொழி, உலகு தழுவி வாழும் மொழிக்குடும்பத்தால் பேசப்படும் மொழி
- இந்த மொழியைக் கற்றுக் கொள்ள ஆகும் நேரத்தைக் குறைக்க வேண்டும்
- உயிர்மெய் என்பது ஐரோப்பிய நாடுகளின் மொழிகளில் கிடையாது, மத்திய தரை நாடுகளிலும் கிடையாது
- இகரம், ஈகாரம், உகரம், ஊகாரம் இதில்தான் குழப்பமே, வித்தியாசமே
- இவற்றைக் கற்கத்தான் நாம் அதிகக் குறியீடுகளை உண்டாக்குகிறோம்

குழந்தைசாமி பேச்சு

kuzanthaisami
- எழுத்துச் சீரமைப்பு என்றால் எழுத்தைக் குறைப்பது அல்ல, கற்பதை எளிதாக்குவது (247 எழுத்துக்களை இம்மியும் குறைப்பதல்ல)
- எழுத்தைக் குறைக்கப் போனால் மக்கள் ஒத்துக் கொள்ள மாட்டார்கள், அதனால் 'சீரமைக்கும்' பணியே கெட்டு விடலாம்.
- எம்.ஜி.ஆர் 'ஐ', 'ஔ' ஆகிய இரண்டையும் நீக்க முயற்சிக்கையில் மக்கள் அதை ஒத்துக் கொள்ளாததனால், அதை விட்டு விட்டார்.

- 1933 இல் பெரியார் கூறிய கருத்து
- 1978 இல் பெரியார் சொன்ன சீர்திருத்தத்தில் பாதி நிறைவேற்றப்பட்டது, மற்றது இதுவரையில் செயல்படுத்தப் படவில்லை.

தமிழ் மொழி - 2

sundaramurthy"தமிழ் எழுத்துச் சீர்மை" பற்றிய கருத்தரங்கு. தலைமை தாங்குவது திரு சுந்தரமூர்த்தி. பேசப்போவது திரு குழந்தைசாமி, சின்னத்துரை ஸ்ரீவாஸ் (அவர் வரவில்லை. பேசப்போவது மற்றொருவர்) மற்றும் திரு லோகசுந்தரம்.

தொழில்நுட்பமும் பயன்பாடும் - 1

மணி மணிவண்ணன் தலைமையில் இந்தக் கருத்தரங்கு தொடங்கியது. மணிவண்ணனின் துவக்க உரைக்குப் பின் முதல் உரை திரு வா.மு.சே ஆண்டவர் 'ஆய்வு நோக்கில் கணினி உதவியுடன் அகராதி' என்பது பற்றிப் பேசினார். கிட்டத்தட்ட எழுதிக் கொண்டு வந்ததை அப்படியே பேசிமுடித்தார். 1968க்குப் பிறகு கலைக் களஞ்சியம் மாற்றப்படவே இல்லை என்று சொன்னார். கணினி, இணையம் உதவியோடு அகராதி செய்ய வேண்டும் என்று சொன்னார். எப்படி, யார் செய்யப்போவது என்பதைப் பற்றி ஒன்றும் சொல்லவில்லை.

பின்னர் உரையாட வந்த பழனிராஜன், "தமிழ் இணைய அகராதி" பற்றிப் பேசினார். அண்ணா பல்கலைக் கழகம் ஒரு மென்பொருள் செய்துள்ளதாகவும் அதன் ஒரு சில காட்சிப் படங்களையும் காண்பித்தார்.

இது எந்த வகையில் பொது மக்களைப் போய்ச் சேரப் போகிறது என்பதும் தெரியவில்லை. வெறும் ஆராய்ச்சிதானா இல்லை ஓரளவுக்கு செயல்படும் முழு மென்பொருளா என்றும் தெரியவில்லை.

அடுத்துப் பேசிய திருமதி இராதா செல்லப்பன் "தமிழ் மலையாளம் பொறி வழி மொழி பெயர்ப்பு" - அந்தோ, ஆங்கிலத்தில் உரையாற்ற ஆரம்பித்து விட்டார். உடனே எழுந்து வெளியே வந்து விட்டேன்.

இந்த தொழில்நுட்பங்கள் எல்லாம் எப்படி மக்களுக்குப் பயன்படப் போகிறது என்றுதான் தெரியவில்லை.

கருத்தரங்கு தொடங்கும் முன்னர்

கருத்தரங்கு இன்னும் சில நிமிடங்களில் தொடங்க உள்ளது. அதற்கு முன்னர் வந்திருந்த சிலரைப் படம் பிடித்துள்ளேன். முனைவர் இராம.கியும் சிஃபிடாட்காம் வெங்கடேஷும் கீழே:


நானும் எழுத்தாளர் சுஜாதாவும். சுஜாதா தற்பொழுது தமிழ் கணினி லினக்ஸில் உருவாக்குவதற்கான முயற்சியில் ஈடுபட்டுள்ளார்.கண்காட்சியில்

இப்பொழுது முதல்வர் துவக்க உரை அண்ணா பல்கலைக் கழகத்தில் முடிந்திருக்கும். இங்கு தாஜ் கொரமாண்டலில் கண்காட்சி துவக்கத்திற்கான வேலைகள் மும்முரமாக நடந்து கொண்டுள்ளது. கண்காட்சி முகப்பு:


பதிவு செய்தவர்கள் தங்கள் அடையாள அட்டைகளுக்காகக் காத்திருக்கின்றனர். வேலையாட்கள் மும்முரமாக பொருட்களை கண்காட்சி அறையினுள் எடுத்துக் கொண்டு செல்கின்றனர்.கண்காட்சி அறையின் ஒரு பகுதி.


மாநாடும், கண்காட்சியும்

இன்று உலகத் தமிழ் இணைய மாநாடு - "தமிழ் இணையம் 2003" - துவங்குகிறது. தமிழக முதல்வர் ஜெயலலிதா மதியம் 12.00 மணிக்கு அண்ணா பல்கலைக்கழகத்தின் விவேகானந்தர் கலையரங்கில் குத்துவிளக்கு ஏற்றித் தொடங்கி வைக்கிறார். மதியம் 14.00 மணி அளவில் தாஜ் கோரமாண்டலில் மாநாட்டின் இணையாக மாநாட்டுக் கண்காட்சி தொடங்குகிறது. அதனை தகவல் தொழில்நுட்பவியல் அமைச்சர் ஜெயக்குமார் தொடங்கி வைக்கிறார்.

நான் மாநாடு துவக்க விழாவிற்கு அண்ணா பல்கலைக்கழகம் வரை போகப் போவதில்லை. காலை ஒரு நான்கு மணிநேரமாவது அலுவல் வேலைகளை முடித்து விட்டுப் பின்னர் மதியம் 13.00 மணி அளவில் தாஜ் கோரமாண்டல் போகிறேன்.

Thursday, August 21, 2003

எப்படிச் செய்கிறேன்?


மாநாட்டை நான் ஆவலோடு எதிர்பார்க்கிறேன். நீங்களும் அவ்வாறே என்று எண்ணுகிறேன்!

நண்பர்களோடு சந்திப்பு


நேற்று இரவு உள்ளூர்க்காரர் மாலனுடன், சிங்கப்பூர் அருண் மகிழ்ணன், நாராயணன், மலேசியா 'முரசு' முத்து நெடுமாறன், சுவிட்சர்லாந்து 'மயிலை' கல்யாணசுந்தரம், யூனிகோடு பற்றிப் போராடும் அமெரிக்கா மணி மணிவண்ணன் ஆகியோரோடு சந்தித்துப் பேசினோம். மணிவண்ணன், நாராயணன் நீங்கலாக மற்றவர் அனைவரும் ஓட்டல் சவேராவின் மால்குடி உணவகத்துக்குச் சென்றோம். அப்பொழுது எடுத்த படம் மேலே. முத்து, அருண், மாலன், நான், கல்யாண் என்று வரிசை. நடக்கவிருக்கும் மாநாடு பற்றியும் மற்ற பல பற்றியும் நிறையப் பேசினோம்.

Wednesday, August 20, 2003

சென்னையில் பரபரப்பு

அதெல்லாம் ஒன்னும் இல்லீங்க. எழுதறதுக்கு வேற எதுவும் இல்லைங்கறதுன்னால இந்த மாதிரி ஒரு தலைப்பு. மாநாட்டுக்கு வரவேண்டியவங்கள்ளாம் வர ஆரம்பிச்சுட்டாங்க. சில பேர இன்னிக்கு இரவு சந்திக்கப்போறேன். சந்திப்புக்கு அப்புறமா அதப்பத்தி இங்க எழுதறேன்.

Monday, August 18, 2003

தமிழ் இணையம் 2003 சென்னையில்

தமிழ் இணையம் 2003 சென்னையில் ஆகஸ்டு 22-24 வரை நடக்க உள்ளது. இது உலகத்தமிழ் இணையக் கருத்தரங்கில் ஆறாவது ஆகும். நான் இந்த மாநாட்டில் பார்வையாளனாகக் கலந்து கொள்கிறேன். கருத்தரங்கில் நடைபெறும் நிகழ்வுகளை நேரிடையாக அங்கிருந்தே இந்த வலைப்பதிவில் பதிக்கத் திட்டமிட்டுள்ளேன்.