மொழி கற்றல்
கற்பித்தலில் தரவகத்தின் பங்கு
முன்னுரை
கணினி மொழியியலின் ஒரு
பிரிவாகத் தரவக மொழியியல் இருக்கிறது. மின்னுரைகளில் இருந்து நாம் எவ்வாறு
தரவுகளைப் பெறுகிறோம், அதற்குத் தேவையான மென்பொருட்கள் யாவை? அவற்றை எவ்வாறு கற்றலுக்கும் கற்பித்தலுக்கும் பயன்படுத்துவது. குறிப்பாக
மேலை நாடுகளில் மொழி கற்பித்தலுக்கு தரவு இயக்கி பயிலகம் (Data Driven
Learning) முறையைப் பயன்படுத்துகிறார்கள். இம்முறையைத் தமிழ் மொழி
பயில்வதற்கும் பயிற்றுவிப்பதற்கும் எவ்வாறு பயன்படுத்துவது பற்றிச் சுருக்கமாகச்
சிந்திப்போம்.
1 தரவக மொழியியல் (Corpus Linguistics)
தரவக மொழியல் என்பது மொழியை எவ்வாறு பயன்படுத்துகிறார்கள்
என்று படிப்பது. அதாவது மொழியும் அதன் பயன்பாடும் என்று கூறலாம். ஒரு மொழி எவ்வாறு
பேசப்படுகிறது மற்றும் எழுதப்படுகிறது என்று ஆராய்வது. மேலும் தரவக மொழியியல், மொழியின் கூறுகளாகிய சொற்கள், சொல்லுருவாக்கம், இலக்கணம், சொற்றொடர் அமைப்பு சொற்பொருள் அமைப்பு,
உரையாடல் அமைப்புப் போன்றவற்றை மொழிப் பயன்பாட்டின் வழி ஆராய்வது.
2 தரவகம் (Corpus)
தரவகம் என்பது மின்னுரைகள்
அல்லது மின்நூல்களின் தொகுப்பு எனலாம். “ஒழுங்குமுறையுடன் அதிக அளவில் தேர்வு செய்யப்பட்டு கணினியில் சேமிக்கப்பட்ட
இயற்கையான நடைகளை உடைய உரைகள்”1. தரவகம் ஒரு
குறிப்பிட்ட மொழியின் சொற்கள் அல்லது துறைச் சொற்களை (Language varieties
or Register) உள்ளடக்கியதாக இருக்கவேண்டும். தரவகத்தில் இரண்டு
முக்கிய காரணிகள் உள்ளன. 1. தரவக வடிவமைப்பு 2. அளவு இவ்விரு காரணிகளும் தரவகத்தின்
தரத்தை உறுதி செய்கின்றன. தரவகத்தை இரு பெரும் பிரிவுகளாகப் பிரிக்கலாம். 1.
உரைத்தரவகம் (Text corpus), 2.
பேச்சுத் தரவகம் (Speech corpus).
-----------------------------------------------------------------------------------------------
1Randi Reppen (1998:pp) “A corpus is a large and
principled collection of natural texts.”
Francis, W.N. (1982:7) “A collection of texts assumed to be a representative of a given
language, dialect, or other subset of a language, to be used in a linguistics
analysis.”
பக்கம் 1
3 தரவகமும் மொழி கற்பித்தலும் (Corpus and Language Teaching)
பயன்பாட்டு மொழியலுக்குத்
(Applied Linguistics) தரவகம் மூல ஆதரமாகத்
திகழ்கிறது. பயன்பாட்டு மொழியிலில் மொழி கற்பித்தலும் ஒன்றாகும். 1970 மற்றும்
1980 ஆம் ஆண்டுகளில் Computer Assisted Language Learning (CALL) கணினி மூலம் மொழி கற்றல் கற்பித்தல் என்ற இத்துறை மிகப்பெரிய
நம்பிக்கையுடன் வளரத்தொடங்கியது. இதன் வளர்ச்சியாக 1990 ஆம் ஆண்டு பேராசிரியர்
ஜான் என்பவர் தரவு இயக்கி பயிலகத்தை (Data Driven Learning)
அறிமுகப்படுத்தினார்2. இது சொற்கள், . சொற்சேர்க்கைகள், சொற்களின் அமைப்பு, இலக்கண விதிகள் அல்லது இலக்கண முறைகள், சொற்றொடர்
அமைப்புகள் பொன்ற கூறுகளை ஆராய்வதற்கு உதவுகிறது. இவற்றுள் சில முக்கியப் பகுதிகளை
இங்குக் காண்போம்.
4 சொற்களஞ்சியம் (Vocabulary)
தரவகத்தில் சொற்களைக்
கொண்டு பவ்வேறு படிநிலைகளில் ஆய்வு மேற்கொள்ளப்படுகிறது. அவை 1. பயன்பாட்டுச் சொற்கள் (Frequency words).
2. தொடரடைவுகள் (Concordance) 3. சொற்சேர்க்கை (Collocation) 5. கூட்டுச் சொல் (Compound
words )
4. 1 பயன்பாட்டுச் சொற்கள் (Frequency words)
தரவகத்தில் பெருமளவிற்குப் பயன்படுத்தப்பட்டு அதிக
எண்ணிக்கையையுள்ள சொற்களைப் பொருவழக்குச் சொற்கள் என்று அழைக்கிறோம். இந்தப்
பெருவழக்குச் சொற்களைக் மொழி பயில்வதற்கும் பயிற்றுவித்தலுக்கும் பயன்படுத்தலாம்.
இச் சொற்களே ஒரு மொழியின் பொதுச் சொற்களாகவும் அடிப்படைச் சொற்களாகவும் அமைகின்றன.
ஒரு மொழியில் அதிக எண்ணிக்கையில் உள்ள சுமார் இரண்டாயிரம் முதல் பத்தாயிரம்
வரையுள்ள பொருவழக்குச் சொற்களைத் தேர்வுசெய்து மாணவர்களின் கல்வி நிலைக்கு ஏற்ப
சொற்களை அறிமுகப்படுத்துவது. இச்சொற்களைக் கொண்டு பாடநூல்களைத் தயாரித்தல்.
அகராதியை உருவாக்குதல் போன்ற பல்வேறு தேவைகளுக்குப் பயன்படுத்திக் கொள்ளலாம்.
பக்கம் 2
-------------------------------
2“gfdgdfjgfdjg”It presents a
Data Driven Learning (DDL) approach promoted to achieve the ability to see
patterning in the target language and to form generalization” (Johns 1991:2) by
means of a concordance programme (wordsmith Tools)
பயன்பாட்டுச் சொற்களைத் தரவகத்தில் இருந்து பெறும் பொழுது
வேர்ச் சொற்களும் வேர்ச்சொல் திரிபுகளும் பெறுகிறோம். அந்தச் சொற்களில் இருந்து
ஒட்டுகளை ஆராயவும் வேர்ச்சொற்களுக்கும் திரிபுகளுக்கும் இடையை பயன்பாட்டு
விகித்தைக் கணக்கிடவும் உதவுகின்றன. அவை பின்வருமாறு.
27262---அழகு---359---0.01295
27172---அழகான---251---0.00905
27127---அழகாக---224---0.00808
27201---அழகிய---321---0.01158
27154---அழகாய்---23---0.00083
அழகு--அரடி
அழகு--அரது
அழகு--அல்ல
அழகு--அழகாக
அழகு--அழகாய்
அழகு--அழகான
அழகு--அற்ற
அழகு--அற்றவராகவும்
அழகு--அற்றிருந்தது
அழகு--அன்
அழகு--அன்று
அழகு--அனா
அழகு--அனாக
அழகு--அனாகவும்
அழகு--அனாய்
அழகு--அனான
அழகு--அனையும்
அழகு--ஆ
அழகு--ஆ
அழகு--ஆக்கி
அழகு--ஆக
அழகு--ஆகக்கூட
அழகு--ஆகத்தான்
அழகு--ஆகப்படுவதற்கு
அழகு--ஆகயிருக்கும்
அழகு--ஆகவும்
அழகு--ஆகவே
அழகு--ஆகாது
அழகு--ஆகும்
அழகு--ஆகுமா
அழகு--ஆத்தாள்
அழகு--ஆத்தாளின்
அழகு--ஆத்தாளுக்கு
அழகு--ஆத்தாளே
அழகு--ஆம்
அழகு--ஆய்
அழகு--ஆய்த்தானே
அழகு--ஆயிருக்கிறது
அழகு--ஆயிருக்கிறேனே
அழகு--ஆயிருக்கின்றன
அழகு--ஆயிருக்குன்னு
அழகு--ஆயிருந்தது
அழகு--ஆயிருந்திருப்பா
அழகு--ஆயிருப்பது
அழகு--ஆயில்லையா
அழகு--ஆயுள்ளனவே
அழகு--ஆர்
அழகு--ஆல்
அழகு--ஆலும்
அழகு--ஆன
அழகு--ஆனதாகவும்
அழகு--ஆனது
அழகு--ஆனதும்
அழகு--ஆனதுமான
அழகு--ஆனதென்பார்
அழகு--ஆனதொரு
அழகு--ஆனவர்
அழகு--ஆனவர்கள்
அழகு--ஆனவர்களாக
அழகு--ஆனவரா
அழகு--ஆனவராகவே
அழகு--ஆனவராயிருந்தா
அழகு--ஆனவள்
அழகு--ஆனவளாய்
அழகு--ஆனவளோ
அழகு--ஆனவன்
அழகு--ஆனவை
பக்கம்
3
4. 2 தொடரடைவுகள் (Concordance)
தரவக ஆய்வில் முக்கிய பங்கு வகிப்பது தொடரடைவுகள். இதற்கு
மற்றெரு பெயர் சொற்சூழல் (Key Word In Context).
அதாவது ஒரு குறிபிட்ட சொல் தரவகத்தில் எப்படிப்பட்ட சொற்றொடர்களுடன்
பயன்படுத்தபட்டிருக்கிறது என்று அறியமுடிகிறது. இம்முறையில் சொற்களைச் சொல்லமைப்புகள், சொலுருவாக்கங்கள், சொல்திரிபுகள், சொற்பொருட்கள், தொடரமைப்புகள் போன்ற பல்வேறு நிலைகளில் ஆராயலாம்.
4. 3 சொற்சேர்க்கை (Collocation)
சொற்சேர்க்கை என்பது சொல்லின் வலம் அல்லது இடமாக
அமைந்திருக்கும் சொற்களைக் குறிக்கிறது.
மனதின் அழகு முகத்தில்
பிரதிபலிக்கிற.
.நிறந்த இடத்தில் அழகு இருக்கும்.
உவம அழகு அனத்ம் நிறந்த
சோலயின் அழகு வளமும்
சேரப்பெற்றுப்
எல்லயற்ற அழகு என் கண்களக்
குருடாக்கிய.
போர்த்தி அழகு செய் காவிரியில்
மிதக்கச் செய்தான்.
ஊருக்கு அழகு நதி அல்ல கோயில்
என்பார்கள்.
அவள் அழகு யார் சித்தத்தயும் கொள்ள
கொள்ளும்
மகுடத்டன் அழகு பொலிந்த தேவியாய்,
இந்தியாவின் அழகு இங்கே
இருக்கிற!"
நிறத்தால்தான் அழகு பெறுகின்றன.
மாணிக்கத்க்கு அழகு அளிப்ப,
மணிக்கு அழகு அளிக்கும்.
உடல் அழகு பாதிக்கப்படலாம்.
மதர்ப்பான அழகு ஒரு மயக்கத்த
ஏற்படுத்திக் கொண்டிருந்த.
உன்னதமான அழகு அவளிடம் ஔதவீசிக் கொண்டிருந்த.
உடத்தெறிந்த அழகு தெய்வத்த
மோகனம் என்ப அழகு என்று பொருள்படும்.
டும்பொழு அந்த அழகு
வௌதப்படும்.
காற்று சுற்றிலும்
அழகு கவித படத்க் கொண்டிருக்கிற.
இடமும் அழகு கொஞ்சக்கூடியதாக உள்ள.
இதே அழகு வேறு சில பெண்களுக்கு
அருவருப்பாகவும்
ருநாள்
தான் அழகு இருக்கும்;
ழகு பளிச்சிடும்
அழகு!"
கூத்க்கலயின் அழகு முழுமயயும் காணுதற்கு
மேகம்
நகரும் அழகு தெரிந்த.
அவனுடய அழகு சோபிக்கிற.
மனம், அழகு
கண்டால் மயங்கும், ன்பம் கண்டால்
அமந்த
பொருள் அழகு உடயதாகிற.
ஒழிக்கும், அழகு
உண்டாகும்.
உள்ள சூடு நீங்கும்; அழகு ஏற்படும் முகம்
வசீகரமாகியிருக்கும்,
தெய்வீக அழகு பற்றியும் கூறும்
இறுதிப் பாடல் இரண்டும் மட்டும்,
என்ற
சொல்லே அழகு என்ற பொருளுக்குரியதாக உள்ள
4. 4 சொல்லிணக்கணம் (Lexico-grammar/ Lexico-syntactic)
சொல்லிணக்கணம் என்பது சொல்
அதன் தொடரியல் இலக்கணம் பற்றி ஆராய்வது. ஒரு சொல் பல்வேறு தொடர் அமைப்புகளில்
பல்வேறு இலக்கணக் கூறுகளையும் பொருண்மைக் கூறுகளையும் பெறுகின்றன. சொல்லின் ஆயிர
கணக்கான தொடர் அமைப்புகளின் மூலம் அதன் இலக்கண கூறுகளை பிரித்து அறிய எளிமையாக
இருக்கும். மேற்கண்ட சொற்சேர்க்கையின் உதவியுடன் மொழி அமைப்பை மிக எளிதில் அறிந்து
கொள்ளலாம்.
முடிவுரை
இந்நூற்றாண்டின் தனிபெருந்
துறையாகத் தரவக மொழியல் வளர்ந்து வருகிறது. தரவகத்தைப் பயன்படுத்தி பல்வேறு
மொழியல் ஆய்வுகள் மேற்கொள்ளப்படுகின்றன. சொற்களை அடிப்படையாகக் கொண்டு, பயன்பாட்டுச் சொற்கள், சொல் வளம்,
சொல்திரிபுகள், சொற்றொடர் வகைகள், பொருண்மைக் கூறுகள் பொன்ற ஆய்வு முடிவுகளை கற்றல் கற்பித்தலில்
பயன்படுத்துவது. இதன் அடுத்த முக்கிய பங்கு மாற்றிலக்கண விதிகளை இதனுடன் ஒப்பிட்டு
செம்மைபடுத்த உதவி செய்கின்றன.
0 comments:
Post a Comment