Computational Linguistics - INFITT

33

Transcript of Computational Linguistics - INFITT

Page 1: Computational Linguistics - INFITT
Page 2: Computational Linguistics - INFITT

163

Computational Linguistics

(роХрогро┐ройро┐ рпЖрооро╛ро┤ро┐ропро┐роп )

Page 3: Computational Linguistics - INFITT

164

Page 4: Computational Linguistics - INFITT

165

A Package for Learning Negations in Tamil

Dr. G. Singaravelu

Reader, UGC-Academic Staff College,&B.Ed Coordinator

Bharathiar University, Coimbatore-641 046.

Introduction

Tamil is an important language to learn different cultures of Tamilnadu and India. Teaching of Tamil

is difficult to the teachers of Tamil due to the more letters in Tamil and learning Tamil grammar is

difficult to the learners of primary and upper primary schools due to ineffective methods of teaching.

Grammar is indispensable for learning any language. Maximum teaching methods of grammar is

adopting formal grammar. Less concentration is transacted in the class room of the Tamil language in

functional grammar. Conventional methods of teaching of functional grammar are ineffective and it

lead the learners towards aversion in learning grammar. Negations have unique place in

communicative competency. Conventional methods discourage the students to learn negation

effectively at school level. Students are able to use it inappropriately. This study investigates the

effectiveness of learning package of Negations in Tamil among the learners of standard VI.

Need of the study

Conventional methods are unable to create the appropriate learning atmosphere for scoring more

marks in Tamil grammar of the mother tongue of the learners and also for the learners of the second

language as Tamil. Traditional methods did not help the learners to learn Negations in Tamil. It was a

challenging task to the learners of standard VI. An innovative Learning package can be encouraged

the young learners to learn more negations in limited time. Hence the researcher endeavoured to

prepare a learning package for acquiring more negations in Tamil for the young learners.

Objectives

The researcher has framed the following objectives of the study:

1. To find out the problems of conventional methods in learning Negations in Tamil at

Government school.

2. To find out the problems of conventional methods in learning Negations in Tamil at Aided

school.

3. To find out the significant difference in achievement mean score between the pre test of

control group and the post test of control group in Government school.

4. To find out the significant difference in achievement mean score between the pre test of

control group and the post test of control group in Aided school.

5. To find out the significant difference in achievement mean score between the pre test of

Experimental group and the post test of Experimental group in Government school.

Page 5: Computational Linguistics - INFITT

166

6. To find out the significant difference in achievement mean score between the pre test of

Experimental group and the post test of Experimental group in Aided school.

7. To find out the impact of innovative Learning package in Negations of Tamil at standard VI

in Government school and Aided school.

Hypotheses

The research has framed the following hypotheses

1. Students of standard VI have problems of conventional methods in learning Negations in

Tamil at Government school.

2. Students of standard VI have problems of conventional methods in learning Negations in

Tamil at Aided school.

3. There is no significant difference in achievement mean score between the pre test of control

group and the post test of control group in Government school.

4. There is no significant difference in achievement mean score between the pre test of control

group and the post test of control group in Aided school.

5. There is no significant difference in achievement mean score between the pre test of

Experimental group and the post test of Experimental group in Government school.

6. There is no significant difference in achievement mean score between the pre test of

Experimental group and the post test of Experimental group in Aided school.

7. To find out the impact of innovative Learning package in Negations of Tamil at standard VI

in Government school and Aided school.

Method of study

Methodology: Equivalent group Experimental method was adopted in the study.

Sample selected for the study

Sixty pupils of studying in standard VI from Government Higher Secondary school,

Kalveeranpalayam, Coimbatore and another Sixty pupils of studying in standard VI from

Maruthamalai Devasdanam Subramanian swamy Higher secondary school, Vadavalli ,Coimbatore

were selected as sample for the study. Sixty students were considered as Controlled group and

another Sixty were considered as Experimental group.

Instrumentation

ResearcherтАЩs self-made achievement test was used as a tool for the study.

Reliability of the tool

Test- retest method was used for the study .The co-efficient correlation was found 0.85 in the tool

through test-retest method.

Page 6: Computational Linguistics - INFITT

167

Validity of the tool

Content validity was established for the test through expert suggestions. Hence reliability and validity

were properly established for the study.

Statistical Technique

Percentage, mean, SD and t test were adopted in the study for analyzing the tabulated data.

Procedures of the study:

Phase 1: Assessing the problems of the students in acquiring competency in learning Tamil

Negations for both schools of Govt and Aided in existing methods through administering pretest.

Phase 2 Pre-production stage..

Phase 3: Production stage.

Phase 4: Preparation of package

Phase 5: Execution of activities through using the learning package

Phase 6: Administrating pretest and post test to the control group and tabulated the scores.

Phase7: Administrating pre test and post test to the Experimental group and tabulated the scores.

Phase 8: Finding the effectiveness of the Package for Negation.

Data collection:

The researcher administered a diagnostic test to identify the problems of the students in learning

Tamil with permission of Principals of the schools. Pretest тАУTreatment-Posttest was used in the study.

Hypothesis testing

Hypothesis 1&2

1. Students of standard VI have problems of conventional methods in learning Negations in

Tamil at Government school.

2. Students of standard VI have problems of conventional methods in learning Negations in

Tamil at Aided school.

In the pre-test, students of Govt schools and Aided schools score 19%, 28% marks respectively in

acquiring Negation in Tamil through conventional method and the Experimental group students

score 49 %, 56% marks respectively..It shows the problems of acquisition of Negation in Tamil

through conventional methods among the students.

Hypothesis 3:

There is no significant difference in achievement mean score between the pre test of control group and

the post test of control group in Government school.

Page 7: Computational Linguistics - INFITT

168

The calculated t value is (0.08) less than table value (1.96). Hence null hypothesis is accepted at 0.05

levels. Hence there is no significant difference between the pre test of control group and post test of

control group in achievement mean scores of the teachers in learning Tamil Negations in Govt school.

Hypothesis 4:

There is no significant difference in achievement mean score between the pre test of control group and

the post test of control group in Private school.

The calculated t value is (1.85) less than table value (1.96). Hence null hypothesis is accepted at 0.05

levels. Hence there is no significant difference between the pre test of control group and post test of

control group in achievement mean scores of the teachers in learning Tamil Negations in private

school.

Hypothesis 5:

There is no significant difference in achievement mean score between the pre test of Experimental

group and the post test of Experimental group in Government school.

Stages N Mean S.D. df t- value Result

Pretest control

group 30 10.63 3.23

Post test control

group group 30 10.78 3.21

58 0.08 insignificant

Stages N Mean S.D. df t- value Result

Pretest control group 30 10.53 3.23

Post test control group

group 30 10.28 3.28

58 0.29 insignificant

Stages N Mean S.D. df t- value Result

Pre test

Experimenta

l group

30 10.62 3.23

Post test

Experimenta

l group

30 16.56 3.21

58 7.14 significant

Page 8: Computational Linguistics - INFITT

169

Achievement mean scores between pre test of Experimental and posttest of Experimental group.

The calculated t value is (7.14) greater than table value (1.96). Hence null hypothesis is rejected at 0.05

levels. Hence there is significant difference between the pretest of experimental group and post test of

experimental group in achievement mean scores of the students in learning Negation in Tamil.

Hypothesis 6:

There is no significant difference in achievement mean score between the pre test of Experimental

group and the post test of Experimental group in Aided school.

Achievement mean scores between pretest of experimental group and posttest of Experimental

group.

The calculatedтАШtтАЩ value is (7.08) greater than table value (1.96). Hence null hypothesis is rejected at 0.05

levels. Hence there is significant difference in achievement mean score between the pre test of

Experimental group and post test experimental group in achievement mean scores of the students in

Tamil Negation.

Hypothesis 7.

Learning package is more effective than conventional learning in learning Negation in Tamil

The above two tables prove and confirm the Learning Package is more effective than traditional

approaches in developing Negation in Tamil.. Mean scores in pre-test of Experimental group is

(10.62 and13.70) greater than the mean score of post test of Experimental group by using Learning

Package in acquiring Negation in Tamil (16.56 and 19.65).

Findings:

1. Students of standard VI have problems of conventional methods in learning Negations in

Tamil at Government school.

2. Students of standard VI have problems of conventional methods in learning Negations in

Tamil at Aided school..

3. There is no significant difference in achievement mean score between the pre test of control

group and the post test of control group in Government school.

Stages N Mean S.D. df t- value Level of significance

Pretest

Experimenta

l group

30 13.70 3.30

Post test

Experimenta

l group

30 19.65 3.20

58 7.08 P>0.05

Page 9: Computational Linguistics - INFITT

170

4 There is no significant difference in achievement mean score between the pre test of control

group and the post test of control group in Aided school.

5. There is significant difference in achievement mean score between the pre test of

Experimental group and the post test of Experimental group in Government school.

6. There is significant difference in achievement mean score between the pre test of

Experimental group and the post test of Experimental group in Aided school.

7. Learning package in Negations of Tamil is more effective than conventional methods in

learning Tamil Negation at standard VI in Government school and Aided school.

Educational Implications:

1. Learning package can be prepared for other subjects also.

2. It can be encouraged to implement to use in adult education

3. It may be implemented in Higher education

Conclusion

The study reveals that the students have problems in learning Negation in Tamil by using traditional

approaches. Learning Package is more effective in Learning Tamil Negation. Hence it will be more

supportive to promote the learners in learning Tamil.

References

я┐╜ Vasu Renganathan(2009) Enhancing the process of learning Tamil with synchronized Media,

Tamil internet conference, INFILL: Germany.

я┐╜ Sampath. K, Paneerselvem. A and Santhanam. S (1998) Introduction to Educational

technology, sterling publication Pvt Lit. Pg: no:103

я┐╜ INFIT (2009) Conference papers, Tamil internet 2009, University of Cologne: Germany

я┐╜ INFIT (2010) Conference papers , Tamil internet 2010, Coimbatore.

Page 10: Computational Linguistics - INFITT

171

Morphology based Factored Statistical Machine

Translation

(F-SMT) system from English to Tamil

Anand Kumar M1, Dhanalakshmi V1, Soman K P1, Rajendran S2 1Computational Engineering and Networking

Amrita Vishwa Vidyapeetham Coimbatore, India {m_anandkumar,v_dhanalakshmi, kp_soman} @cb.amrita.edu

2Tamil University, Thanjavur, India

Abstract

This paper presents a novel preprocessing methodology in factorized Statistical Machine Translation

system from English to Tamil language. SMT system considers the translation problem as a machine

learning problem. Statistical machine translation system for morphologically rich languages is a

challenging task. Moreover it is very complex for the different word order language pair. So a simple

SMT alone would not give good result for English to Tamil, which differs in morphological structure

and word order. A simple SMT system performs only at the lexical level mapping. Because of the

highly rich morphological structure of Tamil language, a simple lexical mapping alone will suffer a

lacuna in collecting all the morphological and syntactic information from the English language. The

proposed SMT system is based on factored translation models. The factored SMT uses machine

learning techniques to automatically learn translation patterns from factored corpora. Using the

learned model FSMT predicts the output factors for the given input factors. Using the Tamil

morphological generator the factored output is synthesized.

Introduction

Statistical approach to machine translation learns translation patterns directly from training sentences

and generalized them to handle new sentences. When translating from simple morphological

language to the rich morphological language, the SMT baseline system will not generate the word

forms that are not present in the training corpora. For training the SMT system, both monolingual and

bilingual sentence-aligned parallel corpora of significant size are essential. The corpus size decides the

accuracy of machine translation. The limited availability of parallel corpora for Tamil language and

high inflectional variation increases a data sparseness problem for phrase-based SMT. To reduce the

data sparseness, the words are split into lemma and their inflected forms based on their part of

speech. Factored translation models [Koehn and Hoang, 2007] allow the integration of the linguistic

information into a phrase-based translation model. These linguistical features are treated as separate

tokens during the factored training process.

Page 11: Computational Linguistics - INFITT

172

P(T|E) = P(T) P(E|T) / P(E)

T╦Ж = argmax P(T) P(E|T)

T

SMT works on the above equation. Where T represents Tamil language and E represents English

language. We have to find the best Tamil translation sentence (T╦Ж) using P(T) and P(E|T), Where P(T)

is given by the Language model and P(E|T) is given by the translation model.

Factored SMT for Tamil

Tamil language is morphologically rich language with free word order of SOV pattern. English

language is morphologically simple with the word order of SVO pattern. The baseline SMT would not

perform well for the languages with different word order and disparate morphological structure. For

resolving this, we go for factored SMT system (F-SMT). A factored model, which is a subtype of SMT

[Koehn and Hoang, 2007], will allow multiple levels of representation of the word from the most

specific level to more general levels of analysis such as lemma, part-of-speech and morphological

features. A preprocessing module is externally attached to the SMT system for Factored SMT.

The preprocessing module for source language includes three stages, which are reordering,

factorization and compounding. In reordering stage the source language sentence is syntactically

reordered according to the Tamil language syntax using reordering rules. After reordering, the

English words are factored into lemma and other morphological features. A compounding process for

English language is then followed, in which the various function words are removed from the

reordered sentence and attached as a morphological factor to the corresponding content word. This

reduces the length of English sentence. Now the representation of the source syntax is closely related

to the target language syntax. This decreases the complexity in alignment, which is also a key problem

in SMT from English to Tamil language.

Parallel corpora and monolingual corpora are used to train the statistical translation models. Parallel

corpora contains factored English sentences (using Stanford parser) along with its factored Tamil

translated sentences (using Tamil POS Tagger [V Dhanalakshmi et.al, 2009] and Morphological

analyzer [M Anand kumar et.al,2009]. Factorized monolingual corpus is used in the Language model.

The parsed source language is reordered according to the target language structure using the syntax

based reordering system. A compounding process for English language is then followed, in which the

various function words are removed from the reordered sentence and attached as a morphological

factor to the corresponding content word. This reduces the length of English sentence. Now the

representation of the source syntax is closely related to the target language syntax. This decreases the

complexity in alignment, which is also a key problem in SMT from English to Tamil language.

The factored SMT systemтАЩs output is post processed, where the Tamil Morphological generator is

pipelined to generate the target sentence. Figure.1 shows the architecture of the prototype factored

SMT system from English to Tamil.

Page 12: Computational Linguistics - INFITT

173

Figure.1 Architecture of the prototype factored SMT system from English to Tamil

Morphological models for Tamil language

Morphological models for target language Tamil are used in preprocessing as well as post processing

stage. In preprocessing, Tamil POS tagger and Morphological analyzer are used to factorize the Tamil

parallel corpus and monolingual corpus. Morphological generator is used in the post processing stage

to generate the Tamil words from Factored SMT output.

Tamil POS tagger

Parts of speech (POS) tagging means labeling grammatical classes i.e. assigning parts of speech tags to

each and every word of the given input sentence. POS tagging for Tamil is done using SVM based

machine learning tool [V Dhanalakshmi et.al, 2009], which make the task simple and efficient. The

SVM Tool[] is used for training the tagged sentences and tagging the untagged sentences. In this

method, one requires Part of speech tagged corpus to create a trained model.

Tamil Morphological Analyzer

The Tamil morphological analyzer is based on sequence labeling and training by kernel methods. It

captures the non-linear relationships and various morphological features of natural language in a

better and simpler way. In this machine learning approach two training models are created for

morphological analyzer. These two models are represented as Model-I and Model-II. First model is

trained using the sequence of input characters and their corresponding output labels. This trained

model-I is used for finding the morpheme boundaries [M Anand kumar et.al, 2009].

Second model is trained using sequence of morphemes and their grammatical categories. This trained

Model-II is used for assigning grammatical classes to each morpheme. The SVMTool is used for

training the data. Generally SVMTool is developed for POS tagging but here this tool is used in

morphological analysis.

Tamil Morphological Generator

The developed morphological generator receives an input in the form of lemma+word_class+Morpho-

lexical Information, where lemma specifies the lemma of the word-form to be generated, word_class

Page 13: Computational Linguistics - INFITT

174

specifies the grammatical category (POS category) and Morpho-lexical Information specifies the type

of inflection. The morphological generator system needs to handle three major things; first one is the

lemma part, then the word class and finally the morpho lexical information. By the way the generator

is implemented makes it distinct from other morphological generator[M Anand kumar et.al,2010].

The input which is in Unicode format is first Romanized and then the paradigm number is identified

by end characters. For sake of easy computation we are using romanized form. A Perl program has

been written for identifying paradigm number, which is referred as column index. The morpho-lexical

information of the required word class is given by the user as input. From the morpho-lexicon

information list the index number of the corresponding input is identified, this is referred as row

index. A verb and noun suffix tables are used in this system. Using the word class specified by the

user the system uses the corresponding suffix table. In this two-dimensional suffix table rows are

morpho-lexical information index and columns are paradigm numbers.

Conclusion

In this paper, we have presented a morphology based Factored SMT for English to Tamil language.

The morphology based Factored SMT improves the performance of translation system for

morphologically rich language and also it drastically reduces the training corpus size. So this model is

suitable for languages which have less parallel corpus. Tamil morphological models are used to create

a factorized parallel corpus. Source language reordering module captures structural difference

between source and target language and reorder it accordingly. Compounding module converts the

source language structure to fit into the target language structure. Initial results obtained from the

Factored SMT are encouraging.

References

я┐╜ Philipp Koehn and Hieu Hoang (2007), тАЬFactored Translation ModelsтАЭ, Conference on

Empirical Methods in Natural Language Processing (EMNLP), Prague, Czech Republic, June

2007.

я┐╜ V Dhanalakshmi, M Anand kumar, K P Soman, S Rajendran (2009),тАЬPOS Tagger and Chunker

for Tamil languageтАЭ, Proceedings of Tamil Internet Conference 2009, Cologne, Germany,

October 2009.

я┐╜ M Anand kumar, V Dhanalakshmi, K P Soman, S Rajendran (2009),тАЬA Novel Apporach For

Tamil Morphological AnalyzerтАЭ, Proceedings of Tamil Internet Conference 2009 , Cologne,

Germany, Page no: 23-35, October 2009.

я┐╜ M Anand kumar, V Dhanalakshmi, R U Rekha, K P Soman, S Rajendran (2010), тАЬMorphological

Generator for Tamil a new data driven approachтАЭ, Proceedings of Tamil Internet Conference

2010, Coimbatore, India, 2010.

я┐╜ Jes┬┤us Gim┬┤enez and Llu┬┤─▒s M`arquez.(2004), тАЬSVMTool: A general pos tagger generator based

on support vector machinesтАЭ, Proceedings of the 4th LREC Conference, 2004.

я┐╜ Fishel,M (2009), тАЬDeeper than words : Morph-based Alignment for Statistical Machine

Translation тАЭ, Proceedings of the conference of the pacific Association for Computational

Computational Linguistics (PacLing 2009 ) Sapporo, Japan.

Page 14: Computational Linguistics - INFITT

175

Tamil Shallow Parser using Machine Learning Approach

Dhanalakshmi V1, Anand Kumar M1, Soman K P1 and Rajendran S2

1Computational Engineering and Networking

Amrita Vishwa Vidyapeetham Coimbatore, India

{m_anandkumar,v_dhanalakshmi, kp_soman} @cb.amrita.edu

2Tamil University, Thanjavur, India

Abstract

This paper presents the Shallow Parser for Tamil using machine learning approach. Tamil Shallow

Parser is an important module in Machine Translation from Tamil to any other language. It is also a

key component in all NLP applications. It is used to understand natural language by machine and also

useful for second language learners. The Tamil Shallow Parser was developed using the new and state

of the art machine learning approach. The POS Tagger, Chunker, Morphological Analyzer and

Dependency Parser were built for implementing the Tamil Shallow Parser. The above modules gives

an encouraging result.

Introduction

Partial or Shallow Parsing is the task of recovering a limited amount of syntactic information from a

natural language sentence. A full parser often provides more information than needed and sometimes

it may also give less information. For example, in Information Retrieval, it may be enough to find

simple NPs (Noun Phrases) and VPs (Verb Phrases). In Information Extraction, Summary Generation,

and Question Answering System, information about special syntactico-semantic relations such as

subject, object, location, time, etc, are needed than elaborate configurational syntactic analyses. In full

parsing, grammar and search strategies are used to assign a complete syntactic structure to sentences.

The main problem here is to select the most possible syntactic analysis to be obtained from thousands

of possible analyses a typical parser with a sophisticated grammar may return. This complexity of the

task makes machine learning an attractive option in comparison to the handcrafted rules.

Methodology

Machine learning approach is applied here to develop the shallow parser for Tamil. Part of speech

tagger for Tamil has been generated using Support Vector Machine approach [Dhanalakshmi V e.tal.,

2009]. A novel approach using machine learning has been built for developing morphological analyzer

for Tamil [Anand kumar M e.tal., 2009]. Tamil Chunker has been developed using CRF++ tool

[Dhanalakshmi V e.tal., 2009]. And finally, Tamil Dependency parser, which is used to find syntactico-

semantic relations such as subject, object, location, time, etc, is built using MALT Parser

[Dhanalakshmi V e.tal., 2011].

Page 15: Computational Linguistics - INFITT

176

General Framework and Modules

тАв The general block diagram for Tamil Shallow parser is given in Figure 1.

Figure.1. General Framework for Tamil Shallow Parser

тАв Tamil Part-of-Speech Tagger [Dhanalakshmi V e.tal., 2009]: The Part of Speech (POS) tagging is

the process of labeling a part of speech or other lexical class marker (noun, verb, adjective, etc.)

to each and every word in a sentence. POS tagger was developed for Tamil language using

SVMTool [Jes┬┤us Gim┬┤enez and Llu┬┤─▒s M`arquez, 2004].

тАв Tamil Morphological Analyzer [Anand Kumar M e.tal., 2009]: Morphological Analysis is the

process of breaking down morphologically complex words into their constituent morphemes. It

is the primary step for word formation analysis of any language. Morphological Analyzer was

developed using a novel machine learning approach and was implemented using SVMTool.

тАв Tamil Chunker [Dhanalakshmi V e.tal., 2009]: Chunks are normally taken to be non recursive

correlated group of words. Chunker divides a sentence into its major-non-overlapping phrases

POS Tagging

Chunking Morphological

Analyzer

Tokenization

Format Conversion

MALT

Parser for

Relation

Input

Sentenc

Shallow

Parsed

Page 16: Computational Linguistics - INFITT

177

(noun phrase, verb phrase, etc.) and attaches a label to each chunk. Chunker for Tamil language

was developed using CRF++ Tool[Sha F and Pereira F, 2003].

тАв Tamil Dependency Parser for Relation finding [Dhanalakshmi V e.tal., 2011]: Given the POS

tag, Morphological information and chunks in a sentence, this decides which relations they

have with the main verb (subject, object, location, etc.). Dependency parser was developed for

Tamil language using Malt Parser tool [Joakim Nivre and Johan Hall, 2005].

Dependency Parsing using Malt Parser

MALT Parser Tool is used for dependency parsing, which uses supervised machine learning

algorithm. Using this tool dependency relations and position of the head are obtained for Tamil

sentence. There are 10 tuples used in the training data that can be user define. For Tamil dependency

parsing, the following features are defined and others are set as NULL and are mentioned as тАШ_тАЩ in the

training data format.

WordID: Position of each word in the input sentence.

Words: Each word in the input sentence.

CPos Tag and Pos Tag: Defines the Parts Of Speech of each word.

Head: The position of the parent of each word.

Lemma: The lemma of the word.

Morph Features The Morphological features of the word.

Chunk The chunk information of the word.

Dependency Relation: The terminology given for each parent тАУ child relation.

Sample Training Data

1 роЕро╡ _ <PRP> <PRP> 8 <N.SUB> _ _

2 рпИроЯроХрпИро│ _ <NN> <NN> 3 <D.OBJ> _ _

3 ро╡ро╛ роХро┐ _ <VNAV> <VNAV> 4 <ATT> _ _

4 роЪрпИроо _ <VNAV> <VNAV> 6 <VNAV.MOD>_ _

5 род _ <NN> <NN> 6 <NST.MOD> _ _

6 рпЗрокро╛ _ <VNAV> <VNAV> 8 <V.COMP> _ _

7 роЙрой _ <PRP> <PRP> 8 <I.OBJ> _ _

8 рпЖроХро╛ роХро┐ ро▒ро╛ _ <VF> <VF> 0 <ROOT> _ _

9 . <DOT> <DOT> 8 <SYM> _ _

For Tamil language, a corpus of three thousand sentences is annotated with dependency relations and

labels using the customized tag set (Table.1). The corpus is trained using the MALT Parser tool which

generates a model. Using this model the new input sentences are tested.

Page 17: Computational Linguistics - INFITT

178

S.No Tags Description S.No Tags Description

1 ROOT Head word 5 NST-MOD Spatial Time

Modifier

2 N-SUB Subject 6 SYM Symbols

3 D-OBJ Direct Object 7 X Others

4 I-OBJ Indirect Object

Table.1 Shallow Dependency Tagset

Application of Shallow Parser

Shallow parsers were used in Verbmobil project [Wahlster W, 2000], to add robustness to a large

speech-to-speech translation system. Shallow parsers are also typically used to reduce the search space

for full-blown, `deep' parsers [Collins, 1999]. Yet another application of shallow parsing is question-

answering on the World Wide Web, where there is a need to efficiently process large quantities of ill-

formed documents [Buchholz and Daelemans, 2001] and more generally, all text mining applications,

e.g. in biology [Sekimizu et al., 1998].

The developed Tamil Shallow Parser can be used to develop the following systems for Tamil

language.

тАв Information extraction and retrieval system for Tamil.

тАв Simple Tamil Machine Translation system.

тАв Tamil Grammar checker.

тАв Automatic Tamil Sentence Structure Analyzer.

тАв Language based educational exercises for Tamil language learners.

Conclusion

Shallow Parsing has proved to be a useful technology for written and spoken language domains. Full

parsing is expensive, and is not very robust. Partial parsing has proved to be much faster and more

robust. Dependency parser is better suited than phrase structure parser for languages with free or

flexible word order like Tamil. Fully functional Shallow Parser for Tamil gives reliable results. The

Shallow Parser system developed for Tamil is an important tool for Machine Translation between

Tamil and other languages.

References

я┐╜ Anand kumar M, Dhanalakshmi V , Soman K P and Rajendran S (2009) , тАЬA Novel Approach

for Tamil Morphological AnalyzerтАЭ, Proceedings of the 8th Tamil Internet Conference 2009,

Cologne, Germany.

я┐╜ Buchholz Sabine and Daelemans Walter (2001), тАЬComplex Answers: A Case Study using a

WWW Question Answering SystemтАЭ, Natural Language Engineering.

я┐╜ Collins M (1999), тАЬHead-Driven Statistical Models for Natural Language ParsingтАЭ, Ph.D

Thesis, University of Pennsylvania.

Page 18: Computational Linguistics - INFITT

179

я┐╜ Dhanalakshmi V, Anand Kumar M, Vijaya M S, Loganathan R, Soman K P, Rajendran S

(2008), тАЬTamil Part-of-Speech tagger based on SVMToolтАЭ, Proceedings of the COLIPS

International Conference on natural language processing(IALP), Chiang Mai, Thailand.

я┐╜ Dhanalakshmi V, Anand kumar M, Soman K P and Rajendran S (2009), тАЬPOS Tagger and

Chunker for Tamil LanguageтАЭ, Proceedings of the 8th Tamil Internet Conference, Cologne,

Germany.

я┐╜ Dhanalakshmi V, Anand Kumar M, Rekha R U, Soman K.P and Rajendran S (2011), тАЬData

driven Dependency Parser for Tamil and MalayalamтАЭ NCILC-2011, Cochin University of

Science & Technology, India.

я┐╜ Jes┬┤us Gim┬┤enez and Llu┬┤─▒s M`arquez.(2004) SVMTool: A general pos tagger generator based on

support vector machines.In Proceedings of the 4th LREC Conference, 2004.

я┐╜ Joakim Nivre and Johan Hall, MaltParser: A language-independent system for data-driven

dependency parsing. In Proceedings of the Fourth Workshop on Treebanks and Linguistic

Theories (TLT), 2005.

я┐╜ Sekimizu T, Park H and Tsujii J (1998), тАЬIdentifying the interaction between genes and gene

products based on frequently seen verbs in Medline abstractsтАЭ, Genome Informatics,

Universal Academy Press.

я┐╜ Sha F and Pereira F (2003), тАЬShallow Parsing with Conditional Random FieldsтАЭ, Proceedings

of Human Language Technology CoferenceтАЩ2003, Canada.

я┐╜ Wahlster W (2000), тАЬVERBMOBIL: Foundations of Speech-to-Speech TranslationтАЭ, Springer-

Verlag.

Page 19: Computational Linguistics - INFITT

180

роХрогро┐ройро┐ро╡ро┤ро┐ родрооро┐ рпЖрооро╛ро┤ро┐ропро╛ ро╡ро┐ рпЖрокро╛ роороп роХроХрогро┐ройро┐ро╡ро┤ро┐ родрооро┐ рпЖрооро╛ро┤ро┐ропро╛ ро╡ро┐ рпЖрокро╛ роороп роХроХрогро┐ройро┐ро╡ро┤ро┐ родрооро┐ рпЖрооро╛ро┤ро┐ропро╛ ро╡ро┐ рпЖрокро╛ роороп роХроХрогро┐ройро┐ро╡ро┤ро┐ родрооро┐ рпЖрооро╛ро┤ро┐ропро╛ ро╡ро┐ рпЖрокро╛ роороп роХ

Ambiguities in Computer Assisted Tamil Language Processing

роЗро▓роЗро▓роЗро▓роЗро▓. родро░родро░родро░родро░ рпИрог рпЗрокро░ро╛роЪро┐ро╛ро┐роп , роТ роХро┐рпИрог рокро╛ро│ ,

роХрогро┐ройро┐ родрооро┐ роХ ро╡ро┐ родрооро┐ рпЗрокро░ро╛роп , SRM рок роХрпИро▓ роХро┤роХ . рооро┐ рой роЪ : [email protected]

рпИро░рпИро░рпИро░рпИро░

роХрогро┐ройро┐ропро┐ родрооро┐ рпЖрооро╛ро┤ро┐ропро┐ рокроп рокро╛ рпЖрок роХро┐ ро│ . родрооро┐ рпЖрооро╛ро┤ро┐ропро┐ ро╡ро│ роЪро┐ роХрогро┐ройро┐ропро┐ рок роХро│ро┐ родро╡ро┐ роХ ропро╛род роТ ро▒ро╛роХро┐ро╡ро┐ роЯ . рпЖрооро╛ро┤ро┐ роЖ роХ ро╡ро┐ропро╛роХ роХрогро┐ройро┐рпИроп рокроп рок родро┐ ро╡ роХро┐ро▒ роиро┐рпИро▓ропро┐ родрооро┐ рпЖрооро╛ро┤ро┐ родро░ роХрпИро│ роЕрод роУ роТ роХрпИроо роЯ роХ родро░рпЗро╡ ро│ .

роЕродро╛ро╡ роХрогро┐род роЕ рокрпИроЯропро┐ рпЖрооро╛ро┤ро┐ропро┐ роЙ ро│ рпЖрооро╛ро┤ро┐ропро┐роп роХрпИро│ роХрогро┐ройро┐ роП ро▒ ро╡рпИроХропро┐ рооро╛ ро▒ро┐ родро░рпЗро╡ ро│ . роЗ родрпИроХроп ро╡ро┤ро┐ рпИро▒роХрпИро│ рпЖроХро╛ рокрпЗрод роХрогро┐ройро┐ рпЖрооро╛ро┤ро┐ропро┐роп роО рокродро╛ . рпЖрооро╛ро┤ро┐ рпЖроЪроп рок ро╡родро┐ роЙ ро│ роТ рпИро▒ропро┐ рпЖродро╛ родро╛ роЗро▓ роХрог . роЗ родрпИроХроп роТ рпИро▒ рои рой, рпЖродро╛ро┤ро┐ рок ро╡ро│ роЪро┐роХро│ро┐ройро╛ рпЖрооро╛ро┤ро┐ роЙро▓роХрооропрооро╛ роХ ро┤ ройро╛ роЪро┐рпИрод рооро╛ рок ро╡ роХро┐ро▒ . рпЖрооро╛ро┤ро┐рпИроп роЗ родрпИроХроп роЪро┐рпИрод роХро│ро┐ роорпА рпЖроЯ роХ рпЖрооро╛ро┤ро┐ропро┐роп

роХрпИро│ рпИро▒ропро╛роХ роХ , рокроп рок родрпЗро╡ роп роХ роЯро╛роп роП рок ро│ .

рпЖрокро╛ роороп роХ родрооро┐ рпЖрооро╛ро┤ро┐ рокроп рокро╛ роЙ ро╡ро╛ роХро┐ ро▒ роиро┐рпИро▓ рокро╛ роХрпИро│ ,роХрогро┐ройро┐ро╡ро┤ро┐ роЖ рпЖроЪ рпЗрокро╛ роП рок роХро┐ро▒ рпЖрооро╛ро┤ро┐ропрпИроо роЪро┐ роХ роХрпИро│ ,роЕро╡ рпИро▒ родро╡ро┐ рокрод роХро╛рой

ро╡ро┤ро┐ рпИро▒роХрпИро│ , рпЖрооро╛ро┤ро┐ропро┐роп ро╡рпИроХ рокро╛ рпЖроиро▒ро┐ рпИро▒роХрпИро│ роО ро╡родро╛роХ роЗ роХ рпИро░ роЕрпИроороХро┐ро▒ .

роЗроп рпИроХрпЖрооро╛ро┤ро┐ропро╛роЗроп рпИроХрпЖрооро╛ро┤ро┐ропро╛роЗроп рпИроХрпЖрооро╛ро┤ро┐ропро╛роЗроп рпИроХрпЖрооро╛ро┤ро┐ропро╛ ; роХрогро┐ройро┐рпЖрооро╛ро┤ро┐ропро┐ропроХрогро┐ройро┐рпЖрооро╛ро┤ро┐ропро┐ропроХрогро┐ройро┐рпЖрооро╛ро┤ро┐ропро┐ропроХрогро┐ройро┐рпЖрооро╛ро┤ро┐ропро┐роп ; рпЖрооро╛ро┤ро┐ рпЖродро╛ро┤ро┐ рокрпЖрооро╛ро┤ро┐ рпЖродро╛ро┤ро┐ рокрпЖрооро╛ро┤ро┐ рпЖродро╛ро┤ро┐ рокрпЖрооро╛ро┤ро┐ рпЖродро╛ро┤ро┐ рок :

родрооро┐ рпЖрооро╛ро┤ро┐ропро┐ роЗроп роХрпИро│ рпЖродро│ро┐ро╡ро╛роХ роЕро▒ро┐ рпЖроХро╛ ро│ роТ ропройро┐роп , роЙ рокройро┐роп , рпЖродро╛роЯро╛ро┐роп

роо рпЖрокро╛ рпИрооропро┐роп рпЗрокро╛ ро▒ рпЖрооро╛ро┤ро┐ропро┐роп роЕро▒ро┐ роЗ ро▒ро┐ропрпИрооропро╛родрой.

рооройро┐род рпИро│рпИроп рпЗрокро╛ роХрогро┐ройро┐рпИроп роЗроп рпИроХрпЖрооро╛ро┤ро┐ роЕро▒ро┐рпИро╡ рпЖрокро▒рпИро╡ ,рпЖрооро╛ро┤ро┐

рпЖродро╛роЯ роХрпИро│ ро╛ро┐ рпЖроХро╛ ро│ , роЙ ро╡ро╛ роХ , рпЖроЪ ропрпИро╡ роп роЪро┐рпЗроп роЗроп рпИроХ рпЖрооро╛ро┤ро┐ропро╛

(Natural Language Processing). роЗ родрпИроХроп роЗроп рпИроХрпЖрооро╛ро┤ро┐ропро╛ рпИро╡ рпЗроо рпЖроХро╛ ро│ роЙ ро╡ро╛ роХ рок роХро┐ро▒

ро╡ро┤ро┐ рпИро▒роХ рпИро▒ рок род рпЗроо роХрогро┐ройро┐ рпЖрооро╛ро┤ро┐ропро┐роп (Computational Linguistics). роХрогро┐ройро┐ рпЖрооро╛ро┤ро┐ропро┐роп рпИрогрпЗропро╛ рпЖрооро╛ро┤ро┐ рпЗродрпИро╡ропро╛рой рооро┐ рой рпЖрооро╛ро┤ро┐ роХ ро╡ро┐роХрпИро│ роЙ ро╡ро╛ роХ

роЙрод рокрпЗроо рпЖрооро╛ро┤ро┐ рпЖродро╛ро┤ро┐ рок (Language Technology). роЗрпИро╡ родро╛ родрооро┐ рпЖроо

рпЖрокро╛ роХрпИро│ роЙ ро╡ро╛ ро╡род рпЗроо рпЖроХро╛ ро│ рок роХро┐ро▒ рок рпИро▒ ро╡ро│ роЪро┐ рокрогро┐роХ .

роХрогро┐ройро┐ родрооро┐ ро╡ро│ роЪро┐ роО рок родрооро┐ рпЖродро╛роЯ роХрпИро│ ро╛ро┐ рпЖроХро╛ ро│ (Understanding), роЕро╡ рпИро▒ роЙ ро╡ро╛ роХ (Generate) рпЗродрпИро╡ропро╛рой родрооро┐ рпЖрооро╛ро┤ро┐ роЕро▒ро┐рпИро╡ роХрогро┐ройро┐ роЕро│ро┐ рокрод роХро╛роХ роиро╛ рпЗроо рпЖроХро╛ ро│рпЗро╡ роп рокрогро┐роХрпИро│ ро▒ро┐ роХро┐ро▒ . родрооро┐ родро░ роХрпИро│ роХрогро┐ройро┐ ро╛ро┐ рпЖроХро╛ ро╡рпИроХропро┐ рпЖроХро╛ рокрод рпЖрооро╛ро┤ро┐ропро┐роп ро╡ро┐родро┐роХ рпЗроХро╛ рокро╛ роХ рпИрог ро╛ро┐роХро┐ ро▒рой. роХрогро┐ройро┐ рпЖрооро╛ро┤ро┐ропро┐роп рпЗроХро╛ рокро╛ роХрпИро│ рпЖроХро╛ рпЖрооро╛ро┤ро┐ропро┐ роЕрпИроо рпИрок, роЗро▓ роХрог рпИрод роХрогро┐ройро┐ рпЗроХ ро▒ ро╡рпИроХропро┐ роиро┐ро░ роХро│ро╛роХ )Programs(, рооро┐ рой роЗро▓ роХрогрооро╛роХ рооро╛ ро▒ро┐ рпЖроХро╛ , родрооро┐ рпЖрооро╛ро┤ро┐ропро┐ рпЗродрпИро╡рпИроп роиро┐рпИро▒ рпЖроЪ роп рпЗро╡ . роЗ ро╡ро╛ родрооро┐ рпЖрооро╛ро┤ро┐ропро┐ роЕрпИроо рпИрок роТ роХрпИроо роЯ ,

Page 20: Computational Linguistics - INFITT

181

ро╡ро┐родро┐роХро│ро╛роХ рооро╛ рпЗрокро╛ родрооро┐ рпЖрооро╛ро┤ро┐ропро┐ род роХро╛ро▓ роО ро╡ро┤ роХро┐ рок рпЗро╡ рпИро▒роХ рокроп рок род рок ро╡родро╛ рпЖроЪро╛ роХрпИро│ рокро┐ро╛ро┐ рпЗрокро╛ (Parsing) ро╡ро╛ро┐рпИроЪ рок рпЗрокро╛ (Sorting)

рок рпЗро╡ рпЖрооро╛ро┤ро┐ рокроп рокро╛ роЪро┐ роХ роХ роО роХро┐ ро▒рой. роЗ родрпИроХроп рпЖрооро╛ро┤ро┐ рокроп рокро╛ роЪро┐ роХ роХро│ро┐ роТ родро╛ рпЖрокро╛ роороп роХ (Word Sense Ambiguity).

родрооро┐ро┤ро┐ роЪ родро┐роЪ родро┐роЪ родро┐роЪ родро┐ рокро┐рпИро┤родро┐ родро┐рокро┐рпИро┤родро┐ родро┐рокро┐рпИро┤родро┐ родро┐рокро┐рпИро┤родро┐ родро┐ (Sandhi Checker), роЙ рокройро┐ропроЙ рокройро┐ропроЙ рокройро┐ропроЙ рокройро┐роп рок рокро╛ ро╡ро┐рок рокро╛ ро╡ро┐рок рокро╛ ро╡ро┐рок рокро╛ ро╡ро┐ (Morphological Parser),

рпЖродро╛роЯро╛ро┐ропрпЖродро╛роЯро╛ро┐ропрпЖродро╛роЯро╛ро┐ропрпЖродро╛роЯро╛ро┐роп рок рокро╛ ро╡ро┐рок рокро╛ ро╡ро┐рок рокро╛ ро╡ро┐рок рокро╛ ро╡ро┐ (Syntactic Parser), роЕрпИроЯро╡ро┐роЕрпИроЯро╡ро┐роЕрпИроЯро╡ро┐роЕрпИроЯро╡ро┐ (Indexing)(рпЖроЪро╛ ро▓рпИроЯ , рпЖродро╛роЯро░рпИроЯ ,

рпЖрокро╛ ро│рпИроЯ ), родро╛ройро┐роп роХро┐родро╛ройро┐роп роХро┐родро╛ройро┐роп роХро┐родро╛ройро┐роп роХро┐ рпЗрокрпЗрокрпЗрокрпЗрок роЕро▒ро┐ро╡ро╛роЕро▒ро┐ро╡ро╛роЕро▒ро┐ро╡ро╛роЕро▒ро┐ро╡ро╛ (Automatic Speech Recognizer-ASR), роЗроп родро┐ро░роЗроп родро┐ро░роЗроп родро┐ро░роЗроп родро┐ро░

рпЖрооро╛ро┤ро┐рпЖрокропрпЖрооро╛ро┤ро┐рпЖрокропрпЖрооро╛ро┤ро┐рпЖрокропрпЖрооро╛ро┤ро┐рпЖрокроп (Machine Translation) роЖроХро┐роп рпЖрооро╛ро┤ро┐ропро╛ рпЖроо рпЖрокро╛ роХ ро╡ро┐роХрпИро│ роЙ ро╡ро╛

ро╡родро┐ роЗ родрпИроХроп рпЖрокро╛ роороп роХ роЗрпИроЯ ро▒ро╛роХ роЕрпИроороХро┐ ро▒рой. роЗро╡ рпИро▒ роЪро╛ро┐рпЖроЪ роп, рпЖрокро╛ роороп роХ

рпЖроЪро╛ ро▓роХро░ро╛родро┐рпИроп роЙ ро╡ро╛ роХрпЗро╡ роп роЕро╡роЪро┐роп .

рпЖрокро╛ роороп роХ рпЖрокро╛ роороп роХ рпЖрокро╛ роороп роХ рпЖрокро╛ роороп роХ - ро╡ро┐ро│ роХро╡ро┐ро│ роХро╡ро┐ро│ роХро╡ро┐ро│ роХ

тАШWord Sense AmbiguityтАЩ роО роЖ роХро┐ро▓ рпЖроЪро╛ родрооро┐ро┤ро┐ рпЖродро│ро┐ро╡ро┐ рпИроо, ро┤ рок , роХ роороп роХ ,

рпЖрокро╛ роороп роХ , роЗ рпЖрокро╛ рок роиро┐рпИро▓, рпЖродро│ро┐ро╡ ро▒ роиро┐рпИро▓ роОрой рок рпЗро╡ роиро┐рпИро▓роХро│ро┐ рпЖрокро╛ рпЖроХро╛ ро│ рок роХро┐ ро▒ . роОройро┐ , роХрогро┐ройро┐рпЖрооро╛ро┤ро┐ропро┐роп рпЖрокро╛ роороп роХ роО рпЗро▒ рпИроХропро╛ро│ рок роХро┐ ро▒ . роЗ родрпИроХроп рпЖрокро╛ роороп роХ роХрпИро│ роХрпИро│ро╡рпИрод роХрогро┐ройро┐рпЖрооро╛ро┤ро┐ропро┐роп тАШWord

Sense Disambiguation )WSD(тАЩ роО ро╡ .

роТ рпЖродро╛роЯ род роЕрпИроо рокро┐ рпЖро╡ро│ро┐ рпЗродро╛ ро▒ родро┐ роЙ рпЗродро╛ ро▒ родро┐ рпЖро╡ рпЗро╡ рпЖрокро╛ род роХро┐ро▒ . роЗ родрпИроХроп рпЖрокро╛ рпИроо рооро╛ рокро╛ роП рок ро╡род ро╛ро┐роп роЪро┐ро▓ рпЖроЪро╛ роХ роЪро┐ро▓ роиро┐рпИро▓роХ роЗ рпЗроиро╛ роХ рок роХро┐ ро▒рой. родрооро┐ рооро░рокро┐ро▓ роХрог родро┐ роТ рпЖроЪро╛ ро▒ро┐ род рокро▓ рпЖрокро╛ , рокро▓ рпЖрокро╛ ро▒ро┐ род

роТ рпЖроЪро╛ роО ро▒ ро╡рпИроХ рокро╛ роХро╛рог рок роХро┐ро▒ . роЕроХро░ро╛родро┐ роиро┐рпИро▓ропро┐ роТ рпЖроЪро╛ рокро▓ рпЖрокро╛ роХ роЗ роХро▓ро╛ .роЖройро╛ , роЗро╡ ро▒ро┐ рпЖрокро╛ роороп роХ роО рок рооро╛ рок роЯ .

рпЖрокро╛ роороп роХ роП рок ро╡род роХро╛рой роиро┐рпИро▓ рокро╛ роХрпЖрокро╛ роороп роХ роП рок ро╡род роХро╛рой роиро┐рпИро▓ рокро╛ роХрпЖрокро╛ роороп роХ роП рок ро╡род роХро╛рой роиро┐рпИро▓ рокро╛ роХрпЖрокро╛ роороп роХ роП рок ро╡род роХро╛рой роиро┐рпИро▓ рокро╛ роХ

родрооро┐ рпЖрооро╛ро┤ро┐ родро░ роХ роЙро▓роХро│ро╛ро╡ро┐роп рпЖрокро╛ рпЖрооро╛ро┤ро┐ропро┐ род рпИроороХрпИро│ рпЖроХро╛ рокрпЗродро╛ родроо рпЖроХрой

роЪро┐ро▓ родройро┐ род рпИроороХрпИро│ рпЖроХро╛ роХро┐ ро▒рой. ро╡ро┤ роХро┐ро┤ род роХ родро╛ роХ роХ родрооро┐ро┤ро┐

роХро╛ро▓ роХро╛ро▓рооро╛роХ роиро┐роХ рпЖроХро╛ ро│рой. роЪро╛родро┐, рпЖродро╛ро┤ро┐ , ро╡ роЯро╛ро░ рпЗрокро╛ ро▒рпИро╡ роЪро╛ род ро╡ро┤ роХ ,

рпИро▒роЪро╛ род ро╡ро┤ роХ рпЗрок , роО роО роиро┐рпИро▓ рокро╛ роХ родрооро┐ рпЖрооро╛ро┤ро┐ родро░ро╡ро┐рпИрой

роХрогро┐ройро┐ропро┐ роП родро┐ро▒ роП ро▒ро╛ рпЗрокро╛ роТ рпИроо рок ро╡род рпЖрокро╛ ро╡ро┐родро┐роХрпИро│ роЙ ро╡ро╛

ро╡род роЗрпИроЯ роХро│ро╛роХ роЕрпИроороХро┐ ро▒рой.

рпЖроЪро╛ роХро│ро┐ роЗро▓ роХрог ро╡рпИроХ рокро╛ рпИроЯ роиро╛ рпИрооропро╛рой роЗро▓ роХрог роЕро▒ро┐ (Grammatical

Knowledge) роо роЙро▓роХро┐роп роЕро▒ро┐ро╡ро┐ (Pragmatic Knowledge) рпИрогрпЗропро╛ роЕро▒ро┐роХро┐рпЗро▒ро╛ . роЖройро╛

роЕро╡ рпИро▒ роХрогро┐ройро┐ роХ род ро╡родро┐ рок рпЗро╡ рпЖрооро╛ро┤ро┐ропрпИроо роЪро┐ роХ роХ роО роХро┐ ро▒рой. роЕро╡ рпИро▒

роЪро╛ро┐рпЖроЪ ро╡род роЙ рокройро┐роп , рпЖродро╛роЯро╛ро┐роп рок рокро╛ роХ рпИрог ро╛ро┐роХро┐ ро▒рой. роТ рпЖродро╛роЯро╛ро┐ роТ

рпЗроо рок роЯ роЕрпИроо роХ роХро╛рог рокроЯро▓ро╛ . роЕродро╛ро╡ ро▒ро┐ рокро┐ роЯ рпЖродро╛роЯро╛ро┐ роЗроЯ рпЖрок рпЖроЪро╛ роХ

род роХ рпЖро╡ рпЗро╡ ро╡рпИроХропро┐ роЗрпИрогропро▓ро╛ . роЕ рпЗрокро╛ рпЖрокро╛ роороп роХ роП рок роХро┐ро▒ .

роЖ роХро┐ро▓ родро┐ роТ рпЖрокроп (Transliterate) роО рпЗрокро╛ рпИро▒ рок род рок роЯ роТ ро▒ро┐ роО роХрпИро│ рокроп рок родрпЗро╡ . роЖройро╛ ро▒ро┐ , рпЖрои , ро▓,ро┤,ро│, ро▒,ро░ рпЗрокро╛ ро▒ роО роХ

рпЗро╡ рокро╛ роХро│ро┐ ро▒ро┐ рокроп рок род рок ро╡родро╛ рпЖрокро╛ ро┤ рок роЕро╡ рпИро▒ роЙ роЪро╛ро┐ рпЗрокро╛

рпЖродро│ро┐ро╡ро┐ ро▓ро╛род роиро┐рпИро▓ роХро╛рог рок роХро┐ро▒ . роО роХро╛ роЯро╛роХ, рокро╛роЯ роО роО ро╡рпИрод тАШpadamтАЩ

роО роО родро┐ройро╛ рокроЯ роО рок рокрод ро╡ро╛ рокро┐ роХро┐ро▒ . роОройрпЗро╡ роо роХро│ро┐ рпЖрокроп , роК рпЖрокроп ,

Page 21: Computational Linguistics - INFITT

182

роХро╡ро╛ро┐, рпЖрокро╛ роХро│ро┐ рпЖрокроп рпЗрокро╛ ро▒ро╡ рпИро▒ родро╡ро▒ро╛роХ роЙ роЪро╛ро┐ роХро┐ро▒ роиро┐рпИро▓ роП рок роХро┐ро▒ . роОройрпЗро╡, роЗро╡ рпИро▒ роУ роТ рпИро▒ рпЖроХро╛ ро╡ро░рпЗро╡ .

рпЖрокро╛ рпЗро╡ рокро╛ рпЗро╡ рпИроо роЙ роХ , роЪ родро┐ рооро╛ ро▒ роХ , ро▓,ро┤,ро│, ро▒,ро░ рпЗро╡ рокро╛ роХ

роХро┐роп рок роХро╛ роХро┐ ро▒рой. рпЗроо роЪро╛ро╛ро┐рпИропроХ , роЗро░ род рпЗрокро╛ ро▒рпИро╡ рпИрогрпЖроЪ роХро┐ ро▒рой.

рокро╛роЯ роХрпИро│ рок рпЗрокро╛ роОро│ро┐рпИрооропро╛роХ ро╛ро┐ рпЖроХро╛ ро│рпЗро╡ рпЖроо рпЗроиро╛ роХро┐ рпЖроЪро╛ роХрпИро│ рокро┐ро╛ро┐ рокродро╛ роЙрпИро░роирпИроЯ роО рпЗрокро╛ рпЖрокро╛ роороп ро╡ рпЖродро╛ро┐ропро╛роо рпЖроЪро╛ роХрпИро│ рокро┐ро╛ро┐ рокродро╛ рпЖрокро╛ роороп роХро┐ро▒ .рпЖрокро╛ роороп роХ роП рокроЯро╛родро╡ро╛ рокро┐ро╛ро┐ роХрпЗро╡ роО рокрпИрод роХро╡рой родро┐

рпЖроХро╛ ро│рпЗро╡ роп роЕро╡роЪро┐роп .рпЖрокро╛ роЙрог родро┐ро▒ рпИро▒ род роЗ роХро╛ро▓ родро┐ рокро╛роЯ роХро│ро┐ роО ро▓ро╛ рпЖроЪро╛ роХрпИро│ рокро┐ро╛ро┐ рпЗрод роО род рпЗро╡ , роОро│ро┐рпИроо рок родрпЗро╡ , роЪро╛родро╛ро░рог рпЗрок ро╡ро┤ роХро┐ роЗ роХрпЗро╡ роО рок рпЗрокро╛ ро▒ род рпИроороХ роХрпИроЯрокро┐ роХ рок роХро┐ ро▒рой .рпЗроо , роО роирпИроЯропро┐ роо ро▒ро╡ роХро│ро┐роЯрооро┐ род роХрпИро│ рпЗро╡ рок родрпЗро╡ роО рокрод роХро╛роХ роЗ родрпИроХроп роиро┐рпИро▓ роЗ роХро┐ ро▒ .

1. родройро┐ рпЖроЪро╛ роХро│ро╛ роП рок роХро┐ро▒ рпЖрокро╛ роороп роХродройро┐ рпЖроЪро╛ роХро│ро╛ роП рок роХро┐ро▒ рпЖрокро╛ роороп роХродройро┐ рпЖроЪро╛ роХро│ро╛ роП рок роХро┐ро▒ рпЖрокро╛ роороп роХродройро┐ рпЖроЪро╛ роХро│ро╛ роП рок роХро┐ро▒ рпЖрокро╛ роороп роХ

роЪро┐ро▓ родройро┐ рпЖроЪро╛ роХ рпЖродро╛роЯ роХро│ро┐ рокроп рок рпЗрокро╛ роЗ рпЗро╡ рпЖрокро╛ роХрпИро│ род роиро┐ роХро┐ ро▒рой.

родрооро┐ро┤ро┐ родройро┐ род роЪро┐ро▓ рпЖроЪро╛ роХрпИро│ рпЖродро╛роЯ роХро│ро┐ рокроп рок рпЗрокро╛ роЕрпИро╡ рпЗродро╛ ро▒ родро┐ роТ

рпЗрокро╛ро▓ рпЖрокро╛ ро│ро┐ роЗ рпЗро╡ роиро┐рпИро▓роХро│ро┐ роХро╛рог рок роХро┐ ро▒ . роТ рпЖродро╛роЯро╛ро┐ рпЗро╡рпИро▓ роО ро▒ рпЖроЪро╛ роХро╛рог рок роХро┐ро▒ . роЕ тАШрпЗро╡рпИро▓рпИроп тАЩ ро▒ро┐ роХро┐ро▒родро╛? роЕ ро▓ тАШрпЗро╡ тАЩ роО роЖ род рпИрод ро▒ро┐ роХро┐ро▒родро╛? роО ро▒ роороп роХ роП рок роХро┐ро▒ . рпЖродро╛роЯ роиро┐рпИро▓ропро┐ роЕрод роЕ роЕ ро▓ роЕрод роЕрпИроо род рпЖроЪро╛ рпИро▓ рпИро╡ рпЗрод, роЗ род рпЖроЪро╛ роЗрпИрод родро╛ ро▒ро┐ роХро┐ро▒ роО роЕро▒ро┐роп роХро┐ро▒ . роиро╛ рпЗро╡рпИро▓рпЗро╡рпИро▓рпЗро╡рпИро▓рпЗро╡рпИро▓ ро╡ро╛ роХро┐рпЗрой .

[роЕро╡рпИро░ - роЕро╡ + роР роЕро╡рпИро░ рпЖроЪ ], [ро╡ роЯ - ро╡ роЯ , родрпИро▓рпИроп ро╡ роЯ],

[роХро╛рпИро▓ - роХро╛ + роР роХро╛рпИро▓ рпЖрокро╛ ], [рокро╛ родро┐ро░ - роХродро╛ рокро╛ родро┐ро░ , роЪрпИроороп рокро╛ родро┐ро░ ]

[роЖ - роЖ (River) роО (Number)], [роО рог - роО рог (Thinking) роО рог(Counting)]

рпЗроо ро▒ро┐ род роЪро┐ро▓ рпЖроЪро╛ роХ роЯ роЗро░ роЯро╛ рпЗро╡ рпИроо роЙ ро╡ ро│родро╛ роЕ ро▓ родройро┐ рпЖроЪро╛ родро╛ройро╛ роО ро▒ ро┤ рокрпЗроо роЗ род рпЖрокро╛ роороп роХ родро┐ ро╛ро┐роп роХро╛ро░рогрооро╛ . роЗ родрпИроХроп ро┤ рокрооро┐ ро▒ро┐ рпЗро╡ рок ро╡род роЪро┐ро▓ роЗроЯ роХро│ро┐ тАШроЗ тАЩ роЪро╛ро╛ро┐рпИроп рокроп рок род рок роХро┐ро▒ .

роХро╛ + роР = роХро╛рпИрод => роХро╛ + роЗ + роР = роХро╛родро┐рпИрой.

роХро╛ + роР = роХро╛рпИроЯ => роХро╛ + (роЗ ) + роР = роХро╛ рпИроЯ, роХро╛ рпИрой.

2. рпЖродро╛роЯро░рпИроо роиро┐рпИро▓ропро┐ роП рок роХро┐ро▒ рпЖрокро╛ роороп роХрпЖродро╛роЯро░рпИроо роиро┐рпИро▓ропро┐ роП рок роХро┐ро▒ рпЖрокро╛ роороп роХрпЖродро╛роЯро░рпИроо роиро┐рпИро▓ропро┐ роП рок роХро┐ро▒ рпЖрокро╛ роороп роХрпЖродро╛роЯро░рпИроо роиро┐рпИро▓ропро┐ роП рок роХро┐ро▒ рпЖрокро╛ роороп роХ

роТ рпЖродро╛роЯ роЕрпИроо рокро┐ роО ро▓ро╛ рпЖроЪро╛ роХ роЪро╛ро┐ропро╛рой рпЖрокро╛ рпИро│рпЗроп род роиро┐ ро▒ро╛ роЕрпИро╡ рпЖрокро╛ рпЖроХро╛ рпИро▒ропро┐ роороп роХ роП рок роХро┐ ро▒рой. тАШ роЯро╛ рооро░ройро┐ роорпИройро╡ро┐тАЩ роО рпЖродро╛роЯро╛ро┐ роЯро╛ роО рок рооро░ рпЖрокропро░рпИроЯропро╛роХ ро╡ роХро┐ро▒родро╛ роЕ ро▓ роЕро╡ роорпИройро╡ро┐ рпЖрокропро░рпИроЯропро╛роХ ро╡ роХро┐ро▒родро╛ роО роХро┐ро▒ ро┤ рок роП рок роХро┐ро▒ . роЗ родрпИроХроп роиро┐рпИро▓ропро┐ рпЗро╡ рпИроо роЙ роорпИро▒ ро╡ ро╡родро╛ роЯро╛ роО рокрод роЕ , роХро╛ ро│ро┐ роЗ роО родро╛родродро╛ роЗ родрпИроХроп

ро┤ рок роП рок роХро┐ро▒ . роЗродрпИрой роЕрпИроо рпЖрокро╛ роороп роХ (Structural Ambiguity) роО рпЖрооро╛ро┤ро┐ропро┐роп роЕро▒ро┐роЮ роХ ро╡ . рпЖродро╛роЯро╛ро┐ ро▒роиро┐рпИро▓ропро┐ роЕроХроиро┐рпИро▓ропро┐ рооро╛ рокроЯро╛роо ро┤ рокрооро┐ ро▒ро┐ роЗ родро╛ роЕрпИро╡ роО рпЖроХро╛ рпИро▒ропро┐ ро┤ род рпЖрокро╛ ро│ро┐ рпЗро╡ рок роХро┐ ро▒рой.

Page 22: Computational Linguistics - INFITT

183

3. рпЖроЪро╛ роХрпИро│ рокро┐ро╛ро┐ рпЗроЪ роО роХро┐ ро▒ роиро┐рпИро▓ропро┐ роП рок роХро┐ро▒ рпЖрокро╛ рпЖроЪро╛ роХрпИро│ рокро┐ро╛ро┐ рпЗроЪ роО роХро┐ ро▒ роиро┐рпИро▓ропро┐ роП рок роХро┐ро▒ рпЖрокро╛ рпЖроЪро╛ роХрпИро│ рокро┐ро╛ро┐ рпЗроЪ роО роХро┐ ро▒ роиро┐рпИро▓ропро┐ роП рок роХро┐ро▒ рпЖрокро╛ рпЖроЪро╛ роХрпИро│ рокро┐ро╛ро┐ рпЗроЪ роО роХро┐ ро▒ роиро┐рпИро▓ропро┐ роП рок роХро┐ро▒ рпЖрокро╛ роороп роХроороп роХроороп роХроороп роХ

родрооро┐ро┤ро┐ рпЗро╡ рпЖроЪро╛ роЯ рок рпЗро╡ рок роЯ роТ роХ роЗрпИрогроХро┐ ро▒рой. роЕ ро╡ро╛ роЗрпИрог рпЗрокро╛ роЕро╡ рпЗро│рпЗроп роУ роЗрпИроп ро╡ро┐родро┐ роЙ ро╡ро╛роХро┐ ро▒ . роЗ ро╡ро╛ рпЖроЪро╛ роХ роЯ роТ роХрпИро│ роЗрпИрог рпЗрокро╛ рпЖроЪро╛ роХрпИро│ рокро┐ро╛ро┐ рпЗроЪ роО роХро┐ ро▒ ро╡ро┤ роХ роХро╛рог рок роХро┐ ро▒ .

родрооро┐ро┤ро┐ рпЖрооро╛ро┤ро┐ропро┐роп ро╡ро┐родро┐ рок родройро┐ роиро┐ рпЖрокро╛ родро░ро╛род рпИрогро╡ро┐рпИройроХ (Auxiliary Verb),

роТ роХ (Affixes) рооро┐родрпИро╡ роТ роХ (Clitic) рпЗрокро╛ ро▒ро╡ рпИро▒ рокро┐ро╛ро┐ роО род роЯро╛ роО рокрпИрод роорпА ро╡ рпЖрокро╛ роороп роХ родро┐ роХро┐роп роХро╛ро░рогрооро╛ .

рпЖрокро╛ ро╡ро╛роХ роТ рпЖроЪро╛ рпИро▓ рокро┐ро╛ро┐ рпЗродро╛ рпЗроЪ рпЗродро╛ роО рпЗрокро╛ ро▒ро╡ род роХ родро┐ роЕ рокрпИроЯрпЗроп рооро╛ роХро┐ ро▒ роиро┐рпИро▓ роП рок роХро┐ро▒ . роО роХро╛ роЯро╛роХ, роЕро╡ роЯрпЗрой роО рпЗроЪ роО родро┐ройро╛ with him

роО рпЖрокро╛ рок . роЕро╡ роЙроЯрпЗрой роО рокро┐ро╛ро┐ роО родро┐ройро╛ he at once роО рпЖрокро╛ рок . роОройрпЗро╡ рооро┐роХ роХро╡рой рпЗродро╛ роЗроЯрооро▒ро┐ рпЖрокро╛ роороп роХ роП рокроЯро╛родро╡ро╛ рпЗроЪ рпЗродро╛ рокро┐ро╛ро┐ рпЗродро╛ роО родрпЗро╡ .

рок роХрпИро▓ роХро┤роХ , рпЖродро╛ро┤ро┐ рок рпЗрокро╛ ро▒ роЪро┐ро▓ роХрпИро▓ рпЖроЪро╛ роХрпИро│ рокро┐ро╛ро┐ роО род роЯро╛ .

роЗ рпЗрокро╛ро▓ рпЖрооро╛ро┤ро┐ рокроп рокро╛ ро╡ро┐родро┐роХрпИро│ рпИро▒ропро╛роХ рокроп рок родро┐ройро╛ роХрогро┐ройро┐ро╡ро┤ро┐ рпЖрооро╛ро┤ро┐ропро╛ рпЖрокро╛ роороп роХрооро┐ ро▒ро┐ ро╡ро╛роЪро┐ рокрод рокроп род .

тАв рпИрогро╡ро┐рпИройроХрпИрогро╡ро┐рпИройроХрпИрогро╡ро┐рпИройроХрпИрогро╡ро┐рпИройроХ ро╡ро┐ро╡ро┐ро╡ро┐ро╡ро┐ (ро╡ ро╡ро┐ , рпЗрокро╛ ро╡ро┐ , рок ро╡ро┐ , роХро┐ро╡ро┐ ). рокрокрокрок (рокро╛ рок , рпЗро╡родрпИрой рок , роЖрпИроЪ рок ).

роЗроЗроЗроЗ (рокро╛ рпЖроХро╛ , рок рпЖроХро╛ ). роЗроЗроЗроЗ рпЗроЪ родро┐ , роХро╛ , рокро╛ родро┐ ). рпЖроХро╛рпЖроХро╛рпЖроХро╛рпЖроХро╛

(рпЖродро╛ро┐ рпЖроХро╛ , рокро╛ рпЖроХро╛ ). рпЖроХро╛ ро│рпЖроХро╛ ро│рпЖроХро╛ ро│рпЖроХро╛ ро│ (рокро╛ рпЖроХро╛ ро│, рпЗрокроЪро┐ рпЖроХро╛ ро│, роЕро▒ро┐

рпЖроХро╛ ро│). ро╡ро┐ро╡ро┐ро╡ро┐ро╡ро┐ , ро╡ро┐ роЯро╡ро┐ роЯро╡ро┐ роЯро╡ро┐ роЯ (рокро╛ ро╡ро┐ , рпЗрокроЪро┐ро╡ро┐ , рокро╛ ро╡ро┐ роЯ , рпЗрокро╛ ро╡ро┐ роЯ ). рокрокрокрок ,

рок роЯрок роЯрок роЯрок роЯ (роЕро▒ро┐роп рок , ро╡ро┐ро│ роХ рок , ро▒ рок роЯ , рпЗроЪ роХ рок роЯ ). рпЗро╡рпЗро╡рпЗро╡рпЗро╡ (рокро╛ роХ

рпЗро╡ , рпЖроЪ ро▓рпЗро╡ , роО родрпЗро╡ ). роЙ ро│роЙ ро│роЙ ро│роЙ ро│ (рпЖродро╛ро┐ропро╡ ро│ , рокро╛роЯ рок ро│ ).

рпЖроХро╛ , роЙ , роЖ , рпЗрокро╛ , ро╡ , род , роЙ роЗ рпЗрокро╛ ро▒ роР рок рпЗроо рок роЯ рпИрогро╡ро┐рпИройроХ

роО ро╡ро┤ роХро┐ рпЗрок ро╡ро┤ роХро┐ роХро╛рог рок роХро┐ ро▒рой. роТ рпЖродро╛роЯро╛ро┐ роТ рпЗроо рок роЯ

рпИрогро╡ро┐рпИройроХ роЗрпИрог ро╡ .

роЕро╡ роХ рок ро╡ро┐рок ро╡ро┐рок ро╡ро┐рок ро╡ро┐ рпЖроЪ ро▒рой . роЕро╡ роХ рок ро╡ро┐рок ро╡ро┐рок ро╡ро┐рок ро╡ро┐ рпЖроЪ ро▒рой .

рокро┐ро╛ро┐ роО родро┐ропродро╛ роЗ ро╡ро┐ рпЖродро╛роЯ роХ роХро┐рпИроЯрпЗроп рпЖрокро╛ рпЗро╡ рокро╛ рпЖродро│ро┐ро╡ро╛роХ рпЖродро╛ро┐роХро┐ро▒ .

тАв рооро┐родрпИро╡ роТрооро┐родрпИро╡ роТрооро┐родрпИро╡ роТрооро┐родрпИро╡ роТ родро╛ - роЕрпИрод родро╛ , роЕро╡ родро╛ , роЕ рпЗрокро╛ родро╛ , роЕродройро╛ родро╛ .

я┐╜ рокро┐ рпЖройро╛рокро┐ рпЖройро╛рокро┐ рпЖройро╛рокро┐ рпЖройро╛

роХрпАроХрпАроХрпАроХрпА , рпЗроорпЗроорпЗроорпЗроо - рпИро▒ропро┐ роХрпА , родрпИро▓рпЗроо . ро╡ро┤ро┐ро╡ро┤ро┐ро╡ро┤ро┐ро╡ро┤ро┐ - роХрогро┐ройро┐ро╡ро┤ро┐, роЕрод ро╡ро┤ро┐. ро╡ро┐роЯро╡ро┐роЯро╡ро┐роЯро╡ро┐роЯ - роЕро╡рпИройро╡ро┐роЯ, рпЗрокроЪро┐ропрпИродро╡ро┐роЯ.

я┐╜ ро╡ро┐рпИройро╡ро┐рпИройро╡ро┐рпИройро╡ро┐рпИрой ро╡ро┐ родро┐ро╡ро┐ родро┐ро╡ро┐ родро┐ро╡ро┐ родро┐ рпЗрокро╛рпЗрокро╛рпЗрокро╛рпЗрокро╛ - рпЖроЪро╛ ройрпЗрокро╛ , рокро╛ родрпЗрокро╛ . рокрокрокрок - роЕрод рок , рпЖроЪро╛ ройрок .

я┐╜ рпЖрокро╛ роиро┐рпИро▓рпЖрокро╛ роиро┐рпИро▓рпЖрокро╛ роиро┐рпИро▓рпЖрокро╛ роиро┐рпИро▓

роХроХроХроХ - роЕрод роХ . роХро╛ро▓роХро╛ро▓роХро╛ро▓роХро╛ро▓ - роЗрпИроЯ роХро╛ро▓ , роЪ роХроХро╛ро▓ . ро╡ро░ро╡ро░ро╡ро░ро╡ро░ - рпЖроЪ ро╡ро░, роироЯ ро╡ро░.

Page 23: Computational Linguistics - INFITT

184

роЙ рокройро┐роп рпЖрокро╛ роороп роХроЙ рокройро┐роп рпЖрокро╛ роороп роХроЙ рокройро┐роп рпЖрокро╛ роороп роХроЙ рокройро┐роп рпЖрокро╛ роороп роХ

роТ рпЖроЪро╛ роУ роЙ рок рпЖроХро╛ роЯродро╛роХрпЗро╡ро╛ роЕ ро▓ роЕрод рпЗроо рок роЯ роЙ рок роХро│ро╛роХрпЗро╡ро╛ роЗ роХро▓ро╛ .

рок рпЗро╡ роЙ рок роХро│ро╛ роЙ ро╡ро╛рой рпЖроЪро╛ роХрпИро│ роХрогро┐ройро┐ро╡ро┤ро┐ рок рокро╛ рпЖроЪ ро╡ тАШроЙ рокройро┐роп рок рокро╛ тАЩ роО рокродро╛ . роЗрод роХро╛роХ роЙ рокройро┐роп рок рокро╛ ро╡ро┐роХ (Morphological Parsers) роЙ ро╡ро╛ роХ

рок ро╡ роХро┐ ро▒рой. роЗ ро╡ро╛ роЙ ро╡ро╛ рпЗрокро╛ рпЖрокро╛ роороп роХ рпЖроЪро╛ роХро│ро┐ роЪро┐ роХ роХ рпЗроиро╛ роХ

род роХродро╛роХ роЙ ро│рой.

роЗроп родро┐ро░ рпЖрооро╛ро┤ро┐рпЖрокроп рокро┐ (Machine Translation) роХрогро┐ройро┐рпЖрооро╛ро┤ро┐ропро┐роп ро╡ро┐родро┐ропро╛рой роЗ роиро┐рпИро▓ роЙ рокройро┐роп (Two Level Morphology) роО ро▒ рпЖрооро╛ро┤ро┐ род рпИроо ро▒ро┐ роЖро░ро╛ ро╡ . роТ рпЖродро╛роЯро╛ро┐ роЕ роиро┐рпИро▓ (Deep Structure), ро▒роиро┐рпИро▓ (Surface Structure) роЖроХро┐роп роЗро░ роХро╛рог рок . роЗро╡

ро▒роиро┐рпИро▓ропро┐ роО родро╡ро┐род рооро╛ рокро╛ роП рок ро╡родро┐ рпИро▓. роЖройро╛ , рпЖрокро╛ роороп роХ рпЖроЪро╛ роХ ро╡ рпЗрокро╛ роЕроХроиро┐рпИро▓ропро┐ ро┤ рок роП рок роХро┐ро▒ .

родрооро┐ро┤ро┐ роХро╛рог рок рпЖродро╛роЯ роХро│ро┐ рпЗро╡ рпЖроЪро╛ роХ родройро┐ ро╡ро┐ родро┐роХрпЗро│ роХро╛рог рок роХро┐ ро▒рой.

родройро┐ род рпЖроЪро╛ роХрпИро│ роХ роЯро▒ро┐ро╡род роЕроХро░ро╛родро┐роХрпИро│ рокроп рок родро▓ро╛ . роо ро▒ро╡ рпИро▒ роЙ ро│рпА рпЖроЪ

роЖ рпЖроЪ рпЗрод рок родро▒ро┐роп . рпЗро╡ рпЖроЪро╛ роХрпИро│ роТ роХрпИро│ рок , рпЖрокро╛ роороп роХрооро┐ ро▒ро┐ ро╡рпИроХ рок ро╡род роЙ рокройро┐роп рок рокро╛ роЕро╡роЪро┐ропрооро╛роХро┐ро▒ .

рпЖрооро╛ро┤ро┐ропро┐ропрпЖрооро╛ро┤ро┐ропро┐ропрпЖрооро╛ро┤ро┐ропро┐ропрпЖрооро╛ро┤ро┐ропро┐роп ро╡рпИроХ рокро╛ро╡рпИроХ рокро╛ро╡рпИроХ рокро╛ро╡рпИроХ рокро╛ рпЖрокро╛ роороп роХрпЖрокро╛ роороп роХрпЖрокро╛ роороп роХрпЖрокро╛ роороп роХ

рпЖрооро╛ро┤ро┐ропро┐роп роЕ рокрпИроЯропро┐ рпЖрокро╛ роороп роХ рпИрод, роТ ропройро┐ропроТ ропройро┐ропроТ ропройро┐ропроТ ропройро┐роп (Phonology), роЙ рокройро┐ропроЙ рокройро┐ропроЙ рокройро┐ропроЙ рокройро┐роп

(Morphology), рпЖродро╛роЯро╛ро┐ропрпЖродро╛роЯро╛ро┐ропрпЖродро╛роЯро╛ро┐ропрпЖродро╛роЯро╛ро┐роп (Syntax), рпЖроЪро╛ рпЖрокро╛ рпИрооропро┐ропрпЖроЪро╛ рпЖрокро╛ рпИрооропро┐ропрпЖроЪро╛ рпЖрокро╛ рпИрооропро┐ропрпЖроЪро╛ рпЖрокро╛ рпИрооропро┐роп (Semantics), роХроХроХроХ родро╛роЯродро╛роЯродро╛роЯродро╛роЯ (Discourse)

роЖроХро┐роп роиро┐рпИро▓роХро│ро┐ ро╡рпИроХ рок родро▓ро╛ .

роТ ропройро┐ропроТ ропройро┐ропроТ ропройро┐ропроТ ропройро┐роп (роЪ родро┐) роиро┐рпИро▓ропро┐ , тАШрпЗро╡рпИро▓ рпЖроЪ родро╛ тАЩ, тАШрпЗро╡рпИро▓ рпЖроЪ родро╛ тАЩ роО рокро╡ ро▒ро┐ родро▓ро╛ро╡

рпЗро╡рпИро▓ рокрогро┐рпИроп ро▒ро┐ роХро┐ро▒ , роЗро░ роЯро╛ро╡ рпЗро╡рпИро▓ роХ ро╡ро┐рпИроп ро▒ро┐ роХро┐ро▒ . роЙ рокройро┐ропроЙ рокройро┐ропроЙ рокройро┐ропроЙ рокройро┐роп роиро┐рпИро▓ропро┐ ,

тАШроиро╛ роХ родро┐ ро╡ро┐ рпЗро▒ тАЩ роО ро▒ рпЖродро╛роЯро╛ро┐ роХ родро┐ роО ро▒ рпЖрокропрпИро░ ро▒ро┐ роХро┐ро▒родро╛ роЕ ро▓ ро╡ро┐рпИройрпИроп

ро▒ро┐ роХро┐ро▒родро╛ роО рокродро┐ ро┤ рок роП рок роХро┐ро▒ . рпЖродро╛роЯро╛ро┐ропрпЖродро╛роЯро╛ро┐ропрпЖродро╛роЯро╛ро┐ропрпЖродро╛роЯро╛ро┐роп роиро┐рпИро▓ропро┐ , тАШроиро╛ роЗро░ро╛роорпЗройро╛ роЪрпАрпИродрпИроп

рокро╛ рпЗрод тАЩ роО ро▒ рпЖродро╛роЯро╛ро┐ роЗро░ ро╡рпИроХропро╛роХ рпЖрокро╛ рпЖроХро╛ ро│ро▓ро╛ . роиро╛ роЗро░ро╛роо роЪрпАрпИродрпИроп

рокро╛ рпЗродро╛ роО роиро╛ роЗро░ро╛роо роЪрпАрпИрод рпЗроЪ родро┐ рпЗрокро╛ рокро╛ рпЗрод роО рпЖрокро╛

рок роХро┐ро▒ . рпЖроЪро╛ рпЖрокро╛ рпИроорпЖроЪро╛ рпЖрокро╛ рпИроорпЖроЪро╛ рпЖрокро╛ рпИроорпЖроЪро╛ рпЖрокро╛ рпИроо роиро┐рпИро▓ропро┐ , тАШрок рпИроЪ роХро╛ роХро▒ро┐тАЩ, тАШрок рпИроЪ рпЖрокро╛ тАЩ, тАШрок рпИроЪ роЙроЯ тАЩ роЖроХро┐роп

рпЖродро╛роЯ роХро│ро┐ рок рпИроЪ роО ро▒ рпЖроЪро╛ рпЗро╡ рок роЯ рпЖрокро╛ роХрпИро│ ро▒ро┐ роиро┐ роХро┐ро▒ . ро▒ро┐ роО род

рпЖрокро╛ рпИро│ роО рпЖроХро╛ ро╡ роО рок роЕрод роЕ род рпЖроЪро╛ рпИро▓ рпЖрокро╛ род . роХ родро╛роЯроХ родро╛роЯроХ родро╛роЯроХ родро╛роЯ роиро┐рпИро▓ропро┐ ,

роП рок роХро┐ро▒ рпЖрокро╛ роороп роХ рпИрод роХрогро┐ройро┐ роХ родро░ ропро╛ . роЕро╡ рпИро▒ роЙро▓роХро┐роп роЕро▒ро┐ро╡ро┐

(Pragmatic Knowledge) ро╡ро╛ропро┐ро▓ро╛роХрпЗро╡ роЙрогро░ .

рпЗроо ро▒ро┐ род рпЖрокро╛ роороп роХ роХрпИро│ родрпА рпИро╡ роХ роп роЕро▒ро┐рпИро╡ - ро╡ро┤ро┐ рпИро▒роХрпИро│ роО ро╡ро╛

роХрогро┐ройро┐ роЕро│ро┐ рок ро▒ро┐ , рок рпЗро╡ роиро┐рпИро▓роХро│ро┐ роЖро░ро╛роп рпЖрок роХро┐ ро▒рой.

рпЖрокро╛ роороп роХ рпИрод родро╡ро┐ рокрод ро╛ро┐роп рпЖрокро╛ ро╡ро╛рой роЪро┐ро▓ ро╡ро┤ро┐ рпИро▒роХрпЖрокро╛ роороп роХ рпИрод родро╡ро┐ рокрод ро╛ро┐роп рпЖрокро╛ ро╡ро╛рой роЪро┐ро▓ ро╡ро┤ро┐ рпИро▒роХрпЖрокро╛ роороп роХ рпИрод родро╡ро┐ рокрод ро╛ро┐роп рпЖрокро╛ ро╡ро╛рой роЪро┐ро▓ ро╡ро┤ро┐ рпИро▒роХрпЖрокро╛ роороп роХ рпИрод родро╡ро┐ рокрод ро╛ро┐роп рпЖрокро╛ ро╡ро╛рой роЪро┐ро▓ ро╡ро┤ро┐ рпИро▒роХ

роХрогро┐ройро┐ро╡ро┤ро┐ родрооро┐ рпЖродро╛роЯ роХрпИро│ роЖ рпЖроЪ рпЗрокро╛ роП рок роХро┐ро▒ рпЖрокро╛ рооропроХ рпИрод роирпА роХро┐

рпЖрокро╛ рпИро│ рпЖродро│ро┐ро╡ро╛роХ ро╛ро┐ рпЖроХро╛ ро╡род роЙ рпЖрокро╛ ропройро┐роп рооро╛ ро▒ роХ рпИрог ро╛ро┐роХро┐ ро▒рой.

рпЖрокро╛ роороп роХ рпИрод роЗро▓ роХрог ро╡рпИроХ рокро╛ ро╡ро╛ропро┐ро▓ро╛роХрпЗро╡ рпЖродро│ро┐ рок род . рпЖрокроп , ро╡ро┐рпИрой

роЕ рокрпИроЯропро┐ роЙ ро╡ро╛ рпЖроЪро╛ роХро│ро╛роХ роЙ рокройро┐роп , рпЖродро╛роЯро╛ро┐роп рок рокро╛ роХрпИро│ рпЖроХро╛

роЕ рпЖроЪро╛ , ро╡ро┐ родро┐роХ роЖроХро┐ропро╡ рпИро▒ рок родро╛ роЗро╡ рпИро▒ роЪро╛ро┐рпЖроЪ роп .

Page 24: Computational Linguistics - INFITT

185

тАШроЕро╡ рпЖрои родро╛ ро╡ро┐ ро▒ро╛ тАЩ роО ро▒ рпЖродро╛роЯро╛ро┐ , роЕро╡ рпЖрои рпИроп родро╛ (рпЖрои +родро╛ ) ро╡ро┐ ро▒ро╛ роО

рпЗро╡ рпИроо роорпИро▒ роиро┐ рпЖрокро╛ род роХро┐ро▒родро╛? роЕ ро▓ роЕро╡ рогро┐рпИроп рпЖрои родро╛ (рпЖрои + + +роЖ )

рокро┐ро▒ ро╡ро┐ ро▒ро╛ роО ро▒ рпЖрокро╛ рок роХро┐ро▒родро╛? роО ро▒ роРроп роП рок роХро┐ро▒ . роЗ родрпИроХроп роиро┐рпИро▓ропро┐ рпЖродро╛роЯро╛ро┐роп

роЖ ро╡ро┐ роЕ рокрпИроЯропро┐рпЗро▓рпЗроп рпЖродро│ро┐ рпЖрокро▒ .

роЕ рпЖроЪро╛ ро▓ро╛ роП рок роХро┐ро▒ рпЖрокро╛ роороп роХ рпИрод ро╡ро┐ родро┐роХрпИро│ рпЖроХро╛ рпЖродро│ро┐ рпЖрокро▒ро▓ро╛ . ро╡ро┐ родро┐роХро│ро╛

роП рок роХро┐ро▒ рпЖрокро╛ роороп роХ родро┐ роЕ рпЖроЪро╛ рпИро▓ рпЖроХро╛ рпЖродро│ро┐ рпЖрокро▒ро▓ро╛ . роО роХро╛ роЯро╛роХ,

тАШрок родро╛ тАЩ роО ро▒ рпЖроЪро╛ рок роО рок рпЖрокропро░ро╛роХ ро╡ рпЗрокро╛ рок родро╛ роО ро╡ро┐рпИройропро╛роХ

ро╡ рпЗрокро╛ рок родро╛ роО ро╡ роО рокродрпИрой роЕ рпЖроЪро╛ ро╡ро╛ропро┐ро▓ро╛роХ рпЖрокро▒ роХро┐ро▒ . тАШроЖ тАЩ

роО ро╡ро┐ родро┐ тАШроЕро╡ройро╛ роиро╛ ро╡ рпЗрод тАЩ роО рпЖродро╛роЯро╛ро┐ рпЖрокроп рокро┐ ро╡ родродро╛ рпЗро╡ рпИроо

ро╡ро┐ родро┐ роО ,тАШро╡ родро╛ роиро╛ ро╡ рпЗро╡ тАЩ роО рпЖродро╛роЯро╛ро┐ ро╡ро┐рпИрой рокро┐ро▒ ро╡ родродро╛ роЖ роО рок

роиро┐рок родрпИрой ро╡ро┐ родро┐ роО рок роХ роЯро▒ро┐роп роХро┐ро▒ .

тАШроЗ тАЩ роО ро▒ рпЖроЪро╛ роЗ рпЗро╡ рпЖрокро╛ род роХро┐ ро▒рой .роЕро╡ рпИро▒ роЗроЯ рпЖрокро╛ роЕ рокрпИроЯропро┐рпЗро▓рпЗроп рпЗроЪ рпЗродро╛ рокро┐ро╛ро┐ рпЗродро╛ роО род . ро╡ро┐ рпИроЪ рокро┐ роХро╛роХ , ро╡рпИроХ рок ро╡род роХро╛роХ , рпЖрокро╛ рпЖродро│ро┐ро╡ро┐ роХро╛роХ роХро╛ ро│ро┐ тАШ,тАЩ роЗ роО ро╡ роХ роЯро╛ропрооро╛роХро┐ро▒ . роЗ рпЗрокро╛ ро▒ рок рпЗро╡ рпЖрооро╛ро┤ро┐ рокроп рокро╛ рпЖроиро▒ро┐роХ родрооро┐ рпЖрооро╛ро┤ро┐ роЗро▓ роХрог роХро│ро┐ рпЖрооро╛ро┤ро┐ропро┐роп ро╡ро┐родро┐роХро│ро┐ роХро╛рог роХро┐рпИроЯ

роХро┐ ро▒рой.

роиро┐рпИро▒ро╡ро╛роХроиро┐рпИро▒ро╡ро╛роХроиро┐рпИро▒ро╡ро╛роХроиро┐рпИро▒ро╡ро╛роХ

рпЖрокро╛ роороп роХ родро┐ роХро╛рой роЕрпИроЯ рокрпИроЯ роХро╛ро░рог роХ , рпЖрокро╛ роороп роХ роП рок ро╡род ро╛ро┐роп роиро┐рпИро▓ рокро╛ роХрпИро│ ро▒ро╛роХ рок рпЖрооро╛ро┤ро┐ропро┐роп ро╡рпИроХ рокро╛ род род роО роХро╛ роХ роЯ

роЖро░ро╛роп рпЖрок ро▒рой. рпЗроо , рпЖрокро╛ роороп роХ рпИрод родро╡ро┐ рокрод ро╛ро┐роп рпЖрокро╛ ро╡ро╛рой роЪро┐ро▓ ро╡ро┤ро┐ рпИро▒роХ ,

роХрогро┐ройро┐ро╡ро┤ро┐ родрооро┐ро┤ро╛ рпЖроЪ рпЗрокро╛ роП рок роХро┐ро▒ роЪро┐ роХ роХ роЖро░ро╛роп рпЖрок ро▒рой. роТ рпЖродро╛роЯрпИро░ роО рпЗрокро╛ рпЖрокроп , ро╡ро┐рпИрой, рпИрогро╡ро┐рпИрой рпЗрокро╛ ро▒ роЕ рокрпИроЯ рпЗро╡ рокро╛ роХрпИро│ роЕро▒ро┐ ,рокроп рок родро┐ройро╛ рок рпЗро╡ рпЖрооро╛ро┤ро┐ рокроп рокро╛ роЪро┐ роХ роХ роЪро╛ро┐рпЖроЪ роп рок . роЕрпИройро╡ роТрпЗро░ро╡ро┐родрооро╛рой рпЖрооро╛ро┤ро┐ рокроп рокро╛ рпЖроХро╛ рпИроХрпИроп рокроп рок ро╡род ро╡ро┤ро┐ ,роХрогро┐ройро┐ро╡ро┤ро┐ рпЖрооро╛ро┤ро┐ропро╛ рпЖроЪ ро╡род роОро│ро┐рпИрооропро╛роХ роЗ . роЗ рпЗрокро╛ ро▒ рок рпЗро╡ рпЖрооро╛ро┤ро┐ропрпИроо роХрпИро│ рпИро▒ рок род

рпЗро╡ роп роХ роЯро╛роп роП рок ро│ роО рокрпИрод роЗ роХ рпИро░ роХро╛ роХро┐ро▒ .

рпЗрод рпЖрод роХ рок роЯрпЗрод рпЖрод роХ рок роЯрпЗрод рпЖрод роХ рок роЯрпЗрод рпЖрод роХ рок роЯ рпИрог рок ропрпИрог рок ропрпИрог рок ропрпИрог рок роп

1. рпИройро╡ роЪ .роЕроХ родро┐роп роХ ,родрооро┐ рпЖрооро╛ро┤ро┐ роЕрпИроо рокро┐ропродрооро┐ рпЖрооро╛ро┤ро┐ роЕрпИроо рокро┐ропродрооро┐ рпЖрооро╛ро┤ро┐ роЕрпИроо рокро┐ропродрооро┐ рпЖрооро╛ро┤ро┐ роЕрпИроо рокро┐роп ,рпЖроо роп рок родрооро┐ро┤ро╛ ро╡роХ ,роЪро┐род рокро░ . 2. роЯро╛ роЯ рпЖрокро╛ рпЗроХро╛, (2006), роЗ роХро╛ро▓роЗ роХро╛ро▓роЗ роХро╛ро▓роЗ роХро╛ро▓ родрооро┐родрооро┐родрооро┐родрооро┐ роЗро▓ роХрогроЗро▓ роХрогроЗро▓ роХрогроЗро▓ роХрог , рпЖрокро╛ро┤ро┐ рпЖро╡ро│ро┐ ,рпЖроЪ рпИрой. 3. роО .роП. роГрооро╛ , (2007), роЕ рокрпИроЯроЕ рокрпИроЯроЕ рокрпИроЯроЕ рокрпИроЯ родрооро┐родрооро┐родрооро┐родрооро┐ роЗро▓ роХрогроЗро▓ роХрогроЗро▓ роХрогроЗро▓ роХрог , роЕрпИроЯропро╛ро│ ,родро┐ роЪро┐. 4. рпЗрокро░ро╛. роХро▓ро╛роиро┐родро┐ роЕ. роЪ роХродро╛ , (2008), родрооро┐ рпЖрооро╛ро┤ро┐родрооро┐ рпЖрооро╛ро┤ро┐родрооро┐ рпЖрооро╛ро┤ро┐родрооро┐ рпЖрооро╛ро┤ро┐ роЗро▓ роХрогроЗро▓ роХрогроЗро▓ роХрогроЗро▓ роХрог роЗроп роХроЗроп роХроЗроп роХроЗроп роХ , роиро┐ рпЖроЪ ро╛ро┐

ро╣ .

5. рпИройро╡ рпЖроЪ. рпИро╡. роЪ роХ , (2004), рпЖродро╛ роХро╛ рокро┐ропрпЖродро╛ роХро╛ рокро┐ропрпЖродро╛ роХро╛ рокро┐ропрпЖродро╛ роХро╛ рокро┐роп рпЖродро╛роЯро╛ро┐ропрпЖродро╛роЯро╛ро┐ропрпЖродро╛роЯро╛ро┐ропрпЖродро╛роЯро╛ро┐роп , роЙро▓роХ родрооро┐ро┤ро╛ро░ро╛ роЪро┐ роиро┐ ро╡рой .

6. рпИройро╡ роЕ. родро╛рпЗрооро╛родро░ , рпИрогро╡ро┐рпИройроХрпИрогро╡ро┐рпИройроХрпИрогро╡ро┐рпИройроХрпИрогро╡ро┐рпИройроХ , , , ,роЖ роХ рпИро░ .

7. родрооро┐родрооро┐родрооро┐родрооро┐ роЗрпИрогропроЗрпИрогропроЗрпИрогропроЗрпИрогроп 2010, рооро╛роиро╛ роХ рпИро░роХ . 8. Dr. M. Suseela, (2001), A Historical Study of Old Tamil Syntax, Tamil University.

9. Thomas Lehman, (1993), A Grammar of Modern Tamil, Pondichery Institute of Linguistics and

Culture.

Page 25: Computational Linguistics - INFITT

186

роХрогро┐ройро┐ропро┐ рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ роТ рпЖрокропроХрогро┐ройро┐ропро┐ рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ роТ рпЖрокропроХрогро┐ройро┐ропро┐ рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ роТ рпЖрокропроХрогро┐ройро┐ропро┐ рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ роТ рпЖрокроп

рпИройро╡рпИройро╡рпИройро╡рпИройро╡ роЗро░ро╛родро╛роЗро░ро╛родро╛роЗро░ро╛родро╛роЗро░ро╛родро╛ рпЖроЪ ро▓ рокрпЖроЪ ро▓ рокрпЖроЪ ро▓ рокрпЖроЪ ро▓ рок

рпЗрокро░ро╛роЪро┐ро╛ро┐роп (роУ ) рокро╛ро░родро┐родро╛роЪ рок роХрпИро▓ роХро┤роХ , родро┐ роЪро┐ро░ро╛ рок ро│ро┐

рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ рпЖрокроп роО рок рпЗро░ро╛роо роО роХрпИро│ рокроп рок родро┐ родрооро┐ роЙрпИро░роХрпИро│ роТ роп ро╡ родро┐ роО ро╡ роЖ . роЕ ро╡ро╛ роО рпЗрокро╛ родрооро┐ роО роХ роХро╛рой род рокро╡ роТ роХ роХро┐рпИроЯ роХро╛родрпЗрокро╛ роЕ роХрооро╛рой роо рпЖро▒ро╛ роТ ропрпИрой рокроп рок родро┐ роО ро╡родро╛ . родрооро┐ рпЖрооро╛ро┤ро┐ропро┐ роЗ родрпИроХроп роп роЪро┐ родро┐ропрод ро▓. родрооро┐ро┤ро┐ роХро┐рпИроЯ род рпЖрооро╛ро┤ро┐рпЖрокроп рок роЯройро╛ роХрпАрпИрод роО рок . роЕ роЪроо роХро┐ род рокро╛роЯ роХрпИро│ родрооро┐ро┤ро┐ роТ рпЖрокроп ро│рой . родрооро┐ро┤ро┐ роЗ ро▓ро╛род роТ роХро│ро╛рой ро╕,ро╖, роЬ, ро╣, роЖроХро┐ропро╡ рпИро▒ роТ рпЖрокроп ро│рпЗрокро╛ роХро┐ро░ род роО роХрпИро│ рокроп рок родро┐рой . родрооро┐ро┤ро┐ роЗ ро▓ро╛род ро╡ роХ роО роХрпИро│ роО род роО рпИро▒ рокроп рок род рок ро│ .

рокро╛ро┐ родро╛ро░ро╛рогро╛роп ро╕ро╛ 4ройро╛ ро╡ро┐ройро╛роЪро╛роп роЪ1 3 родро╛ !

род4 рооро╕ родро╛2рокройро╛ родро╛2роп ро╕ рок4ро╡ро╛рооро┐ рпЗроХ3 рпЖроХ3 !!

рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ родро┐ родрооро┐ рок ро╡ роХрпИро│ роО ро╡ро┤ роХ рокро▓ро░ро╛ рок рпЖрой роХро╛ро▓рооро╛роХ рпИроХропро╛ро│ рок ро╡ ро╡родро╛ . роЖ роХро┐ро▓ родро┐рпЗро▓ роХ рпИро░ роО родрооро┐ро┤ро▒ро┐роЮ роХ родрооро┐ роЪро┐ро▒ рпЖрокроп

роХрпИро│ (роЖ рпЖрокроп , роК рпЖрокроп родро▓ро╛ройрпИро╡) рпЖроЪро╛ роХрпИро│ рпЗро░ро╛роо роО родро┐ роО роХро┐ ро▒рой . родрооро┐ро┤ рпЗроХ роЙро╛ро┐роп роиро╛роХро╛ро┐роХ рок рокро╛ рпЖроЪро╛ роХрпИро│ роТ рпЖрокроп роО роХро┐ ро▒рой . роХ ро╡ро┐ роиро┐рпИро▓ропро┐ родрооро┐рпИро┤ роЖ роХро┐ро▓ ро╡ро┤ро┐ роХ роХ ро╡ро┐ рпЗро╡ро╛ рпЗро░ро╛роо ро╡ ро╡ро┐ родрооро┐рпИро┤ роО родро┐ роХ ро▒рой . родрооро┐ ро╡ро╛ро┐ро╡ ро╡ рпЖродро╛ро┐ропро╛родро╡ роХ родрооро┐ роХ рокро┐ роХ рпЗро░ро╛роо ро╡ро╛ро┐ро╡ рпИрод рокро▓ рокроп рок родро┐рой . роЕро╡ роХ роХро┐ропрооро╛роХ, ро░рооро╛ ройро┐ро╡ , рпЗрокро╛ роЖроХро┐рпЗропро╛рпИро░ ро▒ро┐ рокро┐роЯро▓ро╛ . рпЖрооро╛ро┤ро┐ропро┐роп роЕро▒ро┐роЮ роХ рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ рпИрод рооро┐роХ роЕродро┐роХрооро╛роХ рокроп рок роХро┐ ро▒рой . роТ роЪро╛ роХрпИро│ роТ роп роЪро╛ роХрпИро│ роХро╛ роЯ рпЖроЪро╛ роХрпИро│ роЪро╛ роХро│ро╛роХ роХро╛ роЯ рокро┐ро▒ рпЖрооро╛ро┤ро┐ рпЖроЪро╛ роХрпЗро│ро╛ роТ рокро┐ роХро╛ роЯ роОрой рок рпЗро╡ роиро┐рпИро▓роХро│ро┐ рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ рпИрод рокроп рок роХро┐ ро▒рой . роЕро╡ роХ ро▒ро┐ рокро┐роЯ род роХ рпЗрооройро╛ роЯро╡ роХро│ро╛роХ, ро░ро╛ роо ро░ро╛ , роХро╛ рпЖро╡ роЖроХро┐рпЗропро╛рпИро░

ро▒ро┐ рокро┐роЯро▓ро╛ . родрооро┐ро┤ро╛ ро╡ро┐рпЗро▓ роЖ ро╡ рпИроЯроп рпЖро╡ро│ро┐роиро╛ роЯро╡ рокро┐ро▒ родро┐ро░ро╛ро╡ро┐роЯ рпЖрооро╛ро┤ро┐ропро╛ро░ро╛ роЪро┐ропро╛ро│

роХ родрооро┐рпИро┤ рпЗро░ро╛роо роО родро┐рпН роО родро┐ рокроп рок родро┐рой . родрооро┐ро┤ рокро┐ро▒ роиро╛ роХро│ро┐ роЗро░ , роЕ ро▓ роиро╛ рокро░ рокрпИро░роХ рпЗропро▒ро┐ ро╡ро╛ ро╡ роиро┐рпИро▓ роЙ ро│ . роЕро╡ роХ род родро╛ рпЖрооро╛ро┤ро┐ропро╛ родрооро┐рпИро┤ рои рокроп рок род роЗропро▓ро╛родро╡ роХро│ро╛роХ роЙ ро│рой . рпЗрокроЪ рпЖродро╛ро┐ род роЕро│ро╡ро┐ роЕро╡ роХ роО родрпЗро╡ро╛ рок роХрпЗро╡ро╛ рокропро┐ роЪро┐ роХро┐рпИроЯ рокродро┐ рпИро▓. роЕ ро┤ ро╡ро╛ роЕро╡ роХ роироо рокро╛ро░ рокро╛ро┐роп рок родро┐ рокро╛роЯ роХрпИро│ рок ро╡ роХрпИро│ родрооро┐ роО роХро│ро╛ро▓ ро▒ро┐ рпЗро░ро╛роо роО роХро│ро╛рпЗро▓рпЗроп роЕро▒ро┐роХро┐ ро▒рой . роОройрпЗро╡ роЕро╡ роХ рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ роТ рпЖрокроп рооро┐роХ рпЗродрпИро╡ рок роХро┐ро▒ . роЪро╛ ро▒ро╛роХ, рпЖрооро╛ро╛рпАро╖ро┐роп рпЖрод ройро╛ рокро┐ро╛ро┐ роХро╛ род роп роиро╛ роХро│ро┐ ро╡ро┤ро┐рокро╛ рокро╛роЯ роХрпИро│ рпЗро░ро╛роо роО роХро│ро┐ роО родро┐ рокроп рок роХро┐ ро▒рой . рпЗроорпИро▓роиро╛ роЗ родро┐ропро╡ро┐роп роЖ ро╡ро╛ро│ роХ рпЗро░ро╛роо роО роХро│ро┐ роО ро╡родро┐ роЖ ро╡ роХро╛ ро╡ родрой . роЕ роХро╛ро▓ род роХро╛ро▓ роХрогро┐ройро┐ рой роЙ ро│ роХро╛ро▓ . роЕро╡ рпИро▒ родро░ рок род рпЗро╡ роО ро▒ рпЗроиро╛ роХ роЕро╡

роХро│ро┐рпИроЯрпЗроп 1888 роХро│ро┐рпЗро▓рпЗроп ро╡ро┐ро╡ро╛родро┐ роХ рок роЯродро╛роХ роЕро▒ро┐роХро┐рпЗро▒ро╛ .

рпЗро░ро╛роо роО роХрпИро│ рокроп рок родро┐ родро┐ро░ро╛ро╡ро┐роЯ рпЖрооро╛ро┤ро┐роХрпИро│ роО рпИро▒ роПро▒ родро╛ро┤ роТ ро▒ро╛ рокро┐ рпЗрод рокроп рок род рок роЯ . роЗ рпИро▒роп роХрогро┐ройро┐ роХ родро┐ рпЗро░ро╛роо

Page 26: Computational Linguistics - INFITT

187

ро╡ро╛ро┐ро╡ ро╡ рооро┐роХ рпЗродрпИро╡ рок роТ . родрооро┐ роЗро▓ роХро┐роп роХрпИро│ рокро╛ро░ро▒ро┐роп рпЖроЪ рпЗроиро╛ роХро┐ рокро▓ роп ро╡ роХро┐ ро▒рой . роХро╛ роЯро╛роХ, роо рпИро░ родро┐ роЯ родрооро┐ роЗро▓ роХро┐роп роХрпИро│ рпЗро░ро╛роо ро╡ ро╡

рпЖрокроп рокро┐ род роХро┐ро▒ . рпИро▓ ро░ро╛ро┐ роЖ роХро╛ роХро┐ро░ роЕрпЖрооро╛ро┐ роХ роРрпЗро░ро╛ рокро┐роп роиро╛ роХро│ро┐ ро│ роЕро╡ роХ рпИроЯроп ро▓роХ роХ ро╡рпИро▓роп родро┐ род рок ропрпИро▓, рпЗрод рокро╛ ро╡роЪродро┐ роЯ роЗ ро│рой. Digital Dictionaries of South India роО ро▒ родро│ родро┐ рокро▓ рпЖрооро╛ро┤ро┐ роЕроХро░ро╛родро┐роХ роЙ ро│рой. роЗро╡ ро▒ро┐ рпЖроЪро╛ роХрпИро│ рпЗродроЯ рпЗро░ро╛роо роО роХ рокроп рок род рок роХро┐ ро▒рой. родрооро┐ро┤ро┐ роО ро╡род роЕродро┐роХ рокро┤ роХрооро┐ ро▓ро╛род родрооро┐ро┤ роХ роо роороп рпЖроХро╛ роХрпИро│ ро▒ро┐роп рпЖродро│ро┐ро╡ро┐ ро▓ро╛родро╡ роХ рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ рпИрод рокроп рок роХро┐ ро▒рой . роЗ ро╡ро╛ро▒ро╛рой рпЗродроЯ ро╡роЪродро┐ропро╛роХ рокро┐рпЖро│ роЖ роХро┐ ро╡ ро╡ роХ роЕро╡ ро▒ро┐ роХро╛рой роЪро┐ро▒ ро▒ро┐ роХро│ро┐ ро▒ро┐ рокроп рок род рок роХро┐ ро▒рой. роХрогро┐ройро┐ропро┐рпЗро▓ родрооро┐ род роЯ рпЖроЪ роп рокропро┐ роЪро┐ роЗ ро▓ро╛родро╡ роХ род роХ роХ роХрпИро│ рпЗро░ро╛роо ро╡ ро╡ родро┐ роО родро┐ роЕро╡ рпИро▒ роХрогро┐ройро┐ропро┐ родрооро┐рпН роО роХро│ро┐ рпЖрок роХро┐ ро▒рой . роХрогро┐ройро┐ ро╡ро┤ро┐ роЕ роЪро┐ рокроп рок роХро┐ро▒ . рпЗрод рпЖрокро╛ро▒ро┐роХро│ро┐ родрооро┐ рпЖроЪро╛ рпИро▓ рпЗрод рокро╡ роХ роЕроХро░ро╛родро┐роХро│ро┐ рпЖроЪро╛ рпИро▓ род рпЖрокро╛ рпЗрод рокро╡ роХ рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ роТрпЗро░ роЪрпАро░ро╛роХ роЗ роХ рпЗро╡ ро╡ роЗ ро▒ро┐ропрпИрооропро╛род .

рпЗро░ро╛роо роО роХро│ро┐ роО родро┐ роЕро╡ рпИро▒ родрооро┐ роО роХро│ро┐ рпЖрок род роО ро▒ роиро┐рпИро▓ропро┐ рокро▓ рпЖроо роо роХ род рпЗрокро╛ роЙ ро╡ро╛ роХ рок ро│рой. роЗродро┐ родрооро┐ро┤ро┐ рпЖрок роЙрпИро░ропро┐ родро┐ род роХ рпЖроЪ роп рпЗро╡ рпЖроо ро▒ро╛ роЖ роХро┐ро▓ роЙрпИро░ рпЖроЪ родро┐ род рпЖро╡ . род рпЗрокро╛ родро┐ роО ро▒ роТ рпЖроо роорооро╛рой роЗ родро┐рпИро░роХрпИро│ роЙ ро╡ро╛ роХро┐ рпЗроо родро┐рпИро░ропро┐ роЖ роХро┐ро▓ роХрпА родро┐рпИро░ропро┐ родрооро┐ роО род ро╡ро┤ро┐ ро╡ ро│ . роо рпЖро▒ро╛ рпЖроо роо роЖродро╡ро┐ роО рок . роЗ родрпИроХроп рпЗро░ро╛роо ро╡ ро╡ роЙ ро│рпА рпЖроо роо роХ роЕро┤роХро┐ роО рок ро▒ро┐ рокро┐роЯ род роХ роТ . роЗродро┐ родрооро┐ роО роХрпИро│ рпЗро░ро╛роо роО роХро│ро┐ рпЖрок ро╡роЪродро┐ роЙ ро│ . роЪро┐ройро┐рооро╛ рпИро▒ропро┐рой роЗродрпИрой роЕродро┐роХрооро╛роХ рокроп рок роХро┐ ро▒рой . Universal Digital Library роО рокродро┐ роХро│ро┐ рпЖрокроп роХ рпЗро░ро╛роо роО роХро│ро┐ родрооро┐ роО роХро│ро┐ родро░ рок ро│рой.

рпЗро░ро╛роо ро╡ ро╡ рпЖрокроп рокро┐ род род родро┐ роЯ ро╡ род роиро┐ ро╡рой рпИро▓ ро░ро╛ро┐ роЖ роХро╛ роХро┐ро░ роО рокродро╛ . роХро┐ропрооро╛рой родрооро┐ро┤ро╛ роиро┐ ро╡рой роХ рокро▓ рпН рпИро▓ ро░ро╛ро┐ роЖ роХро╛ роХро┐ро░ ро╡ро╛ро┐ро╡ ро╡

рпИро▒рпИропрпЗроп роП рокроп рок родро┐рой. роЕро╡ роХро┐ропрооро╛роХ роЖроЪро┐ропро╡ро┐роп роиро┐ ро╡рой рпЗро░ро╛роЬро╛ рпИродропро╛ родрооро┐ро┤ро╛ ро▓роХ ро▒ро┐ рокро┐роЯ род роХрой.

тАв 1926-36 роХро│ро┐ рпЖроЪ рпИрой рок роХрпИро▓ роХро┤роХ родро╛ рпЖро╡ро│ро┐ропро┐роЯ рок роЯ родрооро┐ рпЗрокро░роХро░ро╛родро┐ рокро┐рпЖро│ роЖ роХро┐ ро╡ ро╡ рпИрод роЕ рокрпИроЯропро╛роХ рпЖроХро╛ роЯ ро╡ро╛ро┐ро╡ ро╡ рпИрод рокроп рок родро┐роп . рпЖроХро╛рпЗро▓ро╛ рок роХрпИро▓ роХро┤роХ родро┐ роЗ родро┐роп роо родрооро┐ро┤ро╛ роиро┐ ро╡рой роЗ род ро╡ро╛ро┐ро╡ рпИродрпЗроп роП роЪ роХ роЗро▓ роХро┐роп родро▓ро╛рой рокро┤ роХро╛ро▓ роЗро▓ роХро┐роп роХрпИро│ роТ рпЖрокроп ро│ . роЖродро╡ро┐ , роо рпИро░ родро┐ роЯ роЖроХро┐ропрпИро╡ роТ ропро┐рпИрогроХрпИро│ рокроп рок роХро┐ ро▒рой.

тАв ITRANS- роЖ роХро┐ро▓ роЪро┐ро▒ро┐роп роО роХрпИро│ роЪро┐ро▓ роЪро┐ро▒ ро▒ро┐ роХрпИро│ рокроп рок родро┐рой . роЗ род родро┐ роЯ 1912-роЗ роПрпЖрод роЪро┐ роироЯ род роХрпАрпИро┤ рпЗродроп родро╛ро╛ро┐ рок ройро╛ роХро┤роХ рооро╛роиро╛ рокро╛ро┐ рпИро░рпИроп роТ роп .

тАв ISO 15919 роЗ родро┐роп рпЖрооро╛ро┤ро┐роХ роХро╛рой рпЗро░ро╛роо ро▒ро┐ рпИро▒рпИроп род ро│ . роЕ рпЗро╡ рокро┐ рой рпЗроо роХрпА ро▒ро┐ роХрпИро│ родро╡ро┐ рпИро▒ропро┐ рок роХро╡ро╛ ро▒ро┐ роХрпИро│ роЕрпИроо рооро╛ рпИро▒рпИроп род род .

тАв рок ройро╛ роТ рпЖрои роХрог рпИро▒ропро┐ рпЗро░ро╛роо роТ рпЖрокроп роХ роирпИроЯрпЖрок роХро┐ ро▒рой.

Page 27: Computational Linguistics - INFITT

188

тАв рпЖрок роЪро┐ рпЗро╡ройро┐ропро╛ рок роХрпИро▓ роХро┤роХ , роо рпИро░ родро┐ роЯ , рпЗроХро╛ро▓ рок роХрпИро▓ роХро┤роХ , роХро┐ роиро┐ ро╡рой родропро╛ро╛ро┐ род роХро┐ роЗ ро░ро╛ роЯрпЗро░ро╖ роЖроХро┐ропрой рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ родро┐ родрооро┐ роЗро▓ роХро┐роп роХ , роЕроХро░ро╛родро┐роХ родро▓ро╛ройро╡ рпИро▒ роЙ ро╡ро╛ роХро┐ ро╡ роХро┐ ро▒рой.

роЗ ро╡ро╛ роХрогро┐ройро┐ рокроп рокро╛ рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ рокроп рок род рок роиро┐рпИро▓ропро┐ , рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ роТ рпЖрокроп рокро┐ рокро▓ро╡рпИроХропро╛рой рпЗро╡ рокро╛ роХ роХро╛рог рок ро╡рпИрод роХро╛рогро▓ро╛ . роТ рпЖрокроп

рпИро▒ропро┐ роТ роЪрпА рпИроо роЗ рпИро▓ роТрпЗро░ роО рок рпЗро╡ ро╡рпИроХроХропро┐ рпЖрокроп роХ рок ро╡рпИрод роХро╛рог

роХро┐ро▒ . роЕро╡ рпИро▒ роТ рпЖрооро╛ родрооро╛роХ роЖро░ро╛ родро╛ роЕро╡ ро▒ро┐ роХро┐рпИроЯрпЗроп роЪро┐ро▓ ро╡ ро╡ роХро│ро┐ роТ рпИроо рокро╛ роЪро┐ро▓ро╡ ро▒ро┐ рпЗро╡ рокро╛ роЙ ро│рпИрод роЕро▒ро┐роп роХро┐ро▒ . роЗрод роХро╛рой роХро┐ропрооро╛рой роХро╛ро░рог роХро│ро╛роХ роЗ рокрпИро╡ ро╡ рооро╛ . родрооро┐ро┤ро┐ ро│ роО роХро│ро┐ роЪро┐ро▓ рпЗро░ро╛роо роО рпИро▒ропро┐ роЗ рпИро▓. роЙропро┐рпЖро░ роХрпИро│ рпЖрокро╛ род ро╡рпИро░ропро┐ роЖ роХро┐ро▓ ро▒ро┐ рпЖрои роЖроХро┐роп роЗро░ роО роХ рпЗроо роТ ро╡ ро╡ рпИродрпЗроп рокроп рок роХро┐ ро▒рой. рог, рой, рои, роЖроХро┐ропро╡ рпИро▒ рпЗро╡ рок ро╡рпИроХропро┐ , ро▓, ро┤, ро│ роЖроХро┐ропро╡ рпИро▒ рпЗро╡ рок ро╡рпИроХропро┐ , ро░,ро▒ роЖроХро┐ропро╡ рпИро▒ рпЗро╡ рок ро╡рпИроХропро┐ родройро┐ родройро┐ роО роХ роЗ рпИро▓. роЩ, роЮ роЖроХро┐роп роО роХ родройро┐ ро╡ро╛ро┐ро╡ ро╡ роЗ рпИро▓. роОройрпЗро╡ роЗро╡ рпИро▒ рпЗро░ро╛роо роО родро┐ ро▒ро┐ роХ рокро▓ роЙ родро┐роХрпИро│ роТ рпЖрокроп рокро╛ро│ роХ рпИроХропро╛ роЯрой .

род рпЗро▓ родро╛ро│ро┐ роО родро┐ропро╡ роХ роЕ ро▓ род роЯ рпЖроЪ родро╡ роХ роЕ род рпЗроиро╛ роХ родро┐рпЗро▓рпЗроп роЗ род рпЗро╡ рокро╛ роХрпИро│ роирпА ро╡рпИроХропро┐ ро▒ро┐ роХрпИро│ рпИроХропро╛ роЯрой . роЕродро┐ рпЗро░ро╛роо ро╡ ро╡ рпИрод рпИроХропро╛ роТ рпЖрокроп род ро░рооро╛ ройро┐ро╡ рпИроХропро╛ роЯ рпИро▒роХ роЪро┐ро▓ рокро┐ рпЗройро╛ро░ро╛ роО

рпЖроХро╛ ро│ рок роЯрой; роЪро┐ро▓ рооро╛ ро▒ рпЖрок ро▒рой; роЪро┐ро▓ родро┐роп ро▒ро┐ роХ роЙ ро╡ро╛ роХ рок роЯрой.

ро▒ро┐ роЙропро┐рпЖро░ роХ

тАв ро▒ро┐ роЙропро┐ роХро│ро┐ рпЖрок рокро╛ рпЗро╡ рокро╛ роЗ рпИро▓. a i u e o роЗ рпИро▒ рпЖрок роХро┐, роХро╛ рпЖро╡

рпЖродро╛роЯ роХро┐ рокро▓ роЕро▒ро┐роЮ роХро│ро╛ рокроп рок род рок роЯ рпИро▒. ро░рооро╛ ройро┐ро╡ рпИро▒ ISO (1) 1591 роо роо роо роо KOELNтАУроЖроЖроЖроЖ рокроп рок род рок роЯрокроп рок род рок роЯрокроп рок род рок роЯрокроп рок род рок роЯ . google Indic рпЖрокро╛ро┐рпЖроп рпИродрпЖрокро╛ро┐рпЖроп рпИродрпЖрокро╛ро┐рпЖроп рпИродрпЖрокро╛ро┐рпЖроп рпИрод

роЪро┐ ройрпЖро╡ рпИродроЪро┐ ройрпЖро╡ рпИродроЪро┐ ройрпЖро╡ рпИродроЪро┐ ройрпЖро╡ рпИрод рпЗроЪрпЗроЪрпЗроЪрпЗроЪ рокроп рок родро┐ропрокроп рок родро┐ропрокроп рок родро┐ропрокроп рок родро┐роп .

тАв роР-роТ0 роЪрпАро░ро╛рой рпЖрокропя┐╜я┐╜ роОя┐╜ро▒ро╛3я┐╜ роХро╛,4рпЖро╡, родро╡ро┐ро░ роПрпИройрпЗропро╛я┐╜

роЕрпИройро╡0рпЗроо ai роОрой роО7родро┐ройя┐╜. роХро╛,4рпЖро╡, рооя┐╜4рпЗроо ei роОя┐╜я┐╜ роО7родро┐ройро╛я┐╜.

ро╡ я┐╜ро░рооро╛я┐╜ройро┐ро╡

роХро╛я┐╜ рпЖро╡я┐╜

рпЗрокро╛я┐╜

рпЖрод.

рпЖрокро╛.роорпА

рокрпЗро░ро╛

ISO (1)

1591

9

ISO

(2)

Penn.U

ty TL L

C

Madu

rai

KOE

LN

google

Indic

IT

RA

NS

роЕ A a a a a A a a a a a A a/Aa a

роЗ I i i i i I i i i i i I i/I i

роЙ U u u u u U u u u u u U u/U u

роО E e e e e e e e e e e E e/E e

роТ O o o o o o o o o o o O o/O o

Page 28: Computational Linguistics - INFITT

189

google Indic роЕродя┐╜роЯя┐╜ рпЖрокя┐╜роп роОя┐╜я┐╜ ! "ро▒ро┐роп%рпИроЯ'(рпА рпЗроЪя┐╜ я┐╜

рокропя┐╜рок я┐╜родро┐роп

тАв роФ- au роОрой рокропройро╛ро│ро┐роХро│ро╛, роТ0 роЪрпАя┐╜рпИроо9роЯя┐╜ рокропя┐╜рок4я┐╜родрокя┐╜4*ро│:.

google Indic роЕродя┐╜роЯя┐╜ рпЖрокя┐╜роп роОя┐╜я┐╜рпИрод'( рпЗроЪя┐╜ я┐╜ рокропя┐╜рок я┐╜родро┐роп .

тАв рпЖрои% ропро┐роХ-

ро╡ я┐╜ро░рооро╛я┐╜ройро┐ ро╡

роХро╛я┐╜ рпЖро╡я┐╜

рпЗрокро╛я┐╜

рпЖрод.

рпЖрокро╛.роорпА

рокрпЗро░ро╛

ISO (1)

1591

9

ISO

(2) Penn.

Uty

TL L

C

Mad

urai

KOE

LN

Goog

le

Indic

ITRAN

S

роР ai ei ai ai ai ai ai ai ai ai ai ai ai/AI ai

ро╡ я┐╜ро░рооро╛я┐╜ройро┐ро╡

роХро╛я┐╜ рпЖро╡я┐╜

рпЗрокро╛я┐╜

рпЖрод.

рпЖрокро╛.роорпА

рокрпЗро░ро╛

ISO (1)

1591

9

ISO

(2)

Penn.

Uty TL LC Mad

urai

KOEL

N

google

Indic

ITRAN

S

роФ au au au au au au

au au

au au au au au/A

U

au

ро╡ я┐╜ро░

рооро╛я┐╜ройро┐ро╡

роХро╛я┐╜ рпЖро╡я┐╜

рпЗрокро╛я┐╜ рпЖрод.

рпЖрокро╛.роорпА

рокрпЗро░ро╛

ISO (1) 15919

ISO (2)

Penn.Uty

TL LC

Madurai

KOELN

google

Indic

ITRANS

роЖ ─А ─Б ─Б ─Б ─Б ─Б -a aa/ A

─Б ─Б A A aa/Aw

aa, A ─Б

роИ ─к ─л ─л ─л ─л ─к _ i ii/ I ─л ─л I I ii/II ii,I ─л

роК ┼л ┼л ┼л ┼л ┼л ┼л _ u uu/

U ┼л ┼л U U uu/UU

uu,U ┼л

роП ─Т ─У ─У ─У ─У ─У _ e ee/ E

─У ─У E E ee/EE E

роУ ┼Н ┼Н ┼Н ┼Н ┼Н ┼Н _ o oo/ O

┼Н ┼Н O O oo/OO

O

Page 29: Computational Linguistics - INFITT

190

o роЖ--- ─Б a: aa тАУa A Aw o роИ --- ─л i: ii _ i I II

o роК -- ┼л u: uu _ u U UU o роП --- ─У e: ee тАУe E EE o роУ -- ┼Н o: oo -o O OO

роо рпИро░ родро┐ роЯ рпЗроХро╛рпЗро▓ро╛ рпЖрои ропро┐ роХрпИро│ ро▒ро┐ роХ рпЖрокро╛ро┐роп роО роХрпИро│рпЗроп рокроп рок

роХро┐ ро▒рой роО рок ро▒ро┐ рокро┐роЯ род роХ . рпЖроо рпЖроп роХро│ро┐

o роХ роЪ род рок тАУ роЗро╡ ро▒ро┐ роТ рпЖрок роХ рпЖроЪро╛ роХ рпЖрок рокро╛ роТ роЪрпАро░ро╛роХ рпЖрокроп роХ рок ро│рой.

я┐╜ роХ роТ роЪрпАро░ро╛рой рпЖрооро╛ро┤ро┐рпЖрокроп - K. роЕ рпЗро╡ роТ рпЖрокро╛ ропро╛роХ ро╡ рпЗрокро╛ g, роЗ

роЙропро┐ роХ роХро┐рпИроЯрпЗроп ро╡ рпЗрокро╛ h рпЖроЪро╛ ропро╛роХ ро╡ рпЗрокро╛ kh, gh.

я┐╜ роЪ тАУ c роЕ рпЗро╡ роТ рпЖрокро╛ ропро╛роХ ро╡ рпЗрокро╛ j, роЗ роЙропро┐ роХ роХро┐рпИроЯрпЗроп

ро╡ рпЗрокро╛ s рпЖроЪро╛ ропро╛роХ ро╡ рпЗрокро╛ ch.

я┐╜ род тАУ t, d роЕ рпЗро╡ рпЖроЪро╛ ропро╛роХ ро╡ рпЗрокро╛ th, dh

я┐╜ рок тАУ роТ роЪрпАро░ро╛рой рпЖрооро╛ро┤ро┐рпЖрокроп - p. роЕ рпЗро╡ роТ рпЖрокро╛ ропро╛роХ ро╡ рпЗрокро╛ b,

рпЖроЪро╛ ропро╛роХ ро╡ рпЗрокро╛ ph, bh.

o роо, роп, ро░, ро▓, ро╡ роЖроХро┐ропрпИро╡ рпЖрок0я┐╜рокро╛3я┐╜ роТ0 роЪрпАро░ро╛роХ я┐╜рпИро▒рпЗроп m, y, r, l, v

роОрой рпЖрокропя┐╜я┐╜роХрокя┐╜4*ро│рой. KOELN роиро┐5ро╡рой( роЗро╡6рпИро▒ рпЖрокя┐╜роп

роОя┐╜я┐╜ !роХро│ро╛роХ роЕродро╛ро╡ M, Y, R, L, V роОройя┐╜ рпЖрокропя┐╜ -ро│ .

ро╡ я┐╜ро░

рооро╛

я┐╜ройро┐

ро╡

роХро╛я┐╜

рпЖро╡

я┐╜

рпЗрокро╛

я┐╜

рпЖрод.

рпЖрокро╛

.роорпА

рок

рпЗро░ро╛

ISO

(1)

159

19

ISO

(2)

Pen

n.Ut

y

T

L

L

C

Mad

urai

KO

EL

N

google

Indic

ITRA

NS

роХ k k k k K K K k/g k,kh,g

,gh

роЪ s ch,j c,j c C c c cя┐╜ c

c c C ch c,ch

род t t, d t,th t t t t t th t

t t T th ta,th,d

,dh

рок p p, b p, b p p p p p p p p P p

p,ph,b

,bh

Page 30: Computational Linguistics - INFITT

191

o роЩ роЮ роЯ рог рои рой ро┤ ро│ ро▒ -рок рпЗро╡ рпЖрокроп роХ роХро╛рог рок роХро┐ ро▒рой. роЗ рпЗро╡ рокро╛ роХ роХро╛ро░рог роЗ рпЖро╡ роХро│ро╛рой роЗрпИрогроХ рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ родро┐ роЗ рпИро▓ роО рокрпЗрод. роЗро╡ рпИро▒ ро▒ро┐рпН роХ роХрпА роХро╛ рпИро▒роХ рокроп рок род рок роХро┐ ро▒рой.

тАв рпЖрои роХро┐роп рпЖродро╛роЯ рпИроЯроп рпЗро░ро╛роо роО родро┐ рокро┐ рок роХро╡ро╛ роЪро┐ро▒ ро▒ро┐ роХрпИро│ роЕрпИроо род

тАв

ро╡ я┐╜ро░

рооро╛

я┐╜

ройро┐ро╡

роХро╛

я┐╜

рпЖро╡

я┐╜

рпЗрокро╛

я┐╜

рпЖрод

.

рпЖрокро╛

.роорпА

рок

рпЗро░ро╛

IS

O

(1)

159

19

ISO (2)

Pe

n

n.

Ut

y

TL L

C

Ma

dur

ai

KO

EL

N

googl

e

Indic

ITR

AN

S

роо m M m m m m m m m m m M m m

роп y Y y y y y y y y y y Y y y

ро░ r R r r r r r r r r r R r r

ро▓ l L l l l l l l l l l L l l

ро╡ v V v v v v v v;

W v v v V v v

ро╡ я┐╜ро░

рооро╛я┐╜

ройро┐ро╡

роХро╛я┐╜

рпЖро╡

я┐╜

рпЗрокро╛

я┐╜

рпЖрод.

рпЖрокро╛

.роорпА

рок

рпЗро░ро╛

ISO

(1)

1591

9

ISO (2) Penn.U

ty TL LC

M

ad

ur

ai

KO

ELN

goo

gle

Indi

c

ITR

ANS

рог n я┐╜ я┐╜ я┐╜ я┐╜ с╣З #n N с╣З

с╣Я N N N Na

с╣Я

рой n N с╣Я с╣Я с╣Я с╣Я _n n n

с╣Я

n_

/n

2

n_/

n2 nZ n

рои n N n n n n n nd; n;

n^

с╣Я n n тАШ N n n

Page 31: Computational Linguistics - INFITT

192

o рог,рой роЖроХро┐роп родрооро┐ роО роХ ро╛ро┐роп роЗрпИрогроХ роЗ рпИро▓. роЕрпИро╡ роЗро░ роТрпЗро░ роО родро╛рой

n роО рокродро┐ рпЗроо , роХрпА , , рокро┐ роОрой рок рпЗро╡ роЪро┐ро▒ ро▒ро┐ роХро│ро╛ ро▒ро┐ роХ рпЖрок роХро┐ ро▒рой.

я┐╜ рог - n с╣З #n с╣З N Na

я┐╜ рой - n с╣З _n n2 nZ

тАв ро▓, ро│, ро┤ тАУ l роОя┐╜ро▒ роО7я┐╜:роЯя┐╜ роЪро┐ро▓ я┐╜ро▒ро┐роп4рпАроХрпИро│A рпЗроЪя┐╜я┐╜:!

я┐╜ро▒ро┐я┐╜роХрок4роХро┐я┐╜ро▒рой. роЕя┐╜:роЯя┐╜ рпЖрокя┐╜роп роЪро┐ро▒ро┐роп роО7я┐╜:я┐╜роХ я┐╜

рокропя┐╜рок4я┐╜родрок4роХро┐я┐╜ро▒рой.

я┐╜ ро▓ тАУ l, L

я┐╜ ро│ - с╣З , #l L

я┐╜ ро┤ тАУ l, с╣З, с╣З с╣З, _l zh, z, Z LZ

o ро░,ро▒

ро╡ я┐╜ро░

рооро╛я┐╜

ройро┐ро╡

роХро╛я┐╜

рпЖро╡

я┐╜

рпЗрокро╛

я┐╜

рпЖрод.

рпЖрокро╛

.роорпА

рок

рпЗро░ро╛

ISO

(1)

1591

9

ISO

(2)

Penn.

Uty TL LC

Mad

urai

KO

EL

N

googl

e

Indic

ITRA

NS

роЯ d с╣З, с╣З d, с╣Зс╣З с╣З с╣З с╣З #t T; d с╣З

с╣З T T T

T,Th,D

,Dh

с╣З, с╣Зh

d, dh

ро│ l с╕╖ с╕╖ с╕╖ с╕╖ с╕╖ #l L с╕╖ с╕╖ L L L L, с╕╖

ро┤ l с╕╖ с╕╖ с╕╖ с╕╖ с╕╖ _l z; zh с╕╖ с╕╖ z Z LZ/z z

Page 32: Computational Linguistics - INFITT

193

o - r

я┐╜ ро░ тАУ r, R

я┐╜ ро▒ тАУ rr с╣З, с╣Зr с╣З r, t, d, _r, R, Ra

o роЩ, роЮ n роО7я┐╜:роЯя┐╜ роЪро┐ро▒я┐╜я┐╜ я┐╜ро▒ро┐роп4рпАроХрпИро│A рпЗроЪя┐╜я┐╜рпЗродро╛ рпЖрокя┐╜роп

роЪро┐ро▒ро┐роп роО7я┐╜:я┐╜роХро│ро╛рпЗро▓ро╛ роЕрпИро╡ я┐╜ро▒ро┐я┐╜роХрок4роХро┐я┐╜ро▒рой.

я┐╜ роЩ - ng, с╣Я , ├С, ^n, ┼Л, G, NG, ~N, N^

я┐╜ роЮ - nj, ├▒, ~n, ╔▓ , n-, n^/jn, NY, JN

тАв роЖ роХро┐ро▓ рпЖрокро╛ро┐роп роО роХрпИро│ роЪро┐ро▒ро┐роп роО роХрпИро│ рокроп рок род

рпЗроорпЗро▓ ро▒ро┐ рокро┐ роЯрок , роХрогро┐ройро┐ропро┐ рокроп рок род рок рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ роХро│ро┐ роТ рпИроо рокро╛ роЗ ро▓ро╛род роХро╛ро░рог родро╛ рокропройро╛ро│ро┐роХ роЪро┐ро░роо родро┐ роХро╛ро│ро╛роХро┐ ро▒рой . роХро╛ роЯро╛роХ, роорогро┐ роО ро▒ рпЖроЪро╛ рпИро▓ рпИро▓ ро░ро╛ро┐ роХро╛ роХро┐ро░роЪро┐ родро│ родро┐ роХ рпЖро╡ро╛ ройро┐ропро╛ рок роХрпИро▓ роХро┤роХ родро│ родро┐ mani роОрой роО родро┐ родроХро╡рпИро▓ рпЖрокро▒ро▓ро╛ . роЖройро╛ рпЖроХро╛ро▓ро╛ рок роХрпИро▓ роХро┤роХ родро│ родро┐ maNi роОрой роО родро┐ройро╛ родро╛ родроХро╡рпИро▓ рпЖрокро▒

. роОройрпЗро╡ рокропройро╛ро│ро┐роХ роТ родроХро╡ рпЗродроЯрпИро▓ рпЖроЪ рпЗрокро╛ родро╛ роО род ро╡ ро╡ рпИро▒рпИроп

ро╡ я┐╜ро░

рооро╛я┐╜

ройро┐ро╡

роХро╛я┐╜

рпЖро╡

я┐╜

рпЗрокро╛я┐╜

рпЖрод.

рпЖрокро╛

.роорпА

рок

рпЗро░ро╛

ISO

(1)

1591

9

ISO

(2)

Penn

.Uty TL LC

Mad

urai

KOE

LN

google

Indic

IT

R

A

N

S

ро░ r R r r r r r r r r r R r r

ро▒ rr , с╣Я с╣Я r с╣Я , с╣Я с╣Я с╣Я с╣Я с╣Я _r R с╣Я с╣Я R R Ra R

ро╡ я┐╜ро░

рооро╛я┐╜

ройро┐ро╡

роХро╛я┐╜

рпЖро╡

я┐╜

рпЗрокро╛я┐╜

рпЖрод.

рпЖрокро╛

.роорпА

рок

рпЗро░ро╛

ISO

(1)

1591

9

ISO

(2)

Penn

.Uty TL LC

Mad

urai

KOE

LN

goog

le

Indic

ITRA

NS

роЩ ng с╣Я ├▒ ├С ├▒ с╣Я ^n ng с╣Я с╣Я ng G NG

~N,

N^

с╣Я

роЮ nj ├С ├▒ ├▒ ├▒ ├▒ ~n nj ├▒

├▒ n-

n^/j

n NY

JN

├▒

Page 33: Computational Linguistics - INFITT

194

рокроп рок родро│ родро┐ роЗ роХро┐рпЗро▒ро╛ роО рокрпИрод роЕро▒ро┐ род рокро┐ро▒ родро╛ рпЖроЪропро▓ро╛ ро▒ . роОройрпЗро╡ роЕро╡ рпИро▒ родро░ рок родро╡ роЗ рпИро▒роп роХро╛ро▓ роХ роЯ родро┐рпН рпЗродрпИро╡ропро╛роХ роЖроХро┐ роЙ ро│ .

рокро╛ роХроЯ рокро╛ роХроЯ рокро╛ роХроЯ рокро╛ роХроЯ p ─Бс╕╖ka с╕╖ al - - - - ISO (1) 15919 родрооро┐родрооро┐родрооро┐родрооро┐ tamiс╕╖ - - - - ISO (1) 15919 p-a_rka#tal - ISO (2) tami_l ---- ISO (2)

p╔С ╦Р╔С ╦Р╔С ╦Р╔С ╦Р rkatal - IPA tami[╔╗╔╗╔╗╔╗ ] ---- IPA

paaRkaDal, pARkaDal ---- Penn Uty tamiz/tamizh ---- PennUty

p ─Б с╣Яс╣Яс╣Яс╣Я ka с╣Яс╣Яс╣Яс╣Я al ---- TL tamiс╣Яс╣Яс╣Яс╣Я ---- TL

p ─Б с╣Яс╣Яс╣Яс╣Я ka с╣Яс╣Яс╣Яс╣Я al - LC tamiс╣Яс╣Яс╣Яс╣Я ---- LC

pARkaTal ---- Madurai tamiz ---- Madurai

pARkaTal - KOELN tamiz - KOELN

pARkaTal, paaRkaTal - Adami thamiz/tamizh - Adami

роОройроОройроОройроОройрпЗро╡ рок рпЗро╡ ро╡ ро╡ рпИро▒ропро┐ роЗ роЕро╡ рпИро▒ родро░ рок ро╡ роО рок рооро┐роХ рпЗродрпИро╡ропро╛рой

роТ ро▒ро╛роХ роЖроХро┐ ро│ .роЗ ро╡ро╛ родро░ рок роп роЪро┐ропро┐ роХро╡рой рпЖроЪ родрпЗро╡ ропрпИро╡ ро╡ рооро╛ ;

роП роХройрпЗро╡ роЗ ро▒ро┐ роХ рпЖрокро╛ родрооро╛ройро╡ рпИро▒ рпЗрод рпЖрод родро░ рок родро▓ро╛ .

1. родро┐ропродро╛ройрпЖродро╛ рпИро▒рпИроп роЙ ро╡ро╛ роХро┐ рокро╛ро┐ рпИро░ роХро▓ро╛ .

2. рокро┐ рпЗройро╛ роТ рпЖрокроп рокро┐ роЪро╛ро┐ропро╛рой рпЖроЪро╛ роХро┐рпИроЯ роХро┐ро▒родро╛ роО роЙ родро┐ рпЖроЪ рпЖроХро╛ ро│ рпЖро╡ . Universal Digital Library родро│ родро┐ роХро│ро┐ рпЖрокроп роХ рпЗро░ро╛роо роО роХро│ро┐ родрооро┐ роО роХро│ро┐ родро░ рок ро│рой. роЕ роХ ройро╡ро▓ ро╕ро╛ро┐родро┐ро░ ... by роЕ ройроЪро▓ роХро╡ро┐ро░роп L:

Tamil, Y: 1898, S: ARUMUGA NAVALAR SARITHIRAM, 98 pgs. роЖ роХро┐ро▓ родро┐ род роЙ ро│рпА рпЖроЪ роЕродрпИрой родрооро┐ рок родро┐ропрпЗрокро╛ роЖ роХ роиро╛ро╡ро▓ роЪро╛ро┐ родро┐ро░ , роЕ рогро╛роЪро▓ роХро╡ро┐ро░ро╛роп роЖроХро┐ропрпИро╡ ро╛ро┐ рпЖроХро╛ ро│ роЗропро▓ро╛род роЕро│ро╡ро┐ ро╡ ро╡ рооро╛ро▒ро┐ропро┐ рок ро▓ройро╛ .

3. рпЗро░ро╛роо роО рокро┐ , рпЗроо роХрпА рпЗроХро╛ роХ роЕ ро▓ ро│ро┐роХрпИро│ рокроп рок рпИро▒рпИроп роо роЖ рпЖроЪ роп рпЗро╡ . роЕ роЯ рпЖрокро╛ро┐роп роО роХ роЗроЯ рпЖрок роХро┐ ро▒рой. роЗ ро╡ро╛ роЕрпИроо рпЗрокро╛ ро╡ро╛ро┐роХ роЕро┤роХро┐ ро▒ро┐ роТ роЪрпАро░ро╛роХ роЕрпИрооро╡родро┐ рпИро▓. роЕ роЯ роЕро╡ рпИро▒ род роЯ рпЖроЪ ро╡рпИроХропро┐ роХрогро┐ройро┐ ро╡ро┐рпИроЪроХ роЕрпИрооропро╡ро┐ рпИро▓ роО рок рооро┐роХ роХро┐ропрооро╛ройрпЖродро╛ рокро┐ро░ роЪрпИрой. роОройрпЗро╡ роЗ род рпЗро░ро╛роо ро╡ро╛ро┐ро╡ ро╡ родро┐ род роЯ рпЖроЪ роп роТ родройро┐ рпЖроо рпЖрокро╛ рпЗро│ро╛ родройро┐ рокропро┐ роЪро┐рпЗропро╛ рпЗродрпИро╡.

4. роХрогро┐ройро┐ рокроп рокро╛ рпЗро░ро╛роо ро╡ ро╡ роТ рпЖрокроп рпИрок рок ро▒ро┐ рпЖроЪ ро╡ родройро┐рооройро┐род ро╡ро╛роХ роЕрпИрооропро╛роо роп роЪро┐ропро╛роХ роЕрпИроороп рпЗро╡ . роЗрод рпЖроХрой роТ рокрогро┐

рпЖроЪропро▓ро╛ ро▒ро┐ роТ рпЖрокроп рпИро▒роХрпИро│ родро░ рок род рпЗро╡ .