Հայաստանի ատենախոսությունների բաց մատչելիության պահոց = Open Access Repository of the Armenian Electronic Theses and Dissertations (Armenian ETD-OA) = Репозиторий диссертаций Армении открытого доступа

Իմաստի նկարագրության խնդիրները մեքենական թարգմանության տեսության մեջ

Գրիշկյան, Ենոք Հենրիկի (2013) Իմաստի նկարագրության խնդիրները մեքենական թարգմանության տեսության մեջ. PhD thesis, ՀՀ ԳԱԱ Հրաչյա Աճառյանի անվան լեզվի ինստիտուտ.

[img] PDF (Abstract)
Available under License Creative Commons Attribution.

Download (325Kb)

    Abstract

    Ժամանակակից լեզվաμանության մեջ տեքստային տվյալների ձևային կաղապարների կառուցումը իրականում միջնորդ օղակ է բուն տեսական լեզվաբանության և կիրառական հետազոտությունների միջև: Լեզվաբանության մեջ ձևային կաղապարների կառուցումը տեղեկատվական տեխնոլոգիաների կիրառության անհրաժեշտ նախապայմանն է: Սովորաμար այդպիսի կաղապարի տեսակը կանխանշում է նրա ալգորիթմի մշակման ուղիները: Տեսական լեզվաμանությունը հիմնականում ուսումնասիրում է լեզուն` համակարգված իր կայուն հարացույցում: Այն երկար ժամանակ անտեսում էր գիտատեխնիկական նյութը, չկային μուն կիրառական խնդիրների համար նախատեսված կաղապարների նկարագրություններ: Վերջապես, XX դ. 70-ական թթ. գիտնականները եզրահանգեցին, որ շատ կիրառական խնդիրների լուծումներ չեն կարող լինել զուտ լեզվաբանական, քանի որ դրանք գտնվում են մարդու մտածողության և իմաստաμա- նության կաղապարման, ձևային և իմաստային համադրման ոլորտներում: Այսպես առաջ քաշվեց արդի գիտության կարևորագույն ուղղություններից մեկը` գիտելիքների կաղապարումը, որը մեր ժամանակներում դարձել է ամենատարμեր գիտությունների` տրամաբանության, լեզվաբանության, մաթեմատիկայի, հոգեբանության, կիբեռնետիկայի հիմնախնդիրներից մեկը: Այս խնդրի նկատմամμ այսպիսի հետաքրքրության պատճառը պայմանավորված է արհեստական μանականության Artificial Intelligence համակարգերի ստեղծմամբ: Պետք է հիշել, որ գիտելիքները մեզ տրվում են անմիջականորեն լեզվի մեջ և միայն նրա միջոցով: Գիտելիքները գոյություն ունեն ինչպես բանավոր խոսքում, այնպես էլ գրավոր տեքստերում և, վերջապես, լեզվի միջոցով մենք գիտելիքներ ենք փոխանցում սերնդեսերունդ: Այսպիսով` լեզուն հանդես է գալիս և՛ գիտելիքների ստացման ու պահպանման, և՛ դրանց փոխանցման միջոց: Գիտության և տեխնիկայի մեջ տեքստերից դուրս գիտելիքներ առհասարակ գոյություն չունեն, իսկ գիտատեխնիկական տեքստերի իմաստի կաղապարումը ենթադրում է տվյալ բնագավառի գիտելիքների համակարգի կաղապարում: Վերջին տարիներին առաջացած կիրառական լեզվաμանության նոր ոլորտները կապված են մի ընդհանուր հիմնախնդրի` ավտոմատ համակարգի կողմից լեզվի գրավոր և μանավոր ձևերի մշակման հետ: Այդ հիմնախնդիրը հանգեցրեց լեզվի վերլուծության և նկարագրման նոր մեթոդների առաջացմանը: Построение моделей текстовых данных в современной лингвистике, в сущности, является посредником между теоретической лингвистикой и практическими разработками. Построения моделей в лингвистике необходимое условие для использования информационных технологий. Обычно тип модели предрешает способы написания алгоритма. В последнее время появились новые направления прикладной лингвистики, тесно связанные с общей проблемой – разработкой устной и письменной форм языка автоматизированными системами. Эта проблема привела к созданию новых методов анализа и описания. Диссертация состоит из введения, четырех глав, заключения и библиографического указателя, содержащего 110 наименований. Введение содержит основные положения диссертации, историю вопроса, важность и значение темы в современной лингвистике. Первая глава ("Методы определения лексического значения") представляет следующие методы анализа слова: контрастный анализ, статистические методы анализа, анализ по непосредственно составляющим, дистрибутивный анализ, трансформационный анализ, компонентный анализ, метод семантических дифференциальных признаков и контекстный анализ. В диссертации дается общее описание этих методов. Вторая глава («Роль компонентного анализ в моделировании значения") показывает сущность метода компонентного анализа и его значительное место в формализованном описании смысла. Представлены некоторые работы американских лингвистов в сфере терминов родства, керамических изделий, кулинарии, а также обозначения цветов и возрастных групп домашнего скота. Оценены эксперименты и результаты их применения в системах машинного перевода. Третья глава ("Формализованное описание значение в разных системах машинного перевода") представляет разные системы формализованного описания значения в ряде программ машинного перевода (в частности в UNL, ФРАП, Микрокосмос, и т.д.). Также приведены возможности включения и использования армянского языка в таких программах. Четвертая глава ("Формализованное описание значения в универсальной теории языка") полностью посвящена моделирование значения в универсальной теории языка Г. Джаукяна. Формализованное описание языка осуществляется в универсальной лингвистической модели (УЛМ). Эта теория широко признана за рубежом, однако она не была использована в какой-либо программе машинного перевода. Именно поэтому мы предлагаем создание армянского словаря при использовании УЛМ Г. Джаукяна. В этом словаре слова должны быть описаны в соответствии с категориями и термами, предложенными автором. Ежегодно создаются несколько десятков программ машинного перевода и лишь немногие получают признание во всем мире. Они состоят из систем распознавания значений слов на основе определенных признаков, хотя они в очередной раз сталкиваются с проблемой особенностей языкового менталитета. Независимо от этих программ, мы должны по достоинству оценить работу специалистов, которые всеми силами пытаются обобщать познания человечества, делая их доступными для всех. The construction of models of textual data in modern linguistics is really a mediator between the theoretical linguistics and practical researches. In linguistics the construction of models is a prerequisite for informational technology usage. Usually the type of the model implies the ways of writing an algorythm. Lately appeared new spheres of applied linguistics are connected to a general problem – elaboration of oral and written forms of the language by the automatized systems. This problem led to the creation of new analytic and descriptive methods. The dissertation is composed of introduction, four chapters, conclusion and the list of used literature containing 110 publications. The dissertation comprises 150 pages. The Introduction presents the main theses, the history of the issue, its importance and meaning in modern linguistics. The first chapter ("The Methods of Determination Lexical Meaning") presents the following methods of lexicological analysis: contrastive analysis, statistical methods of analysis, immediate constituents analysis, distributional analysis, transformational analysis, componential analysis, method of semantic differential and contextual analysis. The detailed description of these methods is shown in the dissertation. The second chapter ("The Role of Componential Analysis in Modeling of Meaning") shows the nature of the method of component analysis and its unique place in formalising the meaning. Some works of American linguists in the sphere of terms belonging to different semantic fields, their experiments and results, as well as their importance in machine translation (MT) are presented. The third chapter ("The Formalized Description of Meaning in Different Systems of Machine Translation") describes the systems of formalized description of meaning in a number of MT (mainly UNL, FRAT, Microcosmos, etc) programs. The possible implication and perspectives of usage of Armenian in these programs are also considered. The fourth chapter ("The Formalization of Meaning in the Universal Theory of Language") is totally dedicated to the formalization of meaning in G. Jahukyan's Universal Theory of Language. The formalization or modeling of language is implemented in the universal linguistic model (ULM). This theory is widely acknowledged abroad, however it wasn't used in any MT program. That is why we suggest creating an Armenian dictionary when using G. Jahukyan's ULM. In this dictionary the words must be described according to categories and terms suggested by the author. Every year some dozens of MT programs are created and only a few receive worldwide acknowledgment. They comprise of systems of recognition able to reflect the full meaning of the word, though once again they confront peculiarities of linguistic mentality. Whatever these programs are we must worthily appreciate the work of the professionals who by all means try to generalize and bring together the knowledge of mankind hence making it available to all.

    Item Type: Thesis (PhD)
    Additional Information: Проблемы описания значения в теории машинного перевода. Problems of description of meaning in machine translation theory.
    Uncontrolled Keywords: Гришкян Енок Генрикович, Grishkyan Yenok H.
    Subjects: Linguistics
    Divisions: UNSPECIFIED
    Depositing User: NLA Circ. Dpt.
    Date Deposited: 23 Sep 2016 16:31
    Last Modified: 23 Sep 2016 16:31
    URI: http://etd.asj-oa.am/id/eprint/3471

    Actions (login required)

    View Item