Հայաստանի ատենախոսությունների բաց մատչելիության պահոց = Open Access Repository of the Armenian Electronic Theses and Dissertations (Armenian ETD-OA) = Репозиторий диссертаций Армении открытого доступа

UNL լեզվից դեպի բնական լեզու փոխարկման կանոնների հավաքածուների ընդլայնման և ուղղման ավտոմատացված համակարգ

Հակոբյան, Լևոն Ռոբերտի (2014) UNL լեզվից դեպի բնական լեզու փոխարկման կանոնների հավաքածուների ընդլայնման և ուղղման ավտոմատացված համակարգ. PhD thesis, ՀՀ ԳԱԱ Ինֆորմատիկայի և ավտոմատացման պրոբլեմների ինստիտուտ.

[img] PDF (Abstract)
Available under License Creative Commons Attribution.

Download (698Kb)

    Abstract

    Интенсивное развитие компьютерных технологий и их широкое использование в повседневной жизни повлекло за собой спрос на технологии, повышающие эффективность коммуникации между пользователями. В связи с этим актуальными стали проблемы машинного перевода, семантического анализа текста, а также другие аналогичные проблемы. В 1996-ом году в Институте Исследований Университета Объединенных Наций (Institute of Advanced Studies) в Токио был начат проект по созданию искусственного языка, называющегося "Универсальным сетевым языком" (Universal Networking Language, сокращенно UNL), который позволяет решать проблемы как автоматизированного перевода (в рамках UNL называемого также трансформацией) с одного естественного языка на другой, так и предоставляет возможность машинной обработки семантической информации.2 В 2001 году к проекту присоединилась Армения, и начались работы в рамках ИПИА НАН РА под руководством Юрия Шукуряна и Владимира Саакяна. Отметим, что язык UNL является искусственным языком для представления и обработки знаний и информации, описанной на различных естественных языках. Язык UNL также используется в качестве языка-посредника при автоматизированных переводах с одного естественного языка на другой. Предложение на языке UNL имеет вид ориентированного графа или орграфа (семантический граф, semantic network, UNL graph), в котором вершины соответствуют семантическим единицам языка, т. е. словам и словоформам (универсальные слова, Universal Words, UW, concepts), а дуги (универсальные отношения, Universal Relations) соответствуют семантическим связям и отношениям между семантическими единицами. Трансформация с языка UNL на естественный язык, а также обратная трансформация происходит при помощи UNL-грамматики и словарей. UNL-грамматика содержит правила, по которым происходит трансформация, а словари содержат записи об универсальных словах, их переводах и о свойствах соответствующих им атрибутов. Сегодня актуальным является вопрос создания и развития наборов правил, позволяющих производить трансформацию с естественного языка на язык UNL и обратно. Важной составляющей процесса создания наборов правил является наличие соответствующих программных инструментов, позволяющих эффективно корректировать имеющиеся наборы правил. Кроме того, существенным является создание теоретического аппарата, позволяющего формализовать процесс корректировки наборов правил. В работе описывается один из методов решения этой задачи. А именно, дается метод корректирования и расширения наборов правил трансформации с языкаUNL на естественный язык. Этот метод позволяет производить отладку наборов правил в автоматизированном режиме. Քանի որ UNL-ի արդյունավետ օգտագործումը՝ որպես մեքենայացված թարգմանությունների միջնորդ լեզվի, կախված է օգտագործվող ռեսուրսներից (բառարան, կանոնների հավաքածու), ապա մասնագետներին, որոնք աշխատում են նման ռեսուրսների ստեղծման, ընդլայնման և փորձարկման ուղղությամբ, կարևոր է ունենալ համապատասխան ծրագրավորման գործիքներ, որոնք կնպաստեն սխալների հանգող ոչ ճիշտ կանոնների և բառարանային նոթերի (գրառումների) բացահայտմանը և ըստ հնարավարության նաև կնշեն սխալների վերացման ճանապարհը: Աշխատանքում ներկայացված է ծրագրային համակարգ, որը հնարավորություն է տալիս լուծել նմանատիպ խնդիրներ, մասնավորապես, իրականացնել կանոնների հավաքածուի կարգավորումը մեքենայացված ռեժիմով: Նման խնդիրների լուծման համար մշակված են ալգորիթմներ և ծրագրեր, որոնք հնարավորություն են տալիս օգտագործողին գտնել կանոններն ու բառարանային գրառումները, որոնք հանգեցրել են այս կամ այն սխալին, իսկ որոշ դեպքերում ստանալ նաև խորհուրդներ սխալների վերագման հնարավոր ճանապարհների վերաբերյալ: Կանոնների ուղղման ընթացքում զգալի արգելքը է հանդիսանում փոխարկման այլընտրանքային ուղիների հավաքածուի արդյունավետ ստացումը և առավել կիրառելի ուղիների բացահայտումը: Օգտագործողը ստիպված էր ինքնուրույն ընտրել համապատասխան կանոնները տվյալ քայլին և հիշել տեղեկություններ ստացված տարբերակների մասին: Այդ խնդիրը լուծվում է ալգորիթմերի և, այսպես կոչված, «փոխարկման հնարավոր ուղիների ծառի» կառուցման ծրագրերի օգտագործմամբ: Համապատասխան ալգորիթմը հնարավորություն է տալիս օգտագործողին ավտոմատացված ռեժիմով ստանալ բոլոր էական փոխակերպման ճանապարհները և դրանց արդյունքները: Ալգորիթմը նաև հնարավորություն է տալի համեմատել ստացված արդյունքները էտալոնի հետ, որը առաջարկված է օգտագործողի կողմից, մեքենայացված թարգմանության գնահատման որակի ալգորիթմի միջոցով: Ատենախոսության նպատակն է մշակել այնպիսի ալգորիթմեր և ծրագրեր, որոնք թույլ են տալիս արդյունավետ ընդլայնել և ուղղել դիտարկվող փոխարկման կանոնների հավաքածուները և բառարանային գրառումները: Մշակված ալգորիթմերը և ծրագրերը թույլ են տալիս գտնել սխալ կանոնները ու բառարանային գրառումները և առաջարկում են դրանց շտկման հնարավոր ուղղիները: Մշակվել են նոր ալգորիթմեր և ծրագրեր, որոնք թույլ են տալիս ստանալ այսպես կոչված փոխարկման հնարավոր ուղիների ծառը, ինչը հնարավորություն է տալիս ստանալ փոխարկման տարբեր հնարավոր ուղիների հավաքածուներ: Մշակվել է փոխարկման ալգորիթմի աշխատանքի ընթացքում գոյացող սխալների դասակարգումը, որը թույլ է տալիս նշել տվյալ սխալի հատկությունները և օգտագործել համապատսխան ուղղման ալգորիթմ: Մշակվել են ալգորիթմեր և ծրագրեր փոխարկման ընթացքում գոյացող՝ այս կամ այն սխալների համար պատասխանատու կանոնների որոնման և ուղղման համար: Դրանք նաև թույլ են տալիս ուղղել համապատասխան կանոնները: Since the effectiveness of using UNL as an intermediate language for automatic translation depends on the use of resources (dictionaries, a set of rules, etc.), the specialists working on the creation, expansion and testing of such resources need the appropriate software tools that allow the detection of invalid rules and dictionary entries, leading to errors and, if possible, specify the path to eliminate these errors. The thesis presents a software system that allows to solve such problems, in particular, make debugging rule sets in an automated mode. To solve such problems developed algorithms and programs that allow the user to find the rules and dictionary entries, which led to a particular error, and, in some cases, get advice on how to correct the error. Significant obstacles in the process of debugging rules are the difficulty of obtaining a set of alternative ways of transformation and identify the most suitable among them. For this user had to manually select the rules for applying at corresponding step of transformation and remember information about the production of variants. This problem is solved by means of algorithms and software to build the so-called "tree of possible transformation paths". Appropriate algorithm allows the user to automatically get all the essential ways of transformation and their results. The algorithm also makes it possible to compare the obtained results using the algorithms for the evaluation of the quality of machine translations. The aim of the thesis is to develop algorithms and programs to effectively expand and correct transformation rule sets and dictionary entries. The algorithms and programs offer the possibility of finding incorrect rules and dictionary entries and offer the user the possible ways of their correction. Scientific noveltyNew algorithms and applications for the construction of the tree of the possible transformation paths are developed, which let user to obtain different possible transformation paths. A classification for the possible errors of the transformation result is given. This classification let to describe properties of the possible errors and use corresponding algorithms to correct them.An algorithm for the searching of the rule which affected on the node is developed. Also the algorithms for the fixing of the errors of the corresponding types are developed. These algorithms find the rules and dictionary entries which are responsive for the error and suggest some correction ways.

    Item Type: Thesis (PhD)
    Additional Information: UNL լեզվից դեպի բնական լեզու փոխարկման կանոնների հավաքածուների ընդլայնման և ուղղման ավտոմատացված համակարգ: Automated system for the expansion and correction of the rule sets for transformation from UNL into natural language.
    Uncontrolled Keywords: Հակոբյան Լևոն Ռոբերտի, Hakobyan Levon
    Subjects: Informatics and Computer Systems
    Divisions: UNSPECIFIED
    Depositing User: NLA Circ. Dpt.
    Date Deposited: 30 Sep 2016 10:14
    Last Modified: 30 Sep 2016 10:14
    URI: http://etd.asj-oa.am/id/eprint/3526

    Actions (login required)

    View Item