Հայաստանի ատենախոսությունների բաց մատչելիության պահոց = Open Access Repository of the Armenian Electronic Theses and Dissertations (Armenian ETD-OA) = Репозиторий диссертаций Армении открытого доступа

Մեծածավալ տվյալների ամպային պահուստավորման միջոցների հետազոտումը և մշակումը

Աթայան, Բորիս Գենադիի (2018) Մեծածավալ տվյալների ամպային պահուստավորման միջոցների հետազոտումը և մշակումը. PhD thesis, ՀՀ ԳԱԱ Ինֆորմատիկայի և ավտոմատացման պրոբլեմների ինստիտուտ.

[img] PDF (Thesis)
Available under License Creative Commons Attribution.

Download (18Mb)
    [img] PDF (Abstract)
    Available under License Creative Commons Attribution.

    Download (4Mb)

      Abstract

      Ներկայումս քոմփյութերային համակարգերում պահպանվող ոչ համակարգված թվային տվյալների քանակը օրեցօր աճում է: Հաշվի առնելով այն փաստը, որ թվային տեղեկատվությունը մեր օրերում հանդիսանում է թանկարժեք ակտիվ, ապա արդիական խնդիր է դառնում այդ տվյալների պահուստային օրինակների ստեղծումը և պահպանումը: Ամպային տեխնոլոգիաների լայնածավալ տարածումը թույլ է տալիս նորովի լուծել տվյալների պահուստավորման և պահպանման խնդիրը: Պահուստավորման համակարգերում տվյալների բազմակի վերապահուստավորման ժամանակ օգտագործվում է աստիճանական պահուստավորման մեթոդը: Սակայն, այս դեպքում տվյալների քանակի ավելացման ժամանակ առաջանում է պահուստավորման ընթացքում փոփոխված ֆայլերի հայտնաբերման և դրանց՝ ամպային միջավայր վերբեռնման խնդիրը: Այս գործողության տևողությունը կարող է լինել բավական ժամանակատար և հանգեցնել ինչպես օգտագործման անհարմարության, այնպես էլ տվյալների կորստի կամ այլ սխալների: Օգտագործողների անձնական տվյալների անվտանգությունը հանդիսանում է ամպային պահպանման և պահուստավորման համատարած օգտագործման գլխավոր խոչընդոտներից մեկը, քանի որ օգտագործողները լիովին չեն կարող վստահել ամպային պահուստ տրամադրող ծառայությանը: Այդ խնդրի հիմքում ընկած է ամպային տեխնոլոգիաների կարևոր այն առանձնահատկությունը, որ ամպը տրամադրում է օգտագործողներին իրենց տվյալների հետ աշխատանքի աբստրակտ միջավայր և միշտ չէ, որ օգտագործողները տեղյակ են կամ կարիք ունեն տեղյակ լինելու, թե կոնկրետ, որ սերվերի վրա, և ինչպես են պահպանվում իրենց տվյալները, պահվու՞մ են կրկնօրինակներ, թե ոչ, և այլն: Այստեղից բխում է ամպային պահուստավորման համակարգերում տվյալների հավաստի հեռացման խնդիրը, այսինքն, որպեսզի օգտագործողի տվյալները ընդմիշտ անհասանելի դառնան ըստ հեռացման պահանջի՝ անկախ պահպանման միջավայրից և օգտագործվող միջոցներից: Կարևոր է նաև տվյալների վերականգնման ժամանակը, քանի որ այն անմիջական կապ կարող է ունենալ պահուստավորման համակարգի օգտագործողի գործունեության հետ, օրինակ՝ առցանց խանութի տվյալների վերականգնում և դադարեցված աշխատանքի սկիզբ որևիցե աղետից հետո: Քանի որ պահուստավորված տվյալները գտնվում են ամպային պահոցում, ապա տվյալների վերականգման համար առաջին հերթին անհրաժեշտ է կատարել այդ տվյալների հավաքագրում, որի վրա մեծ ազդեցություն ունի աստիճանական պահուստների տարբերակների քանակը, քանի որ համակարգը պետք է կատարի նախորդ բոլոր պահուստների վերլուծություն և տվյալների միավորում՝ նախքան վերականգնման գործընթացի սկիզբը: Ատենախոսության նպատակը մեծածավալ տվյալների ամպային պահուստավորման միջոցների հետազոտումն ու մշակումն է: Այդ նպատակին հասնելու համար դրվել և լուծվել են հետևյալ խնդիրները՝ Մշակել ամպային պահուստավորման համակարգում աստիճանական պահուստավորման գործընթացում փոփոխված տվյալների հայտնաբերման մեթոդ, Մշակել ամպային պահուստավորման համակարգում տվյալների աստիճանական պահուստների անվտանգ և հավաստի հեռացման մեթոդ, Մշակել ամպային պահուստավորման համակարգում տվյալների աստիճանական վերապահուստավորման գործընթացի լավարկման մեթոդ: На сегодняшний день количество не систематизированных числовых данных, хранящихся в компьютерных системах, с каждым днем увеличивается. Принимая во внимание тот факт, что в наши дни числовая информация представляет собой драгоценный актив, актуальной проблемой представляется создание и хранение резервных копий этих данных. Широкое распространение облачных технологий позволяет по новому решить проблему резервного копирования и хранения данных. В системах резервного копирования во время многократного перерезервирования данных используется метод ступенчатого резервного копирования. Однако, в этом случае при увеличении количества данных возникает проблема выявления измененных в процессе резервного копирования файлов и их загрузки в облачную среду. Для подобного действия может потребоваться довольно продолжительное время, а результатом стать неудобное использование или потеря данных, либо другие ошибки. Безопасность данных частных пользователей является главным препятствием массового применения метода облачного хранения и резервного копирования, так как пользователи не могут всецело доверять службе, предоставляющей облачный резерв. В основе этой проблемы лежит та важная особенность облачных технологий, согласно которой облако предоставляет пользователям абстрактную среду для работы со своими данными, и не всегда пользователи в курсе или имеют необходимость быть в курсе того, на каком именно сервере и каким образом осуществляется хранение их данных, сохраняются ли копии или нет, и т.д. Из этого вытекает задача достоверного удаления файлов из систем облачного резервного копирования, то есть чтобы данные пользователя навсегда стали недоступными по запросу на удаление, независимо от среды хранения и используемых средств. Важное значение имеет также время восстановления данных, так как оно может иметь непосредственную связь с деятельностью пользователя системы резервного копирования, например, восстановление данных онлайн–магазина и продолжение остановленных работ после какой-либо катастрофы. Так как зарезервированные данные находятся в облачном хранилище, то для восстановления данных в первую очередь необходимо осуществить сбор этих данных, на который большое воздействие оказывает количество версий ступенчатых резервов, так как система должна осуществить анализ всех предыдущих резервов и объединение данных, прежде чем начать процесс восстановления. Целью диссертации является изучение и разработка средств облачного резервного копирования большого объема данных. Для реализации цели были определены и решены следующие задачи: Разработать метод выявления данных, измененных в процессе ступенчатого резервного копирования в системе облачного резервного копирования; Разработать метод безопасного удаления ступенчатых резервов данных в системе облачного резервного копирования; Разработать метод улучшения процесса ступенчатого перерезервирования в системе облачного резервного копирования. Nowadays the number of unstructured digital data stored in computing systems is increasing rapidly day by day. Digital information being a valuable asset makes it important to create and maintain backup copies of data. The widespread deployment of cloud computing technology brings a new solution to the problem of data backup and maintenance. The incremental backup method for is used in backup systems when data is being backed up multiple times. However, in this case, the increase in the amount of data leads to the problem of detection of modified data that needs a backup and copy that data to cloud backup server. These operations may be time consuming and may result in inconvenient usage, as well as data loss or other errors. User's personal data security is one of the major obstacles in using cloud storage as backup environment since users are not able to fully trust the cloud storage service.The main cause of this problem is one major feature of cloud technologies that it provides users with the abstract environment, and the users are not always informed or need to be informed about on which server exactly and how the data backup copies are being saved. Thus the problem is the assured data removal from the cloud backup environment, which means making the user's data unavailable forever, regardless of the storage server and the means used. Data recovery time is also important because it can be directly connected with the backup system user’s activity, such as online store data restoration and the start of stopped work after a disaster. Since backed up data is stored in cloud, when data recovery is requested, first of all it is necessary to perform data collection.The number of incremental backups in the system has significant impact on the data collection process as the system must perform the analysis and data consolidation of all backups before the start of the recovery process. The goal of the work is the research and development of big data cloud backup methods. To achieve this goal, the following problems have been defined and resolved: Develop a method of modified data detection in the cloud backup system, Develop a method of assured deletion of incremental backups in the cloud backup system, Develop a method of incremental backup process improvement in the cloud backup system. The incremental backup method of large amounts of data has been developed, which is based on mutual dependencies between data, which, unlike existing ones, provides faster detection of modified data [1, 3, 9]. Method of assured deletion of data from the cloud backup system has been developed, which, unlike existing ones, provides means for incremental backup and assured deletion of sensitive data at the same time [2, 4, 5, 6]. Method for determining the combined cycle of incremental and full backup processes has been developed, which, in unlike existing ones, improves data restoration process by determining the range of full backup processes [7, 8, 9]. Based on the results obtained, the Backup Guard cloud computing system has been developed for performing the backup and recovery processes of web sites. The backup process is done with full and incremental backup methods, enabling optimal use of cloud storage space and computing resources. The assured deletion module of incremental backups is implemented in the system, which allows reliable removal of data that was backed up. The system also includes a module for determining the combined cycle of incremental and full [1, 4, 5, 7, 8].

      Item Type: Thesis (PhD)
      Additional Information: Исследования и разработка средств облачного резервного копирования больших данных. Big data cloud backup research and development.
      Uncontrolled Keywords: Атаян Борис Генадиевич, Atayan Boris Genadi
      Subjects: Informatics and Computer Systems
      Divisions: UNSPECIFIED
      Depositing User: NLA Circ. Dpt.
      Date Deposited: 04 Sep 2018 15:53
      Last Modified: 06 Sep 2018 14:18
      URI: http://etd.asj-oa.am/id/eprint/7592

      Actions (login required)

      View Item