Ամեն ինչ սկսվում է մտքից՝ գաղափարից։ Դրան գումարվում է հետեւողական ու տքնաջան աշխատանքը, որն էլ ապահովում է ցանկալի արդյունքը։ Այս մոտեցումն է ընկած «Ազգային արագացում» հանրային նախաձեռնության գործունեության հիմքում։ Տեւական ժամանակ է նախաձեռնությունն զբաղվում է հայերենի թվայնացմամբ նոր՝ իրապես հեղափոխական մեքենայական ուսուցման մեթոդով։ Ներկայումս ընթանում է հայերենով հաղորդակցական տեխնոլոգիաների ամբողջականացումը։ Հաջորդը լինելու է հայերեն լեզվամտածողությամբ հավաքական բանականության մշակումը, որի հիմքերը՝ մեծ տվյալները (Big Data), արդեն իսկ հավաքված են։
«Առաջին փուլում մշակել ենք այնպիսի գործիքներ, որոնք թույլ կտան զանգվածաբար հաղորդակցվել մեքենայական տարաբնույթ սարքերի հետ մեր ազգային պարծանքով՝ հայերենով։ Հաջորդ փուլում մեքենայական սարքերի ուղեղը «լցվելու» է մեր կողմից մշակված զուտ ազգային ու հավաքական բանականությամբ։ Միայն այդ ճանապարհով կկարողանանք անխուսափելի թվայնացումը ծառայեցնել մեր ազգային նպատակներին եւ ապահովել մեր զարգացման թռիչքը տեխնոլոգիական այս դարում։ Անհնար է նկարագրել բոլոր այն հնարավորությունները, որոնք տալու է հայաստանակենտրոն՝ հայակենտրոն թվայնացումը։ Միայն ասեմ, որ այդ ճանապարհով մենք ստեղծելու ենք անհամար ռեսուրսներ, որոնք ծառայելու են միմիայն մեզ»,- «Հայաստանի Հանրապետություն» օրաթերթի հետ զրույցում նշեց «Ազգային արագացում» հանրային նախաձեռնության ղեկավար Արտակ Հովսեփյանը՝ ընդգծելով, որ չափազանց զգույշ պետք է լինենք հայերենի եւ հայերեն լեզվամտածողության թվայնացման հարցում, որպեսզի թույլ չտանք այդ հզոր ու ամենակարող զենքի տրամադրումը կասկածելի անձանց եւ կառույցներին։
Հիշեցնենք, որ «Ազգային արագացում» հանրային նախաձեռնությունը շուրջ չորս տարի իրականացնում է հայերենի թվայնացման 3 հիմնական նախագծեր նեյրոցանցային ծրագրավորման, մեքենայական խոր ուսուցման (Deep Learning) ճանապարհով. դրանք են՝ բնականին մոտ արհեստական ձայների սինթեզը (Text to Speech), խոսքի ճանաչումը՝ վերծանումը (Automatic Speech Recognition) եւ մեքենայական թարգմանությունը (Neural Machine Translation)։
Աշխարհն արդեն թեւակոխել է համընդհանուր մեքենայացման եւ ռոբոտացման փուլ, որտեղ տարատեսակ մեքենայական սարքերը կառավարվելու են հիմնականում ձայնով՝ որպես արագ, պարզ եւ արդյունավետ միջոց։ Զրուցակիցս նշեց, որ իրենց հաջողվել է սինթեզել բնականին մոտ ձայն ամենավերջին եւ առաջադեմ տեխնոլոգիայով, որի ամենամեծ առավելությունն այն է, որ գործածելի է փոքր ու շարժական հարթակներում եւ շատ արագ է աշխատում։ Իսկ դա նշանակում է, որ Հայաստանում գործածվող տարաբնույթ սարքերը բոլոր ոլորտներում կկարողանան հայերեն «խոսել»։ Հովսեփյանը նաեւ հպարտությամբ նշեց, որ նախաձեռնությունը մոտ է իր այն նպատակին, որը մեքենայական սարքերի հետ կապահովի բնական ձայնով երկկողմ (ASR` մուտք, TTS՝ ելք) հաղորդակցություն։ «Թվային գործիքների հայաֆիկացումն այսօրվա հրամայականն է՝ պայմանավորված մեր դեմ տարվող հիբրիդային պատերազմով»,- ասաց նա։
Նախաձեռնությունն իրականացրել է հայերեն խոսքի ճանաչումը` մշակված 1170 ժամ տվյալներով՝ ձայնագրություններով։ Նպատակը 1500 ժամ եւ ավելի ցուցանիշն է։ Պատկերացնելու համար, թե ինչ ծավալի մասին է խոսքը, զրուցակիցս մանրամասնում է. «Որքան ժամանակ կպահանջվի մեկ րոպե խոսելու եւ այդ մեկ րոպեն տեքստի վերածելու եւ անճշտությունները խմբագրելու համար։ Դե, հիմա պատկերացրեք, որ խոսքը 70 հազար 200 րոպեի մասին է։ Իրականում այս հսկայական աշխատանքը, օրինակ, Ուզբեկստանում կատարում են գիտական հատուկ ինստիտուտները եւ մի քանի տասնյակ ընկերություններ, ինչպես Ռուսաստանում։ Մենք մինչ այժմ խոսքի ճանաչման ծրագրի վրա ծախսել ենք 0 լումա։ Նախաձեռնության սկզբնավորման օրվանից ամբողջ աշխատանքը կատարվել եւ կատարվում է անվճար՝ միմիայն հանրային կարեւորության գիտակցմամբ։ Այսպես մենք ապագայի՝ խորքային Հայաստանի հիմքն ենք կառուցում»։
Գնահատելով մեր առջեւ ծառացած սպառնալիքներն ու մարտահրավերները՝ անցած տարվա հունվարին որոշում կայացվեց զբաղվել ադրբեջաներենի ու թուրքերենի թվայնացմամբ։ Մասնավորապես՝ սկսեցին ադրբեջաներեն եւ թուրքերեն խոսքի ճանաչմամբ, ձայնի սինթեզով եւ մեքենայական թարգմանություն։ Արագորեն ձեւավորվեց «Թվային անվտանգության կորպուս» խումբը, որին անգնահատելի օգնություն են ցուցաբերել արցախցիները՝ ավելի կոնկրետ Արցախի Մեսրոպ Մաշտոցի համալսարանի դասախոսական կազմը եւ ուսանողները։ «Հինգ ամսվա ընթացքում մենք մշակեցինք ադրբեջաներենի եւ թուրքերենի խոսքի ճանաչման, ձայնի սինթեզի եւ մեքենայական թարգմանության թվային գործիքները։ Խոսքի ճանաչման նպատակն է զանգվածային դիտարկում կազմակերպել թշնամական ճամբարներում։ Հետեւել ցանկացած խոսքի, որը սպառնալիք է պարունակում հայության համար, օպերատիվ կանխարգելման նպատակով։ Ձայնի սինթեզն ունի ավելի պրոակտիվ նշանակություն։ Դրանով նախատեսվում է հակաքարոզչական նյութեր պատրաստել թիրախավորելու համար թշնամու թույլ կետերը։ Ինչ վերաբերում է մեքենայական թարգմանության գործիքին, ապա այն պետք է հեշտացնի օպերատիվ թարգմանությունն առանց թարգմանիչների։ Կան ադրբեջաներենով ձայնավորման եւ մեքենայական թարգմանության գործիքները։ Մնում է տեսանյութերի պատրաստումը, որն այնքան էլ բարդ չէ եւ ֆինանսական միջոցներ չի պահանջում։ Ձայնի սինթեզը բավական արագ է աշխատում։ Մեկ վայրկյանում գեներացվում է մոտ 20-30 վայրկյան ձայն»,- մանրամասնեց հանրային նախաձեռնության ղեկավարը։ Հիբրիդային այս պատերազմների շրջանում ակնկալվում է հանրության ավելի ակտիվ մասնակցությունը, քանի որ եթե մասնագետները չեն ցանկանում կամ չեն կարողանում առաջ տանել հայկական շահերից բխող օրակարգը, ապա նրանց փոխարեն դա կարող են անել մեքենաները։