[Нийтлэгдсэн огноо: 2019-12-30]
Технологи, тэр дундаа мэдээллийн технологийн эрчимтэй хөгжлийн энэ үед Дата аналист /Data analyst/ болон Дата сайнтист /Data Scientist/ гэхчлэн шинэ ажил, мэргэжил бий болж байна. Ерөнхийд нь авч үзвэл өгөгдлийг шинжлэх ухаан талаас нь судлах тухай ойлголт юм.
Эдгээр нэр томъёог одоогоор Монгол хэлнээ орчуулж оноосон нь үгүй учир бид энэ ярилцлагадаа олон улсын англи нэршлээр нь оруулж байгаа гэдгийг учирлая. Дата буюу өгөгдөл гэдгийг тодруулж, энэ талын мэдээлэл өгөх зорилгоор “ORDB Сonsulting” ХХК-ийн Ахлах аналист Сумъяагийн Уянгыг урьж ярилцлаа.
– Ярилцлагын эхэнд манай уншигчдад өөрийгөө танилцуулна уу?
– Таньд болон уншигчдад нь энэ өдрийн мэндийг хүргэе. Юуны түрүүнд ярилцлага өгөх боломжийг гаргасан Zaluu.com-н багт маш их баярлаж байгаагаа илэрхийлмээр байна. Би 2012 онд МУИС-ийн Эдийн засгийн сургуулийн Статистикийн ангийг төгсөөд Юнитель компанид Бизнесийн Аналист /судлаач/-аар ажиллаж эхэлснээр Их өгөгдөлтэй холбоотой судалгаа шинжилгээ хийх замнал руу орсон. Тэгээд 2015 оноос Тайван улсын Тайпэй хотод Бизнесийн удирдлагын чиглэлээр суралцаж магистр хамгаалсан. Улмаар 2019 онд АНУ-ийн Bentley Их сургуульд Шинжлэх ухааны магистр хамгаалсан. Дата аналистаар зургаан жил, харин Дата сайнтистаар гурван жил ажилласан туршлагатай.
– Одоо өөрөө ORDB consulting компанид ажиллаж байгаа гэлээ. Ямар чиглэлээр ажиллаж байна вэ?
– 2014 оноо хойш ORDB Сonsulting ХХК-д Ахлах аналистаар ажиллаж байна. Би харилцагчдынхаа хүсэлтээр хэрэглэгчийн болон зах зээлийн судалгаа шинжилгээ хийдэг. Мөн харилцагчдын өөрсдийнх нь дотоод мэдээлэл дээр анализ хийх үйл явцыг хариуцдаг. Гарсан үр дүн дээр менежментийн шийдвэр гаргадаг учраас дата анализ маш чухал байгаа юм. Манай компанийн хувьд миний гаргасан анализын үр дүн дээр Ахлах зөвлөх маань бизнесийн анализ хийж үүн дээрээ суурилж стратеги төлөвлөлт гаргадаг.
Тэгэхээр Дата анализ гэдэг маань шийдвэр гаргах үндэс суурь гэсэн үг. Хэрэв ямар нэгэн мэдээлэл дата-гүйгээр шийдвэр гаргаж байгаа бол харанхуй явж байна л гэсэн үг шүү дээ. Тэгэхээр дата анализ хийхийн гол ач холбогдол нь менежментийн оновчтой шийдвэр гаргахад мэдээллээр хангах явдал гэж ойлгож болно.
– Дата гэж яг юуг хэлж байна вэ? Ер нь энэ талын ойлголт иргэдэд тийм ч их биш байх.
– Сүүлийн жилүүдэд ихээр яригдах болсон учраас дата гэдэг ухагдахууныг иргэд ерөнхийд нь сонссон байх. Дата гэдэг маань цуглуулагдсан баримтыг хэлдэг. Анхан шатны процесс хийгдээд эхлэхээр мэдээлэл (information) болдог. Энэ мэдээллийг хэрхэн гаргаж авах, ямар зорилгоор ашиглаж байгаагаас шалтгаалан анализ хийх байдал өөр өөр байдаг.
– Дата анализ гэхээр ерөнхийд нь өгөгдлийн судалгаа гэж ойлгож болох уу?
-Тийм, Ерөнхиийдөө өгөгдөлд шинжилгээ судалгаа хийгээд өнгөрсөн хийгээд одоогийн нөхцөл байдал ийм байна гэсэн үр дүн гаргаж өгч болно. Эсвэл бид ирээдүй ийм байх юм байна аа гэж таамаглаж болно. Үүн дээрээ тулгуурлаж ийм арга хэмжээ авбал үр дүн ингэж өөрчлөгдөж болно гэсэн прогноз таамаглал хийж болдог.
– Дата аналист, Дата сайнтист гэдгийг ялгаж салгаж тодруулж хэлээч. Одоо өөрөө Дата сайнистаар ажиллаж байгаа гэлээ…
– Одоо би Дата сайнтист гэж явж байгаа. Урьд нь Дата аналистаар ажиллаж байсан. Дата-ны хэмжээ, арга аргачлал нэмэгдэж байгаатай холбоотой олон улсад маш олон төрлийн ажлын байрууд бий болсон. Үүний нэг нь Дата сайнтист юм.
Дата аналист гэдэг маань өгөгдөлд статистик болон математикийн арга аргачлалыг ашиглан шинжилгээ хийн удирдлагыг шийдвэр гаргахад мэдээллээр хангадаг. Харин Дата сайнист гэдэг нь статистик, математик болон компьютерийн шинжлэх ухааны нэгдэл гэж явдаг ба таамаглах анализ буюу predictive analysis хийх, загвар байгуулах, ирээдүйн таамаглал хийх чиглэлээр ажилладаг гэсэн үг.
Цаашлаад Дата инженер, Их өгөгдлийн инженер, Хиймэл оюун ухааны судлаач зэрэг олон төрлийн дататай холбоотой мэргэжлүүд бий. Эдгээр нь өгөгдлийн хэмжээ ба хэр нарийн мэргэжлийн арга, аргачлалтай ажиллаж байгаа вэ гэдгээс хамааран ажил үүрэг нь өөр өөр байдаг.
– Яагаад энэ чиглэлээр суралцаж, ажиллахаар сонгосон бэ?
– Энэ чиглэлээр сонирхох болсон нь Юнительд ажиллаж байх үеэс эхлэлтэй. Тэнд ажиллаж байхдаа бид таамаглал хийж байгаа анализууд болон, дата майнингийн чиглэлээр гадаадын нэгэн компанийн сургалт авч байсан. Тэр сургалтын үеэр яг энэ чиглэлээр цааш нь хөгжүүлэлт боловсруулалт хийгээд явах боловсон хүчин Монголд байхгүй юм байна гэдгийг мэдэрсэн. Хэдийгээр би статистик төгссөн, цаад талынх нь ухагдахууныг нь ойлгоод байгаа ч гэсэн яг бодитоор хийх гэхээр сурч мэдсэн маань дутаад байсан. Тийм болохоор дата-гийн шинжлэх ухааны чиглэлээр сурах хэрэгтэй юм байна гэж шийдсэн.
– Байгууллагууд мэдээлэл олж авах ямар нэг давуу нөхцөл байдал байдаг уу?
– Мэдээлллийг компаниуд ихэнхдээ өөрсдөө цуглуулдаг. Өөрсдийн бүтээгдэхүүн үйлчилгээ, вебсайтаар дамжуулан цуглуулж болно. Жишээ нь, Google Analytics зэрэг веб анализын хэрэгслүүдийг ашиглаж болно.
Зарим улсууд нээлттэй дата буюу open data байдлаар өгөгдлийг олон нийтэд ашиглахад нээлттэй болгосон байдаг. Монголын хувьд 1212.mn -р статистикийн мэдээлэл авч болно гэхдээ миний хувьд энэ мэдээлэл нь хязгаарлагдмал санагддаг.
Судалгаа шинжилгээ болон сургалтын зорилгоор маш олон дата мэдээлэл олон нийтэд нээлттэй байдаг ба тэдгээрийг ашиглах боломжтой. Google Dataset Search хайлтын систем бий. Үүгээр өөрт хэрэгтэй өгөгдлийг олох боломжтой.
– Дата анализ хийхэд хувь хүний мэдээлэл тийм чухал биш биз дээ?
– Чухал байдаг. Олон улсад хувь хүн рүү чиглэсэн үйлчилгээ гаргах, бүтээгдэхүүн бий болгосноор компаниуд борлуултаа илүү нэмэгдүүлж ашиг орлогоо өсгөж чадаж байна. Жишээлбэл: компаниуд хэрэглэгчдээ хүрэхийн тулд маркетингийн үйл ажиллагаа явуулдаг. Тухайн компани бүх хэрэглэгч рүү маркетинг хийнэ гэдэг маш их өртөг өндөртэй ажил. Түүний оронд орлого оруулах боломжтой хэрэгчлэгчдээ тодорхойлоод тэдэн рүү чиглэсэн маркетинг явуулбал илүү хямд төсөр зардлаар их ашиг олох боломжтой гэсэн үг. Тэгвэл тэр зорилтот хэрэглэгчийг тодорхойлохын тулд хувь хүний мэдээлэл маш чухал байдаг.
– Үндсэндээ мэдээллийг баялаг болгоно л гэсэн үг юм байна гэж ойлголоо…
– Тийм. Техник, технологийн эрин үед өгөгдөл нь маш үнэ цэнэтэй зүйл. Олон улсад шинээр гарч ирж байгаа амжилттай гарааны бизнесүүдийн ихэнх нь өгөгдөлд суурилсан байгаа. Жижиг гэлтгүй томоохон компаниуд цуглуулсан өгөгдлөөс үнэ цэнэ бий болгох нь тэдгээрийн үйл ажиллагааны салшгүй хэсэг болсон. Үүнээс үүдэлтэйгээр “Өгөгдөл бол шинэ алт”, “Өгөгдөл бол шинэ газрын тос” зэрэг харьцуулалтууд байдаг нь өгөгдөл хэр үнэ цэнэтэйг харуулж байгаа байх.
Гэхдээ өгөгдөл их байх тусмаа сайн гэсэн зүйл биш. Мэдээжийн хэрэг их мэдээлэлтэй байх нь илүү нарийн шинжилгээ хийх боломжийг бий болгодог ч чанартай мэдээлэл байхгүй бол бид хичнээн нарийн шинжилгээ хийгээд ямар ч уялдаа холбоо, үр дүнг илрүүлж чадахгүй гэсэн үг. Мөн өгөгдлийг шинжилгээнд бэлдэн цэвэрлэх, боловсруулах нь маш цаг үрсэн ажил байдаг. Нийт шинжилгээ хийх хугацааны 60-80% нь үүнд зарцуулагддаг. Тиймээс чанартай өгөгдөл цуглуулах нь чухал.
– Хүмүүс өөрт хэрэгтэй дата-гаа цуглуулдаг байх. Жишээ нь би механик хүн гэхэд тэр талынхаа дата-г цуглуулдаг байх. Тэгэхээр Монголд дата худалддаг, худалдан авдаг компани гэж байна уу?
– Дата худалдаж авах нь хэцүү төвөгтэй асуудал. Компаниуд дата цуглуулдаг байлаа ч гэсэн тэр дата-нууд хувь хүний нууцтай холбоотой болоод явчихдаг. Тийм болохоор Монголд ч тэр, олон улсад ч тэр дата худалдах асуудал нь төвөгтэй. Саяхан АНУ-д Cambridge Analytica гэдэг компани Фэйсбүүкийн хэрэглэгчдийн мэдээллийг цуглуулж, тэр мэдээллээ улс төрийн зорилгоор ашигласан хэргээр шүүхэд татагдсан. Ер нь компаниуд хэрэглэгчийнхээ мэдээллийг зарахад анхаарал нухацтай ханддаг.
– Энэ талыг зохицуулсан эрх зүйн орчин байдаг уу?
– Монголд хувийн нууцыг хамгаалах ерөнхий хууль бол бий. Гэхдээ хувь хүний дижитал дата мэдээллийг хамгаалах, хадгалах, түгээхтэй холбоотой нарийн зохицуулалт байхгүй.
– Мэдээллийн аюулгүй байдал гэж их ярьдаг болжээ…
– Мэдээллийн аюулгүй байдал одоо үед их яригдах болсон бөгөөд нилээн чухал асуудал гэж би хувьдаа боддог. Хүмүүс ихэвчлэн тухайн компанийн бүтээгдэхүүн үйлчилгээг ашиглахад компани тэдний ямар мэдээллийг авч, цааш нь яаж ашигладгийг төдийлөн мэддэггүй, зарим нь ойшоодоггүй. Хамгийн түгээмэл жишээ нь, бид фэйсбүүкт бүх мэдээллээ өгчихдөг. Гэсэн ч тэр мэдээлэл цаашаа хэрхэн ашиглагдаж байгааг мэддэггүй. Хувь хүний зүгээс төдийгүй улс орны зүгээс энэ талаар арга хэмжээ авах, зохицуулалт хийх шаардлагатай санагддаг. Тухайлбал, Европт гэхэд General Data Protection Regulation (GDPR) гээд хувь хүний мэдээллийг хадгалах хууль журам гарчихсан явж байна. Энэ журмын дагуу Google, Facebook гээд том компаниудад хэрэглэгчдийн мэдээллийг зарим байдлаар ашиглахад хориг тавьдаг.
– Хувь хүний зүгээс нууцаа хамгаалахад юу хийвэл зохистой вэ?
– Ямар нэгэн апплакейшн, программ ашиглаж байгаа тохиолдолд нэгдүгээрт өөрийнхөө үндсэн эрх, үүргээ мэддэг байх хэрэгтэй. Жишээлбэл: аппликэйшн ашиглахад эхлээд “Хэллэг ба Нөхцөл” (Terms and Conditions) гээд ACCEPT хийдэг цонх гарч ирдэг. Тэнд компаниуд таны ямар мэдээллийг цуглуулах, яаж ашиглах гэдгийг бичсэн байдаг. Гэтэл үүнийг ихэнх хүн уншилгүй шууд доош нь гүйлгээд accept хийчихдэг. Дараа нь хувийн датаг буруу ашигласан тохиолдол гарахад бид тэр ашиглалтыг зөвшөөрчихсөн учраас яаж ч чаддаггүй. Жишээлбэл: Amazon-ы Echo гээд хүний хэлсэн үгийг ойлгож, буцаад хариулдаг дивайс бий. Өнгөрсөн жил энэ дивайс нь өөртэй нь ярьсан ярианаас гадна хувь хүний яриаг бичин компани руу явуулж байсан нь нилээн шуугиан тарьсан. Үүний дүнд энэ дивайсыг ашигладаг хүмүүс компани руу ярианы бичлэгээ явуулах эсэхээ сонгодог болсон.
Хувь хүн мэдээллээ хамгаалахын тулд хувийн тохиргоонуудыг сайн ашиглах хэрэгтэй. Amazon, Facebook дээр хувь хүн өөрсдийнхөө дата-г татаж авч устгадаг функц суулгачихсан байгаа. Жишээ нь би хүсэх юм бол фэйсбүүкийнхээ мэдээллийг аваад устгачихаж болно гэсэн үг.
– АНУ-д суралцсан туршлагаасаа хуваалцаач…
– АНУ одоогийн байдлаар хиймэл оюун ухаан болон өгөгдлийн шинжлэх ухааны чиглэлийн дэлхийд тэргүүлэгч улсуудын нэг. АНУ-с гадна Хятад, Европын улсууд энэ чиглэлээр нилээн судалгаа, шинжилгээ хийж байгаа.
Сургууль болон програмаас хамааран энэ чиглэлийн сургалтууд ялгаатай байдаг. АНУ-д очиход дата-гийн шинжлэх ухаантай холбоотой бүх зүйл өөр байсан. Томоохон компаниудад хийгдэж байгаа зүйлс маш гүнзгий түвшинд байсан. Мөн өгөгдлийн шинжлэх ухааны онол үзэхийн хажуугаар практик талын мэдлэг олж авах шаардлагатай болсон. Тэгээд сургууль дээрээ профессоруудтайгаа судалгаа шинжилгээний ажил хийдэг байлаа. Манай сургууль дээр “Дата Лаб” гээд дата-тай холбоотой уузалт болдог. Миний хувьд тэнд ирсэн хүмүүст нь хичээл заах, судалгаа хийх зэргээр багшдаа туслаад явдаг байсан.
Үүнээс гадна Америкт энэ чиглэлийн хурал, тэмцээн олон болдог. Оюутнуудад олддог давуу тал нь энэ хурал тэмцээнд оролцох боломж их байдаг. Хурал нь бусад хүнд үнэтэй байхад оюутнуудад хямдралтай байх жишээний. Зарим нь бүр үнэгүй. Иймэрхүү хурал уулзалтад энэ мэргэжлийн салбарт ажиллаж байгаа эрдэмтэн судлаачид илтгэл тавьдаг. Тийм болохоор тэдэнтэй холбоо харилцаа тогтоох, туршлагаас нь суралцах боломж бүрддэг. Мөн сургуулиасаа баг бүрдүүлээд тэмцээнүүдэд оролцдог байв.
– Гадагшаа, тэр дундаа Америк явсан хүмүүс тэндээ үлдчихээд байх юм. Харин эх орондоо эргээд ирсэн болхоор том зорилготой л ирсэн байх…
– Хувь хүн өөрсдөөс нь л шалтгаалдаг байх. Тэнд амьдрах орчин гоё, хөгжих, өсөж дэвжих боломж бололцоо гээд маш их зүйл байгаа.
Гэхдээ Дата сайнс нь Монголд сүүлийн жилүүдэд л яригдаж эхэлсэн чиглэл болохоор Монголдоо ирж хөгжүүлье гэж бодсон. “Machine Learning UB Community” гэж бий. Хиймэл оюун ухааны чиглэлээр ажилладаг, сонирхдог мэргэжилтнүүд мэдлэг, туршлагаа хуваалцдаг клуб. Зарим нэг нь мэдэх байх. Америкаас ирээд энэ клубт хамрагдаад бид өөрийнхөө туршлагыг хуваалцаад явж байна. Түүнийгээ буцаагаад хүмүүст хүргэх чиглэлээр ажиллаж байна.
– Америкаас ирэхэд Монголд энэ тал дээр ямаршуухан дүр зураг харагдаж байх юм?
– АНУ-д байхдаа Монголд энэ чиглэлээр яг юу хийгдэж байгааг сайн мэдэхгүй байсан. Ирээд харж байхад Монголын гарааны бизнес болон томоохон компаниудад энэ чиглэлээр нэлээд ажил хийгдэж байгаа юм байна гэдгийг мэдэрсэн. Нэг сул тал нь тэр бүхнийгээ олон нийтэд танилцуулдаггүй, компаниуд тус тусдаа юмаа хийгээд яваад байдаг юм билээ. Нөгөө талаасаа дата хувийн нууцтай холбоотой байдаг учраас шууд тараачихаж болдоггүйд байдаг биз ээ.
– Хэтийн ямар төлөвлөгөөтэй ажиллаж байна?
– Миний хувьд Дата сайнсыг Монголд дэлгэрүүлье гэсэн төлөвлөгөөтэй байна. Хувь хүний зүгээс энэ чиглэлээрээ нарийн мэргэшиж хиймэл оюун ухааны чиглэлийн судалгаа шинжилгээг хийгээд явъя гэсэн төлөвлөгөөтэй байна.
– Хиймэл оюун ухааны чиглэлээр гэхээр сонирхолтой сонсогдож байна…
– Хиймэл оюун ухаан гэдэг маань ерөнхийдөө хүн шиг сэтгэн бодох чадвартай машин гэсэн үг юм. Энэ машин маань хүрээлэн буй орчноосоо суралцаж, бие даан шийдвэр гаргах, бусадтай харилцах зэрэг хүний хийж чадах бүх зүйлийг хийх чадвартай байлгахаар эрдэмтэд ажиллаж байгаа. Эдгээр хүн шиг үйлдлүүдийг хийхийн тулд цаана нь маш их хэмжээний өгөгдлийн боловсруулалт хийгддэг. Тэдгээрийн нэг нь машин сургалт буюу machine learning юм. Дата сайнтистууд энэ машин сургалтын арга аргачлал, загваруудтай ажилдаг. Машин сургалт гэдэг нь өгөгдлөөс хэлбэр бүтэц, шинж тэмдэг байж болох бүх юмыг сураад гаргаж авсан тодорхой шинж тэмдэг бүхий загвараа шинэ дата дээр уншуулж тодорхойгүй байгаа тэр зүйлээ нөхцөл байдлаа таамаглаж гаргаж ирэх боломжийг өгдөг. Машин сургалтаас гадна байгалийн хэл боловсруулалт (natural language processing), компьютерийн хараа (computer vision) зэрэг хэд хэдэн чиглэл нийлж Хиймэл Оюун Ухааны шинжлэх ухааныг бүрдүүлдэг.
– Монголд хиймэл оюун ухаан хөгжих боломж хэр байна вэ?
– Байгаа, байгаа. Гарааны бизнес дата дээр суурилж гарч ирдэг болсон. Үүний хамгийн том жишээ Lend.mn байна. Болорсофт жишээлбэл Монгол хэлний боловсруулалт (natural language processing)-н чиглэлд Монголд тэргүүлж буй компани байна. Боломж хийгээд техникийн чадвар бол байна. Харин боловсон хүчин талаасаа дутагдалтай санагддаг. Монголд Дата сайнс чиглэлээр боловсон хүчин бэлтгэдэг сургууль байхгүй. Цөөхөн тооны багш, профессорууд энэ чиглэлээр судалгаа хийдэг. Тиймээс энэ салбарыг хөгжүүлэхийн тулд залуу үеийг дататай холбоотой чиглэл рүү ороход дэмжих, энэ чиглэлийн сургалтын хөтөлбөрийг бий болгох, компаниуд дадлагажигч байдлаар оюутан залуучуудыг чадавхижуулах ажлууд хийгдэх хэрэгтэй санагддаг. Мөн компанийн удирдлагууд үүнд нээлттэй хандаж, датанд суурилсан шийдвэр гаргалтыг дэмжин, залуу дата сайнтистуудад шинэ арга аргачлал, загваруудыг ашиглах боломжийг олгодог байх хэрэгтэй.
– Уншигчидад маань зориулаад өөр хэлэх зүйл байна уу?
– Монголд дата сайнсыг дэлгэрүүлэх хүслийнхээ хүрээнд, “Machine Learning UB Community” клубтай хамтран бид 2020 оны 4 дүгээр сард Хиймэл Оюун Ухааны хурлыг Монголд зохион байгуулахаар төлөвлөж байна. Энэ эвентийн гол зорилго нь дата-ны хэрэглээ, анализ ямар чухал юм гэдэг талаар мэдээлэл хүргэх зорилготой.
Хурал маань 2-3 өдөр үргэлжлэх ба мэргэжилтнүүд Монголд энэ чиглэлээр яг ямар ажил хийгдэж байгаа, Дата дээр яаж ажиллаж болох зэрэг сэдвээр илтгэл тавих, workshop хийх болон Хакатон тэмцээн зохион байгуулахаар төлөвлөж байна.
Тиймээс, Монголын судалгаа шинжилгээ хийдэг болон их датаг ашиглан бүтээгдэхүүн, үйлчилгээ хүргэдэг компаниудтай хамтран ажиллахыг хүсч байгаа ба хамтран ажиллахаар сонирхсон байгууллага бидэнтэй холбогдоно уу гэж уримаар байна. Бид он гараад илүү дэлгэрэнгүй мэдээллийг сошиал медиа сувгаар дамжуулан хүргэн, хамтрахыг хүсч буй байгууллагуудруугаа хандаж эхлэхээр төлөвлөж байгаа.■
Ярилцлага авсан: П. Ядамдорж, Zaluu.com
ЭХ ХУВИЛБАР: http://www.zaluucom.mn/read/41g22db6a
[Нийтлэгдсэн огноо: 2019-12-30]
Технологи, тэр дундаа мэдээллийн технологийн эрчимтэй хөгжлийн энэ үед Дата аналист /Data analyst/ болон Дата сайнтист /Data Scientist/ гэхчлэн шинэ ажил, мэргэжил бий болж байна. Ерөнхийд нь авч үзвэл өгөгдлийг шинжлэх ухаан талаас нь судлах тухай ойлголт юм.
Эдгээр нэр томъёог одоогоор Монгол хэлнээ орчуулж оноосон нь үгүй учир бид энэ ярилцлагадаа олон улсын англи нэршлээр нь оруулж байгаа гэдгийг учирлая. Дата буюу өгөгдөл гэдгийг тодруулж, энэ талын мэдээлэл өгөх зорилгоор “ORDB Сonsulting” ХХК-ийн Ахлах аналист Сумъяагийн Уянгыг урьж ярилцлаа.
– Ярилцлагын эхэнд манай уншигчдад өөрийгөө танилцуулна уу?
– Таньд болон уншигчдад нь энэ өдрийн мэндийг хүргэе. Юуны түрүүнд ярилцлага өгөх боломжийг гаргасан Zaluu.com-н багт маш их баярлаж байгаагаа илэрхийлмээр байна. Би 2012 онд МУИС-ийн Эдийн засгийн сургуулийн Статистикийн ангийг төгсөөд Юнитель компанид Бизнесийн Аналист /судлаач/-аар ажиллаж эхэлснээр Их өгөгдөлтэй холбоотой судалгаа шинжилгээ хийх замнал руу орсон. Тэгээд 2015 оноос Тайван улсын Тайпэй хотод Бизнесийн удирдлагын чиглэлээр суралцаж магистр хамгаалсан. Улмаар 2019 онд АНУ-ийн Bentley Их сургуульд Шинжлэх ухааны магистр хамгаалсан. Дата аналистаар зургаан жил, харин Дата сайнтистаар гурван жил ажилласан туршлагатай.
– Одоо өөрөө ORDB consulting компанид ажиллаж байгаа гэлээ. Ямар чиглэлээр ажиллаж байна вэ?
– 2014 оноо хойш ORDB Сonsulting ХХК-д Ахлах аналистаар ажиллаж байна. Би харилцагчдынхаа хүсэлтээр хэрэглэгчийн болон зах зээлийн судалгаа шинжилгээ хийдэг. Мөн харилцагчдын өөрсдийнх нь дотоод мэдээлэл дээр анализ хийх үйл явцыг хариуцдаг. Гарсан үр дүн дээр менежментийн шийдвэр гаргадаг учраас дата анализ маш чухал байгаа юм. Манай компанийн хувьд миний гаргасан анализын үр дүн дээр Ахлах зөвлөх маань бизнесийн анализ хийж үүн дээрээ суурилж стратеги төлөвлөлт гаргадаг.
Тэгэхээр Дата анализ гэдэг маань шийдвэр гаргах үндэс суурь гэсэн үг. Хэрэв ямар нэгэн мэдээлэл дата-гүйгээр шийдвэр гаргаж байгаа бол харанхуй явж байна л гэсэн үг шүү дээ. Тэгэхээр дата анализ хийхийн гол ач холбогдол нь менежментийн оновчтой шийдвэр гаргахад мэдээллээр хангах явдал гэж ойлгож болно.
– Дата гэж яг юуг хэлж байна вэ? Ер нь энэ талын ойлголт иргэдэд тийм ч их биш байх.
– Сүүлийн жилүүдэд ихээр яригдах болсон учраас дата гэдэг ухагдахууныг иргэд ерөнхийд нь сонссон байх. Дата гэдэг маань цуглуулагдсан баримтыг хэлдэг. Анхан шатны процесс хийгдээд эхлэхээр мэдээлэл (information) болдог. Энэ мэдээллийг хэрхэн гаргаж авах, ямар зорилгоор ашиглаж байгаагаас шалтгаалан анализ хийх байдал өөр өөр байдаг.
– Дата анализ гэхээр ерөнхийд нь өгөгдлийн судалгаа гэж ойлгож болох уу?
-Тийм, Ерөнхиийдөө өгөгдөлд шинжилгээ судалгаа хийгээд өнгөрсөн хийгээд одоогийн нөхцөл байдал ийм байна гэсэн үр дүн гаргаж өгч болно. Эсвэл бид ирээдүй ийм байх юм байна аа гэж таамаглаж болно. Үүн дээрээ тулгуурлаж ийм арга хэмжээ авбал үр дүн ингэж өөрчлөгдөж болно гэсэн прогноз таамаглал хийж болдог.
– Дата аналист, Дата сайнтист гэдгийг ялгаж салгаж тодруулж хэлээч. Одоо өөрөө Дата сайнистаар ажиллаж байгаа гэлээ…
– Одоо би Дата сайнтист гэж явж байгаа. Урьд нь Дата аналистаар ажиллаж байсан. Дата-ны хэмжээ, арга аргачлал нэмэгдэж байгаатай холбоотой олон улсад маш олон төрлийн ажлын байрууд бий болсон. Үүний нэг нь Дата сайнтист юм.
Дата аналист гэдэг маань өгөгдөлд статистик болон математикийн арга аргачлалыг ашиглан шинжилгээ хийн удирдлагыг шийдвэр гаргахад мэдээллээр хангадаг. Харин Дата сайнист гэдэг нь статистик, математик болон компьютерийн шинжлэх ухааны нэгдэл гэж явдаг ба таамаглах анализ буюу predictive analysis хийх, загвар байгуулах, ирээдүйн таамаглал хийх чиглэлээр ажилладаг гэсэн үг.
Цаашлаад Дата инженер, Их өгөгдлийн инженер, Хиймэл оюун ухааны судлаач зэрэг олон төрлийн дататай холбоотой мэргэжлүүд бий. Эдгээр нь өгөгдлийн хэмжээ ба хэр нарийн мэргэжлийн арга, аргачлалтай ажиллаж байгаа вэ гэдгээс хамааран ажил үүрэг нь өөр өөр байдаг.
– Яагаад энэ чиглэлээр суралцаж, ажиллахаар сонгосон бэ?
– Энэ чиглэлээр сонирхох болсон нь Юнительд ажиллаж байх үеэс эхлэлтэй. Тэнд ажиллаж байхдаа бид таамаглал хийж байгаа анализууд болон, дата майнингийн чиглэлээр гадаадын нэгэн компанийн сургалт авч байсан. Тэр сургалтын үеэр яг энэ чиглэлээр цааш нь хөгжүүлэлт боловсруулалт хийгээд явах боловсон хүчин Монголд байхгүй юм байна гэдгийг мэдэрсэн. Хэдийгээр би статистик төгссөн, цаад талынх нь ухагдахууныг нь ойлгоод байгаа ч гэсэн яг бодитоор хийх гэхээр сурч мэдсэн маань дутаад байсан. Тийм болохоор дата-гийн шинжлэх ухааны чиглэлээр сурах хэрэгтэй юм байна гэж шийдсэн.
– Байгууллагууд мэдээлэл олж авах ямар нэг давуу нөхцөл байдал байдаг уу?
– Мэдээлллийг компаниуд ихэнхдээ өөрсдөө цуглуулдаг. Өөрсдийн бүтээгдэхүүн үйлчилгээ, вебсайтаар дамжуулан цуглуулж болно. Жишээ нь, Google Analytics зэрэг веб анализын хэрэгслүүдийг ашиглаж болно.
Зарим улсууд нээлттэй дата буюу open data байдлаар өгөгдлийг олон нийтэд ашиглахад нээлттэй болгосон байдаг. Монголын хувьд 1212.mn -р статистикийн мэдээлэл авч болно гэхдээ миний хувьд энэ мэдээлэл нь хязгаарлагдмал санагддаг.
Судалгаа шинжилгээ болон сургалтын зорилгоор маш олон дата мэдээлэл олон нийтэд нээлттэй байдаг ба тэдгээрийг ашиглах боломжтой. Google Dataset Search хайлтын систем бий. Үүгээр өөрт хэрэгтэй өгөгдлийг олох боломжтой.
– Дата анализ хийхэд хувь хүний мэдээлэл тийм чухал биш биз дээ?
– Чухал байдаг. Олон улсад хувь хүн рүү чиглэсэн үйлчилгээ гаргах, бүтээгдэхүүн бий болгосноор компаниуд борлуултаа илүү нэмэгдүүлж ашиг орлогоо өсгөж чадаж байна. Жишээлбэл: компаниуд хэрэглэгчдээ хүрэхийн тулд маркетингийн үйл ажиллагаа явуулдаг. Тухайн компани бүх хэрэглэгч рүү маркетинг хийнэ гэдэг маш их өртөг өндөртэй ажил. Түүний оронд орлого оруулах боломжтой хэрэгчлэгчдээ тодорхойлоод тэдэн рүү чиглэсэн маркетинг явуулбал илүү хямд төсөр зардлаар их ашиг олох боломжтой гэсэн үг. Тэгвэл тэр зорилтот хэрэглэгчийг тодорхойлохын тулд хувь хүний мэдээлэл маш чухал байдаг.
– Үндсэндээ мэдээллийг баялаг болгоно л гэсэн үг юм байна гэж ойлголоо…
– Тийм. Техник, технологийн эрин үед өгөгдөл нь маш үнэ цэнэтэй зүйл. Олон улсад шинээр гарч ирж байгаа амжилттай гарааны бизнесүүдийн ихэнх нь өгөгдөлд суурилсан байгаа. Жижиг гэлтгүй томоохон компаниуд цуглуулсан өгөгдлөөс үнэ цэнэ бий болгох нь тэдгээрийн үйл ажиллагааны салшгүй хэсэг болсон. Үүнээс үүдэлтэйгээр “Өгөгдөл бол шинэ алт”, “Өгөгдөл бол шинэ газрын тос” зэрэг харьцуулалтууд байдаг нь өгөгдөл хэр үнэ цэнэтэйг харуулж байгаа байх.
Гэхдээ өгөгдөл их байх тусмаа сайн гэсэн зүйл биш. Мэдээжийн хэрэг их мэдээлэлтэй байх нь илүү нарийн шинжилгээ хийх боломжийг бий болгодог ч чанартай мэдээлэл байхгүй бол бид хичнээн нарийн шинжилгээ хийгээд ямар ч уялдаа холбоо, үр дүнг илрүүлж чадахгүй гэсэн үг. Мөн өгөгдлийг шинжилгээнд бэлдэн цэвэрлэх, боловсруулах нь маш цаг үрсэн ажил байдаг. Нийт шинжилгээ хийх хугацааны 60-80% нь үүнд зарцуулагддаг. Тиймээс чанартай өгөгдөл цуглуулах нь чухал.
– Хүмүүс өөрт хэрэгтэй дата-гаа цуглуулдаг байх. Жишээ нь би механик хүн гэхэд тэр талынхаа дата-г цуглуулдаг байх. Тэгэхээр Монголд дата худалддаг, худалдан авдаг компани гэж байна уу?
– Дата худалдаж авах нь хэцүү төвөгтэй асуудал. Компаниуд дата цуглуулдаг байлаа ч гэсэн тэр дата-нууд хувь хүний нууцтай холбоотой болоод явчихдаг. Тийм болохоор Монголд ч тэр, олон улсад ч тэр дата худалдах асуудал нь төвөгтэй. Саяхан АНУ-д Cambridge Analytica гэдэг компани Фэйсбүүкийн хэрэглэгчдийн мэдээллийг цуглуулж, тэр мэдээллээ улс төрийн зорилгоор ашигласан хэргээр шүүхэд татагдсан. Ер нь компаниуд хэрэглэгчийнхээ мэдээллийг зарахад анхаарал нухацтай ханддаг.
– Энэ талыг зохицуулсан эрх зүйн орчин байдаг уу?
– Монголд хувийн нууцыг хамгаалах ерөнхий хууль бол бий. Гэхдээ хувь хүний дижитал дата мэдээллийг хамгаалах, хадгалах, түгээхтэй холбоотой нарийн зохицуулалт байхгүй.
– Мэдээллийн аюулгүй байдал гэж их ярьдаг болжээ…
– Мэдээллийн аюулгүй байдал одоо үед их яригдах болсон бөгөөд нилээн чухал асуудал гэж би хувьдаа боддог. Хүмүүс ихэвчлэн тухайн компанийн бүтээгдэхүүн үйлчилгээг ашиглахад компани тэдний ямар мэдээллийг авч, цааш нь яаж ашигладгийг төдийлөн мэддэггүй, зарим нь ойшоодоггүй. Хамгийн түгээмэл жишээ нь, бид фэйсбүүкт бүх мэдээллээ өгчихдөг. Гэсэн ч тэр мэдээлэл цаашаа хэрхэн ашиглагдаж байгааг мэддэггүй. Хувь хүний зүгээс төдийгүй улс орны зүгээс энэ талаар арга хэмжээ авах, зохицуулалт хийх шаардлагатай санагддаг. Тухайлбал, Европт гэхэд General Data Protection Regulation (GDPR) гээд хувь хүний мэдээллийг хадгалах хууль журам гарчихсан явж байна. Энэ журмын дагуу Google, Facebook гээд том компаниудад хэрэглэгчдийн мэдээллийг зарим байдлаар ашиглахад хориг тавьдаг.
– Хувь хүний зүгээс нууцаа хамгаалахад юу хийвэл зохистой вэ?
– Ямар нэгэн апплакейшн, программ ашиглаж байгаа тохиолдолд нэгдүгээрт өөрийнхөө үндсэн эрх, үүргээ мэддэг байх хэрэгтэй. Жишээлбэл: аппликэйшн ашиглахад эхлээд “Хэллэг ба Нөхцөл” (Terms and Conditions) гээд ACCEPT хийдэг цонх гарч ирдэг. Тэнд компаниуд таны ямар мэдээллийг цуглуулах, яаж ашиглах гэдгийг бичсэн байдаг. Гэтэл үүнийг ихэнх хүн уншилгүй шууд доош нь гүйлгээд accept хийчихдэг. Дараа нь хувийн датаг буруу ашигласан тохиолдол гарахад бид тэр ашиглалтыг зөвшөөрчихсөн учраас яаж ч чаддаггүй. Жишээлбэл: Amazon-ы Echo гээд хүний хэлсэн үгийг ойлгож, буцаад хариулдаг дивайс бий. Өнгөрсөн жил энэ дивайс нь өөртэй нь ярьсан ярианаас гадна хувь хүний яриаг бичин компани руу явуулж байсан нь нилээн шуугиан тарьсан. Үүний дүнд энэ дивайсыг ашигладаг хүмүүс компани руу ярианы бичлэгээ явуулах эсэхээ сонгодог болсон.
Хувь хүн мэдээллээ хамгаалахын тулд хувийн тохиргоонуудыг сайн ашиглах хэрэгтэй. Amazon, Facebook дээр хувь хүн өөрсдийнхөө дата-г татаж авч устгадаг функц суулгачихсан байгаа. Жишээ нь би хүсэх юм бол фэйсбүүкийнхээ мэдээллийг аваад устгачихаж болно гэсэн үг.
– АНУ-д суралцсан туршлагаасаа хуваалцаач…
– АНУ одоогийн байдлаар хиймэл оюун ухаан болон өгөгдлийн шинжлэх ухааны чиглэлийн дэлхийд тэргүүлэгч улсуудын нэг. АНУ-с гадна Хятад, Европын улсууд энэ чиглэлээр нилээн судалгаа, шинжилгээ хийж байгаа.
Сургууль болон програмаас хамааран энэ чиглэлийн сургалтууд ялгаатай байдаг. АНУ-д очиход дата-гийн шинжлэх ухаантай холбоотой бүх зүйл өөр байсан. Томоохон компаниудад хийгдэж байгаа зүйлс маш гүнзгий түвшинд байсан. Мөн өгөгдлийн шинжлэх ухааны онол үзэхийн хажуугаар практик талын мэдлэг олж авах шаардлагатай болсон. Тэгээд сургууль дээрээ профессоруудтайгаа судалгаа шинжилгээний ажил хийдэг байлаа. Манай сургууль дээр “Дата Лаб” гээд дата-тай холбоотой уузалт болдог. Миний хувьд тэнд ирсэн хүмүүст нь хичээл заах, судалгаа хийх зэргээр багшдаа туслаад явдаг байсан.
Үүнээс гадна Америкт энэ чиглэлийн хурал, тэмцээн олон болдог. Оюутнуудад олддог давуу тал нь энэ хурал тэмцээнд оролцох боломж их байдаг. Хурал нь бусад хүнд үнэтэй байхад оюутнуудад хямдралтай байх жишээний. Зарим нь бүр үнэгүй. Иймэрхүү хурал уулзалтад энэ мэргэжлийн салбарт ажиллаж байгаа эрдэмтэн судлаачид илтгэл тавьдаг. Тийм болохоор тэдэнтэй холбоо харилцаа тогтоох, туршлагаас нь суралцах боломж бүрддэг. Мөн сургуулиасаа баг бүрдүүлээд тэмцээнүүдэд оролцдог байв.
– Гадагшаа, тэр дундаа Америк явсан хүмүүс тэндээ үлдчихээд байх юм. Харин эх орондоо эргээд ирсэн болхоор том зорилготой л ирсэн байх…
– Хувь хүн өөрсдөөс нь л шалтгаалдаг байх. Тэнд амьдрах орчин гоё, хөгжих, өсөж дэвжих боломж бололцоо гээд маш их зүйл байгаа.
Гэхдээ Дата сайнс нь Монголд сүүлийн жилүүдэд л яригдаж эхэлсэн чиглэл болохоор Монголдоо ирж хөгжүүлье гэж бодсон. “Machine Learning UB Community” гэж бий. Хиймэл оюун ухааны чиглэлээр ажилладаг, сонирхдог мэргэжилтнүүд мэдлэг, туршлагаа хуваалцдаг клуб. Зарим нэг нь мэдэх байх. Америкаас ирээд энэ клубт хамрагдаад бид өөрийнхөө туршлагыг хуваалцаад явж байна. Түүнийгээ буцаагаад хүмүүст хүргэх чиглэлээр ажиллаж байна.
– Америкаас ирэхэд Монголд энэ тал дээр ямаршуухан дүр зураг харагдаж байх юм?
– АНУ-д байхдаа Монголд энэ чиглэлээр яг юу хийгдэж байгааг сайн мэдэхгүй байсан. Ирээд харж байхад Монголын гарааны бизнес болон томоохон компаниудад энэ чиглэлээр нэлээд ажил хийгдэж байгаа юм байна гэдгийг мэдэрсэн. Нэг сул тал нь тэр бүхнийгээ олон нийтэд танилцуулдаггүй, компаниуд тус тусдаа юмаа хийгээд яваад байдаг юм билээ. Нөгөө талаасаа дата хувийн нууцтай холбоотой байдаг учраас шууд тараачихаж болдоггүйд байдаг биз ээ.
– Хэтийн ямар төлөвлөгөөтэй ажиллаж байна?
– Миний хувьд Дата сайнсыг Монголд дэлгэрүүлье гэсэн төлөвлөгөөтэй байна. Хувь хүний зүгээс энэ чиглэлээрээ нарийн мэргэшиж хиймэл оюун ухааны чиглэлийн судалгаа шинжилгээг хийгээд явъя гэсэн төлөвлөгөөтэй байна.
– Хиймэл оюун ухааны чиглэлээр гэхээр сонирхолтой сонсогдож байна…
– Хиймэл оюун ухаан гэдэг маань ерөнхийдөө хүн шиг сэтгэн бодох чадвартай машин гэсэн үг юм. Энэ машин маань хүрээлэн буй орчноосоо суралцаж, бие даан шийдвэр гаргах, бусадтай харилцах зэрэг хүний хийж чадах бүх зүйлийг хийх чадвартай байлгахаар эрдэмтэд ажиллаж байгаа. Эдгээр хүн шиг үйлдлүүдийг хийхийн тулд цаана нь маш их хэмжээний өгөгдлийн боловсруулалт хийгддэг. Тэдгээрийн нэг нь машин сургалт буюу machine learning юм. Дата сайнтистууд энэ машин сургалтын арга аргачлал, загваруудтай ажилдаг. Машин сургалт гэдэг нь өгөгдлөөс хэлбэр бүтэц, шинж тэмдэг байж болох бүх юмыг сураад гаргаж авсан тодорхой шинж тэмдэг бүхий загвараа шинэ дата дээр уншуулж тодорхойгүй байгаа тэр зүйлээ нөхцөл байдлаа таамаглаж гаргаж ирэх боломжийг өгдөг. Машин сургалтаас гадна байгалийн хэл боловсруулалт (natural language processing), компьютерийн хараа (computer vision) зэрэг хэд хэдэн чиглэл нийлж Хиймэл Оюун Ухааны шинжлэх ухааныг бүрдүүлдэг.
– Монголд хиймэл оюун ухаан хөгжих боломж хэр байна вэ?
– Байгаа, байгаа. Гарааны бизнес дата дээр суурилж гарч ирдэг болсон. Үүний хамгийн том жишээ Lend.mn байна. Болорсофт жишээлбэл Монгол хэлний боловсруулалт (natural language processing)-н чиглэлд Монголд тэргүүлж буй компани байна. Боломж хийгээд техникийн чадвар бол байна. Харин боловсон хүчин талаасаа дутагдалтай санагддаг. Монголд Дата сайнс чиглэлээр боловсон хүчин бэлтгэдэг сургууль байхгүй. Цөөхөн тооны багш, профессорууд энэ чиглэлээр судалгаа хийдэг. Тиймээс энэ салбарыг хөгжүүлэхийн тулд залуу үеийг дататай холбоотой чиглэл рүү ороход дэмжих, энэ чиглэлийн сургалтын хөтөлбөрийг бий болгох, компаниуд дадлагажигч байдлаар оюутан залуучуудыг чадавхижуулах ажлууд хийгдэх хэрэгтэй санагддаг. Мөн компанийн удирдлагууд үүнд нээлттэй хандаж, датанд суурилсан шийдвэр гаргалтыг дэмжин, залуу дата сайнтистуудад шинэ арга аргачлал, загваруудыг ашиглах боломжийг олгодог байх хэрэгтэй.
– Уншигчидад маань зориулаад өөр хэлэх зүйл байна уу?
– Монголд дата сайнсыг дэлгэрүүлэх хүслийнхээ хүрээнд, “Machine Learning UB Community” клубтай хамтран бид 2020 оны 4 дүгээр сард Хиймэл Оюун Ухааны хурлыг Монголд зохион байгуулахаар төлөвлөж байна. Энэ эвентийн гол зорилго нь дата-ны хэрэглээ, анализ ямар чухал юм гэдэг талаар мэдээлэл хүргэх зорилготой.
Хурал маань 2-3 өдөр үргэлжлэх ба мэргэжилтнүүд Монголд энэ чиглэлээр яг ямар ажил хийгдэж байгаа, Дата дээр яаж ажиллаж болох зэрэг сэдвээр илтгэл тавих, workshop хийх болон Хакатон тэмцээн зохион байгуулахаар төлөвлөж байна.
Тиймээс, Монголын судалгаа шинжилгээ хийдэг болон их датаг ашиглан бүтээгдэхүүн, үйлчилгээ хүргэдэг компаниудтай хамтран ажиллахыг хүсч байгаа ба хамтран ажиллахаар сонирхсон байгууллага бидэнтэй холбогдоно уу гэж уримаар байна. Бид он гараад илүү дэлгэрэнгүй мэдээллийг сошиал медиа сувгаар дамжуулан хүргэн, хамтрахыг хүсч буй байгууллагуудруугаа хандаж эхлэхээр төлөвлөж байгаа.■
Ярилцлага авсан: П. Ядамдорж, Zaluu.com
ЭХ ХУВИЛБАР: http://www.zaluucom.mn/read/41g22db6a