Brief Discussion of AWS Machine Learning Specialty Exam
AWSမှာလက်ရှိဖြေဆိုလို့ရတဲ့ Exam၁၂ခုရှိတဲ့အထဲမှာ အရင်ကဆို AIနဲ့ပတ်သက်တာဆိုလို့ ရှားရှားပါးပါး Specialty Categoryထဲက Machine Learning Specialty တခုပဲရှိတာကနေ အခုဆို Foundational နဲ့Associate category ထဲမှာပါ AI Practitioner ၊Machine Learning Engineer Associateဆိုပြီး Examနှစ်ခု အသစ်တိုးလာပါတယ်။ဒါပေမဲ့ အခုမှ Betaပဲရှိသေးတုန်းဆိုတော့ Examကလက်ရှိအသုံးချနေတဲ့နည်းပညာတွေနဲ့ဘယ်လောက်အတွဲမိတယ်ဆိုတာ ပြောဖို့ခက်ပါသေးတယ်။ဒီဆောင်းပါးမှာတော့ ဖြေလို့ရတာလည်းနည်းနည်းကြာနေပြီး Companyတော်တော်များများ အသိမှတ်ပြုခံထားရတဲ့ Machine Learning Specialty examနဲ့ပတ်သက်ပြီး အနည်းငယ်ဆွေးနွေးချင်ပါတယ်။
၁။ ဘယ်သူတွေဖြေသင့်လဲ
လက်ရှိမှာ Data Scienceပိုင်းမှာလုပ်နေတဲ့သူတွေ ဒါမှမဟုတ် AWS Cloud Platform ပေါ်မှာ Machine Learning နဲ့ပတ်သက်တဲ့ developတာတွေ architecture ဆောက်တာတွေ modelတွေrunနေတာတွေနဲ့ တနှစ်ကျော်ကျော်ဝန်းကျင်လောက်အသားကျနေတဲ့သူတွေဆိုရင်တော့ ကိုယ့်portfolio လေးပိုပြီး strongဖြစ်သွားအောင်ဖြေထားသင့်တဲ့ certificate တခုဆိုရင် မမှားပါဘူး။
၂။ မေးခွန်းပုံစံကဘယ်လိုလဲ
Business logicအခြေပြုထားတဲ့ Machine Learning modelတွေကို AWSရဲ့serviceတွေသုံးပြီး ဘယ်ဟာက အကောင်းဆုံးအဖြေလဲဆိုတာ စဉ်းစားခိုင်းတာမျိုးပါ။အကောင်းဆုံးအဖြေဆိုတာ ယေဘုယျအားဖြင့် Cost-Performance trade off ပါပဲ ။ တချို့နေရာတွေမှာ မေးခွန်းအသွားအလာအရ Costကိုဉီးစားပေးပြီး အဖြေထုတ်ရတာရှိသလို တချို့နေရာတွေမှာကျ Performance ကိုမဖြစ်မနေဉီးစားပေးရတာမျိုးပေါ့။ ဒါဆို တွက်တာချက်တာတွေ ကိုယ့်ထင်မြင်ချက်ရေးသားရတာမျိုးတွေ ပါမှာလား? No ပါ။လုံးဝလုံးဝ မပါပါဘူး။ Response typeက
Multiple Choice: လေးခုထဲက မှန်တာ တခုရွေး
Multiple response: ငါးခု သို့ ငါးခုထက်ပိုသော အဖြေတွေထဲက နှစ်ခု ဒါမှမဟုတ်နှစ်ခုထက်ပိုတာရွေး
ဆိုပြီး ပေးထားတဲ့အဖြေထဲက အသင့်လျော်ဆုံးဟာကို ရွေးထုတ်ရမှာပါ။
၃။ဘယ်လိုဆိုအောင်မှာလဲ
မေးခွန်း၆၅ပုဒ် ဖြေဆိုရမှာဖြစ်ပြီး အမှတ်ပြည့်၁၀၀၀မှာ ၇၅၀ရရင်အောင်တယ်ဆိုပေမဲ့ အမှတ်မယူတဲ့ ၁၅ပုဒ်လည်းရှိသေးတော့ သုံးချက်တွက်နည်းနဲ့ စဉ်းစားကြည့်မယ်ဆိုလို့ရှိရင် ၃၈ပုဒ် မှန်ရင်အောင်ပြီလို့ ဆိုနိုင်ပါတယ်။
၄။ ဘာတွေမေးမှာလဲ
မေးခွန်းပုံစံကတော့ အောက်ပါအတိုင်း Domain ၄မျိူးခွဲထားပါတယ်
Domain 1 : Data Engineering
Machine Learning modelဆောက်ဖို့အတွက်လိုအပ်တဲ့ဒေတာစုဆောင်းတာအတွက်ပြင်ဆင်ပေးရတာမျိုးပါ ဉပမာ customerဆီကလာတဲ့ Data typeတွေကိုဘယ်လိုသိမ်းမလဲ ML modelဆောက်ဖို့အတွက် ဘယ် data typeကိုပြောင်းသင့်လဲ ဒီလို taskတွေကို AWSရဲ့ဘယ်လိုserviceတွေခေါ်သုံးမလဲ (ဉပမာ AWS Glue၊S3၊Apache Sparkစသည်ဖြင့်)
Domain 2: Exploratory Data Analysis
ML model အတွကိသုံးမဲ့ dataတွေကို clean dataဖြစ်အောင်လုပ်ပေးရတဲ့အပိုင်းပေါ့။ missing dataတွေ corruptedဖြစ်နေတာတွေကို ပြင်ဆင်ရတာတို့ Modelအလိုက်normalization, augementation, scaling, data labeling လုပ်ပေးရတာမျိုးတွေရယ် အဆုံးသတ်မှာ ကိုယ်လိုချင်တဲ့ business requirement ပေါ်မူတည်ပြီး binning, one-hot encoding, outlier အစရှိတဲ့ Feature Engineeringဘယ်လိုလုပ်မလဲဆိုတာတွေမေးပါတယ်။AWS serviceတွေထဲက Amazon Athena Amazon Quicksight, SageMaker Ground Truthတို့ကို လေ့လာထားရင် ကောင်းကောင်းကျော်ဖြတ်နိုင်မဲ့ Domainတခုပါ။
Domain 3: Modeling
ဒီအပိုင်းကတော့ MLနဲ့ပတ်သက်ပြီး တော်တော်လေးပြည့်ပြည့်စုံစုံသိထားမှ အဆင်ပြေမယ်ထင်ပါတယ်။ဖြေရှင်းရမဲ့ပြဿနာအပေါ်မူတည်ပြီး MLကတကယ်လိုတာရောဟုတ်ရဲ့လားဆိုတဲ့မေးခွန်းတွေ လိုလာခဲ့ရင်ရော Supervised Learningလား Unsupervised Learningလားကွဲကွဲပြားပြားသိထားသင့်ပြီး foundation modelတွေကို classification regression forecasting clustering recommendation စသည်ဖြင့် မှန်ကန်စွာရွေးတတ်ဖို့လိုပါလိမ့်မယ်။
datasetကို trainingရယ် validationရယ်အတွက်ဘယ်လိုခွဲမလဲ Gradient Descent၊loss function ၊convergerceအစရှိတဲ့ optimization technique တွေထဲကဘယ်ဟာရွေးသင့်လဲ business logicအလိုက် သုံးထားရတဲ့algorithmတွေပေါ်မူတည်ပြီး GPUသုံးမလား CPUသုံးမလား dataကို real timeအတွက်runမှာလားBatchခွဲပြီးrunမှာလား အစရှိတဲ့ ခေါင်းခြောက်စရာတွေရယ်
အပေါ်ကအချက်တွေ အားလုံးပြင်ဆင်ပြီးပြီဆိုရင်တော့ parameter tuningနဲ့Evaluation အတွက်စဉ်းစားရပါတယ် parameter tuningအတွက်ဆို ဒီmodelမှာ regularizationထည့်ရမှာလား cross-validation သုံးသင့်လား Neural Neworkဆိုရင်ရော layer ဘယ်နှစ်လွှာ nodeဘယ်နှစ်ခုထည့်မှာလဲ learning rateရော အတိုးအလျော့ ဘယ်လိုလုပ်ရမလဲ Decision Tree, Random Forest, Gradient Boosting အစရှိတဲ့Tree-based modelတွေသုံးရင် ပိုပြီးထိရောက်မှုရှိနိုင်လား အစရှိတာတွေနဲ့ပတ်သက်တဲ့မေးခွန်းမျိုးတွေလာလေ့ရှိပါတယ်။
modelကြီးတခုလုံး trainပြီးသွားပြီးဆိုရင်တော့ လုပ်ကိုလုပ်သင့်တဲ့evaluation အပိုင်းမှာက overfitting underfittingနဲ့ပတ်သက်တဲ့ bias varianceစစ်တာတို့ accuracy, precision, recall, AUC, ROCအစရှိတဲ့ metricsတွေevaluateလုပ်တာတို့အပြင် offline testing , online testing နဲ့ပတ်သက်တာတွေ trainထားတဲ့ modelsတွေ အများကြီးကိုmetrics comparasionလုပ်ပြီး အကောင်းဆုံးဟာရွေးထုတ်တာတွေလာတတ်ပါတယ်။
Domain 4: Machine Learning Implementation and Operations
ဒီအပိုင်းကတော့ ML conceptထက် AWS serviceကိုအသားပေးမေးလေ့ရှိပါတယ်။ CloudTrail ,CloudWatch သုံးပြီး modelရဲ့logတွေ ဘယ်လိုဖတ်မလဲ။ ကိုယ့်modelကို AWS regionတွေAZတွေမှာ Auto-Scalingဘယ်လိုလုပ်ပြီး deployမလဲ၊Dockerထဲ ဘယ်လိုထည့်မလဲ ကိုယ့်modelနဲ့အဆင်ပြေတဲ့ instanceတွေဘယ်လိုရွေးမလဲ အစရှိတဲ့ ML solutionတခုရဖို့ လိုအပ်တဲ့taskတွေ စဉ်းစားမှာဖြစ်သလို AWS SageMaker ရဲ့algorithmတွေ Amazon Comprehend, Amazon Translateအစရှိတဲ့ AWS High-level services တွေကို အသေးစိတ်သိထားဖို့လည်း လိုအပ်ပါတယ်။
အကျဉ်းချုပ်ရမယ်ဆိုရင် ဒီcertificateက ခေတ်စားနေတဲ့ML careerတခုအတွက် ၁၀၀%အာမခံ မဟုတ်ပေမဲ့ examလေ့လာရင်း ရလာမဲ့ knowledge တွေ information တွေက နောက်တက်မဲ့လှေကားထစ်အတွက် အတိုင်းအတာတခုထိ သက်ရောက်မှုရှိမှာဖြစ်လို့ ဖြေထားတာမမှားတဲ့ certificate တခုလို့ထင်မိပါတယ်။
နောက်ဆောင်းပါးတွေမှာတော့ ဒီစာမေးပွဲအတွက် ဘယ်လောက်အချိန်ယူသင့်လဲ ဘယ်လိုပြင်ဆင်ရမလဲဆိုတာကို အသေးစိတ်ဆွေးနွေးသွားပါ့မယ်။
Subscribe to my newsletter
Read articles from tabarkhet directly inside your inbox. Subscribe to the newsletter, and don't miss out.
Written by