Machine Learning Issue in Machine Learning Deployment
Published:
ML Life Cycle ထဲက Data တွေစု Model တွေ train ပြီးတော့ User တွေ အသုံးပြုလို့ရအောင် လုပ်တဲ့ အပိုင်းဖြစ်တဲ့ Deployment ပိုင်းကို ပြောပြပေးချင်ပါတယ်ခင်ဗျာ Deployment လုပ်တဲ့နေရာမှာ အဓိက Challenges နှစ်ခုကတော့ ML Issue နဲ့ Software Engineering Issue တို့ပဲဖြစ်ပါတယ်
ML Issue မှာ တော့ Concept Drift နဲ့ Data Drift ဆိုပြီး နှစ်ခုရှိပါတယ် ဒါတွေကတော့ ကိုယ့်ရဲ့ model ကို deploy လုပ်ပြီးနောက်ပိုင်းမှာ Data တွေ change သွားတာကြောင့် ဖြစ်ပေါ်လာတဲ့ issues တွေပါ
Concept Drift နဲ့ Data Drift ဘယ်လိုကွာလဲ?? အိမ်ခြံမြေ စျေးကို ခန့်မှန်းတဲ့ AI model ဆိုပါစို့ x (home size) -> y (house price) အရင်က x sizeရှိတဲ့အိမ်ကို y စျေးပေးရတယ် အိမ်စျေးတွေ ရုတ်တရက် ခုန်တက်သွားတော့ အိမ်ရဲ့ size အတူတူ ကိုမှ y စျေးတွေ ပြောင်းလဲသွားတယ် input အတူတူပဲ target ကတော့ အမြဲတမ်း change နေရင် Concept drift ဖြစ်တယ် လို့ခေါ်တယ် Data drift ကတော့ x (home size) ပဲ changes ဖြစ်တယ် x နဲ့ y ရဲ့ mapping ကတော့ မပြောင်း သွားဘူး ဥပမာ အရင်က လူတွေက 1000 စတုရန်းပေ အိမ်တွေပဲဆောက်ခဲ့ရာကနေ နောက်ပိုင်း 2000စတုရန်းပေ လောက်တိုးပြီး အိမ်ကြီးတွေပဲ ပြောင်းဆောက်လာတယ် ဆိုပါစို့ အိမ်ရဲ့ size သာ ပြောင်းသွားတယ် စျေးတွေမပြောင်းသွားဘူး mapping မပြောင်းလဲသွားတာကို Data Drift လို့ခေါ်ပါတယ်
Software Engineering Issue ကတော့ နောက် Post တစ်ခုမှာ ဆက်ရေးပါမယ် ခင်ဗျာ Reference ကတော့ Andrew Ng ရဲ့ course ပါ Machine Learning in Production

