Machine Learning Issue in Machine Learning Deployment

less than 1 minute read

Published:

ML Life Cycle ထဲက Data ​တွေစု Model ​တွေ train ပြီး​တော့ User ​တွေ အသုံးပြုလို့ရ​အောင် လုပ်တဲ့ အပိုင်းဖြစ်တဲ့ Deployment ပိုင်းကို ​ပြောပြ​ပေးချင်ပါတယ်ခင်ဗျာ Deployment လုပ်တဲ့​နေရာမှာ အဓိက Challenges နှစ်ခုက​တော့ ML Issue နဲ့ Software Engineering Issue တို့ပဲဖြစ်ပါတယ်

ML Issue မှာ ​တော့ Concept Drift နဲ့ Data Drift ဆိုပြီး နှစ်ခုရှိပါတယ် ဒါ​တွေက​တော့ ကိုယ့်ရဲ့ model ကို deploy လုပ်ပြီး​နောက်ပိုင်းမှာ Data ​တွေ change သွားတာ​ကြောင့် ဖြစ်​ပေါ်လာတဲ့ issues ​တွေပါ

Concept Drift နဲ့ Data Drift ဘယ်လိုကွာလဲ?? အိမ်ခြံ​မြေ ​စျေးကို ခန့်မှန်းတဲ့ AI model ဆိုပါစို့ x (home size) -> y (house price) အရင်က x sizeရှိတဲ့အိမ်ကို y ​စျေး​ပေးရတယ် အိမ်​စျေး​တွေ ရုတ်တရက် ခုန်တက်သွား​တော့ အိမ်ရဲ့ size အတူတူ ကိုမှ y ​စျေး​တွေ ​ပြောင်းလဲသွားတယ် input အတူတူပဲ target က​တော့ အမြဲတမ်း change ​နေရင် Concept drift ဖြစ်တယ် လို့​ခေါ်တယ် Data drift က​တော့ x (home size) ပဲ changes ဖြစ်တယ် x နဲ့ y ရဲ့ mapping က​တော့ မ​ပြောင်း သွားဘူး ဥပမာ အရင်က လူ​တွေက 1000 စတုရန်း​ပေ အိမ်​တွေပဲ​ဆောက်ခဲ့ရာက​နေ ​နောက်ပိုင်း 2000စတုရန်း​ပေ လောက်တိုးပြီး အိမ်ကြီး​တွေပဲ ​ပြောင်းဆောက်လာတယ် ဆိုပါစို့ အိမ်ရဲ့ size သာ ​ပြောင်းသွားတယ် ​စျေး​တွေမ​ပြောင်းသွားဘူး mapping မ​ပြောင်းလဲသွားတာကို Data Drift လို့​ခေါ်ပါတယ်

Software Engineering Issue က​တော့ ​နောက် Post တစ်ခုမှာ ဆက်​ရေးပါမယ် ခင်ဗျာ Reference က​တော့ Andrew Ng ရဲ့ course ပါ Machine Learning in Production

mlissue