Software Engineering Issue in Machine Learning Deployment
Published:
AI/ML model တစ်ခုကို Deploy လုပ်တဲ့အခါ ဖြစ်ပေါ်လာတဲ့ Software Engineering Issue တွေ အကြောင်းဆက်ပြောပါမယ်ခင်ဗျာ
Real-Time or Batch: ကိုယ့် model က Real-Time သွားမယ်ဆို low-latency နဲ့ response time မြန်အောင်လုပ်ရမယ် ဥပမာ စကားပြောလိုက်တာနဲ့ စာတန်းထိုးပေးတာ Speech Recognition တို့လိုမျိုးမှာ နှေးနေရင်အဆင်မပြေပါဘူး Real-Time မလိုပဲ Data တွေအများကြီးကို process လုပ်ရတဲ့ system တွေမှာ data တွေကို Batch လေးတွေ ခွဲပြီး process လုပ်ကြတယ် Latency များပေမယ့် Data များတဲ့ system တွေအတွက် အသုံးကျပါတယ် ဥပမာ - Recommendation System
Deployment Location: Cloud(Complex models အတွက်) or Edge(local device အတွက်) or Web Browser ပေါ်မှာလား ကိုယ်လုပ်မယ့် model အပေါ်မူတည်ပြီး ရွေးချယ်ရပါတယ်
Compute & Memory Constraints: ကိုယ် deploy လုပ်မယ့် နေရာမှာ high CPU/GPU တွေ မရှိတတ်တာကြောင့် Optimizaton တွေလုပ်ရတတ်ပါတယ်
တခြားသော Security ပိုင်းတွေ Maintenance ပိုင်းတွေမှာလည်း Software Engineering ရဲ့ Challenges တွေ ရှိတတ်ပါတယ် AI/ML model တစ်ခုကို deploy လုပ်တဲ့နေရာမှာ တွေ့ကြုံရမယ့် challenges များဖြစ်ပါတယ်ခင်ဗျာ
Reference ကတော့ Andrew Ng ရဲ့ course ပါ Machine Learning in Production

