Data Augmentation

less than 1 minute read

Published:

Data Augmentation လုပ်တယ်ဆိုတာက​တော့ ကိုယ့်ရဲ့ AI model ကို ပိုပြီး နားလည်​အောင် ရှိပြီးသား dataset ကိုမှ modify လုပ်ထားတဲ့ data အသစ်​လေး​တွေ ထပ်ထည့်တဲ့ technique ဖြစ်ပါတယ် သူ့ကို Unstructured data (images,videos ,text) တွေအတွက်သုံးပါတယ်

ဥပမာ - Speech Recognition မှာဆိုရင် “Hello” လို့​ပြောတဲ့အသံပဲ ထားပါ​တော့ အဲ့ “Hello” ​ပြောတဲ့ အသံ ကို ​ဘေးမှာ noise ​တွေ ပါခဲ့ရင်​တောင် AI က recognize ဖြစ်​အောင် မူလ “Hello” အသံ​နောက်မှာ Music ​လေး​တွေ ထပ်ထည့်တာတို့ လူသံ​တွေ ထပ်ထည့်တာတို့ လုပ်တာကို Data Augmentation လုပ်တာလို့​ခေါ်တယ်

Data ​တွေ modify လုပ်တဲ့​နေရမှာလည်း realistic ဖြစ်ရမယ် အသံဆို တကယ့် လူအစစ်အသံ သီချင်းသံ noise ​တွေဖြစ်ရမယ် အရမ်း noisy ဖြစ်ပြီး “Hello” အသံပါ ​ပျောက်​လောက်​အောင် ကိုယ်ဘာသာ တောင် မခွဲနိုင်​တော့တဲ့ အသံ data ဆိုရင်​တော့ ကိုယ့် AI model အတွက် ​ကောင်း​တော့မှာမဟုတ်ပါ Data Augmentation လုပ်ရင် သတိထားရမယ့်အချက်​တွေဖြစ်ပါတယ်

အဲ့​တော့

  1. Model Train မယ်
  2. Error analysis လုပ်မယ် ( train ပြီး​တော့ ရလာတဲ့ model ရဲ့ weak spot ​တွေ ရှာမယ်)
  3. Data Augmentation လုပ်
  4. Refined လုပ်ထားတဲ့ data နဲ့ ပြန် train ဒါကို Data Iteration loop လုပ်တယ်လို့​ခေါ်ပါတယ် အဲ့လို train ခြင်းအားဖြင့် ကိုယ့် AI model ရဲ့ performance ပိုပြီး ​ကောင်းလာမှာပါ

Reference က​တော့ Andrew Ng ရဲ့ course ပါ Machine Learning in Production

dataAug