Data Augmentation

less than 1 minute read

Published: February 01, 2025

Data Augmentation လုပ်တယ်ဆိုတာကတော့ ကိုယ့်ရဲ့ AI model ကို ပိုပြီး နားလည်အောင် ရှိပြီးသား dataset ကိုမှ modify လုပ်ထားတဲ့ data အသစ်လေးတွေ ထပ်ထည့်တဲ့ technique ဖြစ်ပါတယ် သူ့ကို Unstructured data (images,videos ,text) တွေအတွက်သုံးပါတယ်

ဥပမာ - Speech Recognition မှာဆိုရင် “Hello” လို့ပြောတဲ့အသံပဲ ထားပါတော့ အဲ့ “Hello” ပြောတဲ့ အသံ ကို ဘေးမှာ noise တွေ ပါခဲ့ရင်တောင် AI က recognize ဖြစ်အောင် မူလ “Hello” အသံနောက်မှာ Music လေးတွေ ထပ်ထည့်တာတို့ လူသံတွေ ထပ်ထည့်တာတို့ လုပ်တာကို Data Augmentation လုပ်တာလို့ခေါ်တယ်

Data တွေ modify လုပ်တဲ့နေရမှာလည်း realistic ဖြစ်ရမယ် အသံဆို တကယ့် လူအစစ်အသံ သီချင်းသံ noise တွေဖြစ်ရမယ် အရမ်း noisy ဖြစ်ပြီး “Hello” အသံပါ ပျောက်လောက်အောင် ကိုယ်ဘာသာ တောင် မခွဲနိုင်တော့တဲ့ အသံ data ဆိုရင်တော့ ကိုယ့် AI model အတွက် ကောင်းတော့မှာမဟုတ်ပါ Data Augmentation လုပ်ရင် သတိထားရမယ့်အချက်တွေဖြစ်ပါတယ်

အဲ့တော့

Model Train မယ်
Error analysis လုပ်မယ် ( train ပြီးတော့ ရလာတဲ့ model ရဲ့ weak spot တွေ ရှာမယ်)
Data Augmentation လုပ်
Refined လုပ်ထားတဲ့ data နဲ့ ပြန် train ဒါကို Data Iteration loop လုပ်တယ်လို့ခေါ်ပါတယ် အဲ့လို train ခြင်းအားဖြင့် ကိုယ့် AI model ရဲ့ performance ပိုပြီး ကောင်းလာမှာပါ

Reference ကတော့ Andrew Ng ရဲ့ course ပါ Machine Learning in Production

dataAug

Share on

Bluesky Facebook LinkedIn Mastodon X (formerly Twitter)

Pyae Linn

Data Augmentation

Share on

You May Also Enjoy

Future Blog Post

Software Engineering Issue in Machine Learning Deployment

Machine Learning Issue in Machine Learning Deployment

Three Basic Components of Machine Learning Applications