Augmentace dat
Augmentace dat (rozšiřování dat) označuje soubor technik určených k vytváření kvalitních syntetických dat prostřednictvím úprav stávajících dat.[1][2] Tento proces spočívá v generování nových vzorků, které slouží k trénování modelu, což umožňuje získat větší množství informací z menšího množství dat.[3] Augmentace dat zvyšuje počet označených dat potřebných pro hluboké učení[4] a zároveň zabraňuje nadměrnému přizpůsobení modelu při trénování hlubokých neuronových sítí, zejména v případě nedostatku trénovacích dat.[5][6] Tohoto efektu se dosahuje trénováním modelů na několika mírně upravených verzích původních dat.[7] Tyto metody zvyšují rozmanitost a množství dat, která jsou k dispozici pro trénování modelů strojového učení, a tím zlepšují jejich zobecňovací schopnosti.
Metody augmentace dat
[editovat | editovat zdroj]Metoda syntetického nadvzorkování
[editovat | editovat zdroj]Metoda syntetického nadvzorkování (Synthetic Minority Over-sampling Technique, SMOTE) je určena ke zvýšení zastoupení podreprezentované třídy a ke zlepšení výkonu klasifikátorů, které mohou mít tendenci preferovat většinovou třídu.[8] Cílem SMOTE je vytvořit vyvážené rozložení tříd pomocí generování umělých vzorků podreprezentované třídy pomocí interpolace.[9]
Algoritmus SMOTE
[editovat | editovat zdroj]Algoritmus SMOTE spočívá ve výběru vzorku X0 z podreprezentované třídy a následném určení jeho K nejbližších sousedů X, který náleží téže podreprezentované třídě. Nový syntetický vzorek se poté vytvoří interpolací mezi těmito dvěma bodle podle vzorce: Z = X0 + w (X − X0), kde w je realizace rovnoměrně rozložené náhodné veličiny v intervalu [0; 1].[10]
Augmentace dat v oblasti zpracování obrazu
[editovat | editovat zdroj]Augmentace dat pro zpracování obrazu je technika strojového učení, jejímž cílem je generování nových trénovacích obrazů na základě stávajících obrazů. Tento proces zahrnuje aplikaci různých geometrických transformací na původní obraz, čímž vznikají nové varianty trénovacích vzorků obrazů.[11] Účelem těchto transformací je vytvořit další vzorky dané třídy při zachování její základní kategorie nezměněné.[12]
Geometrické transformace
[editovat | editovat zdroj]Geometrické transformace jsou jednou z technik augmentace dat využívaných při zpracování obrazu, která pomáhá s vytvořením různých variací obrazů, což pomáhá zlepšit generalizaci modelu při strojovém učení.[6]
Příklady geometrických transformací:
- Rotace obrazu: Otočení obrazu o zadaný úhel v rozsahu 0 až 360 stupňů.[13]
- Posun obrazu: Posunutí obrazu v některém ze směrů nahoru, dolů, doprava nebo doleva.[13] Složením dvou lze posunout do libovolného směru.
- Zkosení: Posunutí každého bodu obrazu v lineární závislosti na vzdálenosti od osy zkosení.[13]
- Zrcadlení obrazu: Horizontální nebo vertikální překlopení obrazu.[13]
- Ořezání obrazu: Použití výřezu z původního obrazu.[11]
Transformace barevného prostoru
[editovat | editovat zdroj]Digitální obrazová data jsou obvykle kódována jako tenzor o rozměrech výška × šířka × barevné kanály (zpravidla tři). Mezi metody transformace barevného prostoru patří manipulace hodnot pixelů za účelem zvýšení nebo snížení jasu, oddělování jednotlivých RGB kanálů a úpravy, jako je převod na stupně šedi nebo manipulace histogramu. Tyto metody simulují různé světelné podmínky a upravují barevné vlastnosti obrázků, čímž připravují modely na zpracování obrazů s různorodými vizuálními vlastnostmi.[6]
Přidávání šumu
[editovat | editovat zdroj]Vnášení šumu do obrázků simuluje nedokonalosti reálného světa a učí modely ignorovat irelevantní odchylky. Vnášení šumu pomáhá modelům neuronových sítí optimalizovat svou výkonnost podle intenzity šumu, na kterém byly trénovány. Například přidání Gaussova šumu napodobuje šum snímače nebo zrnitost.[6]
Augmentace dat pro zpracování signálu
[editovat | editovat zdroj]Biologické signály
[editovat | editovat zdroj]Proces augmentace dat je důležitý v oblasti zpracování biologických signálů, které jsou často obtížné získat, protože bývají vysoce dimenzionální a vzácné.[14]
Nedostatek dat je obzvláště patrný u problémů zpracování signálů, jako je například elektromyografie (EMG) u Parkinsonovy nemoci. Tato data jsou obtížně dostupná.[15] Zanini a kolektiv zjistili, že generativní adversariální sítě (GAN), konkrétně model DCGAN (Deep Convolutional GAN), mohou být použity k provedení tzv. přenosu stylu.[15] Tento přístup umožňuje generovat syntetické elektromyografické signály, které odpovídají těm, jež vykazují pacienti s Parkinsonovou nemocí.[15]
Reference
[editovat | editovat zdroj]V tomto článku byl použit překlad textu z článku Data augmentation na anglické Wikipedii.
- ↑ MUMUNI, Alhassan; MUMUNI, Fuseini. Data augmentation: A comprehensive survey of modern approaches. Array. 2022-12-01, roč. 16, s. 100258. Dostupné online [cit. 2025-01-25]. ISSN 2590-0056. doi:10.1016/j.array.2022.100258.
- ↑ Data Augmentation - an overview | ScienceDirect Topics. www.sciencedirect.com [online]. [cit. 2025-01-30]. Dostupné online.
- ↑ HASSAN, Haseeb; REN, Zhaoyu; ZHAO, Huishi. Review and classification of AI-enabled COVID-19 CT imaging models based on computer vision tasks. Computers in Biology and Medicine. 2022-02-01, roč. 141, s. 105123. Dostupné online [cit. 2025-01-25]. ISSN 0010-4825. doi:10.1016/j.compbiomed.2021.105123. PMID 34953356.
- ↑ SALEH, Alzayat; SHEAVES, Marcus; JERRY, Dean. Applications of deep learning in fish habitat monitoring: A tutorial and survey. Expert Systems with Applications. 2024-03-15, roč. 238, s. 121841. Dostupné online [cit. 2025-01-25]. ISSN 0957-4174. doi:10.1016/j.eswa.2023.121841.
- ↑ XIE, Yangchen; CHEN, Xinyuan; ZHAN, Hongjian. Weakly supervised scene text generation for low-resource languages. Expert Systems with Applications. 2024-03-01, roč. 237, s. 121622. Dostupné online [cit. 2025-01-25]. ISSN 0957-4174. doi:10.1016/j.eswa.2023.121622.
- ↑ a b c d SHORTEN, Connor; KHOSHGOFTAAR, Taghi M.; FURHT, Borko. Text Data Augmentation for Deep Learning. Journal of Big Data. 2021-07-19, roč. 8, čís. 1, s. 101. Dostupné online [cit. 2025-01-16]. ISSN 2196-1115. doi:10.1186/s40537-021-00492-0. PMID 34306963. (anglicky)
- ↑ WANG, Shujuan; DAI, Yuntao; SHEN, Jihong. Research on expansion and classification of imbalanced data based on SMOTE algorithm. Scientific Reports. 2021-12-15, roč. 11. Dostupné v archivu pořízeném z originálu dne 2024-11-21. doi:10.1038/. (anglicky)
- ↑ CHAWLA, N. V.; BOWYER, K. W.; HALL, L. O. SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research. 2002-06-01, roč. 16, s. 321–357. Dostupné online [cit. 2025-01-16]. ISSN 1076-9757. doi:10.1613/jair.953. (anglicky)
- ↑ AMIRRUDDIN, Amiratul Diyana; MUHARAM, Farrah Melissa; ISMAIL, Mohd Hasmadi. Synthetic Minority Over-sampling TEchnique (SMOTE) and Logistic Model Tree (LMT)-Adaptive Boosting algorithms for classifying imbalanced datasets of nutrient and chlorophyll sufficiency levels of oil palm (Elaeis guineensis) using spectroradiometers and unmanned aerial vehicles. Computers and Electronics in Agriculture. 2022-02-01, roč. 193, s. 106646. Dostupné online [cit. 2025-01-25]. ISSN 0168-1699. doi:10.1016/j.compag.2021.106646.
- ↑ ELREEDY, Dina; ATIYA, Amir F. A Comprehensive Analysis of Synthetic Minority Oversampling Technique (SMOTE) for handling class imbalance. Information Sciences. 2019-12-01, roč. 505, s. 32–64. Dostupné online [cit. 2025-01-29]. ISSN 0020-0255. doi:10.1016/j.ins.2019.07.070.
- ↑ a b Albumentations Documentation - What is image augmentation. albumentations.ai [online]. [cit. 2025-01-29]. Dostupné online. (anglicky)
- ↑ TONG, Kang; WU, Yiquan; ZHOU, Fei. Recent advances in small object detection based on deep learning: A review. Image and Vision Computing. 2020-05-01, roč. 97, s. 103910. Dostupné online [cit. 2025-01-25]. ISSN 0262-8856. doi:10.1016/j.imavis.2020.103910.
- ↑ a b c d KUMAR, Teerath; BRENNAN, Rob; MILEO, Alessandra. Image Data Augmentation Approaches: A Comprehensive Survey and Future Directions. IEEE Access. 2024, roč. 12, s. 187536–187571. Dostupné online [cit. 2025-01-25]. ISSN 2169-3536. doi:10.1109/ACCESS.2024.3470122.
- ↑ BIRD, Jordan J.; PRITCHARD, Michael; FRATINI, Antonio. Synthetic Biological Signals Machine-Generated by GPT-2 Improve the Classification of EEG and EMG Through Data Augmentation. IEEE Robotics and Automation Letters. 2021-04, roč. 6, čís. 2, s. 3498–3504. Dostupné online [cit. 2025-01-16]. ISSN 2377-3766. doi:10.1109/LRA.2021.3056355.
- ↑ a b c ANICET ZANINI, Rafael; LUNA COLOMBINI, Esther. Parkinson’s Disease EMG Data Augmentation and Simulation with DCGANs and Style Transfer. Sensors. 2020-05-03, roč. 20, čís. 9, s. 2605. Dostupné online [cit. 2025-01-16]. ISSN 1424-8220. doi:10.3390/s20092605. PMID 32375217. (anglicky)