Úplná prostorová náhodnost
Úplná prostorová náhodnost (anglicky Complete spatial randomness – CSR) popisuje bodový proces, při kterém se bodové události vyskytují v rámci dané sledované oblasti zcela náhodně. CSR je synonymem pro homogenní Poissonův prostorový proces.[1] Takový proces je často modelován pouze jednou proměnnou, tj. hustotou bodů ve vymezené oblasti. Termín úplná prostorová náhodnost je běžně používán v aplikované statistice v rámci zkoumání určitých bodových modelů, zatímco ve většině ostatních statistických kontextech odkazuje na koncept Poissonova prostorového procesu.[1]
Model
[editovat | editovat zdroj]Data v podobě sady bodů, nepravidelně rozmístěných v dané oblasti, se vyskytují v mnoha různých kontextech; například jako umístění stromů v lese, ptačích hnízd, jader v tkáni nebo poloha nemocných lidí. Jakýkoliv takový souboru dat nazýváme prostorový bodový model a odkazujeme jím na umístění jako na události, k odlišení od jakýchkoli jiných bodů příslušné oblasti. Hypotéza úplné prostorové náhodnosti prostorového bodového modelu tvrdí, že počet událostí jakékoli oblasti je dán Poissonovým rozdělením o daném průměru při jednotném rozdělení. Události modelu jsou nezávisle a rovnoměrně rozložené v prostoru. Jinými slovy, pro jednotlivé události je stejně pravděpodobné, že se vyskytnou kdekoli a bez vzájemných interakcí.
"Rovnoměrný" se používá ve smyslu stejnoměrného rozdělení pravděpodobnosti v celé studované oblasti, nikoli ve smyslu "rovnoměrného" rozptýlení ve sledované oblasti.[2] Mezi událostmi nedochází k žádným interakcím, jelikož intenzita událostí v rovině se nemění. Předpoklad nezávislosti by byl porušen například v případě, že by existence jedné události buď podnítila, nebo potlačila výskyt jiných událostí v okolí.
Rozdělení
[editovat | editovat zdroj]Pravděpodobnost nalezení právě bodů v oblasti s hustotou jevu je tedy:
Prvním momentem, kterým je průměrný počet bodů v této oblasti, je . Tato hodnota je intuitivní, tak jako Poissonův parametr.
Pravděpodobnost s jakou se v určité radiální vzdálenosti nachází -tý soused daného bodu, je:
kde je počet rozměrů, je intenzita daná vztahem a je gama funkce, která je faktoriální funkcí, jestliže je jeho argumentem integrál.
Předpokládanou hodnotu je možné odvodit pomocí funkce gama, využívající statistické momenty. Prvním momentem je průměrná vzdálenost náhodně rozmístěných bodů v rozměrech.
Aplikace
[editovat | editovat zdroj]Studie CSR je nezbytná pro porovnávání naměřených bodových dat z výzkumných zdrojů. Jako statistická testovací metoda, má testování CSR mnoho aplikací v oblasti společenských věd a v astronomických výzkumech.[3] CSR je standard, na kterému jsou často testovány datové soubory. Zde je zhruba popsán jeden z přístupů testování hypotézy CSR:[4]
- Použijte statistiky, které jsou funkcí vzdálenosti každé události od další nejbližší události.
- Nejdříve se zaměřte na konkrétní událost a zformulujte metodu testování, zda jsou si událost a další nejbližší událost významně blízké (nebo vzdálené).
- Poté vezměte v úvahu všechny události a zformulujte metodu testování, zda je průměrná vzdálenost každé události od další nejbližší události významně krátká (nebo dlouhá).
V případech, kdy je výpočet statistik analyticky obtížný, jsou numerické metody, jako je metoda Monte Carlo, použity k simulaci náhodného procesu s velkým počtem opakování.[4]
Reference
[editovat | editovat zdroj]V tomto článku byl použit překlad textu z článku Complete spatial randomness na anglické Wikipedii.
- ↑ a b O. Maimon, L. Rokach, Data Mining and Knowledge Discovery Handbook , Second Edition, Springer 2010, pages 851-852
- ↑ L. A. Waller, C. A. Gotway, Applied Spatial Statistics for Public Health Data, volume 1 Wiley Chichester, 2004, pages 119–121, 123–127, 137, 139–141, 146–148, 150–151, 157, 203.
- ↑ Statistics on Venus: Craters and Catastrophes [online]. Dostupné online.
- ↑ a b A. Okabe, K. Sugihara, "Spatial Analysis along Networks- Statistical and Computational Methods", volume 1 Wiley Chichester, 2012, pages 135-136
Literatura
[editovat | editovat zdroj]- DIGGLE, P. J. Statistical Analysis of Spatial Point Patterns. 2nd. vyd. New York: Academic Press, 2003. ISBN 0340740701.