Wikipedie:AutoWikiBrowser/Typos/Dokumentace
Tento seznam obsahuje definice oprav špatně psaných řetězců slov ve Wikipedii pro externí programy (AutoWikiBrowser, WPCleaner) nebo boty. Řetězce jsou psány pomocí regulárního výrazu uvnitř XML tagu.
<Typo name="název chyby (správný tvar)" find="výraz pro nalezení" replace="výraz pro nahrazení"/>
Máte-li návrh na chybu nebo jste objevili falešný výskyt a nevíte, jak chybu napsat, resp. opravit, uveďte problém na diskusní stránce. Tam popište, co a proč (uveďte například zdroj) hledat a opravovat, a uveďte i případy, kdy by se to hledat a opravovat nemělo.
Přídáváte-li nové pravidlo, umístěte ho dle platné dokumentace i do druhého seznamu.
Syntaxe
[editovat | editovat zdroj].
znamená jakýkoliv znak kromě nového řádku,*
znamená, že se předchozí znak může vyskytnout mnohokrát, ale také vůbec nemusí,+
znamená, že předchozí znak se může vyskytnout mnohokrát, nejméně však jednou,?
znamená, že se předchozí znak může vyskytnout jednou, nebo se vyskytnout nemusí vůbec;{ }
– počet opakování předchozího znaku/řetězce:{6}
– předchozí znak/řetězec se opakuje přesně šestkrát,{5,}
– předchozí znak/řetězec se opakuje pět- a víckrát,{2,4}
– předchozí znak/řetězec se opakuje dva- až čtyřikrát.
Pokud za některý z výše uvedených operátorů přidáme ?
, bude pracováno s co nejmenším počtem znaků (bude upřednostňován nižší počet znaků); bez otazníku je pracováno s co největším počtem (je upřednostňován co největší počet).
( )
– pokud je nutné ponechat nějakou proměnnou část tak, jak byla nalezena (malé/velké písmeno, koncovka apod.), vkládá se do těchto závorek; závorky se číslují v pořadí zleva doprava a zpět se vkládájí v parametru replace jako$[číslo]
, kde číslo je pořadí závroky – samotný dolar se v části replace vkládá$$
;(?: )
– obdoba oblých závorek, ale obsah se neukládá jako proměnná (není číslován);
(?= )
– oprava pokračuje, pouze pokud je text v závorce shodný s textem vpravo od závorky;(?<= )
– oprava pokračuje, pouze pokud je text v závorce shodný s textem vlevo od závorky;(?! )
– oprava pokračuje, pouze pokud text v závorce shodný s textem vpravo od závorky není;(?<! )
– oprava pokračuje, pouze pokud text v závorce shodný s textem vlevo od závorky není.
Pokud je do nějaké (oblé) závorky vloženo svislítko (|
), oddělí jinou možnost (jiné možnosti; slovně nebo).
[ ]
– jeden ze znaků, který je uveden uvnitř:[A-Za-z0123]
– jeden ze znaků v rozsahu A–Z, a–z nebo čísel 0, 1, 2, 3,[^a–f0–9x]
– žádný ze znaků či v rozsahu;
\
– pokud se vloží před znak, který má svůj specifický význam (např. tečka.
), specifičnost se ruší a je chápán jako obyčejný znak; totéž platí i naopak – pokud je vložen před určitý znak, získává specifickou vlastnost (např. písmeno\w
):\b
– hranice mezi číslem či písmenem a znakem, který není číslem ani písmenem; opak\B
,\w
– písmeno nebo číslice,\W
– ani písmeno, ani číslice,\d
– pouze číslice,\D
– ne číslice,\s
– bílý znak (mezera, nový řádek\n
[opak.
], tabulátor\t
[opak\T
]),\S
– ne bílý znak;
\xčíslo
– hexadecimální kód znaku ( 
[mezera] →\x20
).
V parametru name se používá pouze čistý text, v parametru find je možné využít cokoliv výše uvedené kromě vložení neznámé ($) a v parametru replace se jakýkoliv znak tvořící syntaxi užívá bez lomítka.
Omezení
[editovat | editovat zdroj]AWB nekontroluje cíle odkazů/obrázků, šablony a citace.
WPCleaner umožňuje použít řetězce \[\[
jako počátek odkazu a \{\{
jako počátek šablony. Jinak nekontroluje <!-- komentáře -->, cíle odkazů/obrázků (ale kontroluje popisy), kategorie, mezijazykové odkazy a jiná místa.
WikiEd kontroluje vše, avšak přeskakuje pravidla s look-behind sekvencemi (?<= )
a (?<! )
.
Upozornění
[editovat | editovat zdroj]- Pokud má být vyhledána horní uvozovka ", která se využívá např. ve značkovacím jazyce HTML, musí být zapsána jako
\x22
. Vložit ji je možné pouze přes proměnnou ($1
atd.).
Před přidáním položky
[editovat | editovat zdroj]- Ujistěte se prosím, že opravdu jde o chybu a že její opravování nebude kontraproduktivní (např. pevné mezery za jednopísmennými slovy, přidávání mezery mezi číslo a procento).
- Vymezte si, kdy to chyba je a kdy není (např. opravovat řetězec abla na alba je správně, ale opravovat ablativ na albativ už ne).
- Napište pravidlo tak, aby platilo pro co nejvíc možných tvarů.
- Pravidlo správně pojmenujte a správně abecedně zařaďte.
- Pokuste se, aby pravidlo s žádným jiným nekolidovalo.