Diskuse k Wikipedii:Chybějící stránky/Archiv1
Přidat téma--Wikipedista:BobM d|p 2. 5. 2012, 09:40 (UTC)
K čemu je takový seznam dobrý? --Pastorius 06:25, 1. 8. 2006 (UTC)
Bude seznam aktualizován? Už je půl roku starý... --Adam Hauner 13:18, 4. 2. 2007 (UTC)
- Časem určitě bude. Generování takového seznamu je však poměrně náročná věc. Jinak seznam je ve své podstatě téměř aktuální pořád. Stránky, které byly založeny, automaticky ze seznamu mizí. V seznamu tedy nic nepřebývá, jen chybějí nové odkazy, kterých však není mnoho.
— Danny B. diskuse | mail přehled příspěvků 17:22, 4. 2. 2007 (UTC)- Chtělo by to aktualizovat a dodělat chybějící písmena... --Vojtech.dostal 13:15, 1. 12. 2007 (UTC)
interwiki
[editovat zdroj]Rad bych se proklikal k EN verzi teto stranky, ale nedari se mi ji najit: Pridejte, prosim, spravnou interwiki. Dik --Franta Oashi 12. 7. 2009, 15:26 (UTC)
Aktualizace (2009)
[editovat zdroj]Nešlo by to opět po delší době aktualizovat? --egg ✉ 25. 8. 2009, 20:58 (UTC)
Aktualizace (2010)
[editovat zdroj]Seznam by to chtělo aktualizovat. V současné podobě, kdy zde zůstávají už založené stránky, jsou zde stránky (názvy stránek), které se vyskytují právě jen v tomto seznamu, je tato stránka spíš pro ostudu.Leotard 31. 1. 2010, 08:55 (UTC)
Aktualizace (2012)
[editovat zdroj]Jowe tento týden dvě z podstránek aktualizoval, ale jeho částečně ruční metoda je zbytečně časově náročná. Pokud se mi podaří na to najít čas, pokusím se během příštího prodlouženého víkendu trochu oprášit své programátorské dovednosti a napsat skript(y), které by aktualizaci maximálně zautomatizovaly. Uváděl bych zde jen ty „chybějící články“, které jsou odkazovány z encyklopedických jmenných prostorů (hlavní, kategorie, portál), nikoli diskusních stránek, projektového, nápovědy apod. --Milda (diskuse) 29. 4. 2012, 14:09 (UTC)
- Pokud by se ti to povedlo bylo by to skvělé. Určitě by pak byla možná aktualizace častěji než 1× za 6 let. Osobně bych neuváděl jen články odkazované z diskusních stránek. Jmenný prostor Wikipedie obsahuje mnoho odkazů na skutečně chybějící články v hlavním jmenném prostoru (Wikipedie:Požadované články, Wikipedie:Cizojazyčné články o Česku bez českého interwiki, chybějící články pro různé wikiprojekty atd.) a myslím, že by měly být i v chybějících stránkách. Nápovědy bych se neobával, tam je minimum odkazů do hlavního jmenného prostoru a na nesmyslný jsem nenarazil. Také jmenný prostor Wikipedista obsahuje mnohem víc užitečných červených odkazů do hlavního než nesmyslných (např. Wikipedista:Orange.man/Plány). --Jowe (diskuse) 29. 4. 2012, 15:48 (UTC)
- Můj stav je momentálně takový, že umím vygenerovat seznam chybějících článků podle zadaných kritérií; ta mohou být i složitější, například odkazy vedoucí z jmenných prostorů hlavní, Kategorie, Portál, Wikipedista nebo z vyjmenovaných stránek ve jmenném prostoru Wikipedie (jak jsi chtěl ty Požadované články apod.). Postupuji tak, že naimportuji dumpy pagelinks a page do databáze a seznam získávám složitějším SQL dotazem, který vyžaduje dost místa na disku pro dočasné tabulky. Z hlavního NS je odkazováno přes 930 tisíc unikátních neexistujících stránek, z ostatních jmenných prostorů to bude řádově méně, celkem to ještě nemám, protože jsem neměl dost volného místa na disku na dočasné tabulky, které MySQL během zpracování vytvářela. (Pro zajímavost: celkem je odkazováno necelých 1300 tisíc stránek v hlavním NS, počítaje v to i přesměrování, z čehož lze odhadnout, že Wikipedie je hotová ani ne z jedné třetiny, a to ještě nerozlišujeme kvalitu článků.) Druhá fáze bude napsat skript, který ten seznam roztřídí na jednotlivé podstránky (to mi dá ještě zabrat), třetí fáze (hromadné uložení postránek botem) bude hračka. --Milda (diskuse) 1. 5. 2012, 18:26 (UTC), doplněno 1. 5. 2012, 18:45 (UTC)
Joweho postup aktualizace
[editovat zdroj]Byl jsem vyzván, jestli bych zvěřejnil svůj postup aktualizace. Není to určitě nejlepší postup, ale postup pro jen mírně technicky pokročilé wikipedisty bez znalosti programování. Nejvíce času zabere úprava aktuálního dumpu, kterou je potřeba provést vždy po vydání aktuálního dumpu, tedy jednou za cca 10 dní. To zabere asi hodinu strojového času. Vytvoření jednotlivé stránky mi pak zabere cca 10 minut.
- Stažení dumpu odkazů z [1]
- Rozbalení programem Zipeg
- Úprava souboru, aby každá položka typu (754182,0,'Sochová') začínala na novém řádku. Používám program 010 Editor, který zvládne práci s velkými soubory
- Výsledný soubor kvůli lepší zpracovatelnost rozdělím na několik menších programem The Ultimate splitter.
- Soubory prohledávám v programu Notepad++. Např. pro odkazy na články začínající na "So" je to řetězec ",0,'So". Notepad++ umožňuje označení řádků, kde se řetězec nachází, jejich vyjmutí a vložení do nového souboru.
- Nový soubor obsahující jen řádky s řetězcem ",0,'So" naimportuju do Excelu, upravím aby zůstaly jen názvy článků a odstraním duplicity.
- Tímhle získáš seznam všech odkazů vedoucích do hlavního jmenného prostoru odkudkoliv, tedy i odkazy z diskusí (například z šablon experimenty, copyvio apod.) a bohužel i ony „indukované“ odkazy z předchozí revize chybějících stránek. Bez prokombinování s tabulkou page to však vyfiltrovat nejde. V minulých dnech jsem se opravě chyb podle těchto seznamů věnoval a bohužel nemálo na první pohled chybných odkazů vedlo právě z těchto stránek, kde by nás to nemuselo zajímat, což nepříjemně zdržuje. --Milda (diskuse) 1. 5. 2012, 18:36 (UTC)
- Odkazy z předchozích revizí, jsem odstraňoval pomocí zjištění id stránky s chybějícími odkazy, ale asi jsem na to někde zapomněl. Všiml jsem si, že většina zbytečných a nesmyslných odkazů vzniká použitím šablon experimenty, experimenty0, experimenty2 jsou-li zadány ve tvaru {{experimenty|nesmysl}}. Je zbytečně vytvářen neviditelný link na smazanou stránku a zbytečně ukládán do databáze odkazů. Myslím, že by bylo lepší tyto šablony upravit. Ale jinak máš pravdu, mé řešení není optimální a ve výsledné podobě stránky se vyskytnou i některé zbytečné odkazy, které se by se však daly minimalizovat. --Jowe (diskuse) 1. 5. 2012, 18:59 (UTC)
- Zatím ti mohu pomoci v tom, že (jakmile si zítra nebo ve čtvrtek udělám víc místa na disku, aby MySQL zvládla ten komplexní seznam, a naimportuju novější dumpy – zatím jsem měl z 12. dubna) bych ti poslal čistý seznam chybějících stránek podle domluvených kritérií, ty si ho rozsekáš a můžeš rovnou pokračovat svou metodou od bodu 9. --Milda (diskuse) 1. 5. 2012, 20:03 (UTC)
- Odkazy z předchozích revizí, jsem odstraňoval pomocí zjištění id stránky s chybějícími odkazy, ale asi jsem na to někde zapomněl. Všiml jsem si, že většina zbytečných a nesmyslných odkazů vzniká použitím šablon experimenty, experimenty0, experimenty2 jsou-li zadány ve tvaru {{experimenty|nesmysl}}. Je zbytečně vytvářen neviditelný link na smazanou stránku a zbytečně ukládán do databáze odkazů. Myslím, že by bylo lepší tyto šablony upravit. Ale jinak máš pravdu, mé řešení není optimální a ve výsledné podobě stránky se vyskytnou i některé zbytečné odkazy, které se by se však daly minimalizovat. --Jowe (diskuse) 1. 5. 2012, 18:59 (UTC)
- Tímhle získáš seznam všech odkazů vedoucích do hlavního jmenného prostoru odkudkoliv, tedy i odkazy z diskusí (například z šablon experimenty, copyvio apod.) a bohužel i ony „indukované“ odkazy z předchozí revize chybějících stránek. Bez prokombinování s tabulkou page to však vyfiltrovat nejde. V minulých dnech jsem se opravě chyb podle těchto seznamů věnoval a bohužel nemálo na první pohled chybných odkazů vedlo právě z těchto stránek, kde by nás to nemuselo zajímat, což nepříjemně zdržuje. --Milda (diskuse) 1. 5. 2012, 18:36 (UTC)
- Vytvořím seznam existujících článků pomocí [2]
- Porovnám v Excelu seznam všech odkazů na články začínající na "So" se seznamem existujících článků na "So" a získám seznam odkazovaných neexistujících článků na "So".
- Pomocí textového editoru ze seznamu vytvořím stránku dle vzoru.
Připadné dotazy rád zodpovím a připomínky, jak něco udělat lépe a jednodušeji, uvítám. --Jowe (diskuse) 1. 5. 2012, 12:46 (UTC)
- Jen technická otázečka - maličkost: upravil jsem některé odkazy (např. "Babočkovitých"). Podle hlášky v seznamu by odkaz měl ze seznamu zmizet, ale nezmizel, neboť zůstává odkaz sám na sebe (tedy na seznam chybějících stránek) (jediný). Co s tím? --Kusurija (diskuse) 1. 5. 2012, 20:11 (UTC)
- Nic. Aby to fungovalo jak je popsáno, a jak to fungovalo v roce 2006, by bylo nutné, aby seznam neměl víc než 500 položek (přičemž jeden aktualizovaný, který jsem otevřel, jich měl přes 8000). PS: Odkaz by zmizel jen v případě, že by stránka byla založena, nikoli v případě, že dojde opravě odkazů (to je nutno vyčistit buď další aktualizací nebo ručně). --Reaperman (diskuse) 1. 5. 2012, 20:22 (UTC)
- Zmizí až při příští aktualizaci generování seznamu, což nebude dříve, než jakmile bude k dispozici další dump (cca jednou až dvakrát do měsíce). Automaticky by zmizel jen tehdy, kdyby „zmodral“, ale ani to, zdá se (na rozdíl od doby před necelými šesti lety), nefunguje bezchybně, patrně MediaWiki z výkonnostních důvodů ignoruje test na existenci stránky (#ifexist v šabloně
{{Stránka}}
), je-li takhle vytvářených odkazů na stránce mnoho. --Milda (diskuse) 1. 5. 2012, 20:25 (UTC)
Nástroj pro efektivnější práci s chybějícími stránkami
[editovat zdroj]Přemýšlel jsem včera večer o vhodnějším nástroji, než jsou tyto (ať ručně či roboticky) občas aktualizované seznamy. Moje představa je taková, že by na toolserveru byl skript, který v rozumných intervalech (například jednou týdně) znovu vytvoří vlastní zjednodušenou tabulku odkazovaných stránek (kvůli nižším nárokům na výkon serveru, generování seznamu chybějících stránek z tabulek pagelinks a page má polynomiální časovou složitost) obsahující záznamy ve tvaru (Odkazovaná stránka, příznak existence). Z této tabulky by pak byly při každém zavolání generovány seznamy obdobné současným chybějícím stránkám, ale obsahující všechny (ale podobně jako na Wikipedii rozlišené dle existence) odkazované stránky v hlavním jmenném prostoru (nejhůře lineární časová složitost), jejichž začátek názvu vyhovuje (podobně jako doposud) zadanému minimálně dvoupísmennému vzorku (pro počáteční český znak s diakritikou by možná stačil i jednopísmenný, pro nelatinková písma /alfabeta, cyrilice apod./ či nepísmenné znaky předdefinovaný speciální vzorek).
Proč všechny? Při procházení současných seznamů vidím spostu červených názvů stránek, které bez detailního zkoumání nevypadají chybně, přitom ale mohou obsahovat třeba chybnou diakritiku nebo jinou variantu rozlišovače a současně může existovat správná stránka, o níž se jinak snadno nedozvíte. Pokud by rozdíly v názvech existující a neexistující stránky nebyly v prvních dvou, třech, čtyřech apod. znacích, uvidíte ty názvy stránek blízko sebe a snáze poznáte, že (například) existující stránka s rozlišovačem hudebník a neexistující s rozlišovačem houslista nebo existující stránka s názvem díla s jednou verzí interpunkce a neexistující s druhou verzí je jedno a totéž a budete hned vědět, co a jak opravit.
Současně by na každém řádku byl ještě klikací odkaz, který vynutí aktualizaci vlastní tabulky tohoto nástroje pro konkrétní odkazovanou stránku (logaritmická časová složitost), asi takto:
- Marečku, podejte mi pero! – přehled odkazů – aktualizovat stav
- Marečku, podejte mi péro! – přehled odkazů – aktualizovat stav
Prakticky to bude znamenat, že když jeden řádek vyřešíte (ať už vytvořením stránky nebo opravou odkazu), kliknete vedle na odkaz a při příštím načtení název stránky „zmodrá“ nebo tam nebude vůbec. Když uvážím svůj způsob práce s těmito seznamy, je pro mě pohodlnější a efektivnější pootvírat si do nových tabů prohlížeče výpisy odkazujících stránek pro několik podezřelých názvů zároveň, ty vyřešit a teprve nakonec odmazat vyřešené řádky – jenže to už si nemusím všechny pamatovat, a i kdyby, musím znovu projíždět seznam o stovkách až tisících položek, abych v něm znovu vyhledal třeba jen 5 či 10 názvů. Místo toho bych po vyřešení konkrétního názvu (kde se mi navíc zbarví odkaz z modré na fialovou) jen kliknul na „aktualizovat stav“. Další výhodou je, že se databáze na produkčních serverech nebude zbytečně zanášet revizemi o velikosti až stovek kilobajtů při každé takovéto aktualizaci. --Milda (diskuse) 2. 5. 2012, 09:24 (UTC)
- Představa je to hezká a toto řešení má mnoho nesporných výhod proti stávajícímu. Bohužel mám obavu, že se to zasekne na praktické realizaci. --Jowe (diskuse) 2. 5. 2012, 09:53 (UTC)
Vše při starém
[editovat zdroj]Vše zůstalo při starém - a špatně. Místo smazání (doporučuji), nebo aktualizace zůstalo vše při starém. Namátkově jsem si otevřel sekci "El", protože hodně věcem, které jsou Elektrické rozumím a troufl bych si je opravit. Bohužel, vše zůstalo při starém. Jen namátkou jsou zde rádoby chybějící stránky Elektrické vodiče, Elektrický kabel, Elektrivké pole, na které odkazuje jen a pouze tato stránka (tj. stránka "Chybějící stránky"). Není co opravovat, tyto stránky jsou chybějící pouze virtuálně, reálně nikomu nechybí. Za dalších šest let, pokud bude Wikipedie stále existovat, se můžeme k tématu znovu vrátit. Leotard (diskuse) 3. 5. 2012, 09:28 (UTC)
- Pane kolego, vydržte být ještě chvíli trpělivý. O chybějících stránkách se začalo diskutovat před 2 týdny, DoS byl uzavřen teprve včera. Pokud si všimnete předchozích tří sekcí na této diskusní stránce, zjistíte, že se na aktualizaci pracuje. Jowe se pustil do zatím jednorázové aktualizace, která však vyžaduje nemalý podíl lidské práce, a já se jsem začal vyvíjet řešení, které nebude vyžadovat téměř žádnou ruční práci, ale programování a testování zabere nějaký čas (který zde většina z nás musí dělit mezi práci nebo studium, starost o domácnost, rodinné aktivity apod.). Pokud byste měl pocit, že už to trvá dlouho, zkuste zaurgovat začátkem června. --Milda (diskuse) 3. 5. 2012, 10:50 (UTC)
- Nebudu nikoho urgovat, Wikipedie není nastavená tak, aby někdo někoho úkoloval a upomínal. Jestliže nebylo přijato řešení, které jsem i já podpořil (smazání těchto stránek), považuji za samozřejmost, že ti, kdo trvali na jejich zachování, také zajistí jejich funkčnost. Leotard (diskuse) 3. 5. 2012, 11:20 (UTC)
- Stránky z části funkční jsou, byly zaktualizovány ty, které jsou v seznamu tučně. Wikipedie není nastavena tak, že se neaktualizované stránky mažou. Ukázal jsem, že aktualizace je možná a kdokoliv se může pokusit aktualizovat další. --Jowe (diskuse) 3. 5. 2012, 11:32 (UTC)
- Zjevně si nerozumíme. Nikdy jsem nepochyboval o tom, že existuje způsob, jak stránky aktualizovat. Všechny diskuze, které jsem k tomuto tématu našel, se točí kolem způsobu, jakým se to bude provádět. Způsobu natolik rychlého a efektivního, aby bylo možné aktualizovat vždy po několika týdnech. Takový způsob zatím nikdo nenavrhnul. Takže díky za čas, který jste tomu věnoval, ale více bych si vážil, kdybyste vytvořil nebo vylepšil skutečné stránky o tématu, které Vám vyhovuje. Považuji vznik a další existenci stránky "Chybějící stránky" za slepou uličku vývoje. Ale znovu navrhovat na smazání tuto stránku nebudu. Zařídím se podle vlastní rady a raději vylepším nějakou mně sympatickou stránku. Leotard (diskuse) 3. 5. 2012, 18:55 (UTC)
- Stránky z části funkční jsou, byly zaktualizovány ty, které jsou v seznamu tučně. Wikipedie není nastavena tak, že se neaktualizované stránky mažou. Ukázal jsem, že aktualizace je možná a kdokoliv se může pokusit aktualizovat další. --Jowe (diskuse) 3. 5. 2012, 11:32 (UTC)
- Nebudu nikoho urgovat, Wikipedie není nastavená tak, aby někdo někoho úkoloval a upomínal. Jestliže nebylo přijato řešení, které jsem i já podpořil (smazání těchto stránek), považuji za samozřejmost, že ti, kdo trvali na jejich zachování, také zajistí jejich funkčnost. Leotard (diskuse) 3. 5. 2012, 11:20 (UTC)
Jak dál?
[editovat zdroj]Viz [3].
Současné problémy:
- skript považuje za odkaz cokoliv mezi znaky [[ a ]], takže i stránky, kde je [[ na úplném začátku celé stránky…
… kde je i spousta jiného dokazu …
… a ]] následuje až po několika řádcích.
- skript dále považuje za odkaz i to, co je vloženo mezi <nowiki></nowiki>, včetně těchto značek
- skript najde i odkazy, které se v textu neprojevují - nepoužité parametry šablon etc.
- skript hledá ve všech stránkách - prohledává dump, takže ve všech stránkách dumpu. Jsou k dispozici dva druhy - 1)obsahující všechny stránky 2) neobsahující diskusní stránky a uživatelské stránky) Nelze tedy omezit hledání pouze na hlavní jmenný prostor
- samotné generování obsahu zabere asi půl hodiny, ale následná aktualizace stránek je na dlouhé hodiny
- původně navržená struktura ne zcela vyhovuje - v současnosti by měl například seznam začínající Al 15 tisíc odkazů
JAn (diskuse) 1. 2. 2013, 08:23 (UTC)
Vygenerování vlastních seznamů
[editovat zdroj]- stáhnout původní skripty [4]
- nainstalovat si interpreter PHP a Perlu
- stáhnout si dump cswiki (All pages, current versions only nebo Articles, templates, media/file descriptions, and primary meta-pages)
- změnit u souboru php.ini memory_limit na vyšší (1 GB)
- spustit přes PHP skript parse.php (obsah původního balíčku) - trvá asi 25 minut
- použít upravený missl.pl k vygenerování seznamu - výsledný soubor má přes 40 MB
Nejsem programátor, takže moje úprava skriptu je poněkud amatérská, jistě by šlo silně zjednodušit
#!/usr/bin/perl
# This script is released under terms of GNU GPL license
# See file COPYING for more information
# Nejvice chybejici clanky s ignorovanim odkazu ze sablon
open X, "<date.txt";
$date = <X>;
close X;
$date =~ s/ / /g;
open O, ">missl";
print O <<EOF;
<!--
Tento seznam je generován skriptem a čas od času je automaticky přepsán.
Needitujte ho, vaše změny budou přepsány
Editovat lze podstránky /head (hlavička) a /tail (patička)
Tyto jsou do stránky vkládány a jejich obsah není skriptem nijak měněn.
-->
{{/head|$date}}
<ol>
EOF
%q = ();
open X, "<MISSLINK.txt";
while (<X>) {
if (/^(\d+)\t(.*)/) {
$n = $1;
next if ( $n < 1 ); # vygeneruje, pokud je alespoň 1 výskyt. Pro alespoň dva výskyty použít $n < 2
$no = $n;
$v = $2;
$nkey = 1100000 - $n;
$k = "$nkey/$v";
#$q{$k} = "# [[$v]] ($no)\n";
#$q{$k} = "{{subst:Stránka|$v|<li>| ($no)</li>}}";
#$q{$k} = "{{#ifexist:$v | |<li>[[$v]] ([[Special:Whatlinkshere/$v|$no odkazů]])</li>\n}}";
$q{$k} = "{{Stránka|$v|<li>|</li>}}\n"; #toto je aktuální výstup
}
}
close X;
$iii = 0;
@kk = sort keys %q;
foreach my $i (@kk) {
$iii++;
print O $q{$i};
last if ( $iii == 1100000 ); #1100000 je kvůli tomu, že generovaných odkazů už je přes milion
}
print O <<EOF;
</ol>
{{/tail}}
EOF
- seřadit výsledný soubor dle abecedy
Jak poloautomaticky aktualizovat / čistit?
[editovat zdroj]Pro všechny sledující a jiné údržbáře: Včera mě napadl způsob, jak tyto stránky aktualizovávat:
- stáhnete si program WPCleaner,
- po zalogování napíšete doprava nahoru název stránky (Wikipedie:Chybějící stránky/Ca) a kliknete na analyzovat,
- aktivujete si pomocí nástrojů vlevo nahoře zobrazování chybějících stránek, redirectů atd.,
- pokud to nastavíte správně, je alespoň částečně vidět, které stránky chybí (nemám ozkoušeno, kvůli šablonám je to trochu složitější),
- nyní jen umazáváte existující stránky a redirecty.
Matěj Suchánek (diskuse | příspěvky) 3. 6. 2013, 09:02 (UTC)
- Možná jsem pochopil něco špatně, ale pokud WPC nepřidá nové chybějící stránky, pak vytvořené stránky vidím přímo na Wikipedie:Chybějící stránky/Ca díky modrým odkazům.--Zdenekk2 (diskuse) 3. 6. 2013, 22:34 (UTC)
Chybí mnohé pod O a P
[editovat zdroj]Stále chybí mnohé pod O a P, např. Ol a tedy jméno Olga. A dále vidím, že zdaleka nejsou v seznamu všechny články, které jsou někde zaznamenány červeně. To jistě není lehké, ale nešlo by to nějak automaticky? --Zbrnajsem (diskuse) 20. 12. 2013, 13:52 (UTC)
- V podstatě všechny tyto seznamy jsou dlouho neaktualizované, jedná se o statická data. A Olga existuje, co jste tedy měl na mysli? --20. 12. 2013, 14:19 (UTC), Utar (diskuse)
- Do aktualizace těchto seznamů podle počátečních písmen se již zřejmě nikomu nechce. Pro vytváření seznamů chybějících článků lze použít nástroj Catscan2. Pomocí něho si lze nechat vytvořit aktuální seznam červených odkazů v článcích z určité kategorie včetně podkategorií. Tak např. zde je seznam 1 941 červených odkazů v článcích o českých filmových komediích. --Jowe (diskuse) 20. 12. 2013, 14:42 (UTC)
- Sehnal jsem si dotyčné skripty a zkusil pár seznamů aktualizovat. Žádný velký zájem o aktualizace ale nebyl. Jde ti o články začínající Olga?
- Ideáklní by bylo přenést tyto seznamy na toolserver a tady je smazat, ale k tomu nevládnu příslušným účtem ani znalostmi, aby se seznam aktualizoval nemanuálně. Nenašel by se nějaký znalec PHP, který by to zkusil rozjet? JAn (diskuse) 20. 12. 2013, 15:33 (UTC)
- @Zbrnajsem: Wikipedie:Chybějící stránky/Ol založeno, pár Olg tam je. pár = 521, přesněji. --14. 10. 2015, 12:14 (CEST), Utar (diskuse)
Jmenný prostor
[editovat zdroj]Je zájem i o stránky v jiných jmenných prostorech než Hlavní (0) a o stránky odkazované z těchto jiných jmenných prostorů? --14. 10. 2015, 11:10 (CEST), Utar (diskuse)
- Myslím, že není potřeba uvádět stránky v jiných jmenných prostorech. Uváděl bych jen stránky odkazované ze jmenného prostoru Wikipedie (užitečné např. Wikipedie:Požadované články, Wikipedie:Cizojazyčné články o Česku bez českého interwiki) a ze jmenného prostoru Kategorie (chybějící hlavní články kategorií). --Jowe (diskuse) 14. 10. 2015, 11:17 (CEST)
- OK, dobrý nápad. Podle Nápověda:Jmenný prostor tedy odkazy z 0 (hlavní), 4 (Wikipedie) a 14 (Kategorie), do 0 (hlavní). Hledat cokoli->cokoli místo 0->0 vypadá velmi náročně (místo 10s to bylo pro Oo 5 minut), ale [0,4,14]->0 nebylo o moc náročnější než 0->0. --14. 10. 2015, 11:31 (CEST), Utar (diskuse)
- Akorát jsem zapomněl, že ze jmenného prostoru Wikipedie je odkazováno na mnoho stránek typu Olomoucké tvarůžky (copyvio), což se v minulosti používalo pro řešení copyvií. To by chtělo nějak odfiltrovat. --Jowe (diskuse) 14. 10. 2015, 12:36 (CEST)
- A a) vadí opravdu tyto odkazy ve WP:ChS? b) proč by se neměly prostě tyto staré odkazy z Wikipedie:Archiv porušení práv odebrat? Koukám, že se rozlišovače (copyvio) začaly používat asi až někdy v dubnu 2007, tedy skoro rok poté, co byly WP:ChS původně generované. Přijde mi, že takovýchto (copyvio) odkazů bude proti ostatním velmi málo. Nebo tě napadají ještě nějaké podobné případy krom těchto copyvií? --14. 10. 2015, 13:05 (CEST), Utar (diskuse)
- Akorát jsem zapomněl, že ze jmenného prostoru Wikipedie je odkazováno na mnoho stránek typu Olomoucké tvarůžky (copyvio), což se v minulosti používalo pro řešení copyvií. To by chtělo nějak odfiltrovat. --Jowe (diskuse) 14. 10. 2015, 12:36 (CEST)
- Teď mi došlo, že pokud bych chtěl aktualizovat už existující seznam, je potřeba současné odkazy z WP:ChS nebrat v potaz, jinak se nesmazané odkazy z WP:ChS na již existující články znovu započítají. Asi tedy pro další seznamy vyhodím z vyhledávání jak cokoli, co začíná na „Wikipedie:Chybějící stránky“, tak „Wikipedie:Archiv“, protože odkazy třeba z Wikipedie:Archiv hlasování nás asi taky nezajímají, ne? --14. 10. 2015, 13:20 (CEST), Utar (diskuse)
Utarův postup aktualizace
[editovat zdroj]Všiml jsem si, že Jowe před pár lety uvedl #Joweho postup aktualizace, tak přidávám svůj:
- na Quarry zadám do dotazu žádaný řetězec a pustím jej
- stáhnu v CSV formátu
- otevřu v Excelu
- získaný sloupec překopíruji do jiného dokumentu v Excelu, kde
- přes CONCANTENATE dám název odkazovaného článku do požadovaného formátu
- přes SUBSTITUTE nahradím podtržítka mezerami
- roztáhnu řádek s těmito funkcemi vedle sloupce s daty z CSV souboru
- poslední sloupec zkopíruje vedle v režimu PASTE SPECIAL, TEXT ONLY
- získaný sloupec upravených záznamů vložím do Wikipedie, dodám </ol> na konec a hlavičku s <ol> na začátek
- doplním údaje o běhu dotazu do úvodu i do shrnutí editace
Celé to trvá 5-15 minut pro jeden požadovaný úvodní řetězec, délka běhu dotazu je obvykle kolem půl minuty (i když jsem zatím dělal spíše ty menší seznamy). Účet na Quarry si lze založit jednoduše, spáruje se přes přihlášení na Metě. --14. 10. 2015, 23:04 (CEST), Utar (diskuse)
Tento seznam na Tool Labs
[editovat zdroj]Zdravím, pracuji na náhradě tohoto seznamu ve formě stránek zde na WP pomocí seznamu na Tool Labs. Jestliže tedy seznam má nějakou užitečnost, je možné používat tuto verzi. Pokud by někdo z nějakého důvodu potřeboval seznam stránek, se kterými pracuji, je možné si ho stáhnout na také tam (23 MB). Budu vděčný za jakékoliv návrhy ke zlepšení. --Urbanecm (diskuse) 11. 4. 2016, 19:53 (CEST)