Diskuse s wikipedistkou:Honeybanny

Obsah stránky není podporován v jiných jazycích.
Přidat téma
Z Wikipedie, otevřené encyklopedie

Faigl.ladislav slovačiny 22. 2. 2009, 18:14 (UTC)

Prosím používejte tlačítko „Ukázat náhled“[editovat zdroj]

Dobrý den! Děkuji za Vaše příspěvky do Wikipedie. Zároveň Vás však prosím o častější používání tlačítka Ukázat náhled. To Vám ukáže, jak bude článek vypadat po Vašich úpravách, ale nic se nezapisuje do historie článku ani do seznamu posledních změn. Stránka posledních změn je pro wikipedisty velmi důležitá, jelikož se na ní zobrazují veškeré změny ve Wikipedii. Při častém ukládání jednoho článku jednou osobou se poslední změnyhistorie článku zbytečně přeplňují a znepřehledňují.

Až budete mít pocit, že jsou Vaše úpravy hotovy, zadejte do pole Shrnutí stručný popis Vámi provedených změn a změny uložte. Uložením zároveň dáváte najevo, že další změny v nejbližších okamžicích neplánujete a že se jiní wikipedisté mohou na článek vrhnout, opravit překlepy či jej doplnit. V případě častého ukládání hrozí riziko, že dojde k tzv. editačnímu konfliktu, tedy stavu, kdy dva wikipedisté editují tentýž článek zároveň. Díky moc za pochopení. Faigl.ladislav slovačiny 22. 2. 2009, 18:14 (UTC)

Prosím, věnujte pozornost upozornění, že máte používat tlačítko Ukázat náhled. Neberte to, prosím, na lehkou váhu. Důvody, proč se má toto tlačítko používat, máte uvedeny výše. Kromě technických záležitostí jde i o ohleduplnost vůči lidem, kteří sledují poslední změny nebo budou někdy muset něco hledat v historii (jednotlivých verzích) článků. Věřím, že pochopíte, že je opravdu nanejvýš vhodné a žádoucí toto tlačítko používat. Děkuji za pochopení.--Horst 24. 2. 2009, 21:17 (UTC)


Jak s botem[editovat zdroj]

Hezký den, chtěla bych v rámci své diplomové práce naprogramovat jakéhosi robota opravující chyby z WikiProjektu Check Wikipedia. Měl by být v C# s použitím DotNetWikiBot frameworku a jeho úkoly by mohly být následující:

  1. Oprava interwiki odkazů, pokud je odkaz shodný s popisem(má stejný kořen)
    Technická: vnitřních odkazů, nikoli interwiki = mezijazykových odkazů. --Milda 11. 11. 2009, 12:57 (UTC)
  2. Rovnítka v nadpisech
  3. Úprava referencí v případě, že jsou použité opakovaně
  4. Dvojité interwiky odkazy - při shodě se jeden odstraní
  5. Wikilinky v článcích směřujicí do jiných jazyků nahradit pokud možno českými, nebo běžnými externími odkazy

Prosím Vás o vyjádření k mému záměru, případně o doplnění mých cílů a k postupu jak nového bota uvést bezproblémů do provozu. Děkuji. Honeybanny 11. 11. 2009, 11:56 (UTC)

Zdravím, na wiki jsem krátce a mnoho správců občas skřípe zuby, že něco přesměruji nebo opravím jinak než podle pravidel, ale dělám to ručně, tedy pomalu a je celkem čas to napravit nebo zdůvodnit. Když na stránky pustíš "bota", který bude mít jen malinkou chybičku nebo v zadání nepostihneš absolutně všechny varianty zápisu, které uživatelé dokáží vykouzlit (wikilinky, reference, dvojité interviky odkazy, wikilinky cs × cizojazyčné) tak to může mít docela globální destrukční následky a hlávně ve velmi krátkém čase. Proto s takovou automatizací oprav a hlavně "vše v jednom" (jeden bot na více oprav najednou) bych byl hodně, hodně, hodně opatrný. --Hapesoft 11. 11. 2009, 12:15 (UTC)
@Hapesoft: Víc oprav „najednou“ není problém. Stačí si stránku stáhnout lokálně, opravit jeden typ chyby na celé stránce, druhý typ, … a na závěr stránku se všemi opravami uložit. --Milda 11. 11. 2009, 12:57 (UTC)
@Honeybanny: kromě rovnítek v nadpisech jsou to víceméně rutinní záležitost, takže by to neměl být problém napsat. U rovnítek v nadpisech je dobré se na článek podívat se záměrem pochopit jeho strukturu nebo i obsah – ne vždy je situace tak jednoduchá, že všechny nadpisy se o jednu úroveň poníží (při výskytu nadpisů s jedním rovnítkem) nebo povýší (při nejvyšší úrovni se třemi rovnítky), leckdy může být vhodné tu hierarchii nadpisů upravit komplexněji (tady tento nadpis o úroveň dolů, ten o úroveň nahoru, tady nad tři nadpisy 3. úrovně přidat nadpis 2. úrovně apod.), to se obávám, že nebude typická práce pro bota, i když – píšete, že to má být diplomová práce, třeba to je v rámci specializace „zpracování přirozeného jazyka“ a poperete se s tím (v opačném případě mám pocit, že ty rutinní náhrady jsou tak na zápočtový projekt). --Milda 11. 11. 2009, 12:57 (UTC)
Diplomka je na téma zhodnocení Wikipedie jako zdroje informací. Bot by měl být jeden z několika prográmků. Ale každopádně bych přivítala nějaký návrh na zajímavější funkci bota. Mockrát děkuji za informace. Honeybanny
Část těch oprav už dnes umí dělat modul cosmetic_changes.py běžného pywikipedia bota. Jinak by též nebylo od věci zahnout úkoly, které dělával USer:DinyBot (opravy přesměrování, pravopis, typografie), případně online tvorbu seznamů stránek, které obsahují... (irčité slovo, určitou chybu apod). Například by se hodil i interwiki robot, který by dokázal s ruční asistencí opravit několik článků zároveň. JAn 11. 11. 2009, 13:47 (UTC)
@Honeybanny: zkus vyhledat kolikrát je chybně napsán zápis o nadmořské výšce, tedy mnm. / m.nm. / mn.m. / m n m a jiné varianty (správně má být m n.m.) i s ohledem na to, že tento zápis může být na konci věty nebo před čárkou ve větě, určitě by takovéto zápisy chtěly taky opravit. Pokud bych měl hodnotit wiki jako zdroj informací tak je to Ok, ale potom nevím jak s tím souvisí hledání chybných zápisů a opravy v rámci diplomky. To je spíše přínos pro wiki než pro diplomku. Výsledek studie, že ve wiki je mnoho chyb ve formátování, zápisech, odkazech aj. asi nebude přínosem. Pokud by byla diplomka zaměřena na vyhledávání chyb stylu, odkazů a pod. na wikipedii jako korektura a opravy encyklopedie obecně tak je užití botů zcela v souladu s tématem práce. Samozřejmě, že odstranění chyb zvýší hodnotu wiki jako zdroje informací. Ono to pak vypadá takto: Aby mohl být vydán kladný závěr ke zdroji informací z wiki, bylo použito několik botů, kteří napomohli zvýšit hodnotu informací.
Možná by to chtělo prozradit o jakou VŠ se jedná, jestli technickou nebo humanitní a podle toho uvážit směrování práce. P.S. státnice jsou v r. 2010 nebo až v r. 2011 a jedná se zatím o přípravu ve formě semestrální práce ? --Hapesoft 11. 11. 2009, 13:46 (UTC)
@Milda ... jenom upozornění na možná úskalí, potřeba prověřit všechny změněné odkazy a reference před uložením. --Hapesoft 11. 11. 2009, 13:46 (UTC)
@Hapesoft: No diplomku bych chtěla zkusit odevzdat už v lednu 2010. Chodim na technickou VŠ. Spíš beru tu diplomku jako takovou učebnici co se dá dělat s Wikipedií a jak se kdokoliv může nějakým způsobem zapojit do zlepšení obsahu, jak se informace ve Wikipedii vyvíjí apod.. Každopádně budu jen ráda za každou připomínku, návrh, třeba i jen zajímavost. Díky. Honeybanny

Doporučuji založit vlastní diskusi na své osobní stránce a tuto tam přesunout. Dále oslovit správce a synopy s žádostí na nějaké podněty a nápady. Jinak je možno čerpat z nápovědy a pravidel, která se samozřejmě (ne)dodržují a ze sledování vývoje jednotlivých článků. --Hapesoft 11. 11. 2009, 14:45 (UTC)

Zdravím, sám jsem provozovatelem bota (botovodič :), který běží na bázi Pythonu a specializuje se na různé takovéto úpravy. Většinu navrhovacích fcí můj robot již dělá a neměl by být problém je napsat v jakémkoli jazyku. Shodné odkazy a odkazy na cizojazyčné wiki v článku jsou triviální regex, duplicitní kategorie a reference bude jednoduchý regex a nadpisy jsou trošku oříšek, protože je potřeba postupovat dle logické struktury článku (ideálně ručně). Zajímavý by byl jistě robot, který by dokázal pracovat s přímým zadáním webu (editace nějaké stránky autorizovanou osobou (už existuje)) a dokázal by pracovat se složitějšími šablonami. Například převody šablon, infoboxů a podobně. — Jagro 12. 11. 2009, 23:27 (UTC)

Robotické změny[editovat zdroj]

Zdravím, neprovádějte, prosím, pod svým účtem hromadné změny vedené automatickým programem/skriptem. Založte si na toto nový účet a požádejte o příznak bota – poté Vaše editace nebudou obtěžovat při hlídání posledních změn. Mimochodem si osobně myslím, že oprava [[xx|xxy]] → [[xx|xx]]y je vesměs zbytečná editace… — Jagro 6. 4. 2010, 13:12 (UTC)

Zdravím, dekuji a OK. Ale potrebovala bych si alespon stahovat nejake informace. Jen z duvodu poctu pahylu, delky clanku, zastoupeni portalu.. Nic ukladat nebudu. Je to mozne, nebo jste mi pristup blokl naporad? Diky. Honeybanny 7. 4. 2010, 08:38 (UTC)

Pozdní odpověď[editovat zdroj]

Zdravím, přístup jsem Vám ani Vašemu botovi nezablokoval (ani takto neučinil žádný jiný správce). Můžete tedy dále editovat a stahovat si data, jaká chcete. Z mé strany se jednalo pouze o upozornění, že je potřeba si pro Vašeho bota zaregistrovat další účet a požádat o vlaječku (jak jste učinila). Vše by tedy mělo být v pořádku. S pozdravem, — Jagro 13. 4. 2010, 18:36 (UTC)

Děkuji, měla jsem totiž problémy s připojením bota. Vůbec jsem nemohla přijít, čím by to mohlo být a následovalo to po Vašem upozornění. Na problém jsem nakonec přišla a vyřešila. Omlouvám se z nařčení a děkuji za odpověď.
Honeybanny 13. 4. 2010, 18:47 (UTC)
V pořádku, nic se nestalo. Níže ještě připisuji pár poznámek k testovacímu chodu. — Jagro 13. 4. 2010, 22:22 (UTC)

K činnosti bota[editovat zdroj]

Zdravím, díval jsem se na Vaše pokusné editace a musím říct, že bohužel zatím neodpovídají standardům Wikipedie. Pro běžnou práci bota bude potřeba, aby byla jeho shrnutí (=Automatic page editing) přeložena do češtiny a upřesněna v nich aktuálně opravovaná věc, tedy například Úprava opakujících se referencí. Dále není možno používat jako parametr name celý obsah reference (i když chápu, že z programátorského hlediska je to nejjednodušší :), to bychom ho nemuseli používat vůbec. Jako name se používá nějaký charakteristický text z reference. Takže když cituji například Malý atlas lokomotiv uvedu do parametru name zkratku mal. Toto by však muselo být vždy voleno ručně a tak pro automatizaci snad postačí vzít ze začátku reference první 3–4 písmena (pokud to tedy zrovna není http, pak bude potřeba brát písmena až za mezerou v popisu odkazu). Více informací o vzhledu referencí najdete na stránce Wikipedie:Vzhled a styl#Reference. Přeji hezký den, — Jagro 13. 4. 2010, 22:22 (UTC)

Zdravím a děkuji za připomínky. Snažila jsem se je zapracovat do programu a udělala pár editací. Je to už v pořádku? Děkuji Honeybanny 14. 4. 2010, 11:28 (UTC)
V současnosti to vypadá dobře. Díky za úpravy. — Jagro 14. 4. 2010, 19:39 (UTC)
Už je to lepší, ale eště trochu by to chtělo - jako název reference brát třeba i celé slovo, u něj bych byl opatrný s používáním diakritiky a speciálních znaků. igorovat řetězce "www", "http", "citace" a dvoupísmenné. V tomto druhém případě je celá reference špatně, ale to je chyba autora.
Takže ještě chvíli pokusné editace, prosím. JAn 15. 4. 2010, 08:36 (UTC)
Program jsem upravila a udělala pár editací. Už je to správné? Těm citacím se mám vyhýbat úplně? Děkuji Honeybanny 15. 4. 2010, 10:36 (UTC)
U citačních šablon je ideální brát z pole jméno. Jinak se miz dá vše v pořádku, udělím prozatím příznak a budu se ozývat s dalšími připomínkami, případě bota pozastavíme. JAn 15. 4. 2010, 19:37 (UTC)
Děkuji. Honeybanny 16. 4. 2010, 07:11 (UTC)

Zbytečné editace Honeybota[editovat zdroj]

Speciální:Příspěvky/Honeybot, konkrétně samotné úpravy [[A|Ab]] → [[A]]b nejsou vůbec potřeba, [[A|Ab]] ničemu nevadí. Zbytečně zasí*áte poslední změny, zbytečně zaplevelujete historii jednotlivých článků, zbytečně nárůstá objem databáze. Nechcete si na tu vaši diplomovou práci konečně nainstalovat MediaWiki na vlastní počítač, naimportovat dump Wikipedie a hrát si tam? --Milda 16. 4. 2010, 14:23 (UTC)

Souhlasím, ty změny jsou úplně k ničemu. --Tlusťa 16. 4. 2010, 14:29 (UTC)
OK, ale myslím, že se to dalo napsat slušněji. Honeybanny 16. 4. 2010, 14:35 (UTC)
Souhlasím, více lidskosti by tomu prospělo. Já děkuji za čas strávený nad programováním bota a za pokus. Je to ale zbytečné a ničemu to neškodí. Lepší směřovat energii jinam. Jinak kolegu přejděte, asi špatný den. S pozdravem --Chmee2 16. 4. 2010, 14:44 (UTC)
Tyhle změny dělá i můj robot, ale pouze pokud dělá ve stránce i jinou editaci. Takže třeba pči opravě referencí je to ok. JAn 22. 4. 2010, 19:36 (UTC)