Wikipedie:Žádost o komentář/Přebírání informací z Wikidat vs. lokální vyplňování
Tato stránka obsahuje archiv žádosti o komentář; už ji laskavě needitujte.
Žádost o komentář skončila výsledkem:
Přejímat z Wikidat na českou Wikipedii je obecně povoleno, za určitých pravidel, které budou uvedeny a rozpracovány na stránce Wikipedie:Wikidata/Nástěnka.
- Každé nové nastavení přejímání z Wikidat do české Wikipedie by mělo vždy být pro každý parametr oznámeno a, pokud je sporné, v následné diskuzi na nástěnce posouzeno. V oznámení by mělo být specifikováno, kterých šablon se tyto změny budou týkat (jedné, či několika). Kritériem při rozhodování komunity je zejména kvalita dat na Wikidatech (je-li vysoká, je vhodno přejímat) a jejich proměnlivost v čase (je-li vysoká, je vhodno přejímat). Zejména by se neměly přebírat položky, které nemají na Wikidatech české štítky. U méně proměnlivých údajů je možné ponechat lokální informace a jen monitorovat jejich kvalitu pomocí údržbové kategorie. Není to vhodné v případě, že by tím roboti procházející monitorovací kategorii zahlcovaly poslední změny.
- Upřednostnit v šabloně lokální vyplnění. To by mělo vždy přebít informaci na Wikidatech. To umožní i nováčkům, aby informaci snadno opravili přímo ve Wikipedii, pokud ji vidí jako chybnou. To ovšem neznamená že by nebylo možné parametry z infoboxů a dalších šablon odstraňovat ve prospěch Wikidat, pokud jsou lokální data nekvalitní. Vždy by ale toto mělo být prodiskutováno (viz výše).
uzavřel --Vojtěch Dostál (diskuse) 15. 9. 2016, 22:10 (CEST)'[odpovědět]
Wikidata vznikla v roce 2012 jako sesterský projekt Wikipedie zaměřený na sběr strukturovaných dat. Tato data lze, včetně referencí (pokud jsou dostupné) přebírat do článků na Wikipedii. Již nyní minimálně 31 českých šablon přebírá automaticky údaje z Wikidat, nejčastěji infoboxy. Výhodou je, že není nutné údaje aktualizovat (1) ručně a (2) zvlášť v každé jazykové verzi Wikipedie, která přebírá konkrétní položky z Wikidat. Přebírání z Wikidat je ovšem sporné, protože rušné poslední změny na Wikidatech prakticky znemožnují systematickou kontrolu vandalismu a některá data na Wikidatech jsou nízké kvality, vysoké chybovosti.
- Otázky na komunitu
- Měla by česká Wikipedie přebírat informace z Wikidat, nebo přebírání Wikidat na českou Wikipedii zakázat? (A proč)
- Pokud by přebírání bylo povoleno, v jakých případech by se tak mělo činit? Vždy, nebo jen u některých typů údajů? (A proč)
- Pokud by přebírání bylo povoleno a přitom v konkrétním případě existuje informace už na české Wikipedii (lokálně), je lepší ji přesto generovat z Wikidat než ji mít lokálně? Případně v jakých případech ano (a proč)?
Děkuji všem za zamyšlení se.--Vojtěch Dostál (diskuse) 6. 6. 2016, 15:53 (CEST)[odpovědět]
Domnívám se že:
- Česká Wikipedie by měla informace z Wikidat přebírat. Je to obrovská studnice strukturované moudrosti, z níž by byl hřích se nenapít.
- Mělo by se tak činit ovšem jen v případech, kdy jsou data na Wikidatech dostatečně kvalitní. Každé přebírání informací by mělo být nejprve navrženo na diskuzní stránce WikiProjektu Infoboxy a komunita české Wikipedie by zvážila, zda přebíráním z Wikidat dojde ke zkvalitnění české Wikipedie. Na typu údajů podle mě nezáleží, ale prioritou jsou zejména ty, které se rychle mění - např. stupeň ohrožení podle IUCN, počet obyvatel měst nebo třeba jméno starosty.
- Pokud jsou data na Wikidatech stejně kvalitní nebo kvalitnější než na české Wikipedii, měla by být přednostně přebírána z Wikidat, zejména pokud se rychle vyvíjí (mění). Není pravda, že Wikidata mají inherentně nižší kvalitu kvůli nemožnosti kontrolovat poslední změny: kvalita se dá velmi snadno kontrolovat např. pomocí Queries, tzn. srovnáváním databáze s existujícími kontrolními hodnotami (např. oficiálně publikovaný počet obcí nebo obyvatel v ČR). V praxi odzkoušeno.
--Vojtěch Dostál (diskuse) 6. 6. 2016, 15:53 (CEST)[odpovědět]
- V úvodních otázkách mi chybí ta, která rozpoutala původní debatu Pod lípou. Třetí otázka se ptá, jestli používat Wikidata tam, kde už existují údaje na csWiki. Ale případ byl takový, že naopak už existovala naprosto správná a vyhovující Wikidata a teprve na jejich základě někdo vyplnil údaje lokálně na csWiki. Má smysl to nějak doplnit nebo případně obecněji přeformulovat třetí otázku? --Bazi (diskuse) 9. 6. 2016, 12:48 (CEST)[odpovědět]
- Upřímně řečeno, vzít databázi a ručně ji přepsat do české Wikipedie mi přijde jako tak absurdní řešení, že jsem se na to ani nechtěl ptát. Kdo by přepisoval informace z jedné stránky do druhé a jaké by to mělo výhody? --Vojtěch Dostál (diskuse) 9. 6. 2016, 13:18 (CEST)[odpovědět]
- Jo. Nepřepodkládám, že zakladatel ŽOKu by nevěděl o tom, co vyvolalo tuto diskuzi. Tady neřešíme ten jeden článek, ale obecný úzus. Ostatně já to tam vidím v té formulaci ... případně v jakých případech ano (a proč)? Podle mě, pokud bude konsensus, že je lepší generovat informace lokálně, pak prostě platí, že se informace z wikidat můžou (zdůrazňuju můžou) překlopit do lokálního zdrojového kódu na cs.wiki, kde budou přehledně, kontrolovatelně a zdrojovatelně podléhat dalším editacím, přičemž údržbové kategorie a jiné nástroje zajistí, aby případné aktualizace wikidat mohly být (po kontrole a ozdrojování) využity ke korigování údajů na cs.wiki... Aby bylo jasno: ač skeptik ohledně wikidat, tak nečekám (a nepodporuju), že by po uzavření tohoto ŽOKu měl někdo honem honem nahrazovat všechny wikidatové iboxy těmi lokálními. Dokážu si i představit úzus, že taková změna by se měla provádět jen, když někdo článek a informace v iboxu rozšíří (tzn. třeba v tom konkrétním článku, kvůli kterému vznikla původní debata, bych já osobně wikidatový infobox nenahrazoval - jen aby bylo Bazi jasno, že v tomhle chápu tvoji pozici, že někdo podle tebe zbytečně měnil data za data... i když zaplaťpámbů za to, že se i kvůli/díky tomu aspoň o věci bavíme). Vidím v tom jistou paralelu k nedávné diskuzi okolo dvou variant hierarchie sekce odkazy na konci článku, kdy se jistý editor úporně snažil provádět desítky editací, jejichž jediným obsahem bylo prosazování jedné z těch 2 variant. Tam tomu konsensu rozumím tak, že obě varianty jsou v zásadě možné, přičemž dvouúrovňová je vhodnější u delších článků, ale zároveň že si tu nebudeme vzájemně "přečůrávat" články z jedné varianty na druhou, pokud článek i jinak neobohatíme... Tohle si myslím, že by mělo být i filozofií v téhle obecné otázce. Tzn. když to vrátím k otázce WD nebo lokální data, tak obě varianty jsou v zásadě možné. WD jsou logickou první/rychlou volbou u nových článků, lokální data u rostoucích, náročněji koncipovaných a kolektivně obohacovaných článků (samozřejmě s výjimkami u konkrétních typů iboxů a parametrů, kde např. časté změny a aktualizace vyznívají ve prospěch wikidat). --Davcza (diskuse) 9. 6. 2016, 13:28 (CEST)[odpovědět]
- (s e.k.) No a právě z té absurdnosti vznikl onen spor. Jinak by se to Pod lípou vůbec neřešilo, ačkoli se tam na to nabalily další a širší úvahy o Wikidatech. Jowe a Silesianus ale prosazovali, aby se údaje bez problémů načítané z Wikidat přepsaly lokálně do infoboxu, a to byl ten původní problém. --Bazi (diskuse) 9. 6. 2016, 13:35 (CEST)[odpovědět]
- @Davcza Rád bych vysvětlil, proč je podle mě škodlivé přepisovat informce z Wikidat do Wikipedie "tvrdým způsobem". Na Wikidatech totiž jsme schopni velmi snadno data hromadně aktualizovat. Když je přepíšeme do Wikipedie, tato možnost se vytratí - budeme muset aktualizovat informace na Wikidatech roboticky a na Wikipedii zase jinak roboticky - nebo v horším případě ručně, jako to nyní dělá u počtu obyvatel Petr Kinšt. Data, která bychom podle mě měli přebírat z Wikidat, jsou v zásadě právě ta, která v kódu české Wikipedie nemají co pohledávat - jsou to právě různé rychle se měnící údaje a podobně. --Vojtěch Dostál (diskuse) 9. 6. 2016, 15:48 (CEST)[odpovědět]
- Ano, u rychle se měnících údajů (byly tady zmiňované různé iboxy věnované počítačovým programům nebo odborným věcem kde editační a aktualizační záběr české wikipedie pochopitelně nikdy nemůže být příliš velký) to chápu. Ale jinak platí, to, co jsem už napsal - prioritu má mít cs.wiki, ne WD (zdůrazňuju ale, že stejně to podle mě ale bude na konsensu u jedntl. iboxů a parametrů). I na Wikidata někdo musí všechny informace zadat, čili nevytvářejme dojem, že tam je to bez práce. Všechno, co tu děláme, stojí nějakou práci a přesto to děláme... A jestli budou muset mít roboti dvojí práci - tady i na WD, tak to mě netrápí - robota snad prsty z editování nebolí, ne?... Chybou podle mě bylo, že před pár lety se někdo (tipnul bych to nějaké geeky z en.wiki) technokraticky rozhodl, že psát některé věci paralelně na dvaceti wikipediích, je zbytečné a že se to zglobalizuje. Vím, bylo to někde v bulletinech. Ale na rovinu, komu z nás došlo, že to je věc, ke které by se měl vyjádřit? Kdo rozuměl tomu technickému slovníku a fenoménu WD, neřkuli kdo si to dokázal nastudovat v angličtině? A pak už to jelo a teď část komunity argumentuje, že když už to je na wikidatech tak už to nemá co dělat na české wikipedii... Ale celá ta moje argumentace v této i předešlé diskuzi Pod Lípou, je že pracujeme na cs.wiki a já se odmítám cítit provinile za to, že nezpřístupňuji své vědění celému lidstvu a že si nechci nechat od celého lidstva generovat jazykově, vizuálně i fakticky pochybné pasáže do článků, o jejichž kvalitu tu usilujeme... --Davcza (diskuse) 9. 6. 2016, 17:30 (CEST)[odpovědět]
- + PS:
- Už bych se opakoval, tak snad jen ještě jedna osobní vzpomínka. Přesně si pamatuju na moment, kdy jsem ztratil důvěru ve Wikidata. V desítkách článků o izraelských židovských politicích se objevil v iboxu údaj, že jsou muslimského vyznání. Kolega Chaim mi to vyplašeně napsal na diskuzní stránku s tím, že vůbec neví jak to dát pryč, protože když rozlikne stránku, tak to není vidět. Já o ničem netušil (protože změny na wikidatech nesleduju a nikdo mi neřekl, že někdo propojil infobox politik s wikidaty), takže bůhví jak dlouho to tam viselo... Strávil jsem nějakou dobu tím, že jsem se snažil pochopit, kde a jak se na wikidatech doptat. Pak jsem našel, že to způsobil nějakej chaot, kterej pracuje na WD tím stylem, že pustí bota a provede tisíce editací. Napsal jsem mu, pak i na tamní nástěnce... Reakce pomalá, v angličtině, v geekovském newspeaku, sankce pro onoho babráka nulová... Úplně živě jsem si představil, jak se někdo jinej, s menšími znalostmi angličtiny a pohybu v počítačovém prostředí v tomhle ztratí a kolik nesmyslů může přes WD pronikat na cs.wiki... Zkoušel jsem si i přidat změny na WD do sledovaných změn. Zrušil jsem to po pár dnech, protože historii mi zahltily stovky technicistních informací typu "Created claim bla bla"... Píšu to proto, že každej z nás, i když se snažíme svoje postoje zobecňovat, je formovanej úplně konkrétními zkušenostmi. A já chci na rovinu říct, kdy a proč ve mně Wikidata ztratila potenciálního stoupence... A úplně rozumím (nechci samozřejmě nikomu z vás nic podsouvat) zase tomu, že zastánci wikidat mezi námi na cs.wiki jsou okouzleni tou možností velkého globálního úložiště informací, proto že třeba měli prvotní zkušenost s využitím wikidat dobrou... Za sebe snad můžu říct, že se možná vyplatí mé skepsi naslouchat, protože jsem jinak oddanej wikipedista, nejsem (snad) notorickej prudič a zároveň možná jako člověk, kterej není technologickej geek, mluvím i za lidi, pro které wikidata jsou komplikací... --Davcza (diskuse) 9. 6. 2016, 17:26 (CEST)[odpovědět]
- @Davcza Rád bych vysvětlil, proč je podle mě škodlivé přepisovat informce z Wikidat do Wikipedie "tvrdým způsobem". Na Wikidatech totiž jsme schopni velmi snadno data hromadně aktualizovat. Když je přepíšeme do Wikipedie, tato možnost se vytratí - budeme muset aktualizovat informace na Wikidatech roboticky a na Wikipedii zase jinak roboticky - nebo v horším případě ručně, jako to nyní dělá u počtu obyvatel Petr Kinšt. Data, která bychom podle mě měli přebírat z Wikidat, jsou v zásadě právě ta, která v kódu české Wikipedie nemají co pohledávat - jsou to právě různé rychle se měnící údaje a podobně. --Vojtěch Dostál (diskuse) 9. 6. 2016, 15:48 (CEST)[odpovědět]
- Upřímně řečeno, vzít databázi a ručně ji přepsat do české Wikipedie mi přijde jako tak absurdní řešení, že jsem se na to ani nechtěl ptát. Kdo by přepisoval informace z jedné stránky do druhé a jaké by to mělo výhody? --Vojtěch Dostál (diskuse) 9. 6. 2016, 13:18 (CEST)[odpovědět]
K bodu 1: Pijte Vojtěchu z plna hrdla, ale nenuťte pít každého. --Jowe (diskuse) 15. 6. 2016, 12:39 (CEST)[odpovědět]
Za mě rozhodně:
- přebírat. Čím více dobrých dat i od cizinců nebo globálně, tím lépe.
- nenapadá mě údaj, kde by to nebylo prospěšné (kdyžtak mě prosím uvědomte, já přehodnotím stanovisko).
- jednoznačně upřednostnit lokální. Ne každý méně zkušený editor ví, jak pracovat s Wikidaty, často to tedy vyplní ručně. Navíc pokud opravuje chybu a v infoboxu ji nevidí (páč je na WD), zkusí ji přepsat přímo v článku. Je to přívětivější přístup k nováčkům, než jim nutit verzi z Wikidat, kterou, když s WD neumí pracovat, by museli holt akceptovat. Případné konflikty lokálních a globálních hodnot lze pak řešit údržbovými kategoriemi, patrolou, apod.
--Dvorapa (diskuse) 6. 6. 2016, 16:27 (CEST)[odpovědět]
A ještě poznámka: Infobox by se měl za všech okolností vkládat se základní sadou parametrů (byť nevyplněných, protože se tahají z wikidat). Tj. nikoliv:
{{Infobox - osoba}}
ale rozhodně takto:
{{Infobox - osoba | jméno = | obrázek = | datum a místo narození = | datum a místo úmrtí = | povolání = }}
--Dvorapa (diskuse) 10. 6. 2016, 06:35 (CEST)[odpovědět]
- @Dvorapa Bylo by možno doplnit důvod, proč se to musí? --Vojtěch Dostál (diskuse) 10. 6. 2016, 11:51 (CEST)[odpovědět]
- Jak jsem již zmínil u bodu 3: Méně zkušení editoři (nováčci) neví, jak pracovat s Wikidaty a upřednostňují proto editaci přímo v článku. Proto bychom jim měli dát alespoň pár základních parametrů u blokových šablon připravených k případné editaci. Přepsané parametry se již dají dále dohledat a kategorizovat a je to lepší, než odradit uživatele od opravy tím, že narazí na šablonu bez parametrů. Naopak pro potlačení parametru z Wikidat (v případě, že obsah z Wikidat nechceme, ale nemáme za něj náhradu) bych byl pro vkládání určitého klíčového slova (např
| parametr = -potlačen-
), jak už navrhl někde jinde někdo jiný (možná JAn Dudík?? nemohu to dohledat). - Má to ale háček, že bychom tím naopak nováčky vybídli k duplikování obsahu načteného z Wikidat do článku, protože si bude myslet, že jsou ty informace smazané a v článku se objevují kvůli paměti prohlížeče. Další možností by proto bylo šablony, ve kterých pocházejí data z Wikidat neoznačovat větou „některá data mohou pocházet z Wikidat“, ale spíše třeba větou „některé hodnoty lze editovat na Wikidatech“. Nicméně tento problém je dost složitý a nenapadá mě žádné vhodnější řešení než tato dvě. Třeba někdo vymyslí něco lepšího. --Dvorapa (diskuse) 10. 6. 2016, 12:06 (CEST)[odpovědět]
- Souhlas, (nejen) pro nováčka je tohle:
- Jak jsem již zmínil u bodu 3: Méně zkušení editoři (nováčci) neví, jak pracovat s Wikidaty a upřednostňují proto editaci přímo v článku. Proto bychom jim měli dát alespoň pár základních parametrů u blokových šablon připravených k případné editaci. Přepsané parametry se již dají dále dohledat a kategorizovat a je to lepší, než odradit uživatele od opravy tím, že narazí na šablonu bez parametrů. Naopak pro potlačení parametru z Wikidat (v případě, že obsah z Wikidat nechceme, ale nemáme za něj náhradu) bych byl pro vkládání určitého klíčového slova (např
{{Infobox - osoba}}
- dost matoucí a skoro to působí jako "sem nelez, tohle už si řešíme někde jinde, bez tebe". Mimochodem, upozorňuji na včerejší příspěvek Wikipedie:Potřebuji pomoc#Proč mi nejde editovat infobox na stránce Ivan Gundulić?. Krystalická ukázka toho, jak uživatelsky nevstřícné je řešení prázdných infoboxů... A hlavně jak komické a kvalitu ohrožující je vůbec spolehání se na wikidata (čtenáři wikipedie se totiž mohli dozvědět, že dalmatský barokní básník byl cituji: "Národnost Jugoslávec a Ragusan". A prosím neříkejte mi, že vandalismus nebo zmatečné editace se dějí i na cs.wiki, protože tenhle náš uživatel, kterej na tu chybu upozornil, není žádnej nováček, a přesto nepochopil, jak se toho nesmyslu zbavit (což myslím u skutečných nováčků nebo prostě jen čtenářů cs.wiki bude ještě větší problém) a teď můžeme jen čekat, až skupina nějakých chaotů nebo národovců z bývalé Jugoslávie začne vést na WD válku ohledně národnosti dotyčného básníka a my tu vesele uvidíme všechny jejich výplody... --Davcza (diskuse) 10. 6. 2016, 12:49 (CEST)[odpovědět]
- Jinak, abych byl i konstruktivní... Určité řešení vidím (kromě toho návrhu kolegy Dvorapa, tedy defaultně vkládat ibox osoba s několika prázdnými řádky) i v tom nahradit dnešní vágní větičku na dolním okraji iboxu "Některá data mohou pocházet z datové položky" adresným označením každé konkrétní položky iboxu, která je generována z wikidat mírně jinou barvou písma nebo malým logem WD, do kterého by se dalo kliknout a okamžitě přejít do rozhraní WD. Na dolním okraji iboxu by pak bylo upozornění "zvýrazněné položky se symbolem WD pocházejí z Wikidat". V takovém případě bych myslím měl o jeden důvod méně wikidata kritizovat. Jenže tohle jsem tu navrhoval už před 2 lety a nic se nestalo, mezitím se plíživě WD rozšiřují na další a další iboxy. --Davcza (diskuse) 10. 6. 2016, 13:01 (CEST)[odpovědět]
- To logo mají na enwiki a líbí se mi to, možná by to šlo zkopírovat a stejně plíživě vložit :D. Jako hledání konsensu změnami. --Martin Urbanec (diskuse) 10. 6. 2016, 13:06 (CEST)[odpovědět]
- Nováčci by ideálně neměli kód vidět a měli by editovat pomocí VE (editace infoboxu přímo z Wikipedie je předmětem nedávno vydané bakalářské práce, ze které se bude vycházet).
- Nyní je většina údajů v infoboxech opatřena CSS třídou
.wd
, takže úprava formátování je otázkou diskuse jak a žádosti o úpravu lokálního stylu. Určitý způsob odkazování přímo na údaje funguje u infoboxu videohra a už bylo předmětem diskuse. Matěj Suchánek (diskuse) 10. 6. 2016, 14:29 (CEST)[odpovědět]
- Jinak, abych byl i konstruktivní... Určité řešení vidím (kromě toho návrhu kolegy Dvorapa, tedy defaultně vkládat ibox osoba s několika prázdnými řádky) i v tom nahradit dnešní vágní větičku na dolním okraji iboxu "Některá data mohou pocházet z datové položky" adresným označením každé konkrétní položky iboxu, která je generována z wikidat mírně jinou barvou písma nebo malým logem WD, do kterého by se dalo kliknout a okamžitě přejít do rozhraní WD. Na dolním okraji iboxu by pak bylo upozornění "zvýrazněné položky se symbolem WD pocházejí z Wikidat". V takovém případě bych myslím měl o jeden důvod méně wikidata kritizovat. Jenže tohle jsem tu navrhoval už před 2 lety a nic se nestalo, mezitím se plíživě WD rozšiřují na další a další iboxy. --Davcza (diskuse) 10. 6. 2016, 13:01 (CEST)[odpovědět]
- dost matoucí a skoro to působí jako "sem nelez, tohle už si řešíme někde jinde, bez tebe". Mimochodem, upozorňuji na včerejší příspěvek Wikipedie:Potřebuji pomoc#Proč mi nejde editovat infobox na stránce Ivan Gundulić?. Krystalická ukázka toho, jak uživatelsky nevstřícné je řešení prázdných infoboxů... A hlavně jak komické a kvalitu ohrožující je vůbec spolehání se na wikidata (čtenáři wikipedie se totiž mohli dozvědět, že dalmatský barokní básník byl cituji: "Národnost Jugoslávec a Ragusan". A prosím neříkejte mi, že vandalismus nebo zmatečné editace se dějí i na cs.wiki, protože tenhle náš uživatel, kterej na tu chybu upozornil, není žádnej nováček, a přesto nepochopil, jak se toho nesmyslu zbavit (což myslím u skutečných nováčků nebo prostě jen čtenářů cs.wiki bude ještě větší problém) a teď můžeme jen čekat, až skupina nějakých chaotů nebo národovců z bývalé Jugoslávie začne vést na WD válku ohledně národnosti dotyčného básníka a my tu vesele uvidíme všechny jejich výplody... --Davcza (diskuse) 10. 6. 2016, 12:49 (CEST)[odpovědět]
- přebírat, nezakazovat. Ale zároveň jasně říct, že WD nejsou automaticky pokročilejší vývojovou fází wikilidstva a že ten, kdo nerozorává meze a stále hospodaří na svém poli, není zpátečníkem.
- přebírání řešit vždy v jedntl. případech (nemyslím článek od článků, ale podle typu infoboxu, databáze, tématu...) ad hoc dohodou s komunitou (ostatně takhle to probíhá už teď). Jsou iboxy, kde jsou wikidata víceméně bezproblémová a jednoznačně přínosná (viz uváděné případy často aktualizovaných informací), jsou iboxy a články kde to nutné není, plošně se to řešit moc nedá.
- podobně jako kolega Dvorpapa. Upřednostnit lokální. Lokální data jsou přehlednější pro nezkušené editory + lépe kontrolovatelná a hlídatelná, vypadají lépe (protože netrpí jazykovými a grafickými "mouchami" wikidatových iboxů) a jsou výsledkem naší autentické práce, ne generickým globálním výrobkem. Čím více údržbových kategorií, které ohlídají případné konflikty mezi lokálním kódem a WD, tím lépe. --Davcza (diskuse) 6. 6. 2016, 17:08 (CEST)[odpovědět]
- nezakazovat (ale ani nenařizovat bezvýhradné přebírání, všechno má své meze). Zakázání přebírání by mohlo vzejít v situaci, kdy by historii článků cswiki opět začaly plnit interwiki boti, což vypadá divně a působí to někdy až dojmem, kdy je obsah WP generovaný boty.
- přebírat by se mělo vše, co nenadělá jazykovou paseku (v takovém případě upravit lokálně).
- šablona by měla preferovat lokální údaje, a to i třeba v případě, že by WD měla nějaký (rozumný) zdroj a lokál nikoliv. Je ale vhodné lokální hodnoty čas od času projít, zda stále jsou užitečné tak, jak jsou a jestli se nezměnila pravda.
@Matěj Suchánek: Ping na kolegu, v tomto ŽOKu určitě má co říci i on. --Martin Urbanec (diskuse) 6. 6. 2016, 18:06 (CEST)[odpovědět]
- Každý máme co říct, já jsem si ŽoK dal do sledovaných dřív, než byl založen. Vyjádřím se postupně, aby se debata nevyčerpala hned na začátku. Matěj Suchánek (diskuse) 6. 6. 2016, 20:43 (CEST)[odpovědět]
Nejprve, je nutné informace aktualizovat ručně na Wikidatech, takže to zase tolik práce neušetří. K bodům:
- Nepreferuji přebírání. Kdyby se z Wikidaty něco stalo, je tím zničená halda práce a dat, která mohou být uchovávána v článcích. A že je něco bezpečné: To třeba o Titanicu tvrdili taky, ne? Takže dávám přednost mít všechno pěkně v článcích.
- Všechno nepřebírat je zase na jednu stranu hloupost. Třeba narození/úmrtí. Tady zase takový problém nevidím, protože rozdílné informace lze odhalit (článek/infobox). Ale přebírat třeba celý
{{Infobox - osoba}}
mi přijde hloupé, stačí jeden vandal na Wikidatech. - Jak jsem psal, preferuji lokální variantu. Úsměvné mi přijde automatické vkládání mapek třeba k něčemu jinému než mají (Gepard indický). OJJ, Diskuse 6. 6. 2016, 19:02 (CEST)[odpovědět]
- Ad 1) A co kdyby se něco stalo s Wikipedií? Nebo si snad myslíš, že data na Wikipedii jsou ve větším bezpečí? Nejsou, protože využívají stejnou infrastrukturu. --Martin Urbanec (diskuse) 6. 6. 2016, 19:08 (CEST)[odpovědět]
- @Martin Urbanec: Stačí finanční krize a IMO se zruší řada projektů. OJJ, Diskuse 6. 6. 2016, 20:00 (CEST)[odpovědět]
- Z nihž Wikidata to nebudou. A pak navíc existuje několik (spoustu) mirrorů dat v takové míře, že se dají obnovit jinde. Řekl bych, že větší pravděpodobnost je zrušení české Wikipedie než Wikidat . Ale tohle je už diskuse trochu jinam, než do tohoto ŽOKu . A někde jsem četl (smutnou) předpověď o tom, co Wikipedii čeká, ale kde... --Martin Urbanec (diskuse) 6. 6. 2016, 20:06 (CEST)[odpovědět]
- @Martin Urbanec: Wikipedie:Kdy padne 1 000 000. článek#Nikdy. OJJ, Diskuse 6. 6. 2016, 20:16 (CEST)[odpovědět]
- @OJJ: Ne, tam to nebylo. Ale už jsem to našel. V zimním Wikimediu z roku 2013 :D. Viz https://www.wikimedia.cz/docs/wikimedium/zima2013preview.pdf . Strana 13 :). --Martin Urbanec (diskuse) 6. 6. 2016, 20:23 (CEST)[odpovědět]
- @Martin Urbanec: No jo... Tak doufejme v pěkný osud české Wikipedie, když máme jako jediné interwiki DČ, NČ a články mnohokrát delší než na en. OJJ, Diskuse 7. 6. 2016, 05:39 (CEST)[odpovědět]
- @OJJ: Ne, tam to nebylo. Ale už jsem to našel. V zimním Wikimediu z roku 2013 :D. Viz https://www.wikimedia.cz/docs/wikimedium/zima2013preview.pdf . Strana 13 :). --Martin Urbanec (diskuse) 6. 6. 2016, 20:23 (CEST)[odpovědět]
- @Martin Urbanec: Wikipedie:Kdy padne 1 000 000. článek#Nikdy. OJJ, Diskuse 6. 6. 2016, 20:16 (CEST)[odpovědět]
- Z nihž Wikidata to nebudou. A pak navíc existuje několik (spoustu) mirrorů dat v takové míře, že se dají obnovit jinde. Řekl bych, že větší pravděpodobnost je zrušení české Wikipedie než Wikidat . Ale tohle je už diskuse trochu jinam, než do tohoto ŽOKu . A někde jsem četl (smutnou) předpověď o tom, co Wikipedii čeká, ale kde... --Martin Urbanec (diskuse) 6. 6. 2016, 20:06 (CEST)[odpovědět]
- @Martin Urbanec: Stačí finanční krize a IMO se zruší řada projektů. OJJ, Diskuse 6. 6. 2016, 20:00 (CEST)[odpovědět]
- Přebírat, i když i zde platí, že méně je někdy více. Takže přebírat, ale s rozmyslem. Výše někdo psal, že by se každé přebírání mělo diskutovat. Řekl bych, že spíše každý druh údaje (proč diskutovat přebírání souřadnic pro každý ze stovky infoboxů, který je používá?), i když některé jsou nesporné.
- Jednoznačně má smysl přebírat různé identifikátory a odkazy do externích databází. Ve velké části případů má smysl přebírat často měnící se údaje, typicky aktuální verzi nebo počet obyvatel. Dále má jistě smysl (a v mnoha případech se tak již děje) přebírat obrázky, data a místa narození a úmrtí a zeměpisné souřadnice. Naopak s opatrností a s kontrolou by se měly přebírat věci jako povolání. S velkou opatrností národnosti, etnicity, náboženství...
- Snad až na ten počet obyvatel a aktuální verze by měl být ve všech případech preferován / porovnáván lokální údaj. Zde ovšem může vzniknout problém, když lokální údaj bude nevyplněn (ale v infoboxu přítomen) - jak poznat, jde-li o záměrné potlačení nebo zda jde o nechtěné potlačení? To považuji za jeden systémový problém. A ten by šel řešit třeba vynucením potlačení pomocí klíčového slova
|parametr=potlačen
. JAn (diskuse) 6. 6. 2016, 21:56 (CEST)[odpovědět]
- Přebírat, neb v mnoha případech budou data rychleji aktualizována.
- V zásadě vždy, kdy není lokální údaj.
- U lokální varianty je vhodné mít možnost ji vynutit, ale pokud jsou wikidata výrazně mladší, bylo by pěkné na ně graficky upozornit. --Limojoe (diskuse) 7. 6. 2016, 00:33 (CEST)[odpovědět]
- V zásadě nezakazovat nic, co není v rozporu se závaznými pravidly. Protože závazná pravidla jsou závazná a případnému rozporu je třeba zabránit přímo u zdroje (viz níže bod 2.). Případné rozpory s doporučeními lze akceptovat a řešit ad hoc.
- Podstatný je soulad se závazným pravidlem pravopis. V případě rozporu je přejímání bez automatické úpravy nepřijatelné, jde o níže uvedené body 2.1 a 2.2.1:
- Přebírání číselných hodnot, protože forma zápisu čísel se především od anglického formátu liší. Přitom je česká forma zápisu závazná, neb je definována pravidly českého jazyka.
- Přebírání jmen z jazyků nepoužívajících k zápisu latinku (viz též Wikipedie:Žádost o komentář/Transkripce jmen a názvů v jazyce původu zapisovaných nelatinkovým písmem).
- Pro některé jazyky jsou v pravidlech českého pravopisu dána pravidla jejich přepisu do češtiny - soulad se závazným pravidlem, tedy přebírat bez úpravy nelze.
- U některých dalších jazyků přepisujeme dle tradičních zásad a při automatickém přebírání vzniknou diskuse, ovšem z hlediska pravidel není rozpor, protože zde většinou nejde ani o doporučení, ale o pouhý úzus.
- Je třeba mi mít možnost lokálně upravit (viz bod 2.2.2 výše)
Herigona (diskuse) 9. 6. 2016, 09:47 (CEST)[odpovědět]
- Pokud nemá příslušná položka vyplněný na Wikidatech český štítek, objeví se v infoboxu číslo položky, tedy např. Q123456, a kdokoliv může štítek na Wikidata doplnit.
- Číselné hodnoty, data a souřadnice jsou na Wikidatech uloženy jako prosté číslo, jejich formátování je prováděno až na straně klienta (tedy cs.wiki)
- Výše zmíněné obavy jsou tedy ve většině případů liché. JAn (diskuse) 9. 6. 2016, 10:44 (CEST)[odpovědět]
Původní téma, na jehož základě byla založena tato žádost, se týkala jen údajů v infoboxech, což tady nezaznělo. Údaje z Wikidat se přitom nyní používají (už standardně a snad nezpochybnitelně) pro interwiki a pak taky třeba u Autoritních dat a v šablonách některých externích odkazů (Commonscat nebo namátkou Čsfd film). Nejsem si proto jistý, jestli v úvodu položené otázky míří opravdu jen na infoboxy, nebo všeobecně. V těch jmenovaných případech autoritních dat i některých externích odkazů to může být dost podobné jako u infoboxů, ale mám neurčitou pochybnost, jestli by se nemohly vyskytovat (už nyní, nebo třeba do budoucna) případy, ke kterým by bylo vhodné přistupovat jinak. Proto se vyjádřím jen k těm infoboxům, autoritním datům a externím odkazům:
- Pro Pro. Česká Wikipedie by měla přebírat standardizované informace z Wikidat, měla by s nimi být provázána a čeští wikipedisté by měli (alespoň ti zkušenější) běžně pracovat s Wikidaty při vyplňování, kontrole a opravování údajů pro infoboxy apod. Je to pro českou Wikipedii a české wikipedisty relativně nová, už však docela zavedená a ustálená funkcionalita a je vhodné si práci s ní osvojit. Jednotlivé nedostatky se průběžně řeší a vylaďují. Vzhledem k multilingvistické povaze projektu může být obtížnější domluva s ostatními uživateli, ale v drtivé většině nesporných případů není komunikace potřebná. A podobně multilingvistický je ostatně i projekt Commons, odkud načítáme tisíce a tisíce obrázků. Pochopitelně mohou vznikat obavy z pocitu, že něco dostatečně „nemáme pod kontrolou“, když se to neřeší a neodehrává na našem uzavřeném a ohraničeném písečku, ale po vlastních zkušenostech s více než 4,5 tisíci editacemi Wikidat osobně pocit něčeho cizího a neovladatelného. Připomínám, že pokud bychom se od Wikidat chtěli odříznout úplně, znamenalo by to odříznout nejen infoboxy, ale taky interwiki, což by obnovilo potřebu hromadných robotických změn, které do značené míry zaplevelovaly editační historii článků.
- Měly by se přebírat údaje standardizované, dobře strukturované – právě takové, pro které zejména slouží infoboxy, autoritní data apod. Nemusí to být nutně všechny údaje a určitě ne všechny hned. Odůvodněné výjimky jistě existují. Některé jen dočasně, protože ještě nejsou na Wikidatech dostatečně ošetřeny (napadá mě příklad s premiérami filmů, kdy se do Wikidat můžou vyplňovat premiéry v různých zemích, ale nás zajímá třeba jen světová premiéra a česká premiéra, což se však dá asi obtížně nadefinovat na úrovni celého infoboxu a je lepší to vyplnit lokálně), některé možná i trvale, protože některé položky v infoboxech můžou obsahovat údaj poměrně složitě graficky i jinak sestavený a v databázi uchovatelný/editovatelný (ale třeba časem půjde opravdu všechno, vývoj můžeme těžko předvídat).
- Pro Pro. Měla by existovat technická možnost „přebít“ údaj načítaný z Wikidat lokálně vyplněným údajem. To by se však mělo dít jen v případech, kdy se údaj na Wikidatech vyskytuje ve formě, která je vyloženě závadná nebo pro českou Wikipedii opodstatněně nevyhovující. Pokud jde třeba jen o případ chybějícího štítku k existující datové položce, místo lokálního přepisu by se určitě měl raději vyplnit ten štítek na Wikidatech. Chápu, že třeba zakládání úplně nové datové položky kvůli tomu, aby se mohl vyplnit jeden údaj v infoboxu, je trochu víc práce než jen lokálně vyplnit hodnotu, proto bych měl prozatím pochopení pro lokální vyplňování. Zároveň bych však byl pro odsouhlasení, že lokálně vyplněné hodnoty by se mohly a měly postupně z infoboxů odstraňovat, ať už ručně, nebo i roboticky, pokud tomu odstranění bude předcházet kontrola, že předmětný údaj je na Wikidatech správně vyplněn a infobox ho správně načte a zobrazí. Naopak bych považoval za škodlivé, pokud by se takovému odstraňování zabraňovalo nebo by se (bezchybné) údaje z Wikidat převáděly do lokálního vyplnění.
Ještě bych doplnil, že považuji za žádoucí (až skoro nutné) v každém ifoboxu, který některé údaje z Wikidat přebírá, uvést poznámku po vzoru Infobox - osoba: „Některá data mohou pocházet z datové položky.“ včetně odkazu na onu položku na Wikidatech. Naopak za méně šťastný (až nevhodný) považuji příklad Infobox - videohra, kde se u každé jednotlivé hodnoty načtené z Wikidat zobrazuje odkaz „(e)“ vedoucí na příslušnou datovou položku. V případě, kdy se načítá jen jeden nebo pár údajů z mnoha (např. Lost in Time (hra)) to možná tolik nevadí, ale pokud je takovými „éčky“ zahlcený celý infobox (např. Sniper Elite V2), už to začíná být protivné a nepřehledné. Přitom ke každé jednotlivé položce se lze dostat jedním kliknutím v rámci Wikidat, takže snad není nutný přímý odkaz už z infoboxu na české Wikipedii (něco jiného je případ chybějícího štítku, v takovém případě je ten přímý odkaz víc než vhodný). --Bazi (diskuse) 10. 6. 2016, 13:52 (CEST)[odpovědět]
- Přebírat z Wikidat by se mělo jen, když to čtenáři přináší užitek. Zakázal bych přebírání údajů z Wikidat, které nemají vyplněný český štítek. Číselné kódy položek Wikidat místo encyklopedických údajů nemají pro čtenáře žádný užitek a dokonce ho mohou odradit od přispívání, protože se mu editace jeví jako příliš složitá věc.
- Viz bod 1 a 3
- U neměnných a trvalých údajů vždy upřednostnit lokální údaje. U údajů v čase se měnících (počet obyvatel, starosta) využívat Wikidata. --Jowe (diskuse) 15. 6. 2016, 12:33 (CEST)[odpovědět]
- Ad 1. Nevyplěný štítek je dílčí nedostatek, který se nejsnáz napraví právě tím, že na Wikidatech ten chybějící štítek doplníte. Je to dokonce prospěšnější (a mnohdy snazší) úkon než kvůli tomu přepisovat hodnotu v infoboxu lokálně nebo snad úplně rušit načítání onoho údaje na úrovni infoboxu. --Bazi (diskuse) 15. 6. 2016, 13:01 (CEST)[odpovědět]
- Wikipedii tvoříme pro čtenáře. Běžného čtenáře nezajímá to, že někde mimo Wikipedii něco schází. Všechny informace v každém článku by vždy měly být srozumitelné a to třeba informace v infoboxu v článku Hugo Kapet zdaleka nejsou. --Jowe (diskuse) 15. 6. 2016, 13:17 (CEST)[odpovědět]
- @Martin Urbanec, Matěj Suchánek: Ví někdo, zda by šlo nastavit, aby se neoštítkované položky v infoboxech zobrazovaly např. jen registrovaným uživatelům? Nebo aby se zobrazovaly jen těm, kteří si to nastaví v Nastavení? --Vojtěch Dostál (diskuse) 15. 6. 2016, 13:42 (CEST)[odpovědět]
- Ani na úrovni modulů nelze zjistit, jaký uživatel stránku vidí. Řešením by bylo použít CSS a výstup z modulu změnit na CSS seznam. Styly je potom možné změnit pro jednotlivé uživ. skupiny nebo pomocí udělátek. Tento „hack“ by ale vyžadoval podporu složitějších CSS pravidel na straně čtenáře. Jednodušší pak je tyto údaje vyfiltrovat a nezobrazit nikomu, tyto štítky ale budou dohledatelné jen pomocí databáze. Matěj Suchánek (diskuse) 15. 6. 2016, 16:34 (CEST)[odpovědět]
- @Matěj Suchánek: A je možné vypsat články s infoboxy, které obsahují neoštítkované pooložky? Dík za rady, --Vojtěch Dostál (diskuse) 16. 6. 2016, 13:07 (CEST)[odpovědět]
- Tuším, že by to měla být kategorie Kategorie:Údržba:Doplnit štítek na Wikidatech (zaznělo Pod lípou), ale kategorizace má asi značné zpoždění, protože tam nacházím celou řadu článků, kterým ve skutečnosti české štítky v infoboxu nechybí. Leda by se zahrnovaly i štítky k položkám, které se do infoboxu nenačítají. --Bazi (diskuse) 16. 6. 2016, 13:18 (CEST)[odpovědět]
- Kromě pomalé aktualizace je na vině i míchání článků 1) nemají štítek na WD a 2) obsahují odkaz na stránku bez štítku na WD. Takže se v článku nemusí vyskytovat žádné Q123456 ale položka tohoto článku na WD nemá štítek nebo dokonce neexistuje. JAn (diskuse) 16. 6. 2016, 14:48 (CEST)[odpovědět]
- Tuším, že by to měla být kategorie Kategorie:Údržba:Doplnit štítek na Wikidatech (zaznělo Pod lípou), ale kategorizace má asi značné zpoždění, protože tam nacházím celou řadu článků, kterým ve skutečnosti české štítky v infoboxu nechybí. Leda by se zahrnovaly i štítky k položkám, které se do infoboxu nenačítají. --Bazi (diskuse) 16. 6. 2016, 13:18 (CEST)[odpovědět]
- @Matěj Suchánek: A je možné vypsat články s infoboxy, které obsahují neoštítkované pooložky? Dík za rady, --Vojtěch Dostál (diskuse) 16. 6. 2016, 13:07 (CEST)[odpovědět]
- Ani na úrovni modulů nelze zjistit, jaký uživatel stránku vidí. Řešením by bylo použít CSS a výstup z modulu změnit na CSS seznam. Styly je potom možné změnit pro jednotlivé uživ. skupiny nebo pomocí udělátek. Tento „hack“ by ale vyžadoval podporu složitějších CSS pravidel na straně čtenáře. Jednodušší pak je tyto údaje vyfiltrovat a nezobrazit nikomu, tyto štítky ale budou dohledatelné jen pomocí databáze. Matěj Suchánek (diskuse) 15. 6. 2016, 16:34 (CEST)[odpovědět]
- To je, zdá se, střet imediatismu s eventualismem. Evidentně celá Wikipedie není hotová a dokonalá, máme tu mnoho článků nehotových (zrovna Vy jste obhájcem pahýlů, nemýlím-li se) a mnoho článků vyžadujících úpravy (nejen že v nich něco chybí, ale něco tam už je a je to vyloženě špatně). I články s chybějícími štítky mezi takové patří. A potřebují nápravu, která je mnohdy snazší než náprava těch ostatních nedostatků. Bez toho, aby se chybějící štítky zobrazily, se obtížně dohledají a napraví. Je to vlastně obdoba šablony „pahýl“. --Bazi (diskuse) 15. 6. 2016, 13:56 (CEST)[odpovědět]
- Je velký rozdíl mezi pahýlem obsahující velmi stručné ale srozumitelné údaje a články, které obsahují nesrozumitelné údaje (číselné kódy místo informací). Něco takového by se vůbec nemělo v článcích vyskytovat. --Jowe (diskuse) 15. 6. 2016, 14:04 (CEST)[odpovědět]
- Ty údaje nejsou až tak nesrozumitelné, když se na to podíváte bez předsudků. U každého z nich je ikona s nápovědou, která to jasně vysvětluje: „Položka na Wikidatech neobsahuje český štítek; můžete ho doplnit“. A je tam odkaz vedoucí na tu položku. Navíc by se postupně měly takové případy vytrácet, když budeme všichni spolupracovat na tom, aby se štítky doplňovaly. Chybějící štítek a jeho doplnění je přitom jen jedna z mnoha jiných věcí a postupů, kterým nováček zprvu nemusí rozumět a které si může osvojit. Stejně tak jako třeba to, jak fungují šablony a infoboxy a jak v nich vyplnit nebo upravit nějaký údaj.
- Uvedl jste jako příklad Hugo Kapet s třemi položkami bez štítku, ale já když zakládám třeba články o filmech, je v nich občas i dvakrát víc takových položek. Tak je hned doplním a je to. A tím vyřeším nejen ten jeden článek s jedním infoboxem, ale potenciálně i všechny ostatní články a infoboxy, ve kterých se ony položky vyskytují nebo v budoucnu vyskytnou. Kdybych je ale místo toho neviděl, těžko si jich všimnu nebo nebudu tak motivovaný je vyřešit. --Bazi (diskuse) 15. 6. 2016, 16:24 (CEST)[odpovědět]
- Já se na to dívám pohledem běžného čtenáře, který toho ví málo o editaci Wikipedie a vůbec nic o Wikidatech. Pochopte už konečně, že našim primárním cílem je tvorba srozumitelné encvyklopedie, a nikoliv výchova editorů a zdokonalování počítačových dovedností čtenářů. Mimochodem, narazil jste někdy na nějaké jiné jazykové verzi Wikipedie na infobox, kde jsou místo údajů číselné kódy ? --Jowe (diskuse) 16. 6. 2016, 13:04 (CEST)[odpovědět]
- A myslíte si, že každý zvládne doplnit štítky u položek zobrazovaných v infoboxu článku Arsen Julfalakjan ? --Jowe (diskuse) 16. 6. 2016, 13:31 (CEST)[odpovědět]
- Nějaký problém? A ne, nečeká se, že každý hned zvládne všechno. To se nečeká ani u nováčky zakládaných článků, kdy po nich mnohdy zkušenější doplňují vůbec nějaké infoboxy, další šablony, opravují vzhled a styl... Nikdo učený z nebe nespadl. Nebo čekáte třeba, že každý zvládne opravit nebo doplnit položku do navboxu? Jinak výchova editorů v počítačových dovednostech není cíl, je to prostředek k té tvorbě a rozvoji encyklopedie. --Bazi (diskuse) 16. 6. 2016, 14:45 (CEST)[odpovědět]
- Nečeká se, že každý zvládne vše, od encyklopedie se však očekává, že zde budou údaje ve srozumitelné formě. Škoda, že jste mi neodpověděl na otázku položenou v mém příspěvku. --Jowe (diskuse) 16. 6. 2016, 15:00 (CEST)[odpovědět]
- Máš pravdu, že některé položky se česky označují velice těžko - například názvy ocenění, ale i přepisy některých cizích jmen (děti, manželka...). A zrovna ocenění někdy rozhodují o encyklopedické význmnosti. JAn (diskuse) 16. 6. 2016, 22:13 (CEST)[odpovědět]
- Nečeká se, že každý zvládne vše, od encyklopedie se však očekává, že zde budou údaje ve srozumitelné formě. Škoda, že jste mi neodpověděl na otázku položenou v mém příspěvku. --Jowe (diskuse) 16. 6. 2016, 15:00 (CEST)[odpovědět]
- Nějaký problém? A ne, nečeká se, že každý hned zvládne všechno. To se nečeká ani u nováčky zakládaných článků, kdy po nich mnohdy zkušenější doplňují vůbec nějaké infoboxy, další šablony, opravují vzhled a styl... Nikdo učený z nebe nespadl. Nebo čekáte třeba, že každý zvládne opravit nebo doplnit položku do navboxu? Jinak výchova editorů v počítačových dovednostech není cíl, je to prostředek k té tvorbě a rozvoji encyklopedie. --Bazi (diskuse) 16. 6. 2016, 14:45 (CEST)[odpovědět]
- Je velký rozdíl mezi pahýlem obsahující velmi stručné ale srozumitelné údaje a články, které obsahují nesrozumitelné údaje (číselné kódy místo informací). Něco takového by se vůbec nemělo v článcích vyskytovat. --Jowe (diskuse) 15. 6. 2016, 14:04 (CEST)[odpovědět]
- @Martin Urbanec, Matěj Suchánek: Ví někdo, zda by šlo nastavit, aby se neoštítkované položky v infoboxech zobrazovaly např. jen registrovaným uživatelům? Nebo aby se zobrazovaly jen těm, kteří si to nastaví v Nastavení? --Vojtěch Dostál (diskuse) 15. 6. 2016, 13:42 (CEST)[odpovědět]
- Wikipedii tvoříme pro čtenáře. Běžného čtenáře nezajímá to, že někde mimo Wikipedii něco schází. Všechny informace v každém článku by vždy měly být srozumitelné a to třeba informace v infoboxu v článku Hugo Kapet zdaleka nejsou. --Jowe (diskuse) 15. 6. 2016, 13:17 (CEST)[odpovědět]
Update: díky změně v softwaru se počet stránek s tímto problémem snížil na 400. Na druhou stranu se teď štítky zobrazují v angličtině. Matěj Suchánek (diskuse) 19. 6. 2016, 10:06 (CEST)[odpovědět]
- Ano, v noci jsem si toho všiml a je to dost problém. Když se rovnou zobrazí anglický štítek místo chybějícího českého, není často poznat (typicky u jmen), že štítek vůbec chybí a měl by být doplněn. --Bazi (diskuse) 19. 6. 2016, 11:05 (CEST)[odpovědět]
- Lepší anglický štítek než nějaký číselný kód. --Jowe (diskuse) 19. 6. 2016, 11:35 (CEST)[odpovědět]
- Opravdu je to tím? Kategorii jsem v pátek 17. června projel robotem (touch), takže články (cca 3500 ks) s již doplněným štítkem z kategorie vypadly. A v těch, co v kategorii zůstaly se stále zobrazuje Q123. Našel by někdo příklad, kde se teď vyplňuje název ve špatném jazyce a zároveň není chybně vyplněný štítek na WD? JAn (diskuse) 20. 6. 2016, 09:24 (CEST)[odpovědět]
- Super, díky za update, a hned máme z nějakých 4000 jenom 400 článků bez štítku.
- Moje konkrétní zkušenost byla tady, když se mi po založení článku a provázání na Wikidata v infoboxu rovnou zobrazilo (asi z anglického štítku) jméno korežiséra Angus MacLane a spoluscenáristky Victorie Strouse, ačkoli v té době ještě jeho ani její položka neměla český štítek. Ten jsem k oběma doplnil až pak. --Bazi (diskuse) 20. 6. 2016, 12:56 (CEST)[odpovědět]
- Úplně bych přebírání nezakazoval. Interwiki přes wikidata má svá omezení, ale výhody převažují.
- Vždy jen ve výslovně komunitou odsouhlasených případech, jejichž vyjmenování samozřejmě nemůže tento ŽoK obsáhnout. Pravděpodobně to budou části infoboxů podléhající rychlé zkáze (typicky omílaný příklad počtu obyvatel), na druhou stranu třeba starosta už není úplně bez problémů. Nerad bych tu měl třeba ruské politiky psané anglickým přepisem. Správný český štítek je podstatný. Pokud bude nějaký český wikimedián ať v dobré víře či z lenosti nebo z partyzánštiny, kopírovat do českých štítků anglické přepisy ruských nebo izraelských jmen, nebo anglické názvy francouzských vysokých škol atp., tak bych to rozhodně nepřejímal, dokud si na wikidatech neudělají pořádek a toho člověka nějak neumravní, aby toho rádobyužitečného záškodničení nechal.
- Rozhodně upřednostňovat lokální. Kdyby se člověk musel o správný obsah článku na české Wikipedii jít dohadovat někam do úplně jiné komunity, navíc pravděpodobné v angličtině, bylo by to špatně.--Tchoř (diskuse) 19. 6. 2016, 21:21 (CEST)[odpovědět]
- Přebírat ano, ale s určitými omezeními (viz níže).
- Přebírat pouze tam, kde nehrozí konflikt s pravidly a doporučeními, především WP:Pravopis (nepřebírat údaje bez českého štítku) a WP:Články o žijících lidech (tady mám konkrétně na mysli nepřebírat citlivé údaje jako národnost a náboženská příslušnost).
- Lokální údaj by měl mít vždy přednost, pokud komunita explicitně nerozhodne jinak (v této souvislosti si vybavuji IUCN status v taxoboxu, kde byla shoda na tom odstranit lokální údaje a přebírat aktuálnější údaje z Wikidat). Pokud běžný čtenář uvidí chybu, pravděpodobně dokáže provést opravu změnou hodnoty parametru zde na wiki, pokud by však bylo nutné provádět opravu na Wikidatech, bude ztracen. --Vachovec1 (diskuse) 20. 6. 2016, 01:09 (CEST)[odpovědět]
--Vachovec1 (diskuse) 20. 6. 2016, 01:09 (CEST)[odpovědět]
Souhlasím s kolegy: nezakazovat, přebírat, ale zvážit, kde je to v současném stadiu wikidat rozumné. Ideální by bylo, kdyby se autoři článků časem naučili vyplňovat přímo příslušné položky na wikidatech, ale to by chtělo za prvé více osvěty (co třeba dát stručný výklad k wikidatům do hlavního menu nápovědy?), za druhé i trochu více uživatelské přístupnosti samotných wikidat (jejich současná podoba bohužel ze všeho nejvíc připomíná formulář daňového přiznání).--Hnetubud (diskuse) 23. 6. 2016, 23:25 (CEST)[odpovědět]
Zatím asi stačí přebírat jak je teď jak je, ale co se mi moc nelíbí - když někdo uvede v infoboxu parametr a nevyplní jeho hodnotu a tím (jistě většinou nevědomky) přebije lokální nevyplněnou hodnotou tu wikidatovou užitečnou. Nešlo by nějak zařídit, aby se vymazávalo jinak než nevyplněnou hodnotou? Chrzwzcz (diskuse) 1. 7. 2016, 00:18 (CEST)[odpovědět]
- To by mohla být ta nevýhoda uvedených, ale prázdných parametrů... (viz níže) (Výjimkou je zatím
{{Infobox - videohra}}
.) Matěj Suchánek (diskuse) 1. 7. 2016, 12:45 (CEST)[odpovědět]
- Samozřemě i nadále přebírat. S WD v infoxech není nutné ztrácet čas jejich vyplňováním (a aktualizací, pokud nejde o vyloženě "česká" témata), což šetří čas editorů.
- Přebírání nikdo "nezakázal", tedy není nutné jej "povolovat". Vždy by tak mělo být po předchozím upozornění a prostoru na diskusi na diskusní stránce příslušného infoboxu.
- Ideálně by se všechny užitená data z infoboxů měla přesunout na WD tak, aby z nich měli užitel všíchni uživatelé WD (tedy hlavně ostatní wikipedie). Lokální vyplňování pak ponechat pro případy, kdy výstup z WD není z nějakého důvodu vhodný.
Nesouhlasím s tezí o nemožnosti kontroly vandalismu na WD, naopak jejich datový charakter umožňuje hledat vandalismy (a chyby) mnohem snadněji. Podobně nemohu souhlasit s tvrzením o datech nízké kvality či chybovosti na WD, toto obodí již mají WD za sebou, aktálně je podle mých zkušeností průměrná chybovost na WD naopak mnohem nižší než na wikipedii. Např. občas procházím Kategorie:Údržba:Souřadnice z Wikidat se liší o více než xxx km a zatím vždy byly chybné souřadnice na wiki. V některých případech se ovšem koncept příslušné vlastnosti na WD nemusí přesně shodovat s příslušnou položkou infoboxu, pak ovšem jde o konceptuální rozpor, nikoliv o chybovost. --Jklamo (diskuse) 2. 7. 2016, 22:40 (CEST)[odpovědět]
- Díky za další názor opět ukazující na pestrost našich stanovisek. Ohledně kontroly vandalismu na WD - úvodní teze možná skutečně není úplně přesná, ale je to slovíčkaření. Neumožňuje kontrolu formou posledních změn - nalezení vandalismu hned poté, co se udál. Typicky se chyby objeví datovou analýzou až za delší časové období. Jedná se tedy o kontrolu, ale trochu jiný typ, než jsme na to z Wikipedie zvyklí u posledních změn a sledovaných stránek. --Vojtěch Dostál (diskuse) 2. 7. 2016, 23:32 (CEST)[odpovědět]
Z diskuze v žoku podle mě vyplynulo zatím několik obecných principů:
- Přejímání z Wikidat do české Wikipedie by mělo vždy být pro každý parametr oznámeno a, pokud je sporné, v následné diskuzi posouzeno. Kritériem je zejména kvalita dat na Wikidatech a jejich proměnlivost v čase. Zejména by se neměly přebírat položky, které nemají české štítky. U méně proměnlivých údajů je možné ponechat lokální informace a jen monitorovat jejich kvalitu pomocí údržbové kategorie. Není to vhodné v případě, že by tím roboti procházející monitorovací kategorii zahlcovaly poslední změny.
- Upřednostnit lokální vyplnění. To by mělo vždy přebít informaci na Wikidatech. To umožní i nováčkům aby informaci snadno opravili přímo ve Wikipedii. To ovšem neznamená že by nebylo možné parametry z infoboxů a dalších šablon odstraňovat ve prospěch Wikidat, pokud jsou lokální data nekvalitní. Vždy by ale toto mělo být prodiskutováno (viz výše).
Jsou toto +/- věci, na kterých se jako diskutující shodneme?--Vojtěch Dostál (diskuse) 30. 6. 2016, 20:17 (CEST)[odpovědět]
- Jak se tato ŽoK projeví do stávajících přebírání? Bude nutné všechno vypnout a znovu diskutovat? Matěj Suchánek (diskuse) 30. 6. 2016, 20:55 (CEST)[odpovědět]
- To je nesmysl. Stávající bych ponechal jako výchozí stav a v případě pochyb se jednotlivá přebírání mohou podrobit diskuzi. --Vojtěch Dostál (diskuse) 1. 7. 2016, 00:06 (CEST)[odpovědět]
Baziho dotazy
[editovat | editovat zdroj]K prvnímu bodu: Takže to znamená, že by se měl zavést nějaký typ komunitního „hlasování“ o každém jednotlivém parametru každého infoboxu, u něhož by se chtělo zprovoznit přebírání z Wikidat? Na jaké stránce by se to mělo dít, jaký by měl být proces „schvalování“? Jak je možné rozhodovat o položkách, kterým chybí české štítky, když na úrovni infoboxu se zprovozňuje celý parametr, zatímco chybějící štítky se projevují jen u některých jednotlivých hodnot toho parametru? Znamená to, že by se mělo přebírání na úrovni infoboxu vypnout kvůli každému jednotlivému chybějícímu štítku u hodnoty, nebo při nějakém počtu/podílu nevyplněných štítků? Jak se to pozná? Pokud by mělo jít o rozhodování na úrovni jednotlivých článků s vloženým infoboxem, tam by asi bylo logické, že je možné údaj z Wikidat, jemuž chybí český štítek, přepsat hodnotou lokální. Ačkoli zároveň by se to dalo řešit doplněním onoho českého štítku, takže přepsání lokální hodnotou by snad nemělo být jediným přípustným/doporučovaným řešením takových případů.--Bazi (diskuse) 1. 7. 2016, 01:03 (CEST)[odpovědět]
- Ano navrhuji mít pro to nějakou komunitní nástěnku, buď technickou lípu nebo spíše Diskuse k Wikipedii:WikiProjekt Strojové zpracování. Jak moc štítků musí chybět abychom daný parametr neměli přebírat? To by mělo být součástí diskuze. Když jich bude pár, věřím, že společnými silami je před zavedením přebírání doplníme. Je silná nechuť v komunitě zobrazovat v šablonách neoštítkovaná data.--Vojtěch Dostál (diskuse) 1. 7. 2016, 09:26 (CEST)[odpovědět]
K druhému bodu: Upřednostnit technicky, tedy že lokální hodnota v případě vyplnění přepíše hodnotu z Wikidat (to je stávající přístup)? Nebo upřednostnit v tom smyslu, že se doporučuje wikipedistům raději vyplňovat lokální údaje než vyplňovat údaje přes Wikidata? --Bazi (diskuse) 1. 7. 2016, 01:03 (CEST)[odpovědět]
- Upřednostnit technicky. --Vojtěch Dostál (diskuse) 1. 7. 2016, 09:26 (CEST)[odpovědět]
Pokud by se měly lokální údaje odstraňovat jen když jsou nekvalitní, znamená to, že když chyběly údaje, někdo je doplnil na Wikidatech, aby nechyběly, pak je někdo přepsal z Wikidat ve stejné podobě lokálně, už se to nesmí vrátit do předchozí podoby, přestože to přepsání bylo v podstatě zbytečným krokem, který nepřinesl žádnou užitnou hodnotu? A naopak se to dělat nesmí? I když půjde o stejně kvalitní údaje, je možná jenom cesta z Wikidat do lokálu, ale nikdy naopak? --Bazi (diskuse) 1. 7. 2016, 01:03 (CEST)[odpovědět]
- Pokud už je někdo přepsal (což považuji za nesmyslnou činnost,ať už se bude dělat ručně nebo roboticky), asi je jedno, jestli v praxi čerpáme z Wikidat nebo ty data jsou pevně na Wikipedii - čtenář to nepozná. Nicméně natvrdo vložená data na Wikipedii velmi brzy zastarají a pak by asi bylo vhodné je odstranit (dle věty výše: "To ovšem neznamená že by nebylo možné parametry z infoboxů a dalších šablon odstraňovat ve prospěch Wikidat, pokud jsou lokální data nekvalitní.").--Vojtěch Dostál (diskuse) 1. 7. 2016, 09:26 (CEST)[odpovědět]
JAnovy poznámky
[editovat | editovat zdroj]- Stránka, kde by se oznámilo - "hodlám do šablony
{{Infobox - foo}}
přebírat z Wikidat hodnotu stupeň ochrany. Pokud se osvědčí, zavedeme i do dalších podobných infoboxů" - to by asi šlo. Některé hodnoty se dnes již přebírají v mnoha infoboxech, takže oznamování přebírání data narození v dalších infoboxech oproti dnešním 50 asi smysl nemá. - Každopádně by byla dobrá monitorovací kategorie, která by hlásila přebíjení hodnoty z Wikidat lokálním nevyplněným údajem. @Matěj Suchánek: - je to technicky možné?
Je to už připravené, ale musí se samozřejmě upravit syntaxe infoboxů. Matěj Suchánek (diskuse) 1. 7. 2016, 12:41 (CEST)[odpovědět]- Omyl, přímo tohle připravené zatím není, ale určitě to možné je. Jenom bude nutné přijít na co nejjednodušší způsob. Matěj Suchánek (diskuse) 1. 7. 2016, 13:00 (CEST)[odpovědět]
- Do budoucna by bylo lepší upravit zápis takto
V závorkách další možný monitoring, doplnil Matěj Suchánek (diskuse) 1. 7. 2016, 12:41 (CEST).[odpovědět] |
|
JAn (diskuse) 1. 7. 2016, 11:46 (CEST)[odpovědět]
- Jaký je důvod zavedení čtvrtého stavu parametru – potlačené hodnoty? V současné době se jako potlačené považují parametry uvedené, ale prázdné, tedy lokální ne. Matěj Suchánek (diskuse) 1. 7. 2016, 12:41 (CEST)[odpovědět]
- Ve spoustě článků je vložen infobox tak, jak je uveden v dokumentaci, tedy včetně všech parametrů (příklad). A pokud jej autor nevyplní, automaticky tím potlačí případný údaj z Wikidat. A nejvíce se to projeví ve chvíli, kdy se so infoboxu zavede nové přebírání - ve velké části dávno existujících článků se automaticky přebije přebíraná hodnota lokální nevyplněnou. JAn (diskuse) 1. 7. 2016, 13:50 (CEST)[odpovědět]
- Každopádně jsem právě přemýšlel nad monitoringem přebíjení a ani u jedné z možností by nebyl jednoduchý. Pokud vypadá infobox takto
| data1 = {{#invoke:...}}
a ten složitý zápis nám vrátí kategorii, na místě, kde se normálně zobrazuje text z parametru, se zobrazí prázdná buňka, což nechceme. Takže monitoring musí probíhat na jiném místě, než se pracuje s parametrem. Matěj Suchánek (diskuse) 1. 7. 2016, 16:00 (CEST)[odpovědět]
- Každopádně jsem právě přemýšlel nad monitoringem přebíjení a ani u jedné z možností by nebyl jednoduchý. Pokud vypadá infobox takto
- Ve spoustě článků je vložen infobox tak, jak je uveden v dokumentaci, tedy včetně všech parametrů (příklad). A pokud jej autor nevyplní, automaticky tím potlačí případný údaj z Wikidat. A nejvíce se to projeví ve chvíli, kdy se so infoboxu zavede nové přebírání - ve velké části dávno existujících článků se automaticky přebije přebíraná hodnota lokální nevyplněnou. JAn (diskuse) 1. 7. 2016, 13:50 (CEST)[odpovědět]
- Výše uvedená diskuse je uchovávána jako archiv žádosti o komentář. Laskavě ji neměňte. Případné další debaty patří na příslušnou stránku (na diskusní stránku článku nebo uživatele). Na této stránce by už neměly být prováděny žádné editace.