úterý 18. října 2011

Doporučení pro komentátory

V znovuoživené diskusi pod tímto článkem došlo opakovaně k tomu, že filtr označil regulérní komentář za spam a přesunul ho do spamové složky. Není to první případ, a proto považuji za vhodné na toto riziko komentátory upozornit a přidat několik (nepříliš spolehlivých) rad, jak se mu vyhnout.

Pokud je komentář vyhodnocen jako spam, přesune se do složky Spam, odkud ho mohu manuálně přesunout zpět mezi regulérní komentáře. Je zde ale několik problémů:


  1. Pokud je komentář vyhodnocen jako spam okamžitě, nedostanu žádné upozornění, že k tomu došlo. Může se tak stát, že se o něm dozvím až po dlouhé době, když se podívám na obsah spamové složky. Ta je ale většinou prázdná, takže se do ní pravidelně nedívám, a po nějaké době se její obsah automaticky maže. Komentář tak může zaniknout bez povšimnutí.
  2. Může se dokonce stát, že filtr komentář smaže zcela, aniž by jej dal do spamové složky.
  3. Někdy se komentář zobrazí, ale filtr ho po určité době dodatečně vyhodnotí jako nevhodný a smaže. Za těchto okolností si autor komentáře nemusí povšimnout, že komentář zmizel. (Pokud komentář zmizí, je to vždy následkem činnosti filtru. Pokud někdy dojde k tomu, že nějaké komentáře smažu já manuálně, oznámím to v příslušné diskusi s uvedením důvodů. Zatím k něčemu takovému nikdy nedošlo.)


Spamový filtr nelze vypnout a ani pravděpodobně nastavit. Přístup Googlu jakožto provozovatele systému k této otázce je patrný zde. V zásadě je to: „skutečně si myslíme, že filtr vypínat nepotřebujete, kdyby to šlo, spameři by to zneužili, a vůbec, filtr funguje dobře, místo stížností nám radši pomožte filtr natrénovat tak, aby fungoval ještě líp“. Problém je, že na tomto blogu filtr dobře nefunguje: nepamatuji jediný případ, kdy by ve spamové složce skončil skutečný spam, a nesprávně zakázané komentáře tvoří odhadem 2% všech komentářů. (Protože ne všechny spamy končí ve spamové složce, je možné, že spousta případů prošla naprosto bez povšimnutí.) Jestli problémy tohoto rázu budou přetrvávat, uvážím převést blog jinam, což ovšem má své problémy.

Protože filtr je postaven tak, aby se mohl sám učit, je obtížné říct, jaká kritéria užívá při posouzení komentářů. Možná to nikdo pořádně neví. Přesto několik doporučení:

  • Odkazy jsou podezřelé. Jestliže vám neprojde komentář obsahující odkazy, snižte množství odkazů v poměru k množství textu.
  • Cizí jazyky jsou podezřelé. (Na Seznamu mejlový filtr žádá mně, jako odesílatele, zadávat ověřovací kód při posílání mejlů v angličtině a zcela znemožňuje poslat delší mejl ve francouzštině. Našel jsem stížnost, že Google označil jeden z finskojazyčných blogů za semeniště spamu. Předpokládám, že filtr na komentáře bude fungovat podobně.) Nemám naprosto žádné výhrady proti cizojazyčným komentářům zde, ovšem může se stát, že filtr takové výhrady mít bude.
  • Pokud vám komentář zmizí (a není to proto, že by vám mezitím spadl prohlížeč nebo jste se odhlásili z účtu nebo něco podobného), neposílejte tutéž verzi komentáře opakovaně. Filtr je konsistentní a co jednou zadržel, napodruhé také nepustí. Navíc je možné, že opakované zasílání téhož bere jako příznak spamerství. Navíc, sedm kopií jednoho komentáře ve spamové složce znamená, že buď jednu povolím a šest smažu (a šest smazaných instancí přibyde do databáze, podle které filtr rozpoznává spam), nebo musím povolit všech sedm a šest smazat manuálně v dalším kroku, což je pro mně nepohodlné. Místo opakovaného zasílání zamítnutého komentáře zkuste jinou, upravenou verzi, nebo napište zkrátka „komentář zmizel“; tím mě upozorníte na to, že mám zkontrolovat spamovou složku.
  • Krátké komentáře mají obecně větší šanci projít než dlouhé. Pro čitelnost a strukturu debaty je lepší, pokud komentátor všechny námitky shrne do jednoho delšího příspěvku, filtr ale někdy může vynucovat opak.
  • Filtr kontroluje nejen obsah komentáře, ale i odkud byl komentář odeslán. Posíláte-li komentář jako majitel účtu na Googlu, jedno filtrování proběhne už na vaší straně, a já se o ničem nemusím dozvědět. Jestli vám komentáře mizí bez zjevného důvodu, může se stát, že je váš účet považován za podezřelý (možné důvody pro podezření: dřívější komentáře vyhodnocené jako spam, podezřelé jméno účtu, prázdný vlastní blog, ...) V takovém případě může být vhodnější komentovat anonymně.

4 komentáře:

  1. viagra penis expansion credit card pay viagra penis expansion credit card pay viagra penis expansion credit card pay viagra penis expansion credit card pay viagra penis expansion credit card pay viagra penis expansion credit card pay viagra penis expansion credit card pay viagra penis expansion credit card pay viagra penis expansion credit card pay viagra penis expansion credit card pay

    OdpovědětVymazat
  2. No tak tento filter dobre natrenovany nie je :-D

    OdpovědětVymazat
  3. Pokud jde o ty odkazy, IMHO Gogle považuje odkazy přes vlastní zkracovač http://goo.gl/ za důvěryhodnější.
    Chce se mi si myslet, že je lépe zkracovat přihlášen.

    OdpovědětVymazat
  4. @matus: Naopak, filtr dobře poznal, že komentář není spam, ale pokus dělat si srandu z filtru, a proto ho pustil.

    OdpovědětVymazat