サイトの中には中途半端なURLエンコードのURLをリンクに登録するサイトが結構ある模様。たとえば、http://.../?a=%xx&b=あ 見たいな感じ。アスキーでない文字に対してURLエンコードを実行した方が良い。
HtmlTransformer で以下のメソッドに変更予定。
protected List<String> getUrlFromTagAttribute(URL url, Document document, String xpath, String attr, String encoding)