Uploaded image for project: 'S2Robot'
  1. S2Robot
  2. ROBOT-38

次のクロール対象URLをURLエンコードする

XMLWordPrintable

    • Type: Icon: Improvement Improvement
    • Resolution: Fixed
    • Priority: Icon: Major Major
    • 0.1.0
    • Affects Version/s: None
    • Component/s: S2Robot
    • None

      サイトの中には中途半端なURLエンコードのURLをリンクに登録するサイトが結構ある模様。たとえば、http://.../?a=%xx&b=あ 見たいな感じ。アスキーでない文字に対してURLエンコードを実行した方が良い。

      HtmlTransformer で以下のメソッドに変更予定。

          protected List<String> getUrlFromTagAttribute(URL url, Document document,
                  String xpath, String attr, String encoding)
      

            Assignee:
            shinsuke shinsuke
            Reporter:
            shinsuke shinsuke
            Votes:
            0 Vote for this issue
            Watchers:
            0 Start watching this issue

              Created:
              Updated:
              Resolved: