ソフトウェアあれこれ
ソフトウェアあれこれ

HOME HELP 新規作成 新着記事 ツリー表示 スレッド表示 検索 過去ログ

[47]  pixGet133 に関する質問
□投稿者/ Toshi -(2007/09/22(Sat) 15:00:37)

    ご提示されたURLを見て見ました。

    かなりギチギチにダウンロードソフト対策がなされているサイトです。
    パターンとしては、HIMG形式のサイトですね。
    まず、解析パスの指定が全て htmlファイル名省略URLになっています。
    http://www.hentai-cg.com/gallery/00094/1/
    からリンクされているイメージ埋め込みhtmlへのパスが
    通常ですと
    http://www.hentai-cg.com/gallery/show/00094/0001/image.html
    などなのですが、このサイトでは最後のhtmlファイル名が省略されていて
    http://www.hentai-cg.com/gallery/show/00094/0001/
    になっています。
    つまり、pixGetオプションの解析対象拡張子を指定してはいけないと言う事になります。(逆に解析対象拡張子を指定しないと、全てのリンク先を解析してしまうので厄介ですが)
    しかし、イメージ埋め込みhtmlへのパスはラッキーな事に、必ずurl中に「show」と言う文字列が含まれており、関係ないリンクへは逆に「show」と言う文字列は含まれていませんので、pixGetオプションの
    HIMG時の解析パス無視文字列を指定する->チェック外す
    HIMG時の解析パス対象文字列を指定する->チェックを入れて show を指定する。
    とする事により、解析効率を上げる事が可能です。

    と、ここまで書いておきながら申し訳有りませんが、現行のpixGetではこのサイトは攻略不可能です。
    パス解析までは上記の設定で出来るのですが、実際に画像をダウンロードしようとする時に、そのサイトのサーバがリファラーをチェックしていて、必ずイメージの埋め込まれたURLから画像をダウンロードしないと 403エラーで弾くダウンロードソフト対策が施されています。
    つまり、1枚目の画像をダウンロードするならば、リファラーは
    http://www.hentai-cg.com/gallery/show/00094/0001/
    を示していないといけないと言う事です。
    リファラー制御は今までかなりアバウトに行ってきました。
    例えば、無条件にトップドメインをリファラーにするとか、または画像のURLの一つ上のURLとかです。
    (例:この画像のURLは例えば1枚目なら
    http://www.hentai-cg.com/content/7bb850a6d3baff6198daaea6ab1a14ff/46f4af60/gallery/00094/0001.jpg
    ですので、pixGetのりファラーは
    http://www.hentai-cg.com/content/7bb850a6d3baff6198daaea6ab1a14ff/46f4af60/gallery/00094/
    に設定されます。)

    リファラーをpixGet利用者が有る程度カスタマイズ出来る方向に改善し始めたのは
    pixGet Ver.1.34 からです。
    そして、Ver.1.34でもまだ不完全で、このサイトには対応しきれていません。

    しかし、Ver.1.35では対応します。
    (元々、HIMGパターンの時だけ、解析時のURLをリファラーに設定するのは当たり前な話なのですが、これまで一重にサボって来ました。(^^; なぜなら、そこまで厳格にダウンロードソフト対策をするサーバが今まで余り無かったからです。)

    近日中にVer.1.35を公開します。
    作者環境でご指定のURLの画像ダウンロードは成功していますので、
    その設定を先に紹介しておきます。

    最小サイズ : 15000
    タイムアウト値:15
    リトライ数:2
    リトライ間隔:200
    ウェイト値:400
    DL対象拡張子を指定する->ON
    jpg jpeg wmv avi mpg mpeg zip
    解析対象拡張子を指定する->OFF
    (普段は htm html php cgi に設定)
    HIMG時の解析パス無視文字列を指定する->OFF
    HIMG時の解析パス対象文字列を指定する->ON
    show
    リファラーの設定
    リファラーに直前のURLを付けるを選択
    IEキャッシュを使わない->ON
    スクリプト対応する->ON
    既存ファイルに上書き保存する->OFF

    です。
    Ver 1.35 が公開されましたらダウンロードし、
    上記設定で試してみて下さい。

    Ver 1.35 公開予定先URL
    http://secret.ddo.jp/planets/downloads/index.html

    尚、参考までにですが、指定のURLは複数のページを持っていますね。
    全ページを一つのフォルダーにダウンロードする事は pixGetの仕様上できませんが、
    全ページを一括ダウンロードする際は
    URL1  : http://www.hentai-cg.com/gallery/00094/[1-135]/
    保存先1 : D:\test\[001-135]
    などと指定すれば、OKです。
記事引用  削除キー/

前の記事(元になった記事) 次の記事(この記事の返信)
←pixGet133 に関する質問 /メールでの質問からの移行 →Re[3]: pixGet133 に関する質問 /A
 
上記関連ツリー

Nomal pixGet質問用スレ /Toshi (07/09/22(Sat) 14:27) [45]
Nomal pixGet133 に関する質問 /メールでの質問からの移行 (07/09/22(Sat) 14:32) [46]
┃┗Nomal Re[2]: pixGet133 に関する質問 /Toshi (07/09/22(Sat) 15:00) [47] ←Now
┃  ┗Nomal Re[3]: pixGet133 に関する質問 /A (07/09/23(Sun) 01:38) [48] 解決済み!
Nomal ver1.35で、うまく動きません /チップデール (08/10/10(Fri) 06:07) [53]
┃┗Nomal Re[2]: ver1.35で、うまく動きません /Toshi (08/10/12(Sun) 15:21) [54]
┃  ┗Nomal Re[3]: ver1.35で、うまく動きません /チップデール (08/10/14(Tue) 14:08) [55]
┃    ┣Nomal Re[4]: ver1.35で、うまく動きません /Toshi (08/10/14(Tue) 16:39) [56]
┃    ┃┗Nomal Re[5]: ver1.35で、うまく動きません /チップデール (08/10/15(Wed) 22:46) [57]
┃    ┗Nomal Re[4]: ver1.35で、うまく動きません /イノタツ (10/05/07(Fri) 00:38) [99]
Nomal pixgetで落としたいページがあるのですが.. /@@; (09/01/17(Sat) 19:37) [60]
┃┣Nomal Re[2]: pixgetで落としたいページがある.. /Toshi (09/01/17(Sat) 19:40) [61]
┃┗Nomal Re[2]: pixgetで落としたいページがある.. /Toshi (09/01/18(Sun) 07:16) [62]
┃  ┗Nomal Re[3]: pixgetで落としたいページがある.. /@@; (09/01/18(Sun) 13:31) [63]
┃    ┗Nomal Re[4]: pixgetで落としたいページがある.. /Toshi (09/01/18(Sun) 17:47) [64]
┃      ┗Nomal Re[5]: pixgetで落としたいページがある.. /@@; (09/01/18(Sun) 21:08) [65]
┃        ┗Nomal Re[6]: pixgetで落としたいページがある.. /Toshi (09/01/19(Mon) 01:40) [66]
┃          ┗Nomal Re[7]: pixgetで落としたいページがある.. /mi (09/03/03(Tue) 01:42) [67]
┃            ┣Nomal Re[8]: pixgetで落としたいページがある.. /Toshi (09/03/03(Tue) 20:36) [68]
┃            ┃┗Nomal Re[9]: pixgetで落としたいページがある.. /mi (09/03/03(Tue) 22:47) [69]
┃            ┗Nomal Re[8]: pixgetで落としたいページがある.. /イノタツ (10/05/07(Fri) 01:05) [100]
┃              ┗Nomal Re[9]: pixgetで落としたいページがある.. /Toshi (10/05/07(Fri) 03:31) [101]
Nomal 動かない? /自称中級者 (09/04/05(Sun) 18:35) [71]
┃┗Nomal Re[2]: 動かない? /Toshi (09/04/08(Wed) 17:55) [72]
┃  ┗Nomal Re[3]: 動かない? /自称中級者 (09/04/09(Thu) 19:56) [73]
┃    ┗Nomal Re[4]: 動かない? /Toshi (09/04/13(Mon) 16:16) [74]
┃      ┗Nomal Re[5]: 動かない? /自称中級者 (09/05/22(Fri) 01:45) [79]
┃        ┗Nomal Re[6]: 動かない? /Toshi (09/05/25(Mon) 19:07) [80]
┃          ┗Nomal Re[7]: 動かない? /自称中級者 (09/05/31(Sun) 16:01) [81]
┃            ┗Nomal Re[8]: 動かない? /Toshi (09/06/01(Mon) 16:02) [82]
┃              ┗Nomal Re[9]: 動かない? /自称中級者 (09/06/02(Tue) 05:16) [83]
┃                ┗Nomal Re[10]: 動かない? /Toshi (09/06/02(Tue) 06:47) [84]
┃                  ┗Nomal Re[11]: 動かない? /自称中級者 (09/06/02(Tue) 14:23) [85]
┃                    ┗Nomal Re[12]: 動かない? /自称中級者 (09/06/02(Tue) 15:12) [86]
┃                      ┗Nomal Re[13]: 動かない? /Toshi (09/06/02(Tue) 21:20) [87]
┃                        ┗Nomal Re[14]: 動かない? /自称中級者 (09/06/07(Sun) 20:45) [89]
Nomal フォルダたくさん /h31bz (10/01/23(Sat) 19:09) [95]
┃┗Nomal Re[2]: フォルダたくさん /Toshi (10/04/16(Fri) 01:50) [96]
Nomal Re[1]: pixGet質問用スレ /自称中級者 (10/04/16(Fri) 23:06) [97]
  ┗Nomal Re[2]: pixGet質問用スレ /Toshi (10/04/18(Sun) 01:05) [98]

All 上記ツリーを一括表示
 
上記の記事へ返信
Pass/

HOME HELP 新規作成 新着記事 ツリー表示 スレッド表示 検索 過去ログ

- Child Tree -