4. 設定の詳細
A. Configulation
メインメニューで 設定→現在の.iniファイルの編集 を選択すると以下の画面が開きダウンロードするサイトの設定を編集することができます。
![]() |
自動実行:これをチェックすると次回以降、packNewsを起動すると自動でダウンロードが始まり終わると勝手にプログラムを終了します。
データ出力先:作成したファイルを出力するパスです。なければプログラム側で勝手に作ります。なおエラーログ(packNews.log)とテンポラリファイルもここに作ります。
" Fit to Screen"サポート: 非日本語IEでFit to screenが動作するよう、一定間隔でスペースを挿入します。
1行文字数: Enable fit to Screen がONの場合の挿入するスペースの間隔
日付ディレクトリでソート: onにするとデータ出力先の下に日付ディレクトリを作りそこにファイルを出力します。
日付ディレクトリでソートがonの場合,日付ディレクトリにindex.htmlを作るほかにひとつ上(DataPath)にもindex.htmlを作ります。ここには日付ディレクトリのindex.htmlにリンクが貼ってあります。DataPathのindex.htmlにブックマークを貼っておけば日付→ファイル(ジャンル)の順にリンクをたどって閲覧が出来ます。ただしDataPathのindex.htmlは単純に作業した日の日付を追記していきますので、過去のデータを削除した場合は手動で削除した日付へのリンクを削除してください。当然ながら過去データも手動で削除してください。
目次ページの作成 : これをチェックするとその日に出力したファイルにリンクを貼った”目次”ページを作ります。ファイル名はindex.html. このファイルにブックマークを貼っておくとブラウザからの閲覧が簡単になります。
記事を別々のファイルに保存 : これをチェックすると記事はそれぞれ別々のファイル(ファイル名は自動割当)に出力し、サイト一覧で指定したファイルには記事の見出しと記事ファイルへのリンクを出力します。サイト一覧で指定したファイルを開きその中の記事の見出しから読みたい記事を選択すると記事のファイルが開きます。目次ページの作成も選択しておくと、目次→記事の一覧→記事本文とたどって記事を読むことが出来ます。1つのファイルサイズに制限のある携帯電話等(?)で閲覧する際に便利です。
常にこの.ini ファイルを使用:曜日ごとに.iniファイルを使い分ける設定をしない場合はチェックします。このチェックをはずすと曜日設定するチェックボックスが表示されます。曜日ごとの設定については別項で説明します。
サイト名の前のチェックボックスをチェックするとそのサイトをダウンロードします。ダウンロードしないサイトのチェックははずしてください。 全部チェック, 全部はずす ボタンで表示されているすべてのサイトのチェックをつけたりはずしたりできます。
サイト名は変更可能です。
出力ファイル名も変更可能です。
詳細ボタンを押すと、そのサイトについての詳細の定義が変更できます。 B に示す画面が開きます。
削除ボタンを押すと、そのサイトを削除できます。
1画面には10サイトしか表示されません。 <>ボタンで表示サイトを切り替えることが出来ます。
読み込みボタンで設定の読み込みが出来ます。(別項参照)
閉じるボタンで変更を保存せずに終了、OKボタンで保存後終了
名前を付けて保存ボタンで別のファイル名で保存できます。現在のファイルを流用して他の曜日に使う.iniファイルを作るときに便利です。
B. 詳細設定の詳細
Aの設定画面で詳細ボタンを押すと以下のような画面が開きサイトの詳細が設定できます。
同梱されているiniファイルに設定されているサイトは、大体最適化されている(はず)ですからあまりいじる必要はないと思います.
詳細設定画面
![]() |
最初の行がサイト名(ファイルの最初に出力されます)
出力ファイル名: 出力ファイル名
インデックスアドレス: 最初に記事のアドレスを読みに行くアドレスです。
ホストアドレスヘッダ: indexページでは相対アドレスで記事ページを参照していることが多いのですが、その場合に省略されているホスト(ドメイン)部分をここに入れておきます。
ダウンロード記事数: ここに数字を入れておくとそれ以上あっても指定した記事数以上ダウンロードしません。Configurationページでも同様に設定できますが、こちらはサイトごとに設定できます。両方設定してあると小さいほうの数字の設定が有効になります。
以降の3組はアドレスや記事を切り出すための文字列です。2つの文字列の間にあるのが必要なアドレスや記事だと判断します。htmlファイルのソースを読んでうまく設定してください。
インデックスを切り出す文字列: インデックスページで記事ページアドレスを切り出すためのフィルタ
ヘッダを切り出す文字列:記事ページで見出しを切り出すためのフィルタ
記事を切り出す文字列: 記事ページで本文を切り出すためのフィルタ
* インデックスを切り出す文字列を空白にするとインデックスアドレスで指定したページの内容だけを出力します。(1ページのみのDL)
記事ページに対する詳細の設定
タグを全部除去: これをオンにすると記事中のすべてのタグを除去します。テキストのみの出力になります。(改行は追加します)
テーブルタグ
全部のテーブルを保持:これをオンにすると記事中のテーブルタグをすべて残します。記事中に表がある場合にはオンにしておくと表が読めます。
テーブルタグのみ除去: これをオンにすると記事中のテーブルタグのみを取り除き、タグの間の内容は残します。テーブルタグを使って整形しているページの場合に使います。記事中のイメージは大抵テーブルタグで整形されているのでイメージを残すときはこれを指定するとうまくいくことが多いです。
テーブルをすべて除去:これをオンにするとテーブルをすべて除去します。テーブルタグとその間にある内容も除去します。
画像を保持: これをオンにすると記事中のイメージ(写真など)を残します。
最小サイズ: 規定値では256バイト以下の画像はダウンロードしません。これ以下の画像のダウンロードが必要な場合はここに最小の画像サイズを入力します。
削除:このボタンを押すとこのサイトの設定すべてを削除します。
閉じるで変更を保存せずに終了、OKボタンで保存後終了 ボタン
3. 使い方のヒント
テキストファイル出力
HTMLはブラウザが重い、テキストビュワーでさくさく読みたい方は、Config Detail画面でRemove all tagsをチェックしてください。タグをすべて取り除いた上、改行(<BR>、<P>タグ)は改行(CRLF)に置き換えて出力します。
見出しのみの出力
インデックスページの見出し(ヘッドライン)だけ読みたい方は、Config Detail画面で、Filter Strings for indexをFilter Strings for textに移して、Filter Strings for headlineとFilter Strings for textを空にしてください。(やったことないけどたぶんこれで見出しだけの出力ができると思います…)