2004年07月31日
コンバートのための覚え書き
結局、サーバーに4回くらいアップしました。
sedと秀丸だけでhtmlファイルをコンバート(笑)詳細は「追記」(extend)にメモしておこっと。
まず、秀丸の正規表現で改行をすべて、つないでしまう。
理由は後述。
次にsed
-----01.sed-----
s/-------- /\
--------\
/g
s/----- /\
-----\
/g
s/●★//g
-----end-----
-----02.sed-----
s/\(COMMENT:\) /\1\
/g
s/ \(EMAIL:\.*\)/\
\1/g
s/ \(IP:\.*\)/\
\1/g
s/ \(URL:\.*\)/\
\1/g
s/ \(DATE:\.*\)/\
\1/g
-----end-----
-----03.sed-----
s/\(TITLE:.*\)/\
\1/
s/\(STATUS:.*\)/\
\1/
s/\(PRIMARY CATEGORY:.*\)/\
\1/
s/\([^Y]\) \(CATEGORY:.*\)/\1\
\2/g
s/ \(DATE:.*\)/\
\1/g
s/\(BODY:\)/\1\
/g
-----end-----
-----04.sed-----
s/\(DATE: [0-9][0-9]\/[0-9][0-9]\/[0-9][0-9][0-9][0-9] [0-9][0-9]:[0-9][0-9]:[0-9][0-9] [AP]M\) /\
\1\
/
-----end-----
-----05.sed-----
s/^ \(.*$\)/\1/
/^$/d
/^STATUS:.*/d
s/""/"http:\/\/y384.com\/mt\/oldphoto\/●★"/g
-----end-----
こんなもんか。多少冗漫だけど、ま、よかろうと…。
バッチファイルは省略
その後、
TITLE:
AUTHOR:
の入れ替えに秀丸のキーボードマクロ。
カテゴリが多少変になってるけど、これは手作業で修正。
何度も「読み込み/書き出し」作業やってると、IDがやたらめったら複雑で多くなってしまうのが最大の難関かなー。
元データがIEでhtml保存というのも痛かった。でも、テキストでコンバートしたものは画像へのリンクなどが切れてしまっているので、やはりhtmlでも保存しておくべきだろうな。
htmlで保存してると、適当な所に改行が入ってしまって、最初にこの処理をしてなかったのがコメント書いてくれてる人のデータなどがめちゃめちゃになった理由。だから、最初に秀丸で改行を消してしまったのでありました。ストリームエディタのsedで改行を削除するのは大変に面倒なんで、柔軟に対応。
手作業は画像ファイルのURLをコピー&ペーストする程度で、ほとんど無し。(^^ゞ
Trackback on "コンバートのための覚え書き"
このエントリーのトラックバックURL:
"コンバートのための覚え書き"へのトラックバックはまだありません。
"コンバートのための覚え書き"へのコメントはまだありません。