ちょっと古めの情報なんですが、ローカルに保存してあるメールを Gmail に一括アップロード可能なツールが、Google から出ていることに気付きました。とりあえずあとで試してみようと思います。これがちゃんと使えるなら便利だなぁ。http://mail.google.com/mail/help/email_uploader.html
Archive for the Category » めも «
作業めもめも。
#!/usr/bin/ruby
target = ARGV[0]
redirectFlag = false
buffer = String.new
fh = open(target)
fh.each { |line|
buffer += line
if /<comment>redirect<\/comment>/ =~ line
redirectFlag = true
end
if /<\/page>/ =~ line
print "#{buffer}\n" if redirectFlag == false
buffer = ""
redirectFlag = false
end
}
実行
./delredirect.rb jawiki-20070903-pages-articles.xml
全件対象にして、8分ほどで出力終了。
grep '<page>' noredirect.xml | wc -l
で調べてみると、774490件。おかしいな。動作確認用にWikipediaの小さなサンプルを作ってみるで確認したデータと見比べても件数が減っていなさすぎる。
むむぅ。要再検討だな。
いや、自分で計算してもいいんですが。
いままで、アクセスログからIPアドレスを拾って、それをiptablesとかでごにょごにょするときなんかに、WhoisでIPアドレスの範囲を拾ってそれをごにょごにょするわけですが、めんどくさいなーと思ってました。
で、今日たまたま知ったんですが、perl-Net-IP が入っていれば、
・ipcount IPアドレス + アドレス数
・ipcount IP1 – IP2
・ipcount IP/ネットマスク長
で、計算してくれるんですね。らくち~ん。
全文検索の研究用に、テストサーバに Hyper Estraier をインストール。
テストデータを入手したらいろいろ試してみなくっちゃ。
とりあえずインストール手順(書くほどでもないけど)。
cd /usr/src wget http://qdbm.sourceforge.net/qdbm-1.8.77.tar.gz tar zxvf qdbm-1.8.77.tar.gz cd qdbm-1.8.77 ./configure make make install
cd /usr/src wget http://hyperestraier.sourceforge.net/hyperestraier-1.4.13.tar.gz tar zxvf hyperestraier-1.4.13.tar.gz cd hyperestraier-1.4.13 ./configure make make install
cd /var/www/cgi-bin cp /usr/local/libexec/estseek.cgi ./ cp /usr/local/share/hyperestraier/estseek.* ./
phunというソフトがあるんですが、これ、ひじょーにおもしろいです。
時間が飛ぶように過ぎて行ってしまうので、忙しい作業をしている人にはお勧めしません。
日本語情報がhttp://www.phun.jp/にあるので、インストールもらくらく。操作はちょっと癖があるかな。
使い方とかは
がとてもよくできてます。面白さみたいなものも非常によく伝わっていてすごくいい感じ。
で、こいつを、とある人に紹介したら、カウンター気味に返ってきたのがこれ。
こいつもすげー。てか、作った人、すさまじい。
知ってる人はとっくにご存知かもしれませんが、激しく感動したのでお薦めしておきますです。
はてブ経由でUNIX Toolbox。
結構知っているつもりで知らないコマンドがちらほらあったので、後で時間があるときに見なおしておく予定。
これが事実なら、お仕事的にちょっと確認しておかなくちゃという気がするので一応メモ。
『Office 2003 SP3』の「古いフォーマット排除」問題
まだご存じないかもしれないが、米Microsoft社から最近リリースされた更新プログラム『Microsoft Office 2003 Service Pack 3(SP3)』には、隠れた「機能」が搭載されている。
古いバージョンのMicrosoft Officeフォーマットがサポートされなくなるという機能だ。旧バージョンの『Word』『Excel』『Lotus 1-2-3』『Quattro Pro』『CorelDRAW』による文書がハードディスクなどにある場合、開こうと思ったらWindowsのレジストリを詳しく調べなくてはならない。
これいいなぁ。自宅でえらいことになってるPC達をこれに全部乗っけちゃったらずいぶんすっきりしそう。
ちょっと訳あって、久しぶりに技術方面のことをいろいろ調べる気になってきた。
とりあえずメモ。ロードバランサ。
http://dsas.blog.klab.org/archives/50664843.html
http://ultramonkey.jp/


最近のコメント