2012年02月11日

Data::Dump はデフォルトでそれなりに整形して表示してくれるのと、コンテキストを見てよしなに処理を変えてくれるので、スクリプトのデバッグなどに使うのはまぁまぁ便利だったりします。

が、この子は PurePerl で実装されているので実行速度が結構遅いです。

どのくらい遅いかというと

use strict;
use warnings;
use Benchmark qw(cmpthese :hireswallclock);
use Data::Dump ();
use Data::Dumper ();

my $data = {
    foo => [qw/bar/],
    bar => {
        hoge => 'piyo',
    },
    heavy => So::Heavy::Object->new(10),
};

cmpthese -1, {
    'Data::Dump' => sub {
        my $res = Data::Dump::dump($data);
    },
    'Data::Dumper' => sub {
        my $res = Data::Dumper::Dumper($data);
    },
}, 'all';

package So::Heavy::Object;

sub new {
    my ($class, $depth) = @_;
    bless [ $depth, $depth ? $class->new(--$depth) : () ], $class;
}

こんなのを実行すると、

Benchmark: running Data::Dump, Data::Dumper for at least 1 CPU seconds...
Data::Dump: 1.09744 wallclock secs ( 1.09 usr  0.00 sys +  0.00 cusr  0.00 csys =  1.09 CPU) @ 1644.04/s (n=1792)
Data::Dumper: 1.0532 wallclock secs ( 1.05 usr  0.00 sys +  0.00 cusr  0.00 csys =  1.05 CPU) @ 10240.00/s (n=10752)
                Rate   Data::Dump Data::Dumper
Data::Dump    1644/s           --         -84%
Data::Dumper 10240/s         523%           --

こんくらいの差がでる。

Web アプリケーションなどで log を出す場合には、Data::Dumper を使ったほうがオーバーヘッドが少ないし、

local $Data::Dumper::Terse  = 1;
local $Data::Dumper::Indent = 0;
local $Data::Dumper::Pair   = '=>';

みたいにすると一行にみっちりと詰まって出るのでよいですね。インデントとか余計な物が消えて、出力される文字の量が減るので実行速度も若干上がるし*1、ディスク容量の削減にもつながってハッピーです。

ただし、 $Data::Dumper::Useqq = 1 とかするとかなり遅くなるので注意が必要。
改行されたデータが食わされる可能性があったら使わざるを得ないかもしれませんが。

あと、あんまり関係ないけどテストとかで Data::Dumper とかを使ってるコードをたまに見かけますが

use Test::More;
use Data::Dumper;

# do something...

warn Dumper $data

# do something...

これは

use Test::More;
# do something...

note explain $data;

# do something...

みたいに note explain {expr} 構文を使っとくと捗りますね。
別にどっちでもいいんですけど。

まとめ

素直に Log::Minimal を使っておけばこのへんのこと考える必要が無いのでハッピーですね。

  • *1 : 上の例だと 12000/s ぐらいになる


xaicron at 04:12コメント(0)トラックバック(0)Perl この記事をクリップ!  はてなブックマーク  はてなブックマーク数

2012年02月10日

意外とみんな知らない感じなのかな。そして使う機会が滅多にないので知らなくてOK。

use strict;
use warnings;
use 5.12.1;
use Data::Dumper;

my @data = (
   ['nekokak', '1130', '1900'],
   ['nekokak', '1000', '1800'],
   ['zigorou', '1230', '2000'],
   ['zigorou', '1130', '2100'],
   ['xaicron', '1300', '2200'],
   ['xaicron', '1400', '2330'],
);

$Data::Dumper::Terse  = 1;
$Data::Dumper::Indent = 0;
say join "\n", Dumper sort {
    $a->[0] cmp $b->[0] or $b->[1] <=> $a->[1] 
} @data;

復数の条件でソートしたい場合は、or で連結していけばよい。

perldoc -f sort するといろんなレシピがあって結構楽しいです。



xaicron at 01:06コメント(0)トラックバック(0)Perl この記事をクリップ!  はてなブックマーク  はてなブックマーク数

2012年01月11日

大体いつもスクラッチで書いてて忘れるのでメモ。

pipe を使う場合

pipe() とか socketpair() とか色々方法はあるけど、素直に IO::Pipe 使っとくと簡単便利。コアモジュールですし。

use strict;
use warnings;
use IO::Pipe;

my $pipes    = [];
my $children = [];
for my $i (1..10) {
    push @$pipes, my $pipe = IO::Pipe->new;
    my $pid = fork;
    if ($pid) {
        # parent
        $pipe->reader;
        push @$children, $pid;
        next;
    }
    # child
    die $! unless defined $pid;
    $pipe->writer;
    print {$pipe} "pid: $$, index: $i\n";
    exit;
}

for my $pid (@$children) {
    waitpid($pid, 0);
}

for my $pipe (@$pipes) {
    print <$pipe>;
}

この書き方だと、すべての子プロセスの終了を待ってから初めて親プロセスで読み込みを始めているけど、use POSIX 'wait_h' して waitpid(-1, WNOHANG) すれば終わった奴から読み込めるはず。

ファイルに書く場合

pipe だと、送受信できるサイズに限界があるので、ファイルを使ったほうが巨大なデータを送る場合は安全。

use strict;
use warnings;
use File::Temp qw(tempdir);
use File::Slurp qw(write_file read_file);

my $tmpdir = tempdir CLEANUP => 1;

my $children = [];
for my $i (1..10) {
    my $pid = fork;
    if ($pid) {
        # parent
        push @$children, $pid;
        next;
    }
    # child
    die $! unless defined $pid;
    write_file "$tmpdir/$$", "pid: $$, index: $i\n";
    exit;
}

for my $pid (@$children) {
    waitpid($pid, 0);
    print read_file "$tmpdir/$pid";
}

pipe の時と基本的な書き方は変わらない。pid 毎にファイルを作っておいたほうが何かと便利かもってぐらい。

ちなみに pipe もファイルも単なるバイト列しか送受信できないので、データ構造を送りたい場合はなんかしらのシリアライザーを使う必要がある。JSON とか Data::MessagePack とかそのへん。

Parallel::ForkManager の場合

ちなみに、Parallel::ForkManager 0.7.6 からは、run_on_finish() で子プロセスからデータを受信できる。
実際には、子プロセスの finish() のタイミングで pid 毎にファイルに Storable::store() して、親プロセスでは Storable::retrieve() しているので、さっき書いたようなことと一緒。

use strict;
use warnings;
use Parallel::ForkManager 0.7.6;
use Data::Dumper;

my $pm = Parallel::ForkManager->new(3);
$pm->run_on_finish(sub {
    my ($pid, $exit_code, $ident, $exit_signal, $core_dump, $data) = @_;
    print Dumper $data;
});
for my $i (1..10) {
    $pm->start and next;
    $pm->finish(0, { pid => $$, index => $i });
}

$pm->wait_all_children;

まとめ

プロセス間通信ってめんどいですね。

ちなみに、ここに書いてあるプログラムはエラーハンドリングとかシグナルとか考慮してないし、いろいろとあれです。親プロセスから子プロセスに書きこむやつとか書いてないし。めんどいから DBD::SQLite っていうのもありですね。

あと、別に fork したいんじゃなくて並列処理をしたくてその結果を受け取りたいんだぜって場合は Coro::Channel とか使うとシンプルに書けるんじゃないかと思います。



xaicron at 22:44コメント(1)トラックバック(0)Perl この記事をクリップ!  はてなブックマーク  はてなブックマーク数

2012年01月02日

そろそろ元旦も開けて落ち着いた感もあるのでまとめておこう。

  • 1月
    • エロ画像を収集してた
  • 2月
    • Furl をいじりだした
  • 3月
    • Kagura っていう WAF を書いてた
    • 地震で漫画がすべて本棚から落ちる
  • 4月
    • Amazon.co.uk で 攻殻機動隊全部揃えた (まだ観終わってない)
    • Sub::Retry にパッチ送った
    • CPAN モジュールガイド購入
  • 5月
    • dotcloud が始まったりした
    • Yokohama.pm#7
    • DNS とか調べてたっぽい
    • atsort コマンド作成
  • 6月
    • perl segv golf
    • クリスマス
    • WEB+DB Press vol.63 に記事が載った
  • 7月
    • App::envfile 書いた
    • Test::Flatten 書いた
    • Furl に執拗にパッチ送った
  • 8月
    • Data::WeightedRoundRobin 書いた
    • C80
    • 四半世紀経過
    • ISUCON で文字化け FAILED
  • 9月
    • IO::Prompt::Simple 書いた
    • 閃乱カグラ!!!1
    • configure_requires について
    • perl は言語内にイテレーターないからあれげ
  • 10月
    • YAPC::Asia 2011
    • いろいろとモジュール更新してた
  • 11月
    • Test::Mock::Guard とかいじってた
    • is_deeeeeeeeeply
    • Yokohama.pm#8
  • 12月
    • Perl Advent Calendar
    • MySQL Casual Advent Calendar
    • WEB+DB Press vol.66 にグラビア写真が載った
    • C81


xaicron at 13:07コメント(0)トラックバック(0)Diary この記事をクリップ!  はてなブックマーク  はてなブックマーク数

2011年12月30日

要は、オレオレ証明書使ってるサーバーに https でアクセスすると die しちゃうわけですが、無視したいときもあるわけです。

そういう時は、

$ENV{PERL_LWP_SSL_VERIFY_HOSTNAME} = 0;

とすれば OK ですね。っていうのを zigorou さんに教えてもらいました。ちなみにこの ENV は LWP::Protocol::https にはコードの中にしか出てこなくて、LWP*1 の POD に書かれてました。

あとは、

LWP::UserAgent->new(ssl_opts => { verify_hostname => 0 });

でもいいですね。こっちは LWP::Protocol::https に書いてありました。ちゃんとドキュメント読めって感じですが、LWP はいろんなところに分散していて、ちょっとした機能がなかなか探しづらいですね。

追記

よくみたら、普通に LWP::UserAgent の POD に書いてあって

$ua->ssl_opts(verify_hostname => 0);
say $ua->ssl_opts('verify_hostname'); # 0

とかできるし、PERL_LWP_SSL_VERIFY_HOSTNAME のことも書いてあったので、本当にちゃんとドキュメント読みましょう!!111

  • *1 : LWP::UserAgent でなく LWP


xaicron at 23:00コメント(0)トラックバック(0)Perl この記事をクリップ!  はてなブックマーク  はてなブックマーク数

2011年12月03日

こんにちは! MySQL Casual Advent Calendar の三日目がやって参りました。皆様いかがお過ごしでしょうか。僕は例年通り、クリスマスをどうやってなくすかに頭を悩ませています。

さて、自分は MySQL のこととかあんまりよくわからないんですが、仕事で Q4M とか HandlerSocket とか使う機会があります。
更に言うと、手元の Mac の環境でそれらを手軽に使いたいので、簡単にセットアップが出来ると嬉しいですね。

というわけで、一発で MySQL と Q4M と HandlerSocket のセットアップが出来ちゃうシェルスクリプトを書きました!大変カジュアルですね!!

前提条件として、Xcode と homebrew は入っているものとします。

$ zsh -c "$(curl -fsSL https://raw.github.com/gist/1426403)"

とか実行すればOKです!

このスクリプトのとってもカジュアルなところを2、3説明すると、

  1. brew install の時に一回 MySQL をビルドしてるけど終わると消えちゃうので、もう一回ビルドしている
  2. テストとか一切走らせない
  3. エラーが起きてもお構いなしに最後まで処理する

といったところでしょうか。

ちなみに、MySQL5.1系を入れているのは Q4M が現時点では 5.1系しか対応していない為です。
HS は 5.5とかでも普通に動くよって作者の人が言ってました。

まとめ

という訳で、コマンド一発叩くだけで手元で Q4M と HS が入った状態の MySQL5.1 が手に入るのでとってもお手軽で良い感じですね。
誰かバイナリ配布してください

さて、明日は椅子とMySQL4をこよなく愛するスーパーインフラエンジニアの kazeburo さんです。
お楽しみに!!



xaicron at 17:23コメント(0)トラックバック(0)MySQL この記事をクリップ!  はてなブックマーク  はてなブックマーク数

2011年12月02日

こんにちは!例年のように Perl Advent Calendar が始まっています。

今年は Test Track っていうのをやっているので、テストに一家言あるぜっ!て人はぜひぜひ参加してみてください!

募集は ATND で行なっていますので、お気軽に。
記事の書き方は、コチラを参照してください。
writer 権限は twitter で @xaicron まで言ってくれれば追加します。

景品は、自分の書いた記事が、電子書籍化される権利です!今すぐ応募しよう!!

はてさて、25日書けるかな?



xaicron at 01:19コメント(0)トラックバック(0)Perl この記事をクリップ!  はてなブックマーク  はてなブックマーク数
プロフィール

Perlが少しだけ出来る気になってます。
JavaScriptはよくわかりません。
Rubyもちんぷんかんぷんです。
Pythonは難しいです。
ActionScript勘弁してください。
Javaあばばばばば。
低級言語できません。

github
はてなブックマーク数
はてなブックマーク数
閃乱カグラ
『閃乱カグラ -少女達の真影-』オフィシャルサイト
記事検索
ホットなもの
  • ライブドアブログ