月間2900万PV

http://itpro.nikkeibp.co.jp/article/OPINION/20071031/286028/
月間2900万PVってどの程度の負荷なのだろう? Web系はやったことがないのでイメージが湧かないなぁ。
単純に平均を取ると、秒間約350PVということになる。ピーク時負荷はこの100倍くらいを見積もっておけばいいのかな?そうすると、秒間35000アクセスを処理できる必要があるということか。
おー。これはすごいな。

      • -

1リクエストを0.05秒で処理できるとして、1サーバーあたりの同時接続最大数が100だとすれば、秒間に2000アクセスを処理できる。すると、Webサーバーの台数は20台くらい必要になるの?
(計算間違ってました。下に書き直し)

      • -

http://www.thinkit.co.jp/free/article/0610/1/1/
はー。5000万PVでWebサーバーが9台か。

      • -

計算が間違っていたのでもう一度計算。
単純平均で、秒間約10PVということで、ピーク時はその100倍の秒間1000PVと見積もる。
大したことはなさそう。
1リクエストを0.05秒で処理できるとして、1サーバーあたりの同時接続最大数が100だとすれば、秒間に2000アクセスを処理できるという計算で、サーバー1台で対応可能?

      • -

データベースアクセスのネットワーク転送量を考えると、1アクセスあたり1KBのデータ転送があるとして、100Mbpsの転送帯域があるならば、秒間12500アクセスが上限。オーバーヘッドや輻輳を考えても、5000アクセスは可能。
データベースサーバーの処理能力はネットワーク帯域を使いきるところまでは強化できるので、秒間2000アクセスは可能な数字と言っていいよね?

      • -

ハードディスクの性能が、平均シーク時間が10msで平均転送帯域が100MB/sとして、1アクセスあたりハードディスク上のランダムな位置から1KBのデータを1つ読み込むとすれば、ハードディスク1つあたり100アクセスが限界。
これはいただけないので、データベースサーバーのチューニングが重要ということかな。
バッチ処理だと、データベースサーバーへのアクセスは連続領域にすることができるので、ディスクアクセスの効率をよくすることは比較的簡単なんだけどね。