Hadoop Conference Japan 2009でご講演頂いたCloudera社ですが、blogも、ちょくちょく更新されていて、おもしろい話が書いてあります。まだ読んだことのない方は、一度、見てみてはいかがでしょうか?(→ http://www.cloudera.com/blog/)
最近では、「Hadoop at Twitter (part 1): Splittable LZO Compression」という記事が出ています。LZO圧縮で、ディスク容量とディスクIOの節約をして、効率的にHadoopクラスタを利用する話です。お馴染みのbzip2は重く・gzipは分割に向かないので、展開が軽く・分割できるLZO圧縮を使ってるよ、と。簡単に手順も書いてありますので、参考になるかも。
また、いままでの記事では、例えば、こんな記事もありました。
| Hadoop HA Configuration | Master Nodeの冗長化の話です。現実的な一例で、引用されているのをちらほら見かけます。 |
| Hadoop Default Ports Quick Reference | Hadoopで利用されるポート一覧です。 |
| File Appends in HDFS | ちょっと気になるHDFSのFile Append機能に関する解説です。 |



