Hadoopユーザー会

Hadoop User Group Japan

  • Increase font size
  • Default font size
  • Decrease font size

Cloudera社ブログ

Print

Hadoop Conference Japan 2009でご講演頂いたCloudera社ですが、blogも、ちょくちょく更新されていて、おもしろい話が書いてあります。まだ読んだことのない方は、一度、見てみてはいかがでしょうか?(→ http://www.cloudera.com/blog/)

最近では、「Hadoop at Twitter (part 1): Splittable LZO Compression」という記事が出ています。LZO圧縮で、ディスク容量とディスクIOの節約をして、効率的にHadoopクラスタを利用する話です。お馴染みのbzip2は重く・gzipは分割に向かないので、展開が軽く・分割できるLZO圧縮を使ってるよ、と。簡単に手順も書いてありますので、参考になるかも。

また、いままでの記事では、例えば、こんな記事もありました。

Hadoop HA Configuration Master Nodeの冗長化の話です。現実的な一例で、引用されているのをちらほら見かけます。
Hadoop Default Ports Quick Reference Hadoopで利用されるポート一覧です。
File Appends in HDFS ちょっと気になるHDFSのFile Append機能に関する解説です。