- Starburst社がIcehouseアーキテクチャを提唱
- オープンなデータレイク上にウェアハウス機能を提供
- TrinoクエリエンジンとApache Icebergテーブル形式で構成
- Starburst Galaxyによる自動化と製品機能の投資
StarburstのCEOであるジャスティン・ボーグマンは、オープンアートキテクチャ「Icehouse」を推進し、NetflixやApple、Shopify、StripeなどのデータリーダーがTrinoとApache Icebergを採用していると強調しました。
Icehouseは、40年以上にわたってプロプライエタリなフォーマットとSQL実装で顧客を縛り付けてきたデータウェアハウスベンダーに対する解放を可能にするものです。
Trinoクエリエンジンは、ペタバイトスケールでの高速かつ大規模な並列インタラクティブ分析を実現します。
Apache Icebergテーブル形式は、データレイク上で完全なウェアハウス体験を提供し、時系列分析やACID準拠などを可能にします。
これまでデータレイクは、低コストのストレージソリューションとみなされ、インタラクティブな分析用途には限定的な価値しかありませんでしたが、Icehouseはそのギャップを埋めます。
しかし、多くのデータチームはリソースや専門知識が不足しており、Icehouseアーキテクチャの大規模な運用が困難であるという課題がありました。
Starburst Galaxyは、データの取り込みからクエリ、ガバナンスに至るlakehouseのプロセスを自動化し、各種チームがTrinoとIcebergのアーキテクチャのメリットを享受できるようにします。
StarburstはApache IcebergとTrinoのオープンソースコミュニティを支援する一方、顧客がデータをより生産的かつ効率的に扱えるよう製品機能に大きく投資しています。
- 近実時間分析へのアクセス
- 業界トップレベルのコストパフォーマンス
- 自動テーブル最適化
はStarburst Galaxyの独自機能の一部です。
ねえ、これってスゲエ大きなデータもサクサク扱えるようになるってこと?なんでそんなに注目されてんの?
はい、そうですね。新しいIcehouseという仕組みがデータレイクでの分析をすごく早くするんです。Starburstって会社が、いろいろなデータを簡単に扱えるようにしたので、たくさんの人が注目しているんですよ。
Starburstが新しいアーキテクチャ、Icehouseを打ち出したね。
オープンなデータレイク上で、ウェアハウス機能を提供するんだ。
これによって、ペタバイト級のデータを高速に分析できるようになるんだよ。
TrinoっていうクエリエンジンとApache Icebergっていうテーブル形式を使うことで、従来のデータレイクの限界を超えて、もっとインタラクティブな分析ができるようになるんだ。
今までデータウェアハウスがプロプライエタリなものだったけど、Icehouseがオープンソースで解放するわけだね。
ただ運用にはちょっとハードルが高い部分もある。
そこでStarburst Galaxyが出てきて、自動化とか製品機能の面で助けになってくれるってわけ。
簡単に言えば、データの扱いがもっと簡単に、そしてパフォーマンス良くなるんだ。
だから、Starburstには注目が集まっているんだよ。