Find Communities by: Category | Product

こんにちは、SDS製品担当の平原です。

 

さて、EMCSoftware-Defined Storage戦略の中核をなすソフトウェアであるViPR Controller。今年のEMC World 2015ではどんな進化を見せてくれるだろうかと期待された方もいらっしゃったかと思います。しかし、その発表はこれまでとは少し毛色の変わったものでしたね。そう、ViPR Controllerのオープンソース化です。

fig1.png

 

ところで、オープンソース化と聞くと、ViPR Controllerの無償化を想像されるかもしれませんが、今回の発表は異なる意味合いがあります。というのも、無償版という意味では、既に我々は商用版ViPR Controllerの全ての機能を試すことができるフリートライアルを提供しているからです。

 

実はこのオープンソース化が発表される以前、2年前のEMC World でのViPR Controller発表時にも「コミュニティ化」というのがキーワードとして語られていました。しかし、それは今日に至るまで目立った進捗が見られなかったのも実状でした。これまでのEMC(正確にはEMC Federationの一社であるEMC II)の文化を考えると、自社のテクノロジーをオープンなコミュニティに出すということにあまりノウハウもなく、社内的にも色々な議論があったのかもしれません。

 

そして、その状況を大きく変えた背景には、ある人物が影響していると私は推測するのです。それは、EMC World 3日目のジェネラルセッションに登壇していた、エマージング・テクノロジー部門バイスプレジデントのランディ・バイアスという人物です。彼は、EMCが昨年買収したOpenStack関連新興企業Cloudscaling社のCEOOpenStackコミュニティのファウンダーでもあった人。いわば、根っからのOSSスピリッツを持ったエンジニアというわけですね。そんな彼がOpenStackでの成功体験に基づいた確固たる信念をEMCに持ち込み、この短期間に社内の文化や思考を変えるほどの影響力を及ぼしたのではないかと。今回の出来事は、EMCのソフトウェアビジネスを根本から変えるエポックメイキングとなるかもしれません。

fig2.png

 

さて、このオープンソース版ViPR Controllerプロジェクトは「CoprHD」Copperhead:カッパーヘッドと発音)という名称で、githubから6月を目標にMPL (Mozilla Public License) 2.0に基づいてソースコードが公開される予定です。公開されるソースコードは商用版のViPR Controllerから一部の機能を取り除いたものとなりますが、これらはEMCとのオンラインサポート、ライセンス管理およびソフトウェアの自動アップデート機能といったものですので、ViPR Controllerの核となる機能は全て公開されると考えて良いでしょう。

fig3.png

 

では、公開されるソースコードの中で特にコミュニティによる開発が期待される部分はどこでしょう?それは、ViPR Controllerのインターフェース領域である、Northbound APISouthbound APIになるでしょう。Northbound APIはオーケストレータや各種アプリケーションと連携した新たなデータサービスの開発、Southbound APIEMCの開発リソースだけではフォローしきれなかったストレージ機種の対応追加が期待されます。もちろん、この他の部分でも利用者目線で画期的なイノベーションがもたらされることをEMCは大きな期待を持っています。

fig4.png

 

そして、大事なことは、このプロジェクトにおいて意味するオープンソース化というのは、単なる無償化ではなく「開発モデル」そのものであるということです。すなわち、コミュニティ内で改修・新たに開発されたソースコードは適切にコミットされ、次のバージョンのソースコードに新機能として取り込まれていくことになります。この機能をコミットするためのプロセスや、どのようにコミットに関与するメンバーを選定するのかなど、開発の中立性やガバナンス担保のための細かな議論も6月の公開時期までにはクリアになっているはずです。

また、EMCもこのソースコードをベースに商用版としてViPR Controllerを継続して開発・販売していきます。商用版はテクニカルサポートサービスとの一体化やEMCが開発したプラグインソフトウェアの利用権といった部分で差別化を図りながら、お客様に最適な選択肢を提供していくことになります。

fig5.png

 

それにしても、私はこの発表に非常にワクワクしています。日頃、私はViPR ControllerSEとしてお客様と会話の機会が持つことが多いのですが、そこではEMC視点で製品を見ている私にとって、お客様が非常に興味深いアイデアや期待をViPR Controllerに抱いていることにハッとさせられます。その中には、それらアイデアの実現にEMCだけでは困難なことも、他社もしくは他のOSSテクノロジーとの組み合わせでは意外に容易に出来そうかなということがいくつかありました。私は「CoprHD」プロジェクトがそんな利用者の夢を叶えるエコシステム実現の触媒となることを期待したいと思います。今後の「CoprHD」プロジェクトの展開をどうぞお楽しみに!

fig6.png

関連リンク

CoprHD公開予定サイト (Github) 

http://coprhd.github.io/

 

Randy Biasblog記事

http://www.cloudscaling.com/blog/cloud-computing/introducing-coprhd-copperhead-the-cornerstone-of-a-software-defined-future/

EMC World 2015において、The Beastの愛称で呼ばれている「XtremIO 4.0」の発表や、ラックスケールフラッシュ「DSSD」のお披露目がありました。これら2製品もちろんそれぞれ特性は異なり棲み分けがなされるべきなので、一言でまとめること自体が間違っているのですが、あえてまとめるとどちらも「低遅延」であることです。

 

なぜ、データレイクに関するタイトルなのにいきなりXtremIODSSDの話をしているかというと、データレイクを中心としたビッグデータ分析基盤には必要不可欠なものと考えられるからです。

 

 

Isilon Data Lake

 

EMCは以前から「Isilonデータレイク」の提案をしています。

そもそも「Isilonデータレイク」は、SMBNFSはもちろんHDFSOpenStack Swiftと言った異なるプロトコル、手法でファイル共有可能な「IsilonスケールアウトNAS」を従来のNASとしての単純なデータ置き場ではなく、多種多様で膨大なビッグデータを効率よく一元管理する場として用いるものです。

例えば、NFS経由でIsilonに書き込みをしたログファイルをそのままHDFSにて分析することも可能です。


 

datalake.PNG.png

 

 

 

適材適所


しかしビッグデータの活用、分析には様々な手法や目的があります。

その中には、ゴールデンウィークに発生する渋滞傾向を分析して次の年の渋滞を防ぐ為の策を分析するようなある程度時間をかけて行うことのできるものがあります。また、為替のように一瞬一瞬判断で数億ドルを得るあるいは失うような取引の分析、これらは瞬間的な判断がものをいうので、極めて短い時間での分析が必要です。

 

先にあげた渋滞情報のようなある程度時間をかけて分析可能なビッグデータはIsilonに保存したまま分析をすることができます。また、後者の為替取引のような瞬間的に分析が必要なビッグデータに関しては、少しの遅延も許されません。この少しの遅延も許されない分析においては、EMCに限らずどのメーカの製品についても言えることですが、Diskベースアレイには向いていない

ワークロードとなります。

 

このようなワークロードに関しては、分析ホストのブロックデバイスとしてXtremIOや、さらに高速な分析が必要なものは今まではインラインメモリで処理を行ってきましたが、今後はPCIeバス直結のDSSDの様な製品も利用されるようになると考えられます。


 

datalake2.PNG.png


このようにIsilonの様なデータレイクにて一元管理されているビッグデータを、それぞれの用途に適したソフトウェア、インフラで処理をさせるということがビッグデータの活用を成功させるための鍵ではないでしょうか。

 

この度、ビッグデータ分析に関してXtremIOIsilonSplunkのホワイトペーパーがリリースされました。

パフォーマンスやコストのバランスの取れたビッグデータ分析基盤の構築ノウハウが記載されています。是非ともご覧ください!


splunk画像.PNG.png


<ホワイトペーパーリンク>

EMC SOLUTION FOR SPLUNK

May 04, 2015

EMC World Day 1: XtremIO 4.0 – the best AFA gets better.

 

XtremIO 4.0の発表! 数週間でその一部はお客様へ無料で開放される。

おまけにこれはXtremIO 3.0からのNDU(オンライン)アップグレード!だから安心して!

 

何がイイって?この広大なプラットフォームがもっともっとパワーアップしたってことさ。身震いするくらいにいい感じでね。

だから僕らはXtremIO 4.0のリリースを愛をこめて“The Beast”と呼んでいる。

 

新しい機能その①

5TBから320TB (8x40TB X-bricks)までならオンラインでのcluster拡張が可能。また将来的には40TB 6,8 node clusterQ3 はじめにはリリースされる予定。なぜスケールアウトがそんなに重要かって? Flash Storageにおいてはシンプルにスケールアウトする方が簡単だ、という結論に大多数のお客様がたどりついたからさ。XtremIO 4.0ではオンラインでのダイナミックなスケールアップが可能。もう一つ!X-brickでは- 1-2-4-6-8でスケールアップが可能!

12thmay4.jpg

オンラインでのcluster拡張を詳しく知りたいならこれ!

 

https://www.youtube.com/watch?v=***2KLrkm-Y&feature=player_embedded


新しい機能その②

remote replicationの充実。Recoverpointとの融合で何千デバイス、コンシスタンシーグループのReplicationsub 60-second RPOで可能。

これはトライアルではないよ、XtremIO clusterのスケールアウトが可能であればreplicationだってそうならないといけない。RPOの充実のために

“Beast’s”ではやっとの思いで1M IOpsを実現した。XtremIO customerVPLEX RecoverpointもしくはRecoverpoint for Virtual Machinesreplication

をしている一方で XtremIO“platform”なしのremote replicationをしていた。この新しい機能は異種サポートも含んでいる。

vSphere SRM, Appsync support, そしてViPR automationだってサポートする・・・そしてもっと他のものも!

そうXtremIOno “platform”ReplicationからAFA 業界では一番のBest Remote Replicationを提供できるようになったんだ。


こっちのデモビデオでそれを体感して!

https://www.youtube.com/watch?v=IJBeQiGgntI&feature=player_embedded&list=PLDoAsI7hhKMfnefdeAW0eeUsMoW8c3_Qu

https://www.youtube.com/watch?feature=player_embedded&v=8nd12_TKVa8

https://www.youtube.com/watch?list=PLDoAsI7hhKMfnefdeAW0eeUsMoW8c3_Qu&v=PPlCc4dJpYw&feature=player_embedded

 

新しい機能その他・・・・

  • 40TB X-brick。もっとたくさんのRAMにMetaDataを入れて $/GB を稼ぎ、IOps をも勝ち取る。そしてそう、その恩恵はすべてXtremIO cluster に詰まっている!
  • 8 X-brick (16 node) cluster サポート。これは平均で1PB ほどのdata reductionが一つのXtremIOで可能、ということを意味している。
  • パフォーマンスの向上(すでにパフォーマンスはすごいいいけどね)
  • 障害耐久性の強化。X-Brick 当たりN+2 SSD 障害、16 SSD (同時)障害に耐えうることが可能。Xbrick でのDual SSD 障害は業務に何ら影響を与えない。これはXDP RAID-6との大きな違い。この dual parity は初代X-Brick のころからの伝統でこれが今回のバージョンで完結した。XtremIO には単一障害スポットが無い。(NO SPOF

  Note:面白いことに(ありがたいことに、、、か!)僕らはまだ大きなお客様でのdual SSD failureというのに遭遇していない。

Rebuild時間はHDDよりずっと早く障害状態も短時間のはず。

  • snapshot 機能の充実(すでに結構いいものだけどもっとよくなった!)4倍の snapshot ボリューム機能、リフレッシュ機能の充実、などなど。Appsync サポートによるMicrosoft, VMware, Oracle などのエコシステムとの融合も実装! .


わおー、さっすがBeast !

僕らがXtremIOに注目しているわけがわかると思う。適切なアーキテクチャ、素晴らしいエンジニアリング、ここ数年の投資とサポートを

受けうるに足りるプロダクトだよ。

 

ところでXtremIO 4.0のアップデートは以下…いっぱいあるので一応列挙しておくね

 

注意:もしかしてこのリストにちょっとしたプロダクトチームからのユーモアがみつけられるかも!

 

UIでの改善もあるので是非こっちをチェック!

https://www.youtube.com/watch?feature=player_embedded&v=MUgos1Fa8sY 

 

 

 

XtremIOはマーケットでの成功を収めている、誰が何というおうともね。そう、数がそれを物語っている。

マーケティングじゃない、お客様がその選択をして流れを作ってくれている。

low latency と安定性が必要なtransactional workloads に今や hybridを導入する必要はないんだ・・・

僕の中にあるSEの血がこれだけは別だろう、って白黒つけているのは以下。

  • RDFMainframeiSeriesサポートの必要なWorkload, それにはSSD搭載のVMAX がいいだろう。
  • 物理的にも経済的にも小さい規模、それにはVNXe, もしくは2U $25K 3TB all-flash かな。 
  • data reductionの必要ないDataでSDS + commodity タイプであればNAND の充実したScaleIOがイイのでは・・・。

XtremIO 4.0の素晴らしさはこういうこと(上記参照)じゃない・・・・・

本当に大切なのはこういった成功例ではなくもっと大人な話

僕らはAFA業界の leader 的な地位を築いて、これからももっと成長していくけれど、それはつまり数多くのXtremIO を野生に返す、ということに

他ならない、つまりXtremIO の持つ機能性を沢山の人に(もちろん競合各社にも)公明正大に知らしめていかねばならないってことだ。

競合各社が盗もうとしたって、そもそも僕らに隠す気はないからね。。無駄ってもんだ。

とにかく。。。。。

ここからはメインストリームになりつつあるXtremIO AFA関連情報。やっと導入実績も統計が取れるくらいに増えたからね。

上記がその一部情報。これがEMCを含む各ベンダーの数字。

Run Rate(前期の稼働実績)×4の売り上げってことは全体でみると$1B規模での成長。といってもお客様が$1BXtremIoを買ったのではなく計算で言うと$250Mの収益を得た計算になる。

Growth rates(伸び幅)これは小さなビジネスについて考えるのではなく、大きな枠で計算したほうが正確な数字が出る。だってもし$200Kを売ってその次のQ$20M売れば、結局10,000xの成長って言えちゃうだろう・・・・


で、どこまで話したっけか。。。


他に大切なのはお客様満足度・・・・

customer satisfaction これはいってみればリピート率。どれだけお客様がその製品をすきになってくれたか、ということに尽きる。


他の点としてAFA “Tier 0” もしくは“VDI” storageという認識から 広いData圧縮率、エコシステムへの浸透、などにより “broad transactional workload use”へと変革したか・・・ってことも重要なポイントではある。

僕が信頼する競合他社もthinプロビジョニングはdata-reduction技術ではない、というだろう。オペレーションをシンプルにはするけれど。

とにかくdata-reductionってのはそんなものじゃない。

僕の書き物に関してその競合他社はきっと「僕らのことだ。。」なんて思うかもしれない。

しかしカーリーサイモン(アメリカの歌手。サイモンシスターズ)のの名言に「この歌が自分のことをうたっているなんて

思うあなたはかなりの自惚れやだわ」にあるように、僕は誰かのことを言っているわけではない。

ただ、data reduction に関して鉄拳の決まりやスタンダードは無い。ってことを言いたいだけなんだ。

 

興味深いのはthinプロビジョニングを使っているお客様ってのはそれを止めることができない。。。ってことだよ。

下の表を見て。。。

 

thinプロビジョニングは今や広く採用され浸透している。しかしthick使用のプラットフォームだって同じころに紹介されたのに

そんなに使っている人がいない。これは長年培ってきたものへの馴れ、信頼みたいなもんで、なかなか違うものへの発想の転換ができない、

ということだと思う。

もちろんXtremIOのデザインは最高。これはアーキテクチャの機能追加、というよりもその追求結果としての意味合いが強いからね。



結局、data reduction って何?

先週素晴らしいお客様との出会いがあった。

彼らはすべてをEMC製品にしてくれている素晴らしいお客様なんだけどね。VMAXVNX,CX4,(この間やっとCX300 を引退させた・・・!)

ローカルチームはVMAXに変わるストレージとしてXtremIOをおすすめしている状況なんだ

AFAにおいて一番の魅力は$/GB、すなわちdata reduction機能だ。というのもきちんと設計されたAFAdata reductionを通常のオペレーション

として常に行うからだ。一日の書き込み量(WPD)とそのNAND media費用は日々さがっていく一方でこれ無しではTCOはそこまでクリアにはならない。とはいっても・・・・このお客様はdata reductionに関してかなり懐疑的だった。ローカルチームはMitrend dataを使って実際彼らのData4:1になるであろうことを示唆した。お客様的には、コンサバティブに3:1の試算で落ち着いたけれど。またそれまで稼働していたVNX/VMAXWorkloadXtremIOへ移行するのも簡単にできることを示し、その他に関しては、MainFrameRDFはそのままVMAXにVNX NAS に関してはIsilon へ、そして小規模なNAS系はそのままVNXに適宜対応することでお客様の不安をやっとのことで取り除くことに成功したんだ。


お客様の懐疑的な思いは十分にわかる、、だからこれを読んでいる君にもDataを示してその不安を取り除こうと思う。

これは1,400以上のお客様とCluster の導入実績からとったData。おそらく君の考えもそれで変わるだろう。。。。


重複排除:書かれたものってのはすべてオリジナルでユニークなものということだ。XtremIOの重複排除は機能ではなく仕様。これは常時インラインで行われている、そのRate2:1から3:1 10:120:1と数値の出ているお客様もいるけれどこれもまた真実。

圧縮:きれいに配列されたDataはもっと整理された形で配置される。ほとんどの場合41-60%のスペース有効活用が可能になる。(あくまで物理スペースの話でコストの話ではない。)

何が重複排除に最適(Server Image等)で、向いていないのは何か。(databasesなど)

何が圧縮に向いていて(databaseなど)、そうじゃないのはなにか。(Server Image等)ということはよく知られている。

しかしWorkloadというのは一定ではないから,結局トータルでのdata reductionがその目安、としかならない。


だから、XtremIOのようなproven technology(証明された技術)が君の環境をもっと経済的にするんじゃないのか・・・・

Data reductionにはスタンダードはない。あるベンダーでは“eliminated repeat zeroes”0計算部分の抹殺!)が圧縮の一部であったりする。

僕らはそうじゃない。またほかのベンダーはSnap機能にそれが含まれていたりする。僕らは違う。僕らがはっきり示すことができるのは混合されたWorkload全体でその圧縮率が3:1から5:1だということ、それだけだ。


Data reductionから先のことって? –ロード、書き込み、消耗について(お客様の興味のポイントは今これら)


(これは今時のDataCentreやお客様環境の状況を表にしたもの・・・)

上記の表真ん中にあるような極例として125K IOpsで無停止、というお客様が存在する。また一方でR/Wが1PB以上というお客様もいる。

平均的なXtremIO 30TBのフラッシュを保有しているので平均、6か月間に30倍以上の書き込みを可能にする。僕らはXtremIOを一年くらい

販売しているけれどほとんどの販売がQ3/4だ。

 

NANDWriteに弱いのは知っているだろう。だからあの手この手でAFAへのWrite少なくするように工夫がなされている。

XtremIOの特色としてすべてのWirteにある固有のobject data distribution modelの抽出を行うことだ。これにより不要なWriteが発生することを防ぐ。そしてCluster内でその情報(Write)は公表される(シェアされるので同じように不要なWriteの発生が無い)


 

これはClusterOverWriteをするまでのグラフになっている。平均で6か月以内。


こちらは真面目な機能説明のためのスライド・・・

 

Writesは完全に分散される。SSDHotSpare はないし、hot spot もない。そこから考えるとXtremIO NANDmagnetic mediaとして

使っていない事を意味している。すべてのWriteは固有にhashe計算され、分散される。その方法で無用なWriteは避けられる。

無用なWriteを避けることでSSDのLifeを長持ちさせる。

中には6PB のwritesがあった客様で、各SSD98Write Life が残っていたという記録もある。正常じゃないって思うかもしれないけど

本当にあった事・・・全てのお客様で見ると“life left”な状態というのは案外多い、95%から100%のWriteLeftがその大半だ。

 

 

じゃあavailabilityは?

 

XtremIO 3.0のお客様からのコメントはこれ・・・

僕らだってパーフェクトではないんだ。。。

障害対応はどんなプロダクトでも起きる、ただそれをどうやって対応するかによってお客様の印象や信頼は変化してくる。

僕らはいつでもベストを尽くす!


障害はエピソードであって統計ではない。XtremIOはお客様満足度において上位の部類だけれどそれは製品が素晴らしいからだ。

XtremIO 4.0からはAFA marketでベストのRemoteReplicationがサポートされる。これはRDFではないけれどそれに匹敵するとおもう。


これからの課題として、絹の様なスムーズアップグレードを可能にするための技術を開発中。

Native Remote Replicationの実装に向けての開発。


改良はXtremIOmission criticalな環境には不向き、ということではない。金融系でXtremIOを採用している

お客様を僕は知っているしね、そしてほら、full sync replicaその上、FAST.X VMAX3 XtremIOサポートが必要だって?

僕たちならそれができるよ。そしてActive-ActivevSphere clusterXtremIOのサポートも可能だ、さらにVPLEXとだって大丈夫。

 

XtremIO 4.0ではAFA業界ではベストな製品だ。そしてオンラインでのアップグレードが可能(XtremIO 3.0から)

そして僕らはそれだけでは止まらない。。2015年を通じて様々なアップデートを加えていくつもりだ。もちろんVVOL supportも含めてね。



このスレッドはVirtual Geek の作者の許可をもらって日本語訳にしています。

 

 

Filter Blog

By date:
By tag: