?DataStaxはAureliusとTitanチームをスナップして新しいグラフデータベースを構築する

Martin Van Ryswyk:グラフデータベースをとり、ノード間で分散します; DataStax

Apache Cassandra社のDataStaxは、本日発表したAureliusのエンジニアリングチームの専門知識を使用して新しいグラフデータベースを構築しています。

オープンソースの分散型Titanグラフデータベースの背後にあるAureliusのエンジニアはすべてDataStaxに移行し、DataStax Enterprise(DSE)Graphプロジェクトの作業を開始します。

「私たちは統合を行うつもりはありません。ここでは、Titanで行われたすべてをインスピレーションとして取り上げ、Titanプロジェクトの一部がDSEグラフになるでしょう」とDataStaxのエンジニアリング担当副社長Martin Van Ryswyk 。

DataStaxとデータベースの詳細

CouchbaseのCEO、DataStaxは、Apache Cassandraがどのようにして106百万ドルの資金を調達するのかを説明し、DataStaxの4.5 CassandraはApache Sparkのメモリ内分析を、MongoDB CTOはNoSQLのデータベースを、私たちの新しいWiredTigerストレージエンジンがどのようにストライプを獲得するのか、Splice MachineのSQL for Hadoopデータベースは一般公開され、Apache CassandraはDataStax Enterprise 4.0と、GoogleとAccentureのDataStaxはCassandraの登場を、PostgresとMySQLはEnterpriseDBこれらのオープンソースデータベースをリンクする新しい方法を発表した; MySQL:オープンソースデータベースがOracle

「しかし、カサンドラとDSEの機能を具体的に活用できるようになるため、新しいものを作り上げようとしています。これは、新しい製品を作るためのエンジニアリングの取り組みです。当社のポートフォリオへの製品としてのタイタン。

グラフデータベースは、ネットワークとコンテキストを記述するためにノードとノード間の接続を使用します。昨年Forrester Researchは、企業の約25%が2017年までにグラフデータベースを使用して、接続されたデータセットを必要とする次世代のアプリケーションに使用すると予測しました。

グラフデータベースは、複雑で多くの接続を含むデータへのアクセスを簡素化し、高速化します。ノード、エッジ、プロパティを持つグラフ構造を使用して、接続された情報を保存およびアクセスし、グラフ全体に触れることなくデータの一部をトラバースできます、 “Forresterは言った。

人気度に応じて分類されたグラフデータベースのDBエンジンランキングでは、Titanが第2位にあり、Neo TechnologyのNeo4jの一番下に何らかの形で存在しています。全体的な人気ランキングでは、Titanは200以上のデータベースのリストのうち57位に位置しています。

Aureliusの管理パートナーとTitanのリード開発者であるMatthias Broechelerは、Titanの主要な貢献者は、新しい商用プロジェクトの開発に取りかかっており、オープンソースのコミュニティ形式でも利用できると述べています。

Matthias Broecheler:あなたのデータにどの程度の関係があるか考えてみてください; DataStax

ビッグデータ分析、Big Data Analytics、DataRobotはデータサイエンスの欠点を自動化することを目指している、Big Data Analytics、MapR創設者のJohn Schroederが辞任し、交換するCOO

2年半前、私たちがTitanプロジェクトを開始したとき、人々は実際にグラフデータベースを拡大縮小できるとは確信していませんでした。今、私たちは人々がそれを受け入れ、Titanを使用しており、「私たちはミッションクリティカルなアプリケーションでTitanを使用しています。私たちは皆さんからの商業的支援を本当に必要としている、と彼は言った。

「これは、Aureliusの観点からは、この動きが非常に意味をなさない理由です。既に流通チャネルとセールスフォースとサポートのセットアップを行っているDataStaxの助けを借りて、商業的準備をより迅速に行うことができるためです。技術コミュニティには、彼らが期待しているすべてのサポートとインフラストラクチャーを利用できる製品を提供しています」

DataStaxのVan Ryswyk氏は、多くのDataStax顧客がすでにCassandraの上を走ることができるTitanを使用しており、Cassandraのツールとサービスの商用バンドルであるDataStax Enterpriseとの統合作業を開始したと述べています。

「私たちは、同じユースケースで多くの同じ顧客と話をしていました。正しいことをするには、Titanを使って新しいものに進化させるのが大変でした」

価格設定とパッケージングがまだ決定されていないDSE Graphの作成は、主な事業ですが、設計プロセスはすでに始まっている、とVan Ryswyk氏は述べています。

「買収を行う前に、これを行う正しい方法と思ったことについて多くの話し合いがあり、それに同意しました。しかし、詳細なデザインやプロトタイプはまだ作成していません。それがいつ行われるのか把握することが重要だが、それは直ちに起こるものではない。私はそれが何年もかかるとは考えていない」と述べた。

最近のデータベース投資の高まりの中で、Neo TechnologyはNeo4jの主要なグラフデータベースの後ろに、数百万回の独自の注入を発表しました。

これは非常に難しい問題です。Matthias [Broecheler]は、グラフデータベースをノードに分散して配布するというこの問題について、彼の人生の大部分を費やしています」とVan Ryswyk氏は述べています。

「それが解決しようとしている問題であり、我々が解決しようとしている問題でもあるという事実:事態を非常に効率的かつスケーラブルかつ分散させることだから、両者間の結婚は素晴らしい」

Matthias Broecheler氏は、企業はリアルタイムで分析または照会する必要のある相互に関連性の高いデータを使用するアプリケーション用のグラフデータベースを選択したいと考えていると述べました。

「あなたのアプリケーションを見て、関係がデータの中でどれほど重要であるかを考え、それをスペクトルの上に置かないようにする」と言って人々を助けます。おそらく、あなたのアプリケーションにグラフデータベースを使用する必要があります。

データモデルが実際のアプリケーションモデルに非常に近いため、使いやすさに大きなメリットがあります。第2に、クエリー言語は、異種の高度に接続されたデータを照会するのに非常に適しています。

Van Ryswykによると、カッサンドラを経営している多くの用途には既にグラフコンポーネントが含まれています。

たとえば、推薦エンジン:これは、あなたが収集したこのすべての高度に関連したデータに基づいて製品を提供しようとしている小売業者のためのものです。私はあなたに何を提供するか決定しようとしているアルゴリズムを実行するためにすべてを使用しています。

ワークロードがグラフデータベースに貸し出すその他の分野には、ファイナンス、ソーシャルネットワーク、不正検出、IDとアクセス、医療などがあります。

TitanはDataStaxには提供されませんが、Gremlinクエリ言語を含むオープンソースのTinkerPopグラフコンピューティングコミュニティをサポートします。 TinkerPopは最近Apacheインキュベータープロジェクトになりました。

LinkedInが新しいブログプラットフォームを発表

これはBig OLAPの時代ですか?

DataRobotは、データサイエンスの果実の低さを自動化することを目指しています

MapRの創設者John Schroederが辞任し、COOが辞任