Definitions: Terms Flashcards
分散処理システムのApache Hadoopが利用する分散ファイルシステム。
HDFS(Hadoop Distributed File System)
オープンソースの大規模分散計算フレームワークHadoop上で動作するデータウェアハウス(DWH)向けのプロダクトです。> https://www.idcf.jp/words/hive.html
Hive
NoSQLの1つで、センサ機器が生成する時系列データを管理するための有力なデータストアとして注目されています。> https://thinkit.co.jp/article/11882
Apache HBase
Apache HBase をストレージとして使用する HadoopでOLTP をサポート可能な、オープンソースでマッシブパラレルなリレーショナルデータベースエンジンです。(SQL) > https://jp.cloudera.com/products/open-source/apache-hadoop/apache-phoenix.html
Apache Phoenix
オープンソースの全文検索エンジンです。> https://www.designet.co.jp/ossinfo/apachesolr/
Apache Solr
Apache Hadoop のジョブスケジュールに使用される、Java Web アプリケーションです。
https://jp.cloudera.com/products/open-source/apache-hadoop/apache-oozie.html
Apache Oozie
Hadoop上で稼動するクエリエンジン(SQL)
> https://www.gixo.jp/blog/12489/
Impala
分散プロセスを優れた信頼性で連携させるためのオープンソースサーバー
https://jp.cloudera.com/products/open-source/apache-hadoop/apache-zookeeper.html
Zookeeper
巨大なデータに対して高速に分散処理を行うオープンソースのフレームワーク
Spark
SparkをREST APIから実行する > https://qiita.com/chocomintkusoyaro/items/9ad844d8386cbab4aa5a
Apache Livy
Apache Hadoopクラスタとともに使用されるウェブ基盤のユーザーインターフェース
https://guide.ncloud-docs.com/docs/ja/hadoop-chadoop-4-3#:~:text=HUE(Hadoop%20User%20Experience)は,などを実行できます。
HUE(Hadoop User Experience)
webベースのデータ分析ノートブックです。デフォルトでSparkをサポートしている https://avinton.com/academy/apache-spark-zeppelin-environment-setup/#:~:text=Apache%20Zeppelinはwebベース,することが出来ます。
Apache Zeppelin
Apache Hadoop サービスにセキュア・アクセスの単一ポイントを提供するシステム
Apache Knox
リソース管理とジョブのスケジューリング/監視の機能を別個のデーモンに分割することです
Apache Hadoop YARN