Terms: Definitions Flashcards

1
Q

HDFS(Hadoop Distributed File System)

A

分散処理システムのApache Hadoopが利用する分散ファイルシステム。

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hive

A

オープンソースの大規模分散計算フレームワークHadoop上で動作するデータウェアハウス(DWH)向けのプロダクトです。> https://www.idcf.jp/words/hive.html

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Apache HBase

A

NoSQLの1つで、センサ機器が生成する時系列データを管理するための有力なデータストアとして注目されています。本連載では、HBaseを用いたシステム設計のノウハウと、1,000万個のスマートメータから収集したデータによる性能検証の結果を紹介します。> https://thinkit.co.jp/article/11882

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Apache Phoenix

A

Apache HBase をストレージとして使用する HadoopでOLTP をサポート可能な、オープンソースでマッシブパラレルなリレーショナルデータベースエンジンです。(SQL) > https://jp.cloudera.com/products/open-source/apache-hadoop/apache-phoenix.html

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Apache Solr

A

オープンソースの全文検索エンジンです。> https://www.designet.co.jp/ossinfo/apachesolr/

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Apache Oozie

A

Apache Hadoop のジョブスケジュールに使用される、Java Web アプリケーションです。
https://jp.cloudera.com/products/open-source/apache-hadoop/apache-oozie.html

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Impala

A

Hadoop上で稼動するクエリエンジン(SQL)
> https://www.gixo.jp/blog/12489/

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Zookeeper

A

分散プロセスを優れた信頼性で連携させるためのオープンソースサーバー
https://jp.cloudera.com/products/open-source/apache-hadoop/apache-zookeeper.html

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Spark

A

巨大なデータに対して高速に分散処理を行うオープンソースのフレームワーク

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Apache Livy

A

SparkをREST APIから実行する > https://qiita.com/chocomintkusoyaro/items/9ad844d8386cbab4aa5a

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

HUE(Hadoop User Experience)

A

Apache Hadoopクラスタとともに使用されるウェブ基盤のユーザーインターフェース
https://guide.ncloud-docs.com/docs/ja/hadoop-chadoop-4-3#:~:text=HUE(Hadoop%20User%20Experience)は,などを実行できます。

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Apache Zeppelin

A

webベースのデータ分析ノートブックです。デフォルトでSparkをサポートしている https://avinton.com/academy/apache-spark-zeppelin-environment-setup/#:~:text=Apache%20Zeppelinはwebベース,することが出来ます。

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Apache Knox

A

Apache Hadoop サービスにセキュア・アクセスの単一ポイントを提供するシステム

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Apache Hadoop YARN

A

リソース管理とジョブのスケジューリング/監視の機能を別個のデーモンに分割することです

How well did you know this?
1
Not at all
2
3
4
5
Perfectly