第一部では、 Hadoopなどの並列データ処理系の基礎である並列データベース技術や分散システム技術を解説してきました。第二部では、 実際の処理系により焦点を当て、 それらの設計と実装を見ていきます。 第二部では、 最初の4回を用いて、 Apache Hadoopの ...
今回は、 Hadoopの構成要素である並列データ処理フレームワークMapReduceにおける実装アーキテクチャの特徴について解説します。加えて、 類似のシステムである並列データベースを取り上げ、 想定するワークロードなどの違いについて解説します。 Apache ...
英Apacheソフトウェア財団の「Hadoop」は高い評価を得ている。だが、2014年の夏の間、そのうわさは影を潜めていた。新しいテクノロジーにはある程度の失望が付き物だ。だが、Hadoopに対する失望は厄介なタイミングで訪れた。その一因は長きにわたって苦楽を ...
「MapReduce」に関する情報が集まったページです。 Gartnerには、「ビッグデータ」に関する問い合わせが継続して寄せられているが、「Apache Hadoop」についての問い合わせは多くない。本稿では、Hadoopの現状と今後の動向について考察する。(2022/9/30) AWSが ...
UDAの中核として、データサイエンティスト向けの「実験室」の役割を担うのが、リレーショナルデータベースとMapReduceプログラミングフレームワークを統合したAsterだ。2011年に買収で獲得、昨年にはHadoopを統合した業界初のビッグデータアプライアンス ...
SAS Institute Japanは4月17日、ビッグデータ分析ソフトの新製品「SAS In-Memory Statistics for Hadoop」と、データ可視化機能を持つ「SAS Visual Analytics」の最新版「6.4」について記者説明会を行った。SAS In-Memory Statistics for Hadoopは同日より、SAS Visual Analytics ...
HadoopのサブプロジェクトHive、Pig、Impala、HBase、Hamaの紹介 Hadoopは非常に強力な分散処理のフレームワークを提供しますが、Hadoop単独でできる処理は限られます。また、MapReduceの設計や実装を必要とするために使いにくい面があるのも事実です。そのため ...
Big data means big business. One of the most critical assets and organization has is the data that traverses the data center, the user, and the computing environment. All of this information needs to ...
HadoopはGoogleの技術者が発表した論文を元に実装されたオープンソースで、 その論文で述べられたGoogle File System及びMapReduceは分散処理の原理群を基にしています。 Hadoopの生みの親であるDoug Cutting氏は、元々Web検索エンジンNutchを開発していましたが、これはWeb ...
Teradataのマイク・コーラーCEOも「ここ数年、テクノロジーはかつてないスピードで変化している。中でもビッグデータがゲームチェンジャーであることは間違いない」と話す。 これまでは捨てていた詳細データを取り込み、ソーシャルメディアやコール ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する