ビッグデータとは「膨大な量のデータ」のこと
上司
新人
上司
とても膨大な量のデータのことをさして『ビッグデータ』といいますが、一つの情報だけがたくさんあるだけではビッグデータとはいいません。それではビッグデータにはどんな定義があるのでしょうか。詳しく見てみましょう。
ビッグデータの意味をチェック
ビッグデータは、文字通り『大きなデータ(膨大な量のデータ)』です。しかし、『大きい』と感じる大きさや量は人それぞれですよね。ビッグデータと呼ばれるデータ量はいったいどの程度のものをいうのでしょうか?
ビッグデータの定義
ビッグデータには、実は今のところ明確な定義がありません。しかし、一つの定義としては以下の要素がすべて組み込まれていることとされています。
■データの形式がさまざまである。
■データの性質がさまざまである。
■さまざまな種類のデータがある。
■発生頻度・更新頻度がさまざまである。
これらのデータを大量に処理するには通常のデータベース管理のシステムでは追い付きません。はっきりとした分量が定められているわけではありませんが、特別なデータベース管理システムを利用しなければいけなくなるほどのデータ量のことを一般的に『ビッグデータ』とよびます。
身近なビッグデータの例
今や日本だけでも7,600万人以上もの人が日々利用しているLINEが提供しているサービスは、友達・家族との会話機能だけではありません。日記投稿の役割をしているタイムライン、LINE NEWS、LINE Pay、広告データ、写真・アルバムの管理、LINEゲーム、広告データなど、さまざまなサービスがあり、それぞれに膨大なデータが存在します。
この他にも、アドレスの管理、アカウント管理、過去の会話のバックアップなど、機能がたくさんありますよね。これらを処理・管理するためのデータもとても膨大です。
その他、Facebook、mixi、Googleなど、無料でさまざまなことができ、その都度膨大なデータを処理しています。Googleについては、写真のバックアップが保存できるGoogleフォトが無料で利用でき、保存データ量は無制限。考えただけでも莫大なデータ量であることが想像できますよね?
ビッグデータを活用するメリット・問題点
ビッグデータは、SNSや検索サイトで活躍するだけでなく、一般企業でも活用する例は多々あります。ビッグデータを活用すると、データの管理が容易になったり、仕事を楽に進めたりすることができ、とても便利に感じることが多いでしょう。
しかし、どんなことにも良い点だけでなく欠点も存在します。それでは、ビッグデータにはどんなメリットと問題点があるのでしょうか。
メリット
ビッグデータを処理するためには、RDBMS(リレーショナル・データベース)、NoSQLなど、大容量のデータを処理するためのソフトウェアが必要です。そして、そのような処理能力・データ管理能力の高いシステムを導入すれば、従来できなかったような分析もできるようになります。
そのほか、Googleなどで検索をした際、利用者が何について検索したかの情報を蓄積・分析することで、その人の興味・関心に合った広告を表示させられます。そして、蓄積する情報が多ければ多いほど明確に分析をすることができます。
販売業界においては、販売データをたくさん蓄積してそれらを細かく分析できればどんな商品が売れ筋なのか、地域ごとで売れ筋商品の違いはあるのかなども知ることができます。
これらのデータ分析は、自社でシステムを導入して自社で行う場合もありますが、データ分析の専門業者に委託する場合もあります。どちらの方法をとるとしても、企業発展のためにはさまざまなメリットがあるといえます。
問題点
ビッグデータになると、そのぶん管理やバックアップをする量も膨大になり、作業も大変になります。その他にも以下の問題点があるとされています。
■個人情報を取得している場合、不正アクセスによる情報漏洩のリスクが高くなる。
■データが多い分、不具合が生じた際の復旧時間も長くなる。
■保有しているデータを使って分析をする際、抽出する部分によってまったく違う結果が導き出されることがある。
一般的な量のデータを管理するのであれば、IT部門だけで見ているだけでもいいかもしれません。しかし、ビッグデータを扱うようになると、情報漏洩などの問題が生じた場合は、悪くするとビジネス上の問題にまで発展します。経営陣はこの最悪の状態に陥ったときの解決策も事前に準備しておく必要があります。
ビッグデータ分析を役立てている企業の事例3つ
ビッグデータはさまざまな企業の発展に役立っています。では実際にどのような企業がこのデータを利用しているのかを見てみましょう。
①:Yahoo!ショッピング
Yahoo!は検索サイトをはじめ、オークション、ショッピング、フリマ、Yahoo!知恵袋など、数多くのサービスを提供しており、多岐にわたるビッグデータを保有しています。そしてそれらのデータを、自社で保有するAI技術などの計算技術をあわせて活用することで、日々さまざまな分析を行っています。
その一例がYahoo!ショッピングです。利用者は「こんなものが欲しい」と思ったとき、インターネットで検索しますよね?そしてある程度の情報を得て購入に踏み切ります。この検索履歴と購入履歴をあわせて解析を行うことで、新規ユーザーへの商品レコメンド*のクリック率が4.5倍も向上しました。
これと同じように、大手通販サイトの楽天でも同じ手法を取り入れて購入率UPに成功しています。
また、Amazonにおいても、直近で検索した商品や購入した商品がTOPページに表示されるようになっています。さらにそれに関連する商品や類似する商品をあわせて紹介することで、利用者の興味を引き出しています。
(レコメンド*:ネットショッピングなどで利用者の好みに応じた商品やサービスを推奨すること)
②:ホームセンター
売り上げデータ、従業員の行動データ、商品の陳列データを蓄積・解析することで、顧客単価の高いエリアの特定に成功しました。
購入を考えて尋ねたいことがあっても、従業員が近くにいなければあきらめて帰ってしまうことがありますよね?このような顧客の取り逃がしをなくすよう、顧客単価の高いエリアに従業員を重点的に配置した結果、これまでの売り上げが15%もUPしたという事例があります。
③城崎温泉:
兵庫県にある城崎温泉(きのさきおんせん)は、平安時代から知られる古い温泉です。由緒ある温泉街ではありますが、インターネットサービスも推進し、スマートフォンでの支払いができるシステムも導入しました。
これにより、観光客の多い時間帯やどのエリアが人気スポットになっているかを把握することができました。また、家族連れ、夫婦など、どんな客層が多いのかもあわせて分析することで、温泉街の広報活動やサービスの改善にも成功しています。
各分野でビッグデータの研究も進んでいる!
一般企業、IT業界、旅行業界、情報サービス産業などさまざまな分野でビッグデータを利用しており、それにともなう研究も進んでいます。
たとえば、首都大学東京には『ソーシャルビッグデータ研究センター』があり、社交的なデータと実世界のデータの関連させることでどのような分析結果が得られるかなどの研究が行われています。
参考
首都大学東京ソーシャルビッグデータ研究センター
また、情報通信研究機構に属する『統合ビッグデータ研究センター』ではビッグデータを分析するための技術を研究を進めています。
参考
情報通信研究機構統合ビッグデータ研究センター
このように、ビッグデータを研究する機関が増えてきましたが、その中には医療業界を対象にしているケースもあります。『医療ビッグデータ研究センター』ではオープンハウス*やシンポジウムもたびたび開催されています。そして、2018年12月には『AIが変える医学の未来(ミライ)-人口知能と診断の交差点』というシンポジウムが開催されました。
(オープンハウス*:企業や研究所などの一般公開)
参考 医療ビッグデータ研究センター公式サイトビッグデータと一緒に覚えたいカタカナ語
ビッグデータという言葉がでてくると、一緒に登場するカタカナ語もいくつかあります。ここではよく使われているものの中からいくつかピックアップしてみたので、ぜひあわせて覚えてください。
データベース
多くの情報を集め、あとでそれら使いやすい形に整理した情報の集まりのことを『データベース』といいます。基本的にはコンピュータ上に作られていますが、紙で保管している顧客情報や住所録のことをデータベースと呼ぶ場合もあります。
クラウド
インターネットを利用する際、通常はデータの保存場所としてサーバー、ストレージ(記憶装置)、ソフトウェアが必要です。しかし、それらを持たなくても利用できるようにしたものがクラウドです。
たとえば、Googleのアカウントを一つ取得すれば、Eメール、写真保管のアプリ、地図アプリなどが自由に利用できますよね。これらもクラウドの一つです。
バズワード
もっともらしく聞こえるが、実は具体的な定義がなく、意味があいまいなまま世間に浸透している言葉を『バズワード』といいます。
ビッグデータも具体的な大きさや内容が定まっていないため、ビッグデータもバズワードといえます。バズワードについては以下の記事でくわしく解説していますので、あわせて読んでみてください。
バズワードとはどんな意味?バズるって何?IT業界における使い方や例を解説
企業で積極的に活用したいビッグデータ
ビッグデータやシステムの導入や管理は非常に大変ですが、ビッグデータを活用することで、業績UPを実現した企業はたくさんあります。もしあなたが勤めている会社が業績の伸び悩みの問題をかかえているのなら、ぜひビッグデータの活用を提案してみてください。