COLUMNS コラム

ビッグデータとは。定義や注目の背景、将来の展望まで解説

IT機器やネットワークの進歩、AIブームに並行して頻繁に耳にするようになった「ビッグデータ」。その名のとおり大量のデータという意味も持ちますが、使われ方によって意味は様々で、定義や活用の実態が掴みづらい抽象的な言葉です。

この記事では、ビッグデータの定義や注目される理由、活用方法について、順に解説していきます。

ビッグデータとは

ビッグデータとは、あらゆる性質を持った膨大な量のデータのことです。量以外にもさまざまな種類と形式を指す場合もあり、使われ方によって定義がさまざまな言葉の一つです。

ビッグデータは、IoT機器の進化やネットワーク環境の整備によって日常的に生成されています。現在、この膨大なデータは社会経済の問題解決や事業に役立つ知見を導入するために使われたり、ビジネスでの新たな付加価値創出に役立てられたりと、活用が進んでいます。
出典:総務省情報通信白書

ビッグデータの5V

  • データの量(Volume)
  • データの種類とその性質の多様化(Variety)
  • データの出入力発生頻度(Velocity)
  • データの真実性(Veracity)
  • データの持つ価値(Value)

ビッグデータは「データの量(Volume)」だけでなくそのデータの持つ種類とその性質(Variety)によって意味合いが変わります。たとえば、エクセルに代表される「行と列」の概念を持つ構造化データだけがビッグデータと言われるのではなく、行と列の概念のない音声・画像やテキスト、その他Web上の蓄積データ、位置情報やセンシングデータ等の非構造化データもビッグデータとして分類されます。さらに日々蓄積されるデータがリアルタイムに、かつ頻度高く生成され続けているという特徴もビッグデータを構成する重要な要素です(「データの発生頻度(Velocity)」)。これらを総称して「3V」と表します。

ただ、近年はデータ利活用の推進を背景に、新たに2Vを加えた「5V」として構成されています。特に、新たに追加されたうちの1つ「データの真実性(Veracity)」は、データの正確性や発出元の信ぴょう性を指し、不確かなデータの場合はビジネスの価値創出に向けて活用されるビッグデータとして分類しないとされています。

ビッグデータの種類


そのほか、データの発生源と性質からビッグデータを4種類に分類する考え方もあります。以下、生成元と種類をもとに分類しますので、ご確認ください。

生成元

種類

説明

政府・行政

オープンデータ

『官民データ活用推進基本法』を踏まえ、政府や地方公共団体などが保有する公共情報

企業

知のデジタル化

農業やインフラ管理からビジネス等に至る産業や企業が持ちうるパーソナルデータ以外のデータ

 

M2Mデータ

工場等の生産現場におけるIoT機器から収集されるデータ(M2M:Machine to Machine)、橋梁に設置されたIoT機器からのセンシングデータ(歪み、振動、通行車両の形式・重量など)等

個人

パーソナルデータ

個人の属性情報、移動・行動・購買履歴、ウェアラブル機器から収集された個人情報、さらに特定の個人を識別できない加工されたデータも含む

出典:総務省情報通信白書

ビッグデータは、使われ方によって定義がさまざまな言葉の一つです。そのため、定義をもとにしつつ用途によって意味を使い分けることが必要です。

ビッグデータが注目される背景

ビッグデータは、政府や公的機関だけではなく民間企業からも注目を集めていますが、その背景にはIT機器の発達やネットワークの拡充による影響があります。

特に、2000年代初頭からのインターネットの台頭で、多くのWebサービスやデジタルデバイス上で動くアプリケーションが誕生しました。これにより発生するデータ量は増幅し、データを構造的に管理していくという概念が生まれます。これがデータセットを保存し分析するソースコードの誕生にもつながり、大量で多種類かつ更新頻度の高いビッグデータとして認知されるようになりました。

その後、政府による指針を筆頭に、経済や社会でのビッグデータ活用が注目されるようになっていきました。このセクションでは、近年のビッグデータが注目されるに至った背景を詳しく説明します。

SNS等の発展で収集できるデータ量が増加


ビッグデータの台頭には、FacebookやTwitterに代表されるSNSから収集されるデータ量が爆発的に増えた点が影響しています。

インターネットやモバイルデバイスの普及を背景に、SNSは身近なものになりました。たとえば2015年時点でFacebookユーザーのいいね数は1分あたり410万個、Twitterのアクティブユーザーが発するつぶやきは1分あたりで347,222個と言われています。さらに、各種SNSのユーザー数やコンテンツ投稿数はさらに増え続けており、Twitterのアクティブユーザー数は日本だけでも2021年度末で2億1700万人と、SNSを介して収集されるビッグデータは全世界的に莫大な量となっているのです。

マシンパワーの増強によるデータ収集・計算能力の向上


大量のデータセットを保管し分析する概念が誕生したのと時を同じくして、それらのデータを処理するマシンスペックや計算処理方法が進化を遂げたことも、ビッグデータが社会に注目され始めた理由の一つです。

たとえば、各種パソコンスペックの進化によるデータ処理速度の増強はもちろん、Hadoopというオープンソースで動く分散処理技術が開発されたことで、データを複数のマシンに分散させた分析処理が可能になり、大規模なデータの蓄積や分析を効率的に行えるようになりました。

官公庁によるデータ利活用の推進


これらの取り組みは、主に民間企業を中心に行われていましたが、近年日本でも官公庁による第4次産業革命やSociety5.0に向けた新たな枠組みが示され、ビッグデータの活用が推進されています。

さらには社会でビッグデータ活用を促進していくために、必要に応じてデータの流通範囲を広げ、民間企業と公的機関が相互に有用なデータ分析や処理共有ができるよう2016年には官民データ活用促進基本法が制定されました。

これにより民間企業は国や地方自治体が管理するオープンデータや各種届出に関わるデータを利用できるようになり、データに基づく新たなビジネスの価値創造に公的データを活用できるようになりました。

このように、ビッグデータの活用に向けた環境が整備され始めたことで、これまで以上にビッグデータの活用に取り組む事業者が増え続けています。

ビッグデータによって解決できる課題と活用事例

ビッグデータの活用で、狭い範囲のデータや少量のデータでは見通しが立てられなかった領域まで、さまざまなアイデアを検討できるようになりました。では、具体的にどのような課題を解決できるようになるのか、その事例とともに解説します。

さまざまな角度のデータを収集し分析できる


さまざまな角度からビッグデータを収集し分析することで、客観的な根拠に基づいた予測や計画の策定が可能です。

たとえば、実績ベースや単純な市場調査結果から製品開発企画をしても、予想した需要が生まれない場合があります。その際は、従来のやり方に加えてソーシャルビッグデータを解析し消費者の動向を調査することで、より実態に即したデータによる意思決定を促し、新規事業開拓へ取り組む場合にも役立ちます。

データを用いて将来の可能性を予測できる


膨大な過去の実績データを用いることで、高精度に予測・分析することも可能です。たとえば、素材や部材の調達量を予測をする際、現場の担当者が確認できる範囲だけの記録をもとに予測を立てる場合と、過去全期間かつ多品目の膨大な取引記録を用いる場合では、学習・分析できるデータの量が違います。その際に膨大な過去の実績データをAIや機械学習に用いることで現状を踏まえた将来的な需要量を高精度に予測し、供給量の調整に結びつけることが可能です。

品質向上や製品開発などイノベーション促進につながる


ビッグデータの活用は過去のデータ分析による予測だけにとどまりません。複数種類のデータを活用することで、サービス品質向上や製品開発等のイノベーション促進につなげた例も出てきています。

たとえば、某飲料メーカーでは、アイトラッキングデータを解析し、消費者の目線の動きに合わせて自動販売機の商品陳列を変更したり、某AIサービス提供会社ではスーパーのショッピングカートにレジ機能をつけ、POSデータ、陳列棚や人流を画像データ分析といった複数種類のビッグデータを活用して、需要予測の最適化とカート上での販促活動に活かしたりしています。

このように、今までデータ化が難しかった消費者心理を分析することで、新たな商品の仕入れや販促企画の開発へも活用できます。

ビッグデータの活用における課題とこれから

これまで紹介してきたように、ビッグデータ活用によってビジネスの新たな価値創造が始まっている一方、ビッグデータの活用には課題もあります。その証拠に、ビッグデータという言葉の話題性に比べて、実社会におけるビッグデータ活用例はまだ多いとは言えません。

ここからは、高精度な需要予測や消費者動向を見越した販促戦略の策定等、ビジネスの新たな価値創造に向けた取り組みを実現していくために、ビッグデータ活用にまつわる課題や、ビッグデータ活用市場の変動ついても解説します。

ビッグデータの活用における課題

ビッグデータを活用する際に問題の一つは、データ活用に必要な準備やデータセットの用意等の費用対効果が見えづらいことです。さらに、ビッグデータは量や種類が豊富な分、データの取り扱いには細心の注意が必要となり、データを取り扱える専門家も必要です。

また、近年では法規制の厳格化にともなうデータセキュリティ対策やデータのプライバシー保護が求められていますが、特にビッグデータのような自社データや他社との連携データは機密性が高く、データを保管・分析時のプライバシー保護体制やシステム環境の整備は情報漏えい対策として欠かせません。

ビッグデータのこれから


これらの課題がある一方で、事業推進や新たな施策の企画といった企業の意思決定力向上にも活用されるビッグデータ。実際に市場規模は2027年には世界で4,480億米ドルに達すると予測され、生み出す価値に対する期待は高く、今後も世界規模でビッグデータの活用が進んでいくことが見込まれています。

そのためEAGLYSは、ビッグデータ活用の大きな障壁となっているデータを保管・分析時のプライバシー保護体制やシステム環境の整備について、データを保護しながら活用できる秘密計算ソリューションを提供しています。秘密計算によって従来はデータの保管・連携時以外にも分析や計算処理する場合も暗号化を実施。安全なデータ活用を実現します。

また、EAGLYSのAI解析時はやみくもにビッグデータを活用せず、事前準備を重視し、導き出したい結果を多面的に検討します。

このようにビッグデータ活用には、どのようなデータセットを使うとどのような分析結果が持たられるのか、足りていないデータはどのようなものかそしてどうやって調達するのか、どの程度の精度で分析結果が返って来るのか等を把握し、適切な打ち手を検討する必要があります。その場合、データサイエンティスト等の専門家による指示を必要としますが、希少な存在のデータサイエンティストを自社で雇うのは難しいため、そういった専門知識を持つデータ活用支援企業にアドバイスを求めるのが適切です。

まとめ

ビッグデータとは、多種類で次から次へと生まれ出る膨大な量のデータ群を指します。生み出される価値への期待やデータ処理するマシンスペックの進化から、すでに多くの企業で活用が広がっています。

一方、データ量が膨大かつ種類や形式も多岐にわたるため、専門知識による必要なデータセットの見極めや、そのセキュリティ対策は同時並行で行わなければならず、ビッグデータ活用における制約は少なくありません。

このように、データの収集や問題提起に加えて経験豊かな相談相手を見つけ、都度対策を講じていくことも、ビッグデータの活用をスムーズにすすめるうえで重要な手順です。

EAGLYSでは、創業よりデータのセキュリティとデータ利活用を専門に支援してきた経歴を活かし、ビッグデータを用いたAI分析や、そのセキュリティ対策を支援します。

構想段階からビジネスイシューを捉え、本来求められているデータ活用の形を実現する方法をともに検討し、時にはデータを活用する際に必要なAIの開発にも携わります。ディスカッションベースのご相談から承りますので、データ活用を検討される場合はぜひお気軽にご相談ください。

 

一覧に戻る