歴史から辿るデータ活用の進歩と重要性と今後
I. 構造化データ管理システムの誕生(〜1990年代)
リレーショナルデータベース(RDB)が誕生し、企業の基幹業務がデータ化され、「正しく蓄積して検索できる」状態ができるになりました。ここでの主役は 構造化データ(売上、在庫、顧客、会計、取引)と呼ばれる数値情報を主にしたものです。
データ活用の先駆けとして1960年代から米国では経営の道具としてのビジネスインテリジェンス (BI)という言葉が現れ、企業の営利活動において「集計して状況を把握する」「報告する」ための仕組みが普及しました。
リレーショナルデータベースはその操作言語であるSQLの習得が必要なため、“分析できる人が限られる”状況にありました。
その後、企業内の部門ごとのデータを統合するデータ管理システムデータウェアハウス**が徐々に普及し始め、全社的に共通なKPIで語れる状態の実現に踏み切る取り組みが増えてきています。「現場のExcel」から「データの共通化」に移行し始めています。
II. 競争優位としてのデータ活用が着目され、分析が「利益に直結」し始めた(2000年代)
2000年代に入り、Google / Amazon / Netflix などの新しいプラットフォーム企業が躍進します。ここで起きた変化は、データが社内の業務管理から、推薦・検索・広告などプロダクトそのものを駆動する資源として扱われ始めたことです。
それ以前にも、金融の市場分析や保険・リスク管理、医療のゲノム解析のように、データ分析が中核にある領域は存在しましたが、その存在は限定的でした。
しかしプラットフォーム企業の成功によって、**「コストセンターとしてのデータ基盤」から、「売上・粗利・LTV・解約率などに結びつく投資」として語られるようになります。企業価値の源泉も、物的な資産より 「データを取り、学習し、改善を回すループ」**へと比重が移っていきました。
「データは21世紀の油田」と呼ばれたのは、まさにこの転換が背景にあります。
III. クラウドにより実装の速度が上がり、活用範囲が一気に広がった(2010年代)
新興プラットフォーム企業は、従来企業で主に蓄積していた構造化データから、センサー・テキスト・画像といったより非構造的データや、サイトのアクセスログといったの半構造データの活用も着目されはじめます。
この背景には計算リソースの拡大があり、更にAmazon Web Service (AWS)の提供するクラウドによってデータ管理やデータ活用の調達・環境構築の壁が一気に下がり、企業の試行錯誤の回転が高速化していきました。
「AIが犬を理解した」と話題になった深層学習(ディープラーニング)技術のブレイクスルーや、Elasticsearchのような全文検索基盤が普及しました。これにより、徐々に画像やテキストを含む非構造データ活用が、多くの企業にとって比較的導入しやすいものになっていきました。
その一方、ディープラーニングは多くのデータ収集やモデルの学習への投資が必要になり、またテキストを扱う技術領域である自然言語処理も同様の状態で、信頼に足る精度の担保や活用は多くの企業にとって困難でした。
そのためデータ活用による価値創造は、不正検知、需要予測、価格最適化、配車、在庫最適化、与信分析など、統計やより古典的な機械学習で扱える構造化データが主な対象になりました。
IV. 社会インフラとしてのオープンデータ公開と民間利用(2010年代〜)
データ活用は営利企業での発展に限らず、社会インフラとして語られ始めるようになりました。
これは政策にも波及し、公的データの公開・再利用が制度として、民間活用も前提に整備されていきました。
日本で「データ活用」が前面に出た政策的な節目
| 時期 | 日本で「データ活用」が前面に出た政策的な節目 |
|---|---|
| 2000年代前半 | IT利活用(e-Japanなど) |
| インフラとIT導入が中心、データ活用はその延長線 | |
| 2010年代前半 | オープンデータ/データカタログ |
| 公的データの公開・再利用が制度化 | |
| 2016年 | Society 5.0/官民データ活用推進基本法 |
| 「データ活用社会」を国家構想・法制度として固定化 | |
| 2018年〜 | DXと“2025年の崖” |
| レガシー刷新の遅れが経済損失リスクとして語られ、説明の定番になる | |
| 2019 | DFFT(信頼ある自由なデータ流通) |
| 越境データと信頼(ガバナンス)を国際ルールとして主導 |
V. 汎用型AI「生成AI」によりデータ活用に新たな転機 (2022〜)
2022年にChatGPTが登場し、汎用型生成AIが誕生しました。もはや従来コストであったAIの学習を行なわずとも、実務上の広い領域で実用可能な水準に到達しました。
背景には、Transformerを基盤とする大規模言語モデル(LLM)の成熟と、対話的にAIと意思疎通可能なインターフェースが実現したことがあります。
生成AIにより、AIはごく一部の専門家が活用する道具から、プライベートや業務現場でも使える汎用ツールへと転換しました。生成AIは、従来扱いにくかったテキストデータ(文書、議事録、メール、仕様書、FAQなど)を、チャットボットの形で容易に活用できるようにしました。
さらにマルチモーダルと呼ばれる、生成AI内でテキストだけでなく画像なども同じ枠組みで扱えるようになり、また初期で課題であった生成AIの出力の揺らぎを減らす取り組みも多く、非構造データ活用と生成AI実装の敷居はもう一段下がりました。
今日、従来のように用途ごとに個別モデルを学習して作り込むのではなく、既に汎用化されたモデルを前提に「業務へ組み込む」ことが企業の大きな関心になっています。
一方で、企業で生成AIを業務利用する際のボトルネックは「社内の正しい情報にアクセスできない」点です。そこで注目されたのが 企業内データの情報検索と生成AIを連携するRAGが注目され、社内チャットボットや社内AIエージェント開発の取り組みが進み始めています。
お問い合わせ
下記フォームよりお気軽にお問い合わせください。
担当者より折り返しご連絡いたします。