今年のITのキーワードはビッグデータ
データベースに保存されているデータは一般に構造化されていて、後でデータを取り出しやすい構造になっています。これを構造化データと呼びます。
それに対して、パソコンのディスクに保存されているデータは、保存の仕方にもよりますが、半構造化されていたり、あるいは構造化がされていない状態です。
半構造化というのは定義が曖昧ですが、例えばフォルダごとにデータを仕分けして保存しているようなデータは部分的に構造化されたデータと言えるでしょう。これを半構造化データと呼びます。それに対して、構造化されていないというのは、パソコンに雑多に保存されているようなデータです。これを非構造化データと呼びます。
現在、私たちは多くの情報の中で生活していますが、それらのデータは上記の構造化データ、半構造化データ、非構造化データにあてはまります。そして、おそらく最も多いデータはインターネットにあふれる非構造化データでしょう。
あらゆる局面において、情報をうまく整理して、活用することは非常に重要です。これは昔も今も変わりません。しかしながら、現在はアクセスできる情報がたくさんあり、ともすれば情報過多で誤った判断をしてしまうおそれもあります。
これからの時代は、パソコンに保存されているデータ、組織内のサーバに保存されているデータ、インターネット上に存在するデータを一層上手に活用することが重要です。
twitterなどのデータはリアルタイムデータですから、その情報はリアルタイムに解析しなければなりません。スマートフォンのGPSデータなども重要な位置づけになるでしょう。
リアルタイムデータを含む大量のデータを収集し、自動的に関連づけを行うなどで整理すると、雑多な情報が価値のある情報に変化します。そのような価値の創造が、とりわけIT分野で広がるだろうと思います。
| 固定リンク | 0
「パソコン・インターネット」カテゴリの記事
- USB Type-Cのマグネット式アダプターを使ってみた(2025.03.13)
- Geminiが描いた「空飛ぶ馬」と「空飛ぶ牛」(2024.11.30)
- 【最新】【解決方法】url末尾に ?m=0 で解決|GoogleのBloggerが検索インデックス登録されない(2024.09.22)
- ATOKで[プライバシーモード]の[学習機能を抑制する]を有効にすると(2024.08.04)
- ATOKでタスク切り替えやGoogle ChromeやMicrosfot Edgeのタブ切り替えが遅くなる問題(2024.08.01)
コメント