今年のITのキーワードはビッグデータ
データベースに保存されているデータは一般に構造化されていて、後でデータを取り出しやすい構造になっています。これを構造化データと呼びます。
それに対して、パソコンのディスクに保存されているデータは、保存の仕方にもよりますが、半構造化されていたり、あるいは構造化がされていない状態です。
半構造化というのは定義が曖昧ですが、例えばフォルダごとにデータを仕分けして保存しているようなデータは部分的に構造化されたデータと言えるでしょう。これを半構造化データと呼びます。それに対して、構造化されていないというのは、パソコンに雑多に保存されているようなデータです。これを非構造化データと呼びます。
現在、私たちは多くの情報の中で生活していますが、それらのデータは上記の構造化データ、半構造化データ、非構造化データにあてはまります。そして、おそらく最も多いデータはインターネットにあふれる非構造化データでしょう。
あらゆる局面において、情報をうまく整理して、活用することは非常に重要です。これは昔も今も変わりません。しかしながら、現在はアクセスできる情報がたくさんあり、ともすれば情報過多で誤った判断をしてしまうおそれもあります。
これからの時代は、パソコンに保存されているデータ、組織内のサーバに保存されているデータ、インターネット上に存在するデータを一層上手に活用することが重要です。
twitterなどのデータはリアルタイムデータですから、その情報はリアルタイムに解析しなければなりません。スマートフォンのGPSデータなども重要な位置づけになるでしょう。
リアルタイムデータを含む大量のデータを収集し、自動的に関連づけを行うなどで整理すると、雑多な情報が価値のある情報に変化します。そのような価値の創造が、とりわけIT分野で広がるだろうと思います。
| 固定リンク | 0
「パソコン・インターネット」カテゴリの記事
- ワープロの日(1978年9月26日)(2023.09.26)
- ハッシュタグの起源(2007年8月23日)(2023.08.23)
- gmailからメーリングリストへの投稿で550-5.7.26エラー(2023.08.19)
- OneDriveアプリのエラー「アップロードする権限のあるフォルダーがありません」(2023.07.03)
- 映画「ショート・サーキット」日本公開(1986年7月5日)(2023.07.05)
コメント