Excel(エクセル)で行うデータ収集の作業内容と主要機能まとめ
AさんAさん

Excelでいろいろデータを集めるのにけっこう手間がかかっています。
何か良いExcel機能はありますか?

森田森田

Excelでのデータ収集は、イチからデータ蓄積する方法と既にあるデータを集める方法があります。

それぞれで役立つ主要な機能をまとめましたので、順番に解説していきますね。

解説動画:【大前提】Excelを実務で活用するために理解必須な5つの作業プロセス

この記事の内容は下記の動画でも解説しています。
コメント欄の各プロセスの時間部分をクリックすると該当の解説へジャンプできますよ!

はじめに

本題に入る前に、この記事がおすすめな方を挙げてみます。

  • Excelでのデータ収集に関する作業を効率化したい方
  • Excelのデータ収集に役立つExcel機能を知りたい方
  • Excelのデータ収集を実務で行う機会が多い方

前提条件

この記事を読む前に、以下の記事でExcel作業プロセスの全体像を把握することをおすすめします。

Excelで行うデータ収集とは

「データ収集」とは、集計/分析の元データを集めることです。

Excelの作業プロセスを5つのプロセスに分けたもののうち、最初のプロセスが該当します。

なぜ、最初にこの収集を行うかというと、いざ集計/分析を行う断面で必要なデータが足りなければ手戻りが発生します。

よって、集計/分析を行う目的に応じて必要なデータを先に集めておくことが非常に重要です。

このデータ収集は大別すると以下の2つに分類できます。

  • データを蓄積するための表を作成し、それにデータを入力していくこと(作表/入力)
  • 既存の表データを集めること(インポート)

では、それぞれを順番に解説していきましょう。

「作表/入力」の運用上のポイントと主要なExcel機能とは

集計/分析に必要なデータが現状なく、これからデータを蓄積しないといけない場合、集計/分析の元データとなる表をつくり、その表にデータを入力していく必要があります。

運用上のポイント

特に作表が重要です。
元データの表レイアウトとしては以下の3要素を満たす必要があります。

  1. 見出しが1
  2. 11データ
  3. 1列同一種類データ

その上でデータの中身としてポイントとなるのが、以下の2点です。

  1. 後工程の集計/分析で必要なデータが網羅されていること
  2. 1行が一意(重複していないこと)であることを示す番号があること
    ※この番号は「主キー」と言います。

ポイント1は、集計/分析の目的やアウトプットイメージからの逆算となります。

たとえば、商品別の売上を知りたいなら、売上金額等の目的の数値データのほか、商品名等のデータの分類を示す情報も必要です。

基本的には、こうしたデータの種類は「列」に分けて管理します。

続いてポイント2は、地味に重要な情報です。

この主キーがあると、表の各行データに重複がないことを示すだけでなく、後で別表から参照する際の目印になるため、原則盛り込みましょう。

主要なExcel機能

基本的には作表で各種Excel機能を活用していくことになります。

まず、大前提となる機能は「テーブルとして書式設定」です。

このコマンドを用いると先に挙げた元データの表レイアウトとして満たすべき3要素を保持した表(テーブル)を簡単に作成することが可能です。
詳細は以下の記事をご参照ください。

その上で活用すべきは、入力時のヒューマンエラーの防止に役立つ機能です。
以下が目的別の代表例です。

  • 予め連続データ(連番等)を入力する:フィル
  • 手入力箇所を減らす:数式(四則演算)、関数(VLOOKUPIFROW等)、マクロ(VBA
  • 誤入力を防ぐ:データの入力規則、シートの保護、マクロ(VBA
  • 入力漏れを防ぐ:関数(IF)、条件付き書式、マクロ(VBA

目的に応じてご活用ください。
なお、マクロ(VBA)は習得難易度が高いため、その他機能から覚えることがおすすめです。

一方、入力に関しては、主にショートカットキーを活用することが重要です。

その他、「作表/入力」に関する個別テクニックについては、以下カテゴリーへ順次記事を更新していきます。
必要に応じてご参照ください。

「インポート」の運用上のポイントと主要なExcel機能とは

集計/分析に必要なデータが既に存在する場合、集計/分析の元データとして集める必要があります。

もし、表データが複数ある場合は、最終的に1つの表に集約しないといけません。

運用上のポイント

まず、既存の表データを集めるにあたり、主要なデータ蓄積のパターンを把握しておきましょう。

上記パターン①~④で同じレイアウトの別データを1つの表にまとめることもあれば、別レイアウトのデータも組み合わせることが必要なケースもあります。
場合によっては、統計データ等の公開されているデータを扱うこともあります。

なお、データの運用上、自分が管理できる範囲であれば、データの名前は規則性を持たせることが非常に大事です。

  • テーブル名
  • シート名
  • ファイル名(ブック名)
  • フォルダー名

この名前に期間や部署名等の規則性があると、後でデータ収集を自動化することが可能となります。

逆に、名前に規則性がない、あるいは全角/半角等の表記ゆれがある場合、自動化できないリスクとなります。

これはExcelに限った話ではなく、RPA等の自動化ツールを活用する際も同様です。

ちなみに、各データの名前には、環境依存文字は使わない方が無難です。
(文字変換時に[環境依存]と表示される文字)

こちらは自動化処理を行う際に、文字化けして正しく文字を認識されずにエラーとなるリスクがあるためです。

主要なExcel機能

Excelで既存の表データを集める機能は以下の2種類です。

  • パワークエリ
  • マクロ(VBA

これらを使わないと、コピペ等の手作業で1つの表に集約しないといけなくなります。

習得の難易度を考慮すると、パワークエリから覚えることがおすすめです。

なお、収集したいデータの種類や場所によって操作方法は変わります。
パワークエリでのデータ収集の詳細は以下の記事をご参照ください。





その他、「インポート」に関する個別テクニックについては、以下カテゴリーへ順次記事を更新していきます。
必要に応じてご参照ください。

さいごに

いかがでしたでしょうか?

データ収集は、集計/分析に必要なデータを漏れなく、かつ効率的に行うかが非常に重要です。

この記事で実務に必要な機能が見つかれば、ぜひその機能を学習し、実務で試してみてくださいね。

なお、データ収集に役立つ機能は、私の拙著でも体系的に解説していますので、こちらも参考にしてみてください。

ご参考になれば幸いですm(_ _)m

森田森田

データ収集を始める前に、そもそも集計/分析の「目的」をしっかり明確にしておくことが地味に重要です。

「データから何の情報を得たいか」、「どんなことを確かめたいか」等がぼやけていると、そもそも集めるべきデータが定まらず、手戻りが起きてしまいますからね。

ぜひ手を動かす前に、こうした思考の整理を行うことも併せておすすめしたいと思います。