Excel(エクセル)で行うデータ分析の作業内容と主要機能まとめ
AさんAさん

Excelで集めたデータをざっと集計できました!
これからデータを分析していきますが、何か良いExcel機能はありますか?

森田森田

Excelはデータ分析に役立つ機能はたくさんあります。

ただし、データ分析もいろいろな手法があるため、それぞれで役立つ主要な機能をまとめましたので、順番に解説していきますね。

解説動画:【大前提】Excelを実務で活用するために理解必須な5つの作業プロセス

この記事の内容は下記の動画でも解説しています。
コメント欄の各プロセスの時間部分をクリックすると該当の解説へジャンプできますよ!

はじめに

本題に入る前に、この記事がおすすめな方を挙げてみます。

  • Excelでのデータ分析に関する作業を効率化したい方
  • Excelのデータ分析に役立つExcel機能を知りたい方
  • Excelのデータ分析を実務で行う機会が多い方

前提条件

この記事を読む前に、以下の記事でExcel作業プロセスの全体像を把握することをおすすめします。

Excelで行うデータ分析とは

「データ分析」とは、集計結果に対して可視化や原因特定、将来予測をすることです。

Excelの作業プロセスを5つのプロセスに分けたもののうち、4つ目のプロセスが該当します。

なぜ、このプロセスが必要かと言うと、集計結果だけではビジネス上の意思決定ができない場合が多いためです。

よって、分析をすることでデータから判断材料となる要素を特定でき、意思決定や打ち手の根拠にすることが可能となります。

逆に言うと、「判断材料となる要素=分析の目的」を明確にしておかないと作業の出口が見えずに迷走しますので、ご注意ください。

このデータ分析は大別すると以下の4つに分類できます。

  • 集計結果を可視化すること(データ可視化)
  • 集計結果の原因を特定すること(多次元分析)
  • 集計結果内や関連データとの関係性を定量化すること(統計分析)
  • 集計結果から将来を予測すること(予測分析)

では、それぞれを順番に解説していきましょう。

「データ可視化」の運用上のポイントと主要なExcel機能とは

集計しただけでは、数値が羅列された状態では傾向や特徴を掴みにくいものです。

よって、パッと見て数値の傾向や特徴が分かるようデータを可視化しましょう。

運用上のポイント

データ可視化を行う際のポイントは次の3点です。

  1. 定量的な基準値と比較すること
  2. 色やグラフ等でデータをビジュアル化すること
  3. フォーカスしたいポイントに絞ること

POINT1】定量的な基準値と比較すること

データ単体ではあくまでも「事実」を示すものであり、良し悪しがあるわけではないため、特定の定量的な基準値(=物差し)と比較した結果に意味付けすることが大事です。

この比較によって、そのデータが良かったのか悪かったのかが一目瞭然となりますね。

例えば、売上の目標が1千万円の場合、実績が1千万円以上で「達成」、1千万円未満で「未達」というイメージです。

この基準値は、絶対的なものと相対的なものがあります。

絶対的なものは、以下の3つが代表例です。

  1. 計画値(目標、予定等)
  2. 過去(前年、前月、前週、前日等)の実績
  3. ライバル(他社、他者、他商品等)の実績

もう一方の相対的なものは、以下が代表例です。

  • 全体の平均値や中央値
  • 全体の上位(下位)○%や◯位等

POINT2】色やグラフ等でデータをビジュアル化すること

色やグラフといった表現の方が視覚的にデータの傾向や特徴が分かりやすくなります。

例えば、元は同じデータですが、下記の図の表(左)とグラフ(右)のどちらが分かりやすいでしょうか?

おそらく、パッと見では右のグラフの方が分かりやすかったと思います。

このように全体感を掴む上では色やグラフは非常に強力です。

なお、グラフを活用する際に詳細の数値をしっかり見せたいなら、表と併用すると良いでしょう。

POINT3】フォーカスしたいポイントに絞ること

データのどのポイントをフォーカスするかが非常に重要です。

なぜなら、あれもこれも付け足すと情報量が多くなり、結局パッと見で良く分からないものになるからですね。

よって、データから何を自分は知りたいのか、あるいは読み手に伝えたいのかを整理し、その部分を比較またはビジュアル化しましょう。

なお、その際にフォーカスを絞る際の観点の代表的なものは以下の4つです。

  1. 実数の大小
  2. 比率の大小
  3. データのトレンド
  4. データのばらつき

それぞれのイメージは、以下の通りです。

これら4つの観点は組み合わせても良いですが、多くても1つの表やグラフ内には2つくらいにした方が無難ですね。

情報量が多くなりそうな場合は、表やグラフを分けて1つあたりの情報量はなるべく少なくすると読み手の負荷が減るのでおすすめです。

主要なExcel機能

Excelでのデータ可視化に役立つ機能はポイント別に以下の通りです。

  • POINT1】データの良し悪しの判定:関数(IFANDOR等)、マクロ(VBA
  • POINT1】相対的な基準値の算出:関数(AVERAGEMEDIANRANKPERCENTRANK等)、マクロ(VBA
  • POINT2】データのビジュアル化:条件付き書式、スパークライン、グラフ(ピボットグラフ含む)、マクロ(VBA

少なくともIF等の関数や条件付き書式、グラフはセットで覚えておくと良いですね。

ちなみに、データのビジュアル化を行う際、グラフが基本になりますが、表のサイズが大きい時は条件付き書式で表自体をグラフ化、あるいはヒートマップにした方が分かりやすい場合もあるため、データによって使い分けてみてください。

その他、「データ可視化」に関する個別テクニックについては、以下カテゴリーへ順次記事を更新していきます。

必要に応じてご参照ください。

「多次元分析」の運用上のポイントと主要なExcel機能とは

データの可視化まで行うと、データ上の問題点あるいは気になる部分が出てくるものです。

こうした場合、原因や理由を調べるためにデータをさまざまな切り口や軸(=多次元)で再集計していきます。

こうした分析手法のことを「多次元分析」と言います。

ぜひデータ可視化とセットで行いましょう。

運用上のポイント

この多次元分析の主な手法は以下の4つです。

  1. ダイシング:別の条件に切り替えること
  2. ドリルダウン:下の階層の条件を追加すること
  3. スライシング:特定の条件で絞り込むこと
  4. ドリルスルー:該当の詳細レコードを確認すること

それぞれのイメージは以下の通りです。

データの切り口の数だけ、上記の手法を組み合わせることで多角的な分析を行うことが可能となります。

なお、基本的には全体→詳細というように階層の大きいレベルから段階的にレベルを下げていくと効果的です。

主要なExcel機能

Excelでの多次元分析に役立つ機能は以下の通りです。

  • 関数(SUMCOUNTASUMIFSCOUNTIFS等)
  • ピボットテーブル
  • パワーピボット
  • マクロ(VBA

元データがワークシート上にあるなら関数かピボットテーブル、データモデルの場合はパワーピボットを使います。

特に、切り口が固まっていない場合、集計表(レポート)の条件の自由自在に切り替えできるピボットテーブルとパワーピボットが非常に強力です。

逆に、切り口を固定できるのであれば、関数を予めセットしておくことでも対応できます。

その他、「多次元分析」に関する個別テクニックについては、以下カテゴリーへ順次記事を更新していきます。

必要に応じてご参照ください。

「統計分析」の運用上のポイントと主要なExcel機能とは

分析を進めていると、特定のデータ間の関係性を調べたいケースが出てきます。

例えば、「売上の増減と連動しているデータは何か」や「売上増加に影響するデータは何か」といった内容です。

これらを調べる際、統計学の手法を用いた分析(=統計分析)を行うと良いです。

ちなみに、先の例の前者は「相関分析」、後者が「回帰分析」で求めることができます。

運用上のポイント

統計学の範囲は広いですが、Excelでもその中のいくつかの手法に対応した機能が用意されています。

ただし、すべてを覚える必要はありません。

  • 職場ですでに使っている手法
  • 数値の意味を自分が自信を持って読み手へ説明できるもの

こうした手法に絞らないと、特に組織の仕事では承認者に承認もらえないことがほとんどです。

分析の目的はあくまでも意思決定するための材料集めのため、マニアックな分析に陥らないようご注意ください。

なお、個人的には相関分析と回帰分析の2つは覚えておくと良いと思います。

それぞれデータ間の以下の関係性を調べることが可能です。

  • 相関分析:データ間の「相関関係」を定量的に調べるもの
  • 回帰分析:データ間の「因果関係」を定量的に調べるもの

実務で使ってみたい方は、まずは比較的とっつきやすい相関分析から学ぶと良いでしょう。

主要なExcel機能

Excelでの統計分析に役立つ機能は以下の通りです。

  • 関数(CORREL等)
  • グラフ(散布図)
  • 分析ツール(相関、回帰分析等)
  • マクロ(VBA

Excelには「分析ツール」という統計分析用のツールがあります。

分析ツールはアドインを設定すれば無料で使えますので、基本的にはこちらをメインで活用すると良いでしょう。

なお、基本的には散布図とセットで使うとデータの異常値(=外れ値)に気づきやすくなるため、おすすめです。

その他、「統計分析」に関する個別テクニックについては、以下カテゴリーへ順次記事を更新していきます。

必要に応じてご参照ください。

「予測分析」の運用上のポイントと主要なExcel機能とは

実務では、現状をまとめるだけでなく、未来に向けてどうなるか、あるいはどうしていくべきかを数値で語ることが必要なケースがあります。

例えば、集めた実績データの傾向を元に今後の予測値を算出する、あるいは目標達成から逆算し、特定のパラメータの最適値を求める等ですね。

こうした場合に行う分析を「予測分析」と総称します。

運用上のポイント

Excelには簡易的に将来のシミュレーションや、最適な値を求めるための機能は用意されています。

イメージは以下の通りです。

ただし、それらを活用する大前提として、「現状を示すデータ」が十分あるかが非常に重要です。

例えば、業務量を試算したいなら繁閑の月や週、日、時間帯の影響が適切に含まれたものでないといけませんし、売上を試算したいなら、売上増減の特殊要因があればそれを加味あるいは除外するといった考慮も必要でしょう。

この辺りの前提を整えないと、せっかく算出した数値は机上の空論に過ぎず、誤った意思決定を誘発してしまうので注意が必要です。

また、統計分析と同じく、組織で行う仕事においては、算出ロジックを説明できないと承認されない可能性も高いため、自分で説明できる手法を選ぶと良いでしょう。

主要なExcel機能

Excelでの予測分析で役立つ機能は作業別に以下の通りです。

  • 将来予測:数式(四則演算)、関数(FORECAST等)、グラフ(散布図+近似曲線)、分析ツール(回帰分析)、予測シート、マクロ(VBA
  • 最適値の逆算:数式(四則演算)、ソルバー、ゴールシーク、マクロ(VBA

個人的には、組織での仕事が多いため、いずれも数式(四則演算)で対応できる範囲で対処しています。

個人レベルの仕事で参考値をさっと算出したいのであれば、将来予測は予測シート(Excel2016以降で使用可能)、最適値の逆算はソルバーかゴールシークが便利でしょう。

その他、「予測分析」に関する個別テクニックについては、以下カテゴリーへ順次記事を更新していきます。

必要に応じてご参照ください。

さいごに

いかがでしたでしょうか?

データ分析は、ビジネス上の意思決定へ直接影響するプロセスのため、分析結果の「精度」と「分かりやすさ」の2点が非常に重要です。

この記事で役立ちそうな機能が見つかれば、ぜひその機能を詳しく調べ、実務で試してみてくださいね。

なお、データ分析に役立つ機能は、私の拙著でも体系的に解説していますので、こちらも参考にしてみてください。

ご参考になれば幸いですm(_ _)m

森田森田

分析はもっとも手法が幅広く、組織によって求められるレベル感もばらつきが大きいため、最も難しいプロセスかもしれませんね。
(本記事の分析の区分けも私の主観で分類しています)

個人的には、データサイエンティストでない限り、データ可視化+多次元分析までできれば十分かなと思います。

私の経験上、統計分析や予測分析は計算が難しすぎると読み手に伝わりにくく、手戻りが多くなる印象だからです。
よって、分析結果はなるべくシンプルにすることを心掛けていきましょう。