文字数を指定し、一括で列内の各値から文字を抽出する方法[Power Query(パワークエリ)基礎]
AさんAさん

特定の列の最初の2文字分だけ抽出したいのですが、Power Query(パワークエリ)の場合、どうしたら良いですかね?

森田森田

その場合、Power Queryエディター上の「抽出」というコマンドが有効ですよ!

具体的な使い方について解説していきますね。

解説動画:【パワークエリ#6】データクレンジング基本テクニック13選 - 元データを綺麗にするための不備修正の作業を自動化する

この記事の内容は下記の動画でも解説しています。
コメント欄の「抽出」の時間の部分をクリックすると抽出の解説へジャンプできますよ!

はじめに

本題に入る前に、この記事がおすすめな方を挙げてみます。

  • 指定した文字数で各データからの抽出作業を自動化したい方
  • データ整形・加工の工程が複数あり、かつその作業が定期的に発生する方
  • Power Query(パワークエリ)の使い方を習得したい方

前提条件

この記事のテクニックを使うためには、以下の条件を満たす必要があります。

  • ExcelのバージョンはExcel2010以降(Microsoft365含む)が必須
  • Excel2010/2013ユーザーの場合、事前にMicrosoft社公式HPよりPower Query(パワークエリ)のダウンロードが必要(Excel2016以降は標準機能)
  • Power Query(パワークエリ)の概要を理解していること
    →まず、以下の記事で概要を把握することをおすすめします。

既存データの一部分のみ切り出したい場合は「抽出」が有効

実務では、作業内容によって元データの一部の文字が必要なケースがあります。

たとえば、番地まで入っている住所データのうち、都道府県情報だけほしいなどですね。

この場合、任意の部分を抜き取る作業をデータ抽出といいます。

データ抽出を行う際、次の2通りの方法があります。

  1. 文字数を基準に抽出する
  2. 特定の記号を基準に抽出する

本記事では1つ目の方法の解説です。(2つ目の方法は下記記事参照)

抽出する文字数を固定できる場合に文字数を基準に抽出する

次のような場合に、文字数を基準とした抽出が有効です。

上記は「先頭から2文字」という条件でしたが、逆に「末尾から●文字」や「●文字目から●文字分」を抽出するということも可能です。

ちなみに、Excelワークシートで文字数を基準とした抽出はLEFT関数・RIGHT関数・MID関数の利用が一般的です。

ただし、他のデータ整形作業とセットで行うなら、Power Query(パワークエリ)で行った方が、一連の作業手順を記録できて自動化できますよ!

では、Power Query(パワークエリ)での文字数を基準とした抽出の手順を確認していきましょう。

Power Query(パワークエリ)での文字数を基準とした抽出の手順

今回の前提として、抽出を行う対象テーブルはブック内にあり、事前にPower Queryエディターに取り込んでいる状態からスタートするとします。(ブック内のデータ取得について復習したい方は下記記事を参照)

今回は「先頭から2文字」という条件を例に解説していきます。

抽出は以下の2ステップとなります。

STEP1】リボン「変換」タブから「抽出」をクリック

まず、抽出元の列を選択(①)します。

これは、通常のワークシート上の操作と同じ感覚で問題ありません。

続いて、リボン「変換」タブをクリック(②)してください。

そして、「抽出」をクリック(③)し、「最初の文字」をクリック(④)します。

手順④は、末尾から抽出する文字数を指定したい場合は「最後の文字」、●文字目から●文字分を抽出したい場合は「範囲」を選択すれば良いですよ!

STEP2】「最初の文字を抽出する」ダイアログで抽出したい文字数を指定

「最初の文字を抽出する」ダイアログが起動します。

ダイアログ内へ先頭から何文字抽出したいかを数値で入力(⑤)したら、OK」ボタンをクリック(⑥)してください。

手順⑤は、末尾から抽出する文字数を指定したい場合は最後から何文字抽出したいかを数値で入力します。
●文字目から●文字分を抽出したい場合は、「抽出を先頭から何文字目で開始するか」と「そこから何文字分抽出したいか」の2種類を数値での入力が必要です。

「プレビュー」ウィンドウ上で抽出が確認できたらOK

「プレビュー」ウィンドウを見ると、無事手順①で指定した列の各データが、先頭から2文字分で抽出された文字へ上書きされていますね!

あとは、その他の処理を行い、任意の方法でデータを出力すれば完了です。

【参考】抽出した文字を別の列に表示することも可能!

リボン「変換」タブの「抽出」コマンドでは、抽出元の列を上書きしてしまう仕様ですが、別の列に抽出結果を表示したい場合もあると思います。

その場合は、リボン「列の追加」タブの「抽出」コマンドを使いましょう。

上記の手順②をリボン「列の追加」タブに置き換えるだけで、他の手順はまったく同じです。

ケースバイケースで使い分けてくださいね。

【注意】Power Query(パワークエリ)の「範囲」コマンドとMID関数の仕様は異なる

なお、このPower Query(パワークエリ)の「範囲」コマンドについて、注意が必要なのはMID関数とまったく同じ仕様ではないことです。

どういうことかというと、MID関数の場合、抽出の開始位置として指定した数値に該当する文字は抽出対象に「含まれる」仕様ですが、Power Query(パワークエリ)の「範囲」コマンドでは「含まれず」、その次の文字が抽出の開始位置となります。

どんなイメージか、以下の図を見ると理解しやすいですね。

つまり、Power Query(パワークエリ)の「範囲」コマンドを使う場合は、「MID関数よりも開始位置を1文字少なくしないといけない」ということを覚えておいてください。

慣れるまでは「プレビュー」ウィンドウで、思い通りの作業結果になったかを確認すると良いですね。

【参考】抽出条件を変更したい場合は

もし、あとで抽出条件を変更したい場合は、「クエリの設定」ウィンドウの任意のステップをダブルクリック、もしくは歯車マークをクリックしましょう。

すると、再度STEP2の「最初の文字を抽出する」ダイアログ(「最後の文字を抽出する」ダイアログ/「テキスト範囲を抽出する」ダイアログ)が文字数の入力された状態で起動します。

あとは、文字数を入力し直して、再度「OK」ボタンをクリックすれば良いですね。

サンプルファイルで練習しよう!

可能であれば、以下のサンプルファイルをダウンロードして、実際に操作練習をしてみてください。

サンプルファイル_PowerQueryデータ整形_抽出_文字数.xlsx

※サンプルファイルのダウンロードには無料メルマガに登録いただく必要があります。
(上記リンクから登録フォームへ遷移します)

ファイルを開いたら、文字数での抽出を行う前に、Power Queryエディターを起動させてくださいね。
ブック起動時、「セキュリティの警告」メッセージが表示された場合は「コンテンツの有効化」をクリックしてください。

  1. リボン「データ」タブをクリック
  2. 「クエリと接続」をクリック
  3. 「社員マスタ(抽出_文字数)」クエリをダブルクリック

ここまで準備ができたら、次の手順を実施してください。(今までの解説のまとめです)

  1. 抽出元の列を選択
  2. リボン「変換」タブをクリック
  3. 「抽出」をクリック
  4. 「最初の文字」をクリック
  5. 先頭から何文字抽出したいかを数値で入力
  6. OK」ボタンをクリック

本記事の解説と同じ結果になればOKです!

さいごに

いかがでしたでしょうか?

抽出はPower Query(パワークエリ)における基本中の基本のテクニックです。

後々のデータ集計や分析のために、抽出しておくことが必要なケースも実務では頻繁に発生しますので、ぜひ覚えておいてくださいね。

なお、Power Query(パワークエリ)の各種テクニックは、私の拙著でも体系的に解説していますので、こちらも参考にしてみてください。


ご参考になれば幸いですm(_ _)m

森田森田

抽出に関して、Excelには機能・関数など、あらゆる方法で実現する手法があります。

ただ、Power Query(パワークエリ)の方がお手軽に複数工程を自動化でき、非常に便利ですよ!

私自身も実務で抽出を行う機会はめちゃくちゃ多いので、同じように多く抽出される機会がある方は、ぜひPower Query(パワークエリ)での抽出テクニックにチャレンジしてみてくださいね!