大体でIT

-ちょっと使えるネタを紹介-

大体でIT

Excelのパワークエリで、PDFのデータをExcelに取り込むには、「ファイルから」→「ブックから」クエリを作成するとできます。ただ、デフォルトでは、PDFを選択できないので、ファイルの種類を「全てのファイル」にして、PDFを選択します。パワークエリを使って、データの取得と変換を効率化していきましょう。

はじめに

この記事では、パワークエリを使って、PDFのデータを取り込む方法について、ご紹介します。

PDFを取り込むには、「ファイルから」→「ブックから」クエリを作成します。

デフォルトでは、PDFファイルを選択できないので、ファイルの種類を「すべてのファイル」にして、PDFを読み込みましょう。

「複数ページ」のPDFでも、簡単に取り込むことができるので、便利です。

「複数のPDF」を取り込む場合は、それぞれのPDFからクエリを作成する必要があるので、ちょっと大変です。

「複数のPDF」を読み込みたい場合は、PDFソフトなどで、1つのPDFにまとめてから取り込むと簡単になります。

では、パワークエリを使って、PDFのデータを取り込む方法について、解説していきます。

この記事を読むメリット

  • パワークエリを使って、PDFのデータを取り込む方法がわかります。

本記事の内容を動画でまとめています

目次から見たい項目へ移動すると便利ですよ。

目次

パワークエリでPDFを取り込む

パワークエリで、PDFを取り込こんでみます。

やりたいこと

やりたい内容は、PDFのデータをExcelに取り込みたい、ということになります。

PDFをExcelに取り込みたい

こんなPDFのデータを取り込みたいです。

やりたい内容は、PDFのデータをExcelに取り込みたい、ということになります

こんな感じで、PDFのデータをExcelのテーブルに取り込みたいです。

こんな感じで、PDFのデータをExcelのテーブルに取り込みたいです

手順は、次のようになります。

手順

  • PDFからクエリを作成する
  • パワークエリでデータを整える
  • シートに読み込む

では、実際にPDFをExcelに取り込んでみます。

手動でコピペすると1列になっちゃう

ちなみに、手動でコピペすると1列になってしまいます。

PDFのテキストをコピーしてみます。

PDFのテキストをコピー

PDFのテキストをコピーしてみます

Excelに貼り付けると、1列のデータとなってしまいます。

1列になっちゃう

Excelに貼り付けると、1列のデータとなってしまいました

パワークエリを使えば、きれいにPDFを取り込むことができます。

では、やっていきます。

PDFファイルからクエリを作成する

「ブックから」クエリを作成します。

「ブックから」クエリを作成

「ブックから」クエリを作成します

ファイル形式を「すべてのファイル」にして、PDFを選択します。

ファイル形式を「すべてのファイル」にする

デフォルトでは、PDFファイルが表示されないです。

デフォルトでは、PDFファイルが表示されないです

ファイル形式を、「すべてのファイル」にします。

ファイル形式を、「すべてのファイル」にします

PDFファイルが表示されます。

PDFファイルが表示されました

PDFファイルが表示されました。

PDFを選択して、クエリを作成します。

PDFを読み込む

PDFファイルを選択して、インポートを選択します。

PDFファイルを選択して、インポートを選択します

パワークエリエディタで、PDFを「ダブルクリック」します。

パワークエリエディタで、PDFを「ダブルクリック」します

これで、PDFのデータからクエリを作成することができます。

PDFからクエリを作成できた

PDFのデータからクエリを作成することができました

PDFのデータからクエリを作成することができました。

パワークエリでデータを整える

パワークエリでデータを整えていきます。

「Page001」だけをフィルタします。

「Page001」だけをフィルタする

フィルタボタンをクリックします。

フィルタボタンをクリックします

「Page001」だけを選択して、OKをクリックします。

「Page001」だけを選択して、OKをクリックします

「Page001」だけでフィルタできます。

「Page001」だけでフィルタできました

不要な列を削除していきます。

不要な列を削除

Shiftを押しながら、不要な列を選択します。

Shiftを押しながら、不要な列を選択します

見出しのところで、「右クリック」します。

見出しのところで、「右クリック」します

右クリックメニューの中から、「列の削除」を選択します。

右クリックメニューの中から、「列の削除」を選択します

これで、不要な列を削除できます。

不要な列を削除できました

不要な列を削除できました。

データを展開していきます。

データを展開する

データの展開ボタンをクリックします。

データの展開ボタンをクリックします

そのままOKをクリックします。

そのままOKをクリックします

これで、データを展開することができます。

データを展開することができました

データを展開することができました。

1行目をヘッダーとして使用します。

1行目をヘッダーとして使用する

「1行目をヘッダーとして使用」を選択します。

「1行目をヘッダーとして使用」を選択します

これで、1行目をヘッダーにすることができます。

1行目をヘッダーにすることができました

1行目をヘッダーにすることができました。

ページの列はいらないので、削除していきます。

ページの列を削除

「Page001」の列で、右クリックします。

「Page001」の列で、右クリックします

右クリックメニューの中から、「削除」を選択します。

右クリックメニューの中から、「削除」を選択します

これで、ページの列を削除できます。

ページの列を削除できました

ページの列を削除できました。

シートに読み込む

作成したクエリをシートに読み込んでいきます。

シートに読み込む

「閉じて次に読み込む」を選択します。

「閉じて次に読み込む」を選択します

読み込み先を選択する画面が表示されます。

読み込み先を選択する画面が表示されます

「既存のワークシート」を選択して、参照ボタンをクリックです。

「既存のワークシート」を選択して、参照ボタンをクリックです

読み込み先を選択して、OKをクリックです。

読み込み先を選択して、OKをクリックです

「読み込み」をクリックします。

「読み込み」をクリックします

これで、クエリを、シートに読み込めます。

クエリをシートに読み込めた

クエリを、シートに読み込めました

クエリを、シートに読み込めました。

こんな感じで、パワークエリを使えば、PDFをExcelに取り込むことができます。

複数ページのPDFを読み込む

次は、複数ページのPDFを読み込こんでみます。

やりたいこと

やりたい内容は、複数ページのPDFをExcelに読み込みたい、ということになります。

複数ページのPDFを読み込みたい

イメージは、こんな感じです。

やりたい内容は、複数ページのPDFをExcelに読み込みたい、ということになります

最終的に、1つのテーブルにまとめたいです。

こんな感じで、1つのテーブルにまとめたいです

手順は、次のようになります。

手順

  • PDFからクエリを作成
  • パワークエリでデータを整える
  • シートに読み込む

1ページを読み込む方法とほとんど同じです。

パワークエリでデータの整える方法が少し違います。

では、やっていきます。

PDFファイルからクエリを作成

PDFファイルからクエリを作成していきます。

「ブックから」クエリを作成を選択します。

「ブックから」クエリを作成

「ブックから」クエリを作成します

ファイル形式を「すべてのファイル」にして、PDFファイルを選択します。

ファイル形式を「すべてのファイル」にする

デフォルトでは、PDFは表示されないです。

デフォルトでは、PDFは表示されないです

「すべてのファイル」を選択します。

「すべてのファイル」を選択します

これで、PDFファイルを選択できるようになります。

PDFファイルを選択できるようになります

PDFを読み込んでいきます。

PDFを読み込む

PDFファイルを選択して、インポートを選択します。

PDFファイルを選択して、インポートを選択します

パワークエリで、PDFファイルをダブルクリックします。

パワークエリで、PDFファイルをダブルクリックします

これで、複数ページのPDFから、クエリを作成することができます。

複数ページのPDFからクエリを作成できた

複数ページのPDFから、クエリを作成することができました

複数ページのPDFから、クエリを作成することができました。

パワークエリでデータを整える

パワークエリでデータを整えていきます。

まずは、「Page」だけでフィルタしていきます。

「Page」だけでフィルタ

フィルタをクリックします。

フィルタをクリックします

「Page」だけを選択して、OKをクリックです。

「Page」だけを選択して、OKをクリックです

「Page」だけでフィルタできます。

「Page」だけでフィルタできました

不要な列を削除していきます。

不要な列を削除

Shiftを押しながら、不要な列を選択していきます。

Shiftを押しながら、不要な列を選択していきます

見出しで「右クリック」します。

見出しで「右クリック」します

右クリックメニューの中から、「列の削除」を選択します。

右クリックメニューの中から、「列の削除」を選択します

これで、不要な列を削除できます。

不要な列を削除できました

不要な列を削除できました。

データを展開していきます。

データを展開する

データを展開するボタンをクリックします。

データを展開するボタンをクリックします

そのまま、OKをクリックします。

そのまま、OKをクリックします

これで、データを展開することができます。

データを展開することができました

データを展開することができました。

1行目をヘッダーとして使用します。

1行目をヘッダーとして使用

「1行目をヘッダーとして使用」をクリックします。

「1行目をヘッダーとして使用」をクリックします

これで、1行目をヘッダーにすることができます。

1行目をヘッダーにすることができました

1行目をヘッダーにすることができました。

不要な行を削除していきます。

不要な行を削除

不要な行を、フィルタして削除していきます。

不要な行を、フィルタして削除していきます

「名前」だけフィルタのチェックを外して、OKをクリックです。

「名前」だけフィルタのチェックを外して、OKをクリックです

これで、不要な行を削除できます。

不要な行を削除できました

不要な行を削除できました。

ページの列は不要なので、削除していきます。

ページの列を削除

「Page001」の列を、右クリックします。

「Page001」の列を、右クリックします

右クリックメニューの中から、「削除」を選択します。

右クリックメニューの中から、「削除」を選択します

これで、PDFファイルの複数ページを結合することができます。

PDFファイルの複数ページを結合することができました

PDFファイルの複数ページを結合することができました。

シートに読み込む

作成したクエリをシートに読み込んでいきます。

シートに読み込む

「閉じて次に読み込む」を選択します。

「閉じて次に読み込む」を選択します

読み込み先を選択する画面が表示されます。

読み込み先を選択する画面が表示されます

「既存のワークシート」を選択して、参照ボタンをクリックです。

「既存のワークシート」を選択して、参照ボタンをクリックです

読み込み先を選択して、OKをクリックします。

読み込み先を選択して、OKをクリックします

「読み込み」を選択します。

「読み込み」を選択します

これで、シートに読み込むことができます。

シートに読み込めた

シートに読み込むことができました

シートに読み込むことができました。

こんな感じで、複数ページのPDFからでも、Excelに取り込むことができます。

複数のPDFを読み込む

次は、複数のPDFを読み込むというのをやってみます。

やりたいこと

やりたい内容は、複数のPDFファイルをExcelに読み込みたい、ということになります。

複数のPDFを読み込みたい

イメージは、こんな感じです。

やりたい内容は、複数のPDFファイルをExcelに読み込みたい、ということになります

PDFの中身は、こんな感じになっています。

PDFの中身は、こんな感じになっています

最終的に、1つのテーブルに結合したいです。

最終的に、1つのテーブルに結合したいです

という感じです。

複数のPDFを一度に結合はできない

結論から言うと、複数のPDFを「一度に」結合はできないです。

ファイル毎にクエリを作成して、クエリをまとめていきます。

手順は、次のようになります。

手順

  • ファイル毎にクエリを作成
  • クエリを追加する
  • シートに読み込む

では、実際にやってみます。

ファイル毎にクエリを作成

ファイル毎にクエリを作成していきます。

まずは、1つ目のPDFからクエリを作成します。

「ブックから」クエリを作成です。

「ブックから」クエリを作成

「ブックから」クエリを作成します。

「ブックから」クエリを作成します

デフォルトでは、PDFのファイルは表示されないです。

デフォルトでは、PDFのファイルは表示されないです

ファイルの種類を「すべてのファイル」にして、PDFを選択します。

ファイルの種類を「すべてのファイル」にする

ファイルの種類を、「すべてのファイル」にします。

ファイルの種類を、「すべてのファイル」にします

PDFファイルが表示されます。

PDFファイルが表示されました

PDFを読み込んでいきます。

PDFを読み込む

1つ目のPDFファイルを選択して、インポートをクリックします。

1つ目のPDFファイルを選択して、インポートをクリックします

パワークエリエディタ内で、PDFファイルを「ダブルクリック」します。

パワークエリエディタ内で、PDFファイルを「ダブルクリック」します

これで、1つ目のPDFファイルを取り込むことができます。

1つ目のPDFファイルを取り込むことができました

1つ目のPDFファイルを取り込むことができました。

「Page001」のみをフィルタします。

「Page001」のみをフィルタする

フィルタする画面を開いて、「Page001」のみチェックを入れて、OKをクリックです。

フィルタする画面を開いて、「Page001」のみチェックを入れて、OKをクリックです

これで、「Page001」だけでフィルタすることができます。

「Page001」だけでフィルタすることができました

「Page001」だけでフィルタすることができました。

不要な列を削除していきます。

不要な列を削除

不要な列を「Shift」を押しながら、選択していきます。

不要な列を「Shift」を押しながら、選択していきます

見出しで、右クリックをします。

見出しで、右クリックをします

右クリックメニューの中から、「列の削除」を選択します。

右クリックメニューの中から、「列の削除」を選択します

これで、不要な列を削除できます。

不要な列を削除できました

不要な列を削除できました。

データを展開していきます。

データを展開する

データを展開するボタンをクリックします。

データを展開するボタンをクリックします

そのまま、OKをクリックします。

そのまま、OKをクリックします

これで、データを展開することができます。

データを展開することができました

データを展開することができました。

1行目をヘッダーとして使用します。

1行目をヘッダーとして使用する

「1行目をヘッダーとして使用」を選択します。

「1行目をヘッダーとして使用」を選択します

これで、1行目をヘッダーにすることができます。

1行目をヘッダーにすることができました

1行目をヘッダーにすることができました。

ページの列は不要なので、削除します。

ページの列を削除

「Page001」の列で、「右クリック」します。

「Page001」の列で、「右クリック」します

右クリックメニューから、「削除」を選択します。

右クリックメニューから、「削除」を選択します

これで、不要な列を削除できます。

不要な列を削除できました

不要な列を削除できました。

作成したクエリをシートに接続していきます。

シートに接続する

「閉じて次に読み込む」を選択します。

「閉じて次に読み込む」を選択します

読み込み先を選択する画面が表示されます。

読み込み先を選択する画面が表示されます

「接続の作成のみ」を選択して、「読み込み」を選択します。

「接続の作成のみ」を選択して、「読み込み」を選択します

これで、1つ目のPDFを、シートに接続することができます。

1つ目のPDFを、シートに接続することができました

1つ目のPDFを、シートに接続することができました。

2つ目と3目のPDFも同じように、クエリを作成してシートに接続していきます。

2つ目と3目のPDFも同じようにシートに接続する

同じように他のPDからも、クエリを作成していきます。

同じように他のPDからも、クエリを作成していきます

2つ目のPDFから、クエリを作成します。

手順は、1つ目のPDFと同じなので、省略します。

シートに読み込むと次のようになります。

2つ目のPDFから、クエリを作成しました

3つ目のPDfから、クエリを作成します。

こちらも、手順は1つ目のPDFと同じなので、省略します。

シートに読み込むと次のようになります。

3つ目のPDFから、クエリを作成しました

3つ目のPDFから、クエリを作成しました。

クエリを追加する

作成した3つのクエリを、「クエリの追加」でまとめていきます。

1つ目のクエリで、「ダブルクリック」をします。

パワークエリを開く

1つ目のクエリで、「ダブルクリック」をします

「クエリの追加」をして、3つのクエリをまとめていきます。

「クエリの追加」をする

1つ目のクエリを選択して、「クエリの追加」を選択します。

1つ目のクエリを選択して、「クエリの追加」を選択します

テーブルを追加する画面が表示されます。

テーブルを追加する画面が表示されます

「3つ以上のテーブル」を選択します。

「3つ以上のテーブル」を選択します

他の2つのクエリを選択して、「追加」をクリックします。

他の2つのクエリを選択して、「追加」をクリックします

クエリが追加されたら、OKをクリックです。

クエリが追加されたら、OKをクリックです

これで、クエリを追加して、3つのクエリを1つにまとめることができます。

3つのクエリを結合できた

クエリを追加して、3つのクエリを1つにまとめることができました

クエリを追加して、3つのクエリを1つにまとめることができました。

シートに読み込む

作成したクエリを、シートに読み込んでいきます。

「閉じて読み込む」を選択します。

「閉じて読み込む」を選択

「閉じて読み込む」を選択します

1つ目のクエリをシートに読み込みます。

1つ目のクエリをシートに読み込む

1つ目のクエリで、「右クリック」します。

1つ目のクエリで、「右クリック」します

右クリックメニューの名から、「読み込み先」を選択します。

右クリックメニューの名から、「読み込み先」を選択します

読み込み先を設定する画面が表示されます。

読み込み先を設定する画面が表示されます

「テーブル」を選択します。

「テーブル」を選択します

「既存のワークシート」を選択して、参照ボタンをクリックします。

「既存のワークシート」を選択して、参照ボタンをクリックします

読み込み先を選択して、OKをクリックです。

読み込み先を選択して、OKをクリックです

「読み込み」を選択します。

「読み込み」を選択します

これで、複数のPDFファイルを、1つのテーブルまとめることができます。

複数のPDFを結合できた

複数のPDFファイルを、1つのテーブルまとめることができました

複数のPDFファイルを、1つのテーブルまとめることができました。

こんな感じで、「複数のPDF」を取り込むのは、結構、大変です。

「複数のPDF」の場合は、PDFソフトなどで、「1つのPDFにまとめて」から、Excelに取り込むといいです。

おわりに

この記事では、パワークエリを使って、PDFのデータを取り込む方法について、ご紹介しました。

PDFを取り込むには、「ファイルから」→「ブックから」クエリを作成します。

デフォルトでは、PDFファイルを選択できないので、ファイルの種類を「すべてのファイル」にして、PDFを読み込みましょう。

「複数ページ」のPDFでも、簡単に取り込むことができるので、便利です。

「複数のPDF」を取り込む場合は、それぞれのPDFからクエリを作成する必要があるので、ちょっと大変です。

「複数のPDF」を読み込みたい場合は、PDFソフトなどで、1つのPDFにまとめてから取り込むと簡単になります。

参考になればと思います。最後までご覧くださいまして、ありがとうございました。

関連する記事から探す

カテゴリから探す

カテゴリから見たい項目を探すと便利ですよ。

サイト内を検索する

↓キーワードを入力する

アーカイブから探す