行政の【難読パワポ】を効率よく読むために、AcrobatのAI機能が超便利だった

※この記事はアドビさんのPR企画「みんなのAI活用」に参加して執筆しています。

ここ2年ほど、ポッドキャスト(Podcast)に挑戦しています。
まさに自社がマイクロ法人であるからこそ強く惹かれている「スモールビジネス」をテーマに、不定期ながらポッドキャスト配信に取り組んでいるのです。
今回は、その取り組みにあたって、生成AIがナイスなサポートしてくれるという話題をお届けします。
ポッドキャストの収録では、収録前の事前準備、特に参考資料の読み込みが大変なのですが、生成AIがそこを上手く助けてくれる存在になりました。

Podcast収録のイメージ

そもそも、なぜポッドキャストを始めたのか?

生成AIがどのようにポッドキャストの配信を助けてくれているのかを語る前に、そもそも、私がなぜポッドキャストを始めたのかの理由を少し語らせてください。
自営業って、言うまでもなくすべて自己責任ゆえに、自由度だけは高いですよね。
朝の気分ひとつで「今日は仕事しねえ!」と決めて布団から出ずにネトフリを鑑賞してもOK。寝転んでいることのシラを切りながらZoomに参加するのもよし。責任が取れるならば。

不朽の名作と言っても過言ではない、ジャルジャルによるYouTubeの人気コント。

それゆえに自己管理、ひいては自己研鑽を意識的に続けていかないと、あっという間に堕落してしまいます。
そんな堕落を回避することも1つの目的として始めたのがポッドキャストなのです。
理由をもっと詳しく言えば、以下のようになります。

  1. 「話したいテーマについて調べる」→「話すためには、事実と意見を整理して言語化する必要がある」その一連の流れが自然と自己研鑽へとつながると感じた。
  2. 音声メディアに将来性を感じていた。アメリカと比べて日本では音声メディアの認知度・利用度がまだまだ低く、伸びしろがある(注1)。そのため、この段階で始めておきたかった。
  3. ポッドキャストなら人前に出ることが苦手な人でも配信しやすい。顔を出さず一人で収録できるので、ストレスなく続けやすい。
注1:日本のデジタル音声広告の草分けであるオトナル社のレポート「PODCAST REPORT IN JAPAN Survey of Podcast Usage in Japan #5」にて日本の月間利用率が17.2%と記載。
https://otonal.co.jp/en/download-list/podcast-report-in-japan05.html
コンテンツマーケティングに特化した米国WebメディアBacklinkoの記事「Podcast Statistics You Need To Know」にて米国は12歳以上の人口の55%が少なくとも月に1回はポッドキャストを聴いているという記述あり。
https://backlinko.com/podcast-stats

ポッドキャストならではの「ニッチの海」が心地良い

ポッドキャストは「ニッチの海」である、という言説があります(注2)。
本格的な放送設備や人員はなくても発信できるという手軽さによって、商業ベースでは成り立ちにくいマニアックな番組が無数に生み出されている、ということがこの背景にあるようです。
そしてそこには、どれだけニッチでも良いという、ある種の”ゆるさ”もあります。
結果として私のポッドキャストは、現時点でのべ1500人ほどの方が聴いてくださっておりますが、これはもちろん多い数字ではありません。しかし、その中で1人、2人が共感してくだされば配信者側としては十分に価値を感じます。聴覚経由のメディアは、親しみや共感を得やすいという効果があるようで(注3)、そういった他メディアでは得られない深度が魅力なのです。
さらに言うと、ポッドキャストで稼いでいる国内の配信者はほとんどいないはず。
海外ではスタープレイヤーも存在しますが、前述のように日本はまだまだこれからというフェーズ。
つまり、カリカリと収益を追うような状況ではありません。それらが総合的に好ましく、ちょうど良いと感じています。

注2:オトナル社によるポッドキャスト「”ニッチの海”で伸びる運用型音声広告。2023最新の米ポッドキャストレポート考察」にて3:50から言及。
https://otonal.co.jp/blog/27738
注3:“オーディオメディアは、視覚を伴わないことで話者の声が直接リスナーに届き、リスナーが話者をより近く感じやすい” と指摘する論文がある。
— Hoover, J. Come Close and Listen: Exploring the Intimacy of Audio Media. University of Mississippi, 2022.
https://egrove.olemiss.edu/cgi/viewcontent.cgi?article=3570&context=hon_thesis

ポッドキャストの収録準備、しんどすぎる問題

さて、ここからが本題です。
このポッドキャストでは、私と同じマイクロ法人やフリーランス、小さなお店を経営されているリスナーを想定し「スモールビジネス展開のヒント」をシェアしようとしています。
ヒントを得るには、市場や顧客層を知るための人口動態や地域の経済環境といったオフィシャルなソースが欠かせません。
ただ、そのソースとなる資料の読み込みがけっこう大変で……特に行政による内容の堅いPDF資料が強敵なんです。
ふんふん、と読み進めてはみたものの、最後のページに達した時に「なるほどわからん」となることが多々あります。私の能力の問題でもありますが。
そもそもそういった読み解きの苦労は、ポッドキャストに限らず資料を扱うすべての人類に共通した課題かもしれません。

心が折れかけた、財務省による「箱寿司PDF」の読解

私は以前、財務省が2024年に発表した「成長、人口・地域等」という資料を読み解いてポッドキャストで紹介したことがあります。
国が出した硬くて怖いレポートをサマった【スモビる! #17】

興味深い資料なのですが、これがまた「霞が関パワポ」とも称される、1枚ごとに情報がこれでもかと詰め込まれている難読フォーマットによるものなのです。
四角い箱に美味しさがみっちみちに詰め込まれているという意味で、大阪名物・箱寿司みたいですね。
ポッドキャスト用原稿の作成のために、この箱寿司のようなPDFを咀嚼、というか読解をしていると、途中で何度もお腹がいっぱいになりました。

財務省「成長、人口・地域等」
財務省「成長、人口・地域等」より。これを1枚に詰め込む執念と職人芸を感じる。しかも全52ページ。
大阪名物の箱寿司。四角い寿司がギチギチに詰め込まれている
Adobe Fireflyで画像生成した箱寿司。プロンプトは「大阪名物の箱寿司。四角い寿司がギチギチに詰め込まれている」。まさに行政の資料はこの箱寿司のような見映えです。

そんな時こそ、AIの出番でしょ!

RAG(Retrieval-Augmented Generation:検索拡張生成)によるAIの登場が、そんな難読資料との戦いに光を差し込んでくれました。
このRAGは、大規模言語モデル(LLM)が回答を生成する際に、外部から関連情報を検索・参照して、回答精度と信頼性を高める技術です。
これが応用されたAIツールとして、Google NotebookLMや後述するAdobe Acrobat AIアシスタントがその代表格だといえるでしょう。
極論をいえば、分厚いマニュアルを1文字も読まずに、知りたいことをチャットで質問するだけで済ませてしまうことだってできます。
そんな超・実用ツールであり、小難しい資料を読み解く際の強力なアシスタントになるわけです。
これまで単調だった資料の読み解きにおいて、チャットによる対話が加わることで、新たなアイデアやヒントを得られたり、孤独な作業が少し和らいだりする効用も期待できますね。

実験!Acrobat AIアシスタントで資料の読解がどのくらい楽になるか?

では、Acrobat AIアシスタントを使って、前述の財務省「成長、人口・地域等」に関する読み解きを手伝ってもらいましょう。

情報量がすごい、霞が関パワポ
図表も含めてすごい情報量のPDF。AIはどれくらい読み解いてくれるだろうか?

まずは、こんなプロンプトを送ってみました。

プロンプト
主題の1つである「成長」に関して要約してください。

すると、以下のような回答が。

回答
  1. 労働生産性の向上
    日本の労働生産性は1990年代後半以降低下傾向にあり、特に無形資産(ソフトウェアや人的資本など)の資本装備率が低いことが課題とされています。生産年齢人口の減少を背景に、労働生産性の向上が不可欠であり、民間企業による無形・有形の投資を促進する必要があります。
  2. 民間主導の経済成長
    2000年代以降、日本企業の投資が低迷し、資本の平均年齢が上昇しているとの指摘があります。今後は人材への投資を含め、民間主導の経済成長を実現することが求められています。
  3. 労働市場改革
    「リ・スキリング」「職務給の導入」「成長分野への労働移動の円滑化」を柱とした「三位一体の労働市場改革」を推進し、構造的な賃上げと企業の生産性向上を目指しています。
  4. 産業政策
    気候変動問題や経済安全保障環境の激化を背景に、各国で産業政策が強化されています。日本も半導体産業への支援など、国力を前提とした大規模な取り組みを行っていますが、民間の予見可能性を高める中長期的な戦略が必要です。
これらの取り組みを通じて、持続的な成長と経済の活性化を目指しています。

回答のボリュームは指定しませんでしたが、ほどよく簡潔な要約を示してくれました。ただ、元となる資料の文章が堅いので、要約してもらったところでそれは変わりません。私レベルだと、まだ「なるほどわからん」状態です。

適度な長さの文章で回答するAcrobat AIアシスタント
文章量を指定しなくても適度な長さでサマリを提示。賢さを感じる。

そこで、試しに今度はこんな問いかけをしてみました。

プロンプト
めちゃくちゃくだけた口語で主題の1つである「成長」に関して要約してください。
回答

OK!「成長」についてざっくり言うとこんな感じ!

  1. 働き方もっと効率よくしようぜ!
    日本の働き方、ちょっと効率悪いよね。特にソフトウェアとか人材育成が弱いから、もっとそこに力入れて生産性上げていこうって話。 ​
  2. 会社がんばれ!
    日本の会社、投資がイマイチで古い設備使い続けてるっぽい。だから、もっと人とかモノに投資して、会社が中心になって経済を盛り上げていこうってこと。 ​
  3. 働き方改革でみんなハッピーに!
    スキルアップしたり、仕事に合った給料もらえたり、成長してる業界にスムーズに転職できる仕組みを作って、みんながもっと稼げるようにしようって感じ。
  4. 産業をガチで応援!
    世界中で気候変動とか安全保障がヤバいから、日本も半導体とか重要な産業にめっちゃお金かけて応援してる。 ​でも、ちゃんと先のことも考えてやらないとねって話。 ​
こんな感じで、働き方とか会社とか産業をもっと良くして、日本の経済を元気にしようぜ!っていう内容だよ!

おお、これは分かりやすい!
Acrobat AIアシスタント氏が突如高めのテンションに切り替わりつつ、相変わらずほど良いボリュームの要約をしてくれました。まずは全体像をサッと知るという目的にピッタリで、これぐらいカジュアルなら読解の負荷もグッと下がりますね。
しかもよく見ると、熟語・専門用語も減らしてくれており、配慮が感じられます。
難しい文書の概要を理解するには”くだけた口語”という指定を入れると良い、というハックが得られました。

くだけた口調で回答するAcrobat AIアシスタント
がんばってテンションを上げてくれたAcrobat AIアシスタント。その豹変ぶりに、おじさんが突然若者のパーティーに乱入し「盛り上がろうぜ!」とハッスル(死語)してる姿が脳裏をよぎった。どうであれ分かりやすいのは正義。

【良いところ その1】UI(ユーザーインターフェース)がいい

使用感に大きく影響するのが、UIの善し悪しですよね。
Acrobat AIアシスタントは左側の約3分の2がPDF表示エリア、右側の約3分の1がAIエリアでチャットを表示するという構成で、これはシンプルかつよく練られていると感じます。
これにより、PDFの内容を目視しながらチャットで深掘りができるというわけです。
自然に使ってると気がつきにくいですが、他のRAGだと、この「見ながらチャット」ができなかったりします。
さらにAIの回答にはソースとなる個所へのリンクが貼られており、クリックすれば即座にPDF表示エリアに該当箇所を表示。このスピード感やダイレクト感が気持ち良いです。

AcrobatAIのUI
AIエリア内の番号をクリックするとそれに該当するスライドへと瞬時に移動。ストレスなし。

【良いところ その2】図表の読み取り能力も備えている

さらに、こういった資料につきものとなる、図表の読み取りも試してみます。
実はAcrobat AIアシスタントでは図表に何が書いてあるかも読み取ってくれるんです。

プロンプト
各国の人口の円グラフに着目せよ。パキスタンは2021年と2070年で何ポイントの差異が生じているか?
回答

2021年と2070年の円グラフを見ると、パキスタンの人口割合は以下の通りです:

  1. 2021年:2.9%
  2. 2070年:4.3%
したがって、差異は1.4ポイントです。

うん、完璧な回答ですね。

難読PDFの円グラフ
目視だと「パキスタンのデータはどこ?」となりそうだが、AIなら早い。

その優秀でそつがない姿に、私のいけず精神が刺激されました。
今度は目視で折れ線グラフをしっかり読み取り、推測しないと答えられないような問いを投げてみます。

プロンプト
ドイツと比べた日本の高齢者数の推移、および生産年齢人口の推移について特徴を簡潔に述べよ。
回答

資料によると、日本とドイツの高齢者数および生産年齢人口の推移には以下の特徴があります:

  • 高齢者数の推移
    日本:高齢者(65歳以上)の割合は2030年以降急増し、2070年には約38.7%に達する見込み。
    ドイツ:高齢者割合は日本より緩やかに増加し、2070年には約30%程度。
  • 生産年齢人口の推移
    日本:生産年齢人口(15~64歳)の割合は急速に減少し、2070年には約52.1%。
    ドイツ:生産年齢人口の割合は日本より緩やかに減少し、2070年には約60%程度。
  • 特徴
    日本は高齢化の進行が急速で、生産年齢人口の減少も顕著。
    一方、ドイツは高齢化と生産年齢人口の減少が比較的緩やかである点が特徴です。

すごい。読み取れていますね。
ただ、ドイツの生産年齢人口について「2070年には約60%程度」と答えているところだけ違っていて、実際のグラフ上では53%程度です。
とはいえ、おおむね正しいので、読み解きのアシストとして十分な役目を果たしているでしょう。
私のいけず精神も満たされましたし。

当時ポッドキャストの原稿を作る際にAcrobat AIアシスタントの力を借りていれば、体感値で50%ぐらい工数が削減できたんじゃないか?という気がしてきました。

難読PDFの折れ線グラフ
細かく数値が表示されていない折れ線グラフからも推測できる能力があると分かった。

AIによるアシスト感がちょうど良い

以上のことから、Acrobat AIアシスタントは、完全に何かを丸投げする系統のAIではなく、その名の通り、まさに”アシスト”に適しているツールだと感じます。あくまでも自分が問いを投げかける主体になりつつ、優秀なガイドによってインプットの吸収効率を上げるという、ちょうど良い流れが実現できるのです。
さらに、思いつくままに上記では書ききれない様々なテストをしたのですが、それを通じてAcrobat AIアシスタントならではの4つの魅力に気がつきました。

  1. 継続的な作業のしやすさ。一度生成された対話履歴がPDFごと、つまりドキュメント単位で保存される。他のRAGでは、過去の対話履歴が残らないものもあるが、Acrobat AIアシスタントはいったんファイルを閉じてからまた再開するのが非常にスムーズ。
  2. セキュリティ面の安心感。アドビは読み取ったPDFをAIの学習に使わないと宣言しているため(注4)、契約書や社内の機密文書にも使いやすい。
  3. 開くだけで全体把握。右側のAIアシスタントメニューを展開した時点で、なにも指示をしなくても自動的にPDFの内容を解析して、要約や主要トピックを提示してくれる。まずは全体像を知るのに超便利。
  4. 対応ファイルの柔軟性。Word、PowerPoint、テキストファイルを読み込ませるとAcrobatがPDFに変換してくれるため、実質的にPDF以外の多様なファイルで利用できる。
注4:公式Webサイトには「Acrobat 上での生成 AI とのやり取りと同時に、アドビがお客様のコンテンツで LLM をトレーニングすることはありません。」とある。
https://helpx.adobe.com/jp/acrobat/using/data-usage-and-handling.html

なお、Acrobat AIアシスタントは一定回数まで無料試用ができて、その後は有料となります。
Acrobat AIアシスタントをオンラインで試してみる

ここで立ち止まって考えたいことがあります。
たとえば人間の同僚を相手にこんな作業をタダでお願いする、あるいはそのボリュームが嵩んできた時に
「ランチに牛丼でもおごるからさ、今すぐこの資料の読解と説明をしてほしい。今後も24時間365日、私のタイミングで頼むわ」
などと声をかけることはできるでしょうか。
AIが相手なら、そのような奇行を重ねて職場で噂になるリスクがありません。

手に牛丼と膨大な資料を抱えた男性が、同僚に詰め寄る。同僚は困惑。
Adobe Fireflyで生成。二人ともいい表情です。プロンプトは「手に牛丼と膨大な資料を抱えた男性が、同僚に詰め寄る。同僚は困惑」

そしてこれはあくまでも個人的な感想ですが、RSSなどの枯れた技術で駆動するポッドキャストという「音声」を、最新のAI駆動による「テキスト」が裏で強力サポートしてくれるという構図がちょっと好きです。これを10年前に誰が予想できただろう?という軽いワクワク感を覚えます。

というわけで、Acrobat AIアシスタント氏に気兼ねなく、今後もバリバリと難読資料の読み解きをお手伝いしてもらう予定です。