AIがスモールビジネスでの最強アシスタントになっている件【スモビる #8】

私の実務レベルでAIが自然に優秀なアシスタントとして活躍しているので、Podcastにて3つほど実例をお話ししました。

このイラストは、BingのImage Creator(画像生成AI)にて「優秀なAIのおかげで、PCを使用した業務が楽になり、喜びの涙を流す日本人男性。ピクセルアート。」という指示文で生成されました。

※本編でご紹介した活用方法やプロンプトのリスト→https://bit.ly/3MVakru

各配信サービスでもお聴きいただけます

GPT-4による要約

このポッドキャストでは、シララ株式会社の伊東宏之が、スモールビジネスでAI技術を活用する方法について話しています。特に、ChatGPTとOpenAIのWhisperを使用している点に焦点を当てています。伊東氏は、ファクト収集、原稿の校正、音声の文字起こしの三つの作業においてAIの利用を紹介しています。

  1. ファクト収集: ChatGPTのプラグイン、特にScalar AIを使用して世界中の論文を検索し、日本語で概要を得る方法を説明しています。また、Ask Your PDFプラグインを使用してPDFファイルから情報を抽出する方法についても言及しています。
  2. 原稿の校正: ChatGPTを利用して原稿の校正を行い、特にビフォーアフターとその理由を明確にすることの重要性を強調しています。また、誤字・脱字のチェックや差別的な表現の有無の確認もAIを用いて行っていることを紹介しています。
  3. 音声の文字起こし: OpenAIのWhisperを使った音声の文字起こしについて話しており、このAIがmp3や動画ファイルの文字起こしを可能にすることを強調しています。ただし、複数の話者がいる場合には人間の手が必要であることを述べています。

伊東氏は、これらのAI技術を使うことで、スモールビジネスにおいてコストを抑えながら高品質な仕事ができるようになったと語っています。また、リンクやプロンプトの例を概要欄に掲載しており、リスナーに実際に試してみることを勧めています。

文字起こしテキスト全文(LISTENを基に編集)

このポッドキャストでは、スモールビジネスやその周辺のカルチャーについての話題をお届けしていきます。
再生ありがとうございます。
Webディレクションと音源制作を手掛ける、シララ株式会社の伊東宏之です。
今回は、私のようなスモールビジネスをやっている人間にとって、
完全に普段の実務レベルで、AIが最強のアシスタントになっているということについてお話します。
うちの会社は、Webに関連したコンテンツの制作業務や、マーケティングも絡んだ業務が結構多いです。
その中で、実務としてのAI、特にChatGPTがかなり活躍してくれているので、
今日はそのうちの3つの作業についてご紹介したいと思います。
1つ目は、ファクト収集。2つ目は、原稿の校正。
3つ目は、これはですね。
僕はちょっと革命的だなと思ってるんですけれども、音声の文字起こしについてです。
この3つ目だけは、ChatGPTではなくて、同じOpenAI社のWhisperというAIを使っています。
ちなみに、概要欄にもですね、プロンプトの例を掲載したリストへのリンクを載せておきますので、ぜひご参照ください。
では、早速1つ目なんですけれども、ファクト収集についてお話ししたいと思います。
マーケティング上で、何か仮説を立てる際、もちろんその根拠となるファクトがないと、やっぱり意味をなさないわけですよね。
そのファクトがあった上で、初めてウェブで言えば、設計とかデザインとか、制作物に落とし込めて、なんでこういうものを作ったのかっていうのを説明ができるわけですよね。
その根拠としてですね、過去の研究や論文を探したい時もあるわけなんですけれども、
それはChatGPTのプラグインを併用すれば、
簡単に探せるんですよね。
これはですね、Scalar AIというプラグインがおすすめで、
これを使うと世界中の論文を探して、しかもその概要をですね、日本語でちゃんと教えてくれるっていう、非常に優秀なプラグインだろうので、これを結構よく使っています。
あるいは、すでに長々とした論文のPDFを見つけている場合もあったりしますよね。
この場合は、Ask Your PDFっていうプラグインを使えば、
そのPDFの中身を読み解けます。
こうやって、さらにポイントを抜き出してもらうっていう使い方もできるので、めちゃくちゃ楽になります。
例えばですね、「このリンク先のPDFについて要約してください。
特にどのような調査と対象者で、どのような結果が得られたのかという点が知りたいです」みたいなプロンプトで依頼するわけですよね。
これで即答してくれるので、すごい優秀なアシスタントを雇っているような気分になるんですよね。
あとは、最近、ファイル添付が容易になったので、
ExcelファイルかCSVをアップロードして、
例えば、Webサイトの会員データを匿名性の高い形に加工してアップロードして傾向を見てもらうとか、
そういうことに結構活用できていますね。
処理がやっぱりどうしても重くなりやすいんですけれども、
直近での僕の実例だと、8万人分ぐらいのデータをどうにか切り口を工夫することでうまく分析してくれました。
ポイントとしては、
分析であまり大事そうじゃない項目はバッサリ切ってデータ自体を軽くするということと、
一度に依頼の切り口をたくさん依頼しないでシンプルにするということで、
割とうまくいきました。
スモールビジネスでやっぱりコストをかけて、
例えば外部のデータサイエンティストとかマーケターに依頼できない局面っていうのが結構多いじゃないですか。
なので、そういうときにそこまで求めると、
そういうときにそこまで求めると、
そういうときにそこまで求められないような要件とか状況であれば、
優秀なアシスタントとしてこうやって振る舞ってくれて、
それなりの示唆を与えてくれるっていう、
めちゃめちゃ役に立ってますね。
2つ目なんですけれども、2つ目は原稿の校正です。
これは本当にさっきからも役に立っているしか言ってない気がするんですけども、
役に立っています。
ポイントとしては、
ビフォーアフターを分かるようにして、
その理由をはっきりと述べてほしいというふうに依頼することが重要かなと思います。
そうしないと、どこを直して、
何で直したのか、
さっぱり分からない回答が結構返ってくることが多いので、
なので、ビフォーアフターと理由を明確にしてくださいっていう依頼をするのが大事かなと思います。
あとは当然ですけど、
誤字・脱字チェックをするように明確に依頼するとか、
あと最近はですね、
ヘイトスピーチにあたるようなことをしていない方は、
差別的な表現がないかとか、
これもですね、
私としては結構重要なので、
依頼文の中に書くようにしています。
これも、
概要欄にリンクを貼っておきますので、
ご確認ください。
あとですね、
これはちょっとした遊びみたいな部分でもあるんですけれども、
構成後に、
文章のクオリティが高かったか低かったかっていう観点で、
100点満点で何点だったかっていうのを点数化して、
好評をお願いしますっていうふうにプロンプトにして、
こういうふうにちょっとプロンプトに付け加えているんですね。
そうすると、
やっぱりですね、
ガチのプロのライターさんの原稿っていうのは、
高得点をもらうことが多いんですよね。
逆に、
そういう書くお仕事ではない方の原稿を読ませると、
そこそこ辛辣な好評を得たりすることもあるので、
結構面白いなと思うし、
やっぱりかなり参考になるなと思って見ています。
3つ目なんですけれども、3つ目は、
音声の文字起こしですね。
ChatGPTと同じオープンAI社が提供している、
Whisperという音声の文字起こしAIを、
最近、私の仕事としては使うことが結構出てきました。
まず、ちょっと手間はかかるんですけれども、
自分のPCのローカル環境で動かせるようにするんですよね。
例えば、
疑似録とか、
取材したときのmp3をデスクトップに置いておいて、
それを読み込んでもらうと。
これ、マシンパワーに依存するとは思うんですけれども、
大体、実物の尺と同じぐらいの時間を待てば、
テキスト化してくれるんですよね。
さらに、精度も自由に選べて、
Tiny、Small、Medium、Large、
みたいな感じで4段階かな、
書き起こしてくれるんですけれども、
やっぱり、Tinyだと早く接してくれるし、
当然、Largeだと時間もかかるんですが、
結構、Smallとかでも、
そこそこいい感じに書き起こしてくれるんですよね。
あとは、動画ファイル、MOVとか、MP4とかも扱えて、
これを知ったときは、本当にすげえなと思います。
MP3じゃなくて、ちゃんと動画ファイルでも、
文字起こし、書き起こしをしてくれるという。
ローカルで作動されるのって、
やっぱり、ちょっと導入が大変な方もいると思うんですけれども、
オンラインで、今のところは無料で、
やってくれるサービスも複数出ては、
消えたりはしている感じなので、
その辺も、セキュリティが気にならないようなデータなら、
試していただくといいかもしれないなと思いました。
例えば、writeout.aiとかが有名なのかなと思います。
この辺のサービスは、やっぱりすぐ消えちゃったりとか、
最初無料でも、すぐ有料化になったりもするので、
あと、運営元が誰なのか、
ちょっとわからないところもあったりするのもあるので、
参考程度としてお伝えしておきます。
精度も、多分オンラインのやつは、
特に無料とかだったりすると、
おそらくLargeとかじゃなくてTinyという、
一番軽い、精度が低いモードでやってるんじゃないかな、
とか思ったり、
あと、多分当然動画も扱えないんじゃないかな、
とか思います。
あと、この文字起こしでちょっと思い出したんですけど、
奥の手としては、例えば動画だった場合は、
YouTubeに非公開の動画としてアップして、
Chromeのプラグインの、
YouTube Summary with ChatGPT & Claudeっていうやつかな、
これを使うと、字幕をテキスト化してくれるので、
それを使うのもアリかなとは思います。
字幕のテキスト化といっても、
そこそこ綺麗に、
文字起こししてくれる印象があります。
ただ、Whisperであろうと、
YouTubeの、
字幕の文字起こしであろうと、
やっぱり話者が2名以上いて、
書き分けるっていうことが、
今のところはできないんですよね。
なので、そのまま使えるかっていうレベル、
特にインタビューとかであれば、
そのまま使えるかって言われると、
そうではないし、
ちょっとね、やっぱり人間の手を入れる必要はあるんですけども、
仮に話者が1人で、明確なしゃべりをしていれば、
だいぶ文章として意味が、
あるレベルの書き起こしになっていることが多いです。
実際、私のこのPodcastも、
文字起こしは全部Whisperでやっていますので、
そう思うと、結構ね、
私はしゃべるのが下手なので、
後で自分で文字起こしデータを直してはいるんですけれども、
結構ね、1人のしゃべりで、
あと音声がクリアだったら、
まあまあ使えるものになりますね。
なので、いずれにしても、
手直しはしなきゃいけないので、
こちらの人間側の力量が問われるっていうのは、
まあ全く変わらないんですけども、
それでも、以前の状態、
例えばGoogle Docsとかで、
力技で書き起こすような、
音声を書き起こすような仕事ハックが、
昔あったと思うんですけども、
それとはもう比べ物にならないレベルで、
まあすげえなと思って、最近感動しています。
はい、というわけで、
今日はAIが実務レベルで優秀なアシスタントになっている例を、
まあ自分の仕事の範囲で、
恐縮なんですけども、お知らせしました。
ぜひ番組をフォローしていただけると、
大変励みになります。