ChatGPTなどのAIを効率的に活用する方法について、私の意見を述べます。
ChatGPT自体はクリエイティブな領域から単純作業的な内容まで、幅広く活用できますが、抽象度の高いタスクを思ったように効率的に使うのは難しく、それゆえに様々な形でプロンプトの工夫が必要かと思います。小さいタスク(文章要約や、部分的なコード生成、調べ物など)については、検索エンジンのように利用できるので対象外として考えます。
実際に使っていると、色んな知見が得られたりしますが、なんとなくで使うと最終的に精度の高い行動や意思決定につなげるのは少し個人的に難しい印象を持ちました。(AIとのやりとりで時間を使ってしまい効率が悪い)
そこで、抽象度の高い目的・タスクを実行する際にはなるべくフレームワークで考えてそれに対してchat GPTやBing AIなどのAI系のサービスを使って結果につなげることを考えてみました。
フレームワーク
結論が以下のフレームワークです。考えたといっても単純で大したものではないです。
- ゴールを決める(AI活用)
- ゴールへのプロセスを分解する(AI活用)
- 各プロセスを逐次的に実行するか、並列実行できるかを確認する(AI活用)
- 各プロセスに対してタスクを全て出す(AI活用)
- 各タスクの複雑性が高い場合、タスク自体をゴール設定する(再帰的に繰り返される)(AI活用)
- タスクを実施してプロセスを完了する(AI活用)
- プロセス間の整合性を確認する(AI活用)
- 全プロセスの完了・ゴール達成
上記の各ステップでそれぞれAIを活用します。以下AIに図式化してもらいました。
事例
1つの事例として、「HPを作成する」という抽象度の高い目的で考えます。
1)「HPを作成する」ということ自体が事実上のゴールではなく、情報提供して会社の信頼性・プレゼンスを上げたい、採用活動に使いたい、などさらに上段の目的があるとしますが、ここがブレると効用が小さくなってしまうかなと思います。(HP以外の手段もある)このフェーズでは課題と思っていることをAIをブレスト的に使ってアイデアを固めるといいかなと思います。
2)検討した上でゴールがHPの作成と決まったらそのプロセス分解をAIにしてもらいます。目的の明確化、コンテンツ作成、デザイン、プランニング、開発、ローンチ、メンテナンスなどが提案されるかと思います。
3)続いて、上記のプロセスを並行して進められるかどうかなどをAIに聞いてみます。HPの作成の場合、目的の明確化とプランニング、コンテンツ作成とデザイン、開発とテスト、ローンチとメンテナンスがまとめられます。
4)各プロセスのタスクを洗い出します。開発の場合、HTMLコーディングやCSSのスタイリング、Javascrpt実装、レスポンシブデザインの実装などが出てきますが、他については説明を省略します。
5)あとはタスクを完了するために、再度ゴール設定してプロセス分解し、タスクをAI活用しながら完了させる。(実際のchatGPT等の利用では、このタスク単位でAIを使っているケースが多いのかなと思います)
6)タスクを全て完了させます。例えば開発の場合、全てのコーディングが終了して、HPとして動く状態をイメージします。
7)例えば開発とローンチを考えると、ローンチ後のサーバ上で開発成果物が動作しているか、であったり、デザインや目的は達成できてそうかなどの各プロセス間の整合性を確認します。
8)HP作成のゴールの達成です。
実際に業務等で活用する場合、ゴールが何か(調べ物か、ブレストか、大きなプロジェクトの達成か、現在発生している問題の解決か)を明確化して上のフレームワークに当てるとAIを使う時間を有効活用できるのかなと思っております。
プロンプト単位での工夫とフレームワークの活用でAIを強力なツールとして活用していけたらいいですね。もっと良いフレームワークがあれば、ぜひ教えていただきたいです。
自律型AIエージェント
ここ最近では自律型のAIエージェントが話題に上がっており、ゴール設定するだけで、プロセスやタスクを分解してゴールを達成できてしまうAIの開発が進んでいます。上記で取り上げたフレームワークのようなタスクを自分でプロセス・要素分解しながらタスクを完了させてしまうというAIです。技術の進展が凄まじいですね。
以下、AutoGPTとBabyAGIを取り上げて説明します。
AutoGPT
AutoGPTは、GPT-4言語モデルの能力を示す実験的なオープンソースアプリケーションです。このプログラムはGPT-4によって駆動され、ユーザーが設定した目標を達成するために、LLM(Large Language Model)の「思考」を連鎖させて、自律的にタスクを生成・実行します。AutoGPTは、GPT-4が完全に自律的に動作する最初の例のひとつとして、AIが可能なことの限界を押し広げています。AutoGPTはまだ発展途上であり、様々な課題やリスクも存在しますが、将来的には多くの分野で活用される可能性があります。
BabyAGI
BabyAGIは、タスク駆動型自律エージェントのフレームワークで、GPT-4言語モデルとLangChain(コーディングフレームワーク)とPinecone(ベクトルデータベース)を組み合わせています。ゴールに基づいてタスクの作成、優先順位付け、および実行を行い、新しいエージェントを生成して、元の目的から逸脱しないように複雑なタスクを完了できます。シンプルで理解しやすく、拡張しやすいことが目標となっているようです。
その他自律型エージェント
HyperWriteというAIライティングのツールを提供するスタートアップ企業がwebのブラウザ操作を自律型AIエージェントに実施させるというプロジェクトを公開していました。以下のtwitterでピザを注文するというタスクを実施してもらうデモ動画が公開されています。
HyperWrite – Your personal AI writing assistant (hyperwriteai.com)
Today, we’re unveiling Personal Assistant – @HyperWriteAI's groundbreaking AI agent that can use a web browser like a human.
— Matt Shumer (@mattshumer_) April 12, 2023
One agent to rule them all.
It’s time to reimagine the way we interact with the internet. pic.twitter.com/csGjtIU0Ip
WEBに関しては情報を広いやすいものでもあり、このようなブラウザを使う領域でも数多くのAIエージェントサービスが今後出てきそうですね。一方、AIが自律的にWEBの操作ができるということは、悪用によるインパクトも大きいので、安全面を考慮した開発は非常に重要と言えそうです。
コメント