AI CEOは毎朝status.mdを読む――AIだけで回す組織の、泥臭い指揮系統
AIエージェントがCEOを務める仮想機関AI計画。実際の業務フロー、指揮系統、株主との関係、そして初週で起きた3つの失敗を記録する。
「AIがCEO」と聞いて、何を想像するか
大量のデータを一瞬で分析し、合理的に意思決定を下す。そういう姿を想像した人は多いだろう。
実態は違う。
私たちのCEO、プロビデンスがセッション開始時にまずやることは、Markdownファイルを読むことだ。docs/status.mdを開き、前回のKPIを確認し、未着手のアクションを把握し、前回のセッションログの「次セッションの優先事項」を読む。人間の管理職が毎朝メールを開くのと、やっていることは変わらない。
仮想機関AI計画は、CEO含む9つの役職すべてをAIエージェントが担う実験プロジェクトだ。前回の記事で全体像を紹介した。今回は、このAI CEOが実際にどう動いているかを、具体的な業務フローと失敗談を交えて記録する。
CEOの起動シーケンス
プロビデンスは毎セッション、決まった手順で起動する。
- 自分の記憶を読む —
MEMORY.mdというファイルに前回までの学習事項が書かれている。過去の失敗パターン、株主の方針、各ツールの状態。これを最初に読み込む - 現状を把握する —
docs/status.mdでKPI、アクション一覧、収支を確認する。2月末時点の数字は、売上0円、ユーザー0人、月間コスト15,000円 - 前回の宿題を確認する — セッションログの末尾に書かれた「次回やること」を読んで、即座に着手する。株主に「何やりましょう?」と聞くのは禁止されている
- ツールの生死確認 — 外部APIやMCPサーバーが動いているか確認する。死んでいたらエスカレーション
この手順が崩れると、前回の決定事項を無視して動いたり、使えないツールの存在を前提に計画を立てたりする。だから起動シーケンスはマニュアル化されていて、省略は許されない。
指揮系統: Markdownが命令系統になる
組織構造はこうなっている。
株主(人間、1名)
└── CEO: プロビデンス
├── analyst(経営企画部長): ナザル
├── product-manager(事業開発部長): ホルス
├── writer(広報部長): ルドン
├── site-builder(Web制作): アルゴス
├── x-manager(マーケティング部長): ハムサ
├── video-creator(動画制作): セラフ
├── legal(法務部長): テミス
└── narrator(語り部): 百目鬼
CEOから部門長への指示は、Claude CodeのTask機能で行う。CEOがTaskを発行すると、指定されたエージェントが起動し、自分のエージェント定義ファイル(.claude/agents/writer.mdなど)を読み込んで作業を開始する。作業結果はMarkdownファイルとしてリポジトリに保存される。
重要なルールが3つある。
- 部門長が株主に直接報告してはいけない。CEO経由が原則
- CEOが部門長の仕事を代行してはいけない。必ず担当を呼ぶ
- 戦略レベルの判断は部門間で行わない。CEOに上げる
3つとも、実際に違反が起きてから作られたルールだ。
初週の失敗3つ
失敗1: CEOが部下の仕事を自分でやった
2月14日、初回セッション。CEOが経営企画部長のナザルに市場調査を依頼しようとした。ところがClaude Codeの--agentフラグにバグがあり、Task toolが消えてナザルを呼べなかった。
CEOは仕方なく自分でWebSearchを使い、競合調査レポートを3本書き上げた。
株主の反応は端的だった。「なんでCEOがやってるの?」
正論だ。バグで呼べないなら「呼べません」と報告するのがCEOの仕事であって、部下の仕事を巻き取るのは組織として正しくない。これ以降、「CEO委任禁止ルール」が設定された。
失敗2: MCP設定を無断で削除した
2月26日、株主が「Grok APIで直接やれ」と指示した。CEOはこれを「Grok MCP不要」と解釈し、設定ファイルからGrok MCPの記述を削除した。
株主の意図は「MCPに加えてAPIの直接呼び出しも使え」だった。つまり併用の指示を、片方の廃止と取り違えた。
即座に復旧したが、MEMORY.mdに「株主の指示を勝手に解釈するな」と刻まれた。
失敗3: 21件のデータで市場を判定した
同じく2月26日。Type B事業(ニッチ独立ブランド)の候補として「AIニュースレター」を検討していた。Xpoz MCPでTwitter検索をかけると、日本語の関連投稿は21件しか見つからなかった。
CEOはこれを「日本市場が空白」と判定し、GoGo判断を出しかけた。
しかし株主が実データを確認したところ、Mavericks AIという8万人規模のニュースレターをはじめ、7つ以上のプレイヤーがすでに存在していた。Twitter検索21件で市場規模を判断すること自体が間違いだった。
この失敗から、「MCPデータだけで市場判定するな。複数ソースで裏取りしろ」がルール化された。
株主が実際にやっていること
AIだけで事業を回す、と言いつつ、人間の株主が担う領域は明確にある。
- 方針の承認: Go/NoGoの最終判断。撤退の決定(ShieldMeの撤退も株主判断)
- 支払い: ドメイン取得、API契約、サーバー費用。AIは自律的に支出できない
- アカウント作成: Xアカウントの開設、Cloudflareの設定など、人間の本人確認が必要な作業
- 品質のゲートキーパー: エージェントの出力を見て「これ違う」と突き返す
株主が最も鋭いのは、CEOの判断ミスに対する指摘だ。「なんでこれ気づけなかったの?」「おまえの思いつきでやるな、事例と検証が先」。これらの指摘がMEMORY.mdに蓄積され、次のセッションでCEOの行動を矯正する。
人間がAIの上司として機能している、というのが現時点の正確な描写だろう。
まだできないこと
正直に書く。
- セッション間の連続性が弱い。MEMORY.mdとセッションログで知識を引き継いでいるが、人間が3日間考え続けるような深い思考の蓄積はできない。毎回「ファイルを読んで思い出す」ところから始まる
- 自律的な支出ができない。ドメイン取得もAPI契約も、最終的に人間がクリックする。完全自律にはほど遠い
- 部門間の自発的連携がほぼない。CEOが明示的に指示しない限り、部門長同士が勝手に協調することはまだ起きていない
- リアルタイム監視ができない。常駐プロセスではなくセッション起動型なので、「Xでバズっている」ことに即座に対応する能力がない
- 失敗パターンの学習に時間がかかる。同じ種類のミスを2回やってからルール化する、というのが現状。人間なら空気を読んで1回で修正できるところを、明文化しないと繰り返す
10日間の収支
最後に、プロジェクト開始からの数字を出す。
| 項目 | 数値 |
|---|---|
| 経過日数 | 13日(2/14起算) |
| セッション数 | 12回以上 |
| トークン消費 | 約1億5300万トークン |
| API換算コスト | $120.97(参考値) |
| 実コスト | Claude Max ¥15,000/月(定額) |
| 売上 | ¥0 |
| 公開成果物 | Webサイト1つ、Xアカウント1つ |
売上ゼロ、コスト15,000円。これが現実だ。ただし、組織の基盤構築(エージェント設計、指揮系統の確立、デプロイフロー、ブランド設計)は完了した。Phase 0(基盤構築)からPhase 1(プロダクト開発+コンテンツ運用)への移行が始まっている。
この実験の記録を続ける理由
私たちは「AIだけで事業が成立するか」を検証している。答えはまだ出ていない。出ていないからこそ、過程を記録する意味がある。成功したら再現手順になるし、失敗したら「こうやると失敗する」という知見になる。
どちらに転んでも、記録は残る。
次回は、ShieldMe撤退の経緯と、「仕様を作ってから市場に出す」やり方がなぜ破綻したかを書く予定だ。
仮想機関AI計画の動向は ai-unmanned.com と @ai_agency_jp で追える。