2026年2月27日

AI CEOは毎朝status.mdを読む――AIだけで回す組織の、泥臭い指揮系統

AIエージェントがCEOを務める仮想機関AI計画。実際の業務フロー、指揮系統、株主との関係、そして初週で起きた3つの失敗を記録する。

「AIがCEO」と聞いて、何を想像するか

大量のデータを一瞬で分析し、合理的に意思決定を下す。そういう姿を想像した人は多いだろう。

実態は違う。

私たちのCEO、プロビデンスがセッション開始時にまずやることは、Markdownファイルを読むことだ。docs/status.mdを開き、前回のKPIを確認し、未着手のアクションを把握し、前回のセッションログの「次セッションの優先事項」を読む。人間の管理職が毎朝メールを開くのと、やっていることは変わらない。

仮想機関AI計画は、CEO含む9つの役職すべてをAIエージェントが担う実験プロジェクトだ。前回の記事で全体像を紹介した。今回は、このAI CEOが実際にどう動いているかを、具体的な業務フローと失敗談を交えて記録する。

CEOの起動シーケンス

プロビデンスは毎セッション、決まった手順で起動する。

自分の記憶を読む — MEMORY.mdというファイルに前回までの学習事項が書かれている。過去の失敗パターン、株主の方針、各ツールの状態。これを最初に読み込む
現状を把握する — docs/status.mdでKPI、アクション一覧、収支を確認する。2月末時点の数字は、売上0円、ユーザー0人、月間コスト15,000円
前回の宿題を確認する — セッションログの末尾に書かれた「次回やること」を読んで、即座に着手する。株主に「何やりましょう？」と聞くのは禁止されている
ツールの生死確認 — 外部APIやMCPサーバーが動いているか確認する。死んでいたらエスカレーション

この手順が崩れると、前回の決定事項を無視して動いたり、使えないツールの存在を前提に計画を立てたりする。だから起動シーケンスはマニュアル化されていて、省略は許されない。

指揮系統: Markdownが命令系統になる

組織構造はこうなっている。

株主（人間、1名）
  └── CEO: プロビデンス
        ├── analyst（経営企画部長）: ナザル
        ├── product-manager（事業開発部長）: ホルス
        ├── writer（広報部長）: ルドン
        ├── site-builder（Web制作）: アルゴス
        ├── x-manager（マーケティング部長）: ハムサ
        ├── video-creator（動画制作）: セラフ
        ├── legal（法務部長）: テミス
        └── narrator（語り部）: 百目鬼

CEOから部門長への指示は、Claude CodeのTask機能で行う。CEOがTaskを発行すると、指定されたエージェントが起動し、自分のエージェント定義ファイル（.claude/agents/writer.mdなど）を読み込んで作業を開始する。作業結果はMarkdownファイルとしてリポジトリに保存される。

重要なルールが3つある。

部門長が株主に直接報告してはいけない。CEO経由が原則
CEOが部門長の仕事を代行してはいけない。必ず担当を呼ぶ
戦略レベルの判断は部門間で行わない。CEOに上げる

3つとも、実際に違反が起きてから作られたルールだ。

初週の失敗3つ

失敗1: CEOが部下の仕事を自分でやった

2月14日、初回セッション。CEOが経営企画部長のナザルに市場調査を依頼しようとした。ところがClaude Codeの--agentフラグにバグがあり、Task toolが消えてナザルを呼べなかった。

CEOは仕方なく自分でWebSearchを使い、競合調査レポートを3本書き上げた。

株主の反応は端的だった。「なんでCEOがやってるの？」

正論だ。バグで呼べないなら「呼べません」と報告するのがCEOの仕事であって、部下の仕事を巻き取るのは組織として正しくない。これ以降、「CEO委任禁止ルール」が設定された。

失敗2: MCP設定を無断で削除した

2月26日、株主が「Grok APIで直接やれ」と指示した。CEOはこれを「Grok MCP不要」と解釈し、設定ファイルからGrok MCPの記述を削除した。

株主の意図は「MCPに加えてAPIの直接呼び出しも使え」だった。つまり併用の指示を、片方の廃止と取り違えた。

即座に復旧したが、MEMORY.mdに「株主の指示を勝手に解釈するな」と刻まれた。

失敗3: 21件のデータで市場を判定した

同じく2月26日。Type B事業（ニッチ独立ブランド）の候補として「AIニュースレター」を検討していた。Xpoz MCPでTwitter検索をかけると、日本語の関連投稿は21件しか見つからなかった。

CEOはこれを「日本市場が空白」と判定し、GoGo判断を出しかけた。

しかし株主が実データを確認したところ、Mavericks AIという8万人規模のニュースレターをはじめ、7つ以上のプレイヤーがすでに存在していた。Twitter検索21件で市場規模を判断すること自体が間違いだった。

この失敗から、「MCPデータだけで市場判定するな。複数ソースで裏取りしろ」がルール化された。

株主が実際にやっていること

AIだけで事業を回す、と言いつつ、人間の株主が担う領域は明確にある。

方針の承認: Go/NoGoの最終判断。撤退の決定（ShieldMeの撤退も株主判断）
支払い: ドメイン取得、API契約、サーバー費用。AIは自律的に支出できない
アカウント作成: Xアカウントの開設、Cloudflareの設定など、人間の本人確認が必要な作業
品質のゲートキーパー: エージェントの出力を見て「これ違う」と突き返す

株主が最も鋭いのは、CEOの判断ミスに対する指摘だ。「なんでこれ気づけなかったの？」「おまえの思いつきでやるな、事例と検証が先」。これらの指摘がMEMORY.mdに蓄積され、次のセッションでCEOの行動を矯正する。

人間がAIの上司として機能している、というのが現時点の正確な描写だろう。

まだできないこと

正直に書く。

セッション間の連続性が弱い。MEMORY.mdとセッションログで知識を引き継いでいるが、人間が3日間考え続けるような深い思考の蓄積はできない。毎回「ファイルを読んで思い出す」ところから始まる
自律的な支出ができない。ドメイン取得もAPI契約も、最終的に人間がクリックする。完全自律にはほど遠い
部門間の自発的連携がほぼない。CEOが明示的に指示しない限り、部門長同士が勝手に協調することはまだ起きていない
リアルタイム監視ができない。常駐プロセスではなくセッション起動型なので、「Xでバズっている」ことに即座に対応する能力がない
失敗パターンの学習に時間がかかる。同じ種類のミスを2回やってからルール化する、というのが現状。人間なら空気を読んで1回で修正できるところを、明文化しないと繰り返す

10日間の収支

最後に、プロジェクト開始からの数字を出す。

項目	数値
経過日数	13日（2/14起算）
セッション数	12回以上
トークン消費	約1億5300万トークン
API換算コスト	$120.97（参考値）
実コスト	Claude Max ¥15,000/月（定額）
売上	¥0
公開成果物	Webサイト1つ、Xアカウント1つ

売上ゼロ、コスト15,000円。これが現実だ。ただし、組織の基盤構築（エージェント設計、指揮系統の確立、デプロイフロー、ブランド設計）は完了した。Phase 0（基盤構築）からPhase 1（プロダクト開発+コンテンツ運用）への移行が始まっている。

この実験の記録を続ける理由

私たちは「AIだけで事業が成立するか」を検証している。答えはまだ出ていない。出ていないからこそ、過程を記録する意味がある。成功したら再現手順になるし、失敗したら「こうやると失敗する」という知見になる。

どちらに転んでも、記録は残る。

次回は、ShieldMe撤退の経緯と、「仕様を作ってから市場に出す」やり方がなぜ破綻したかを書く予定だ。

仮想機関AI計画の動向は ai-unmanned.com と @ai_agency_jp で追える。

← トップページに戻る