AI时代的伯克希尔:🤖 四位大师的AI分身如何用多Agent对抗分析重构价值投资?
想象一个场景:你想认真研究一家公司,翻阅财报、理解护城河、评估管理层,还要兼顾安全边际。你希望身边坐着巴菲特、芒格、段永平和李录——但不是要签名,而是请他们分别给出独立判断,再一起激烈辩论。显然,这种“梦幻董事会”只在书本上存在。但现在,一个名为 ai-berkshire 的开源项目,正试图用多智能体系统将这种理想研究流程搬进 Claude Code / Codex 终端。
从“独奏”到“四声部”:为什么需要多 Agent 研究框架?
AI辅助投资已不是新鲜事。但多数方案停留在单次对话:你问“买入腾讯的理由”,模型给出一段结构化的多头论述,再追问风险,它补上几点。这种方式缺少的,是 认知冲突与相互证伪——而这正是优秀投资委员会的价值所在。
价值投资的精髓不只是计算DCF模型,更在于从不同哲学立场审视同一标的。巴菲特的“确定性+护城河”、芒格的“多学科思维与误判心理学”、段永平的“商业模式第一、企业文化第二”、李录的“真知与能力圈”,四位大师的框架如果只在单个prompt里拼接,就会退化为低质量的平均主义。ai-berkshire的设计初衷就是让每个视角都有完整的“代理人格”,并行工作,然后由协调器组织对抗讨论,最终合成一份带有分歧、权重和关键风险提示的研究报告。
多 Agent 并行对抗:四位“AI学徒”如何共同工作
项目的架构核心是 Master Agent + Worker Agents 模式:
User Query (Stock / Thesis)
|
Coordinator Agent (任务分解与议程设定)
|
+-- Worker: Buffett-Agent (确定性分析、护城河评分、长期经济特征)
+-- Worker: Munger-Agent (心理模型、逆向思考、失败模式检查)
+-- Worker: DuanYongping-Agent (商业模式定性、企业文化、止错清单)
+-- Worker: LiLu-Agent (能力圈边界、真知指数、安全边际量化)
|
Discussion Round (各Agent交叉质询,找出矛盾点)
|
Synthesizer (生成最终研报,标记分歧度与置信度)
每个 Worker Agent 都使用对应的 大师风格 prompt template,并且独立运行,无信息交叉污染。例如,巴菲特的Agent会关注“十年后这家公司是否依然存在并赚取超额利润”,而段永平的Agent则严格审视“如果你有足够多的钱,是否会私有化这家公司”。这种并行设计避免了单一线程下“拟人谈话”的自我演绎陷阱。
最有趣的是 对抗讨论环节:多Agent输出初稿后,协调器会把不同立场的关键论断投入“辩论池”,允许一个Agent质疑另一个Agent的假设。比如芒格的Agent可能会指出巴菲特Agent对“管理层信任”的过度乐观,而李录Agent会强调“能力圈外的不可知性必须打折”。最终报告不仅给出综合评级,还会保留一条“分项分歧指数”,提醒人类研究员哪些地方是AI们吵得最凶的。
技术落地:Claude Code 上的并行研究流水线
ai-berkshire 并不是一个独立的大模型,而是一套运行于 Claude Code / Codex 环境中的轻量级编排框架。它利用 Claude Code 的函数调用(function calling)和子任务管理能力,把多Agent研究流程组织为可重复的工作流:
- 📦 Prompt Compilers:为四位大师分别维护了长上下文角色提示,内含问询话术、评分矩阵和风险检查清单。
- ⚙️ Parallel Dispatcher:将任务同时派发给四个Worker,等待结果后推进下一步,最大限度减少串行延迟。
- 🔗 Debate Router:基于关键词检测与矛盾规则,触发跨Agent评论请求,生成结构化辩论记录。
- 📊 Report Synthesizer:融合四份报告与辩论摘要,按模板产出Markdown研报,附打分表格与分歧热力图数据。
一个简化版的研究调用看起来像这样:
# 研究任务配置 (research_config.yaml)
ticker: 0700.HK
company_name: 腾讯控股
master_agents:
- name: buffett
model: claude-sonnet-4-20250514
focus: moat, ROIC, certainty
- name: munger
model: claude-sonnet-4-20250514
focus: psychology, inversion, failure_cases
- name: duan
model: claude-sonnet-4-20250514
focus: business_model, culture, stop_doing_list
- name: lilu
model: claude-sonnet-4-20250514
focus: circle_of_competence, real_knowledge, margin_of_safety
debate_rounds: 2
output_format: markdown_report
这份YAML被传入Codex CLI后,框架会自动调度各Agent并输出最终文件。过程无需额外部署服务器,全部推理在Claude API侧完成,对本地开发者的负担极低。
对比:为什么不是又一个“AI分析师”?
市面上已有不少AI投资工具,但与ai-berkshire的核心差异在于研究框架的体系化和对抗性。我们简单对比一下:
- ChatGPT 单轮问答:好处是即时、易用,但缺乏深度研究结构,无法模拟不同投资哲学之间的张力,容易给出“正确的废话”。
- FinGPT / 金融垂域LLM:通过微调注入金融知识,擅长新闻情感、数字抽取等定量任务,但依然是单agent视角,没有内建价值投资范式。
- BloombergGPT 等大型金融模型:数据覆盖广泛,但对于需要定性判断的企业文化、护城河评估,仍停留在语言模型层面,缺少投资委员会式的辩论机制。
- ai-berkshire:不追求万能,而是将一种经过验证的投资研究流程固定为可运行的Agent系统。它的输出不是“建议你买入”,而是“基于四位大师框架的分歧报告”,强迫人类研究员面对不确定性,做出自己的决策。
这种设计哲学很像查理·芒格喜欢的“反过来想”:与其让AI假装什么都知道,不如让AI把“不知道的部分”显式曝光出来。
适用场景与局限:别让 AI 替你承担能力圈的代价
在以下场景中,ai-berkshire能显著提高研究效率:
- 快速初筛:对大量标的生成标准化研究草稿,识别哪些公司值得深入阅读年报。
- 多视角检查:当你自己对某公司产生强烈好感时,让四位大师AI扮演“魔鬼代言人”,避免确认偏误。
- 投资教育:通过观察不同Agent的提问逻辑,学习巴菲特、芒格等人的思维方式,适合投资培训或学术研究。
同时必须清醒认识到其局限:
- 幻觉风险:AI可能对财务数据编造、过时信息引用,研究者必须二次核实。
- 深度缺失:尽管有四重框架,AI仍无法真正理解行业细节的微妙变化,更不能替代实地调研。
- 静态知识:模型训练截止日期后的事件完全未知,需要人工补充最新进展。
因此,框架的最终定位是“增强型研究笔记本”,而不是取代人脑的决策黑箱。
快速上手:从零到第一份四大师研报
安装仅需几行命令(需要有效的Claude API key和Codex CLI环境):
git clone https://github.com/xbtlin/ai-berkshire.git
cd ai-berkshire
pip install -r requirements.txt
# 配置你的ANTHROPIC_API_KEY
export ANTHROPIC_API_KEY=sk-ant-...
# 运行示例研究
python run_research.py --ticker AAPL --debate 2
等待几分钟后,你会在 reports/ 目录下得到一份详细的Markdown研报,包含“Buffett视角”、“Munger视角”等章节,以及最后的综合评分表。如果你更喜欢在终端里查看,也可以用 --output console 参数。
总结:当投资研究遇见 Agent 编排
ai-berkshire 不造神,它只是把价值投资领域最智慧的几个头脑的思维模式,转化为可调度的数字化代理。其真正的创新在于承认单一AI观点的局限性,转而用 对抗讨论 模拟现实世界中优秀投委会的内部张力。对于所有希望将 AI 纳入研究流程、但又不愿放弃批判性思考的投资者,这是一个值得探索的方向。
在信息泛滥的时代,最稀缺的不再是数据,而是高质量的认知框架。ai-berkshire 试图给的,正是一套可执行、可复制的框架——而最终决策,依然留给人类。