understand - 可视化&开销分析

样本: reliverse/versator 文件: 173 批次: ≈7

understand report

understand
可视化&开销分析

整个 PPT 的主题就是 understand - 可视化&开销分析：先试用，再看它能不能把隐藏调用逻辑和瓶颈暴露出来，重点不是“看懂代码”，而是把重要代码和执行归因挑出来。

代码行数 27,452 输入 token 约43-45万 输出 token 约3-5万

试跑结论先说

它不是只会“读 README”。对这种典型电商 starter，它能稳定识别出前台页面、登录流、支付/结算、国际化、表单与表格、数据库 schema、middleware 保护路由。

可做的事结构图、导览、影响分析、问答

样本类型Next.js 15 + Drizzle + Stripe

结论形式可量化，能落到批次和 token

understand - 可视化&开销分析

2 / 9

capabilities

为什么要先试用它

我们真正关注的不是“代码长什么样”，而是“重要的代码在哪里”：接入运维、调用数据后生成的逻辑、事务数据和分析数据、单项目调用链条、跨项目调用链条。

structure

只看重要代码

只把接入运维、数据后生成、事务链路、分析链路、瓶颈相关代码挑出来，不被表层结构带跑。

relations

隐藏调用可视化

把隐藏的调用逻辑可视化并归因，看到谁触发了谁，哪里执行得多，哪里耗时高。

workflow

单项目链路定位

在单项目里定位执行瓶颈，关注执行次数、执行耗时、调用深度，而不是只看页面入口。

impact

跨项目链路优化

跨项目调用时能看链路优化点和执行瓶颈，尤其适合事务数据 + 分析数据一起看。

这次样本里它能看到什么

README 只告诉你这是一个电商 starter；但我们真正关心的是它能不能把调用链、事务链、分析链和瓶颈点拉出来，而不是只给一张结构图。

// 真正要抓的不是页面，而是调用链
接入运维 -> 调用数据 -> 生成逻辑 -> 事务数据
事务数据 + 分析数据 -> 定位执行效率
单项目调用链 -> 定位执行瓶颈
跨项目调用链 -> 找链路优化点

understand - 可视化&开销分析

3 / 9

sample baseline

样本仓库的硬数据

这个样本是一个 173 文件的电商 starter，文件分布很标准，适合测试结构识别。关键不是“文件很多”，而是它有清晰的业务分层：营销页、登录、Dashboard、支付、数据库、国际化、样式和配置都在。

total files

173

文件层可见度足够高，适合做模块图。

code files

132

绝大多数是 TypeScript，说明它的代码理解能力会真正被用到。

code lines

27,452

这是我们用于 token 估算的主要基线。

raw bytes

1.67M

原始文件体量直接决定 token 基线。

文件类别分布

按 tracked file 统计

code

132 files

config

25 files

assets

7 files

docs

2 files

other

7 files

// 最大的文件很有代表性
bun.lock - 2,963 lines
src/ui/components/data-table-filter.tsx - 1,828 lines
public/android-chrome-512x512.png - 1,347 lines
src/lib/filters.ts - 974 lines
src/ui/components/blocks/bento-media-gallery.tsx - 723 lines

understand - 可视化&开销分析

4 / 9

architecture reading

它怎么读懂这个电商模板

这个项目不是随机堆页，而是典型的业务分层电商 starter：前台页面、登录与注册、Dashboard、Stripe 支付、Drizzle ORM、数据库 schema、next-intl 国际化、middleware 路由保护。理解这些分层，就是它真正有用的地方。

auth

session / middleware

middleware.ts 会读取 session cookie，GET 请求时刷新 1 天过期时间。

billing

stripe checkout / portal

checkout 和 customer portal 都能从代码里直接定位出来。

database

schema / queries

users、teams、team_members、activity_logs、invitations 都是显式表。

ui

landing / dashboard

首页是 marketing pitch，dashboard 才是核心操作面板。

module map

从入口到业务层

图里不是“漂亮线条”，而是这次试跑真正能抽出来的结构：页面入口、守护层、支付层、数据库层和中间件。

understand - 可视化&开销分析

5 / 9

execution flow

语义归纳和解释在哪一步发生

不是一开始就让 LLM 直接读完整仓库。这个项目先用确定性分析把结构、依赖和调用关系抽出来，再把这些结构化结果交给 LLM 做语义归纳和解释。语义输出主要出现在 file-analyzer 的 Phase 2、architecture-analyzer 的 Phase 2，以及 tour-builder 的导览生成阶段。

1. scan

项目扫描

project-scanner 先收集文件树、语言、批次和 import 关系，决定后续怎么分批处理。

2. structure

结构抽取

file-analyzer Phase 1 用 tree-sitter / parser 提取 functions、classes、exports 和 callGraph。

3. semantics

语义归纳

file-analyzer Phase 2 才让 LLM 产出 fileSummary、tags、complexity、function/class summaries。

4. layers

架构归层

architecture-analyzer 再把这些摘要和 import 图变成 API / Service / Data / UI 这样的层。

pipeline view

完整执行顺序

1 扫描project-scanner 生成文件列表、语言、batch、importMap

2 结构file-analyzer Phase 1 抽函数、类、导出、调用图

3 语义file-analyzer Phase 2 生成摘要、标签、复杂度和解释

4 归层architecture-analyzer 基于摘要和依赖关系分层

5 导览tour-builder 把层和路径整理成学习顺序

// 关键点
semantic summarization happens after structural extraction
explanation happens on top of extracted graph data
tour generation happens after layers are assigned

understand - 可视化&开销分析

6 / 9

token estimation

代码行数 - token - 开销

这次不是拍脑袋。先用扫描脚本拿到文件规模，再把整个项目的输入和输出分开估算。这里的数字是“输入 token + 输出 token”，不是只看原始内容。

417.6k

原始文件内容按 bytes / 4 估算的 token 基线。

代码行数

27,452 tracked lines

输入 token

raw content ≈ 417,636 + prompt/context ≈ 25k-35k

输出 token

node summaries + edges + tours ≈ 30k-50k

全量试跑

roughly 470k-500k tokens end to end

成本为什么会抬高

按输入 / 输出拆解

输入1.67M bytes，base input 大约 41.7 万 tokens

上文与提示扫描、批次、关系图、导览设置，再加 2.5 万到 3.5 万 tokens

输出节点摘要、边关系、导览文字，再加 3 万到 5 万 tokens

// 量化口径
input tokens = raw content + prompt/context overhead
output tokens = summaries + edges + tours
total = input + output

understand - 可视化&开销分析

7 / 9

strengths / limits

它的边界在哪里

它不是“看一眼代码就自动告诉你瓶颈在哪”的魔法。它更像是把隐藏的调用逻辑拉出来，让你只盯重要代码，再去归因执行次数、执行耗时和瓶颈。

擅长：把隐藏调用链可视化，帮助你定位单项目里的执行瓶颈。

擅长：把跨项目调用链串起来，找出链路优化点和重复执行点。

擅长：把事务数据和分析数据放在一起看，方便判断执行效率和 IO 效率。

边界：如果你要的是事务级归因、执行次数、执行耗时和 IO 瓶颈，它还得接真实观测数据。

边界：如果仓库里有大量动态生成代码或超长文档，token 预算会明显上浮。

边界：它能帮助你缩小注意力范围，但最后的结论还是要和运行时数据交叉验证。

一句话结论

对典型项目，Understand Anything 的价值不是“更懂代码”，而是把隐藏调用逻辑可视化，让你只盯重要代码，再去定位瓶颈。

如果是你自己的项目

真正有用的不是 raw content，而是“你愿意为多少项目上下文买单”。如果目标是定位执行效率、IO 效率、单项目瓶颈或跨项目链路优化，这个上下文成本才有意义。

适合的场景

单项目调用链定位、跨项目链路优化、执行次数和耗时分析、以及把重要代码从噪音里拎出来。

understand - 可视化&开销分析

8 / 9

real run

把实际运行效果放进 Pages

这不是示意图。右侧这张图是 Understand Anything 跑完后的真实界面：它先把结构铺出来，再让你去找那些真正该盯的调用链和瓶颈点。Pages 里直接能看到它跑起来的样子。

// 页面里展示的是实际输出
knowledge graph overview
node summaries and layer legend
guided tour entry + search interface

如果你在浏览器里打开这页，看到的就是分析后的 Dashboard 截图，不是单纯的介绍文案。

外部 demo ↗

补测样本reliverse/versator · 27,452 lines，最接近 3 万行的展示项目

附近候选CiphersLab/SaaSPilot · 54,229 lines；layekmia/shopcart · 48,227 lines

dashboard screenshot

运行结果

图谱视图文件、函数、类和依赖都能点开

右侧面板摘要、节点数、层级和入口按钮

这页的作用把“重要代码在哪、调用链怎么走”先摆出来

understand - 可视化&开销分析

9 / 9

closing verdict

结论很简单

这份 PPT 的主题就是 understand - 可视化&开销分析：先试用，再看它能不能把隐藏调用逻辑和瓶颈可视化，最后只关注重要代码。

能做到的程度

把一个项目拆成能看链路、看归因、看瓶颈的图，而不是只给你一份“长 README 摘要”。

这次的成本

173 files，27,452 lines，1,670,544 bytes，输入约 43-45 万 tokens，输出约 3-5 万 tokens，整轮约 47-50 万 tokens。真正该看的不是 raw content，而是它能不能帮你找到重要代码。

最有价值的输出

单项目调用链定位、跨项目调用链优化、执行次数、执行耗时、瓶颈归因。

下一步

把这页 deck 部署上线，再看它在真实协作里能不能持续产出“重要代码”的定位价值。

输出路径建议：ppt.waterme7on333xxxx.com/understand-anything-try

understand 可视化&开销分析

试跑结论先说

为什么要先试用它

只看重要代码

隐藏调用可视化

单项目链路定位

跨项目链路优化

这次样本里它能看到什么

样本仓库的硬数据

173

132

27,452

1.67M

文件类别分布

它怎么读懂这个电商模板

session / middleware

stripe checkout / portal

schema / queries

landing / dashboard

从入口到业务层

语义归纳和解释在哪一步发生

项目扫描

结构抽取

语义归纳

架构归层

完整执行顺序

代码行数 - token - 开销

成本为什么会抬高

它的边界在哪里

一句话结论

如果是你自己的项目

适合的场景

把实际运行效果放进 Pages

运行结果

结论很简单

能做到的程度

这次的成本

最有价值的输出

下一步

understand
可视化&开销分析