个人主页 中国时间

AI 产品工程师 / 多模态系统

I code.

模糊的产品意图,会变成可以被观察、控制、交付的系统:像素、提示词、数据流、服务、部署,以及影响人如何感受和预期的关联。

把 AI 产品里不可控的部分,压成系统。

我工作在产品判断、模型行为、工作流设计和生产工程的交界处。真正有用的往往不是单个模型,而是模型周围那套能被使用、维护和扩展的系统。

高可用 分布式、高可用服务设计
数据 结构化与非结构化数据处理
Infra 模型服务、容器、内部工具
Lead/SRE 交付负责人与运维可靠性经验
产品负责人 拆解模糊的 AIGC 需求,定义能力边界,让产品、设计、前端、后端和工作流团队在同一张图上推进。
Agent 系统 基于 LangChain 构建搜索、阅读、图像生成、视频检索和结构化输出链路,让前端可以稳定渲染模型结果。
多模态 AI 交付文本、图像、语音和视觉工作流系统,使用 Stable Diffusion、LoRA、GPT-SoVITS、ComfyUI、FastAPI、Docker 和 Gradio。
Infra / SRE 把重复运维变成可靠工具,覆盖模型服务基础设施、数据库运维自动化、容器优化和线上故障处理。

私有实验室:按控制面组织。

有些项目从零开始,有些从已有脚手架出发。重点不是来源,而是我能把它变成什么控制面:哪些东西变得可观察、可编程,并且可靠到可以长期使用。

Personal AI OS

设备即界面

手机、NFC、USB、语音、本地事件、消息通道和常驻网关,组成一个个人控制平面。

devices / voice / events / gateways
Knowledge engines

记忆即基础设施

持久化摄取、来源追踪、Schema 约束抽取、图谱相关性和可信度评分。

schemas / queues / graphs
Agent interfaces

混乱平台,干净工具

把真实世界的界面包成 CLI、MCP、skills、JSON-first 合约和安全边界,让 Agent 真的能用。

CLI / MCP / agent I/O
Generative canvases

像素受控

白板、时间线、场景协议、TTS、动画、GPU 调度和模型行为控制。

pixels / timelines / model control

艺术也是一条可以拖动的时间线。

一个小型滚动视频实验:运动、文字、阴影和进度都映射到同一根时间轴。观感是柔软的,底层是精确的。

ScrollVideo study

滚动变成时间。

画面、标注和离场状态共享同一个 progress。

0% / 0.00s

产品比介绍更诚实。

PageOn

AI PPT 生成产品,使用视觉表示语言、结构化 LLM 输出,以及能组合多模态内容的 Agent。

app.pageon.ai

Cyber Space

App Store 上线的多模态 AI 聊天产品,结合文本、语音、图像输入、Stable Diffusion 生成和变声服务。

App Store

Tencent SRE systems

面向 TDSQL 的自动化运维、容器优化和 SRE 工具:更快的单机部署、可复用 Python 运维包,以及规模化告警处理。

Automation operations / container optimization / SRE

像素负责感知,比特负责状态。

意义先以邻近的方式出现:场景、心情、语言、时间。重复让它们变成预期;代码把模式变成可调接口。

共现 / 预期 / 控制