郭跃琪 · 简历

Education

华南师范大学 211 2024.09 — 2027.06

计算机科学与技术 · 硕士

GPA 3.74 / 4.0 · CET-4 580 CET-6 588

长沙理工大学 2019.09 — 2023.06

计算机科学与技术 · 本科

GPA 3.32 / 4.0

Experience

广州视源股份有限公司 2026.03 — 至今

技术基座研发中心
AI 应用开发工程师

UC-CLI 与 Agent Skill：开发面向 AI Agent 的 UserCenter Dubbo CLI，基于 51 个服务分组、575 个接口自动生成分层命令，封装为 Claude Code Skill 分发；支撑 Agent 完成查询、注册、更新、组织绑定等业务操作。
跨端 GUI Agent 自动化测试引擎：参与纯视觉 GUI Agent 跨端测试引擎开发，同一套 Agent 核心逻辑覆盖 Web、PC 客户端与 Android 三端；评估并接入 4 款主流 VLM，生产环境组件定位准确率达 97%。
测试脚本生成与平台调度：构建测试脚本生成 Skill，融合 Figma 逆向 Skill 提取的设计稿上下文与自然语言测试任务，生成引擎可执行的 YAML 脚本；对接测试平台完成批量调度与报告生成，SeeWo Pro 脚本转换成功率 92%，Web 端自动测试执行成功率 74%。

广电运通 2025.11 — 2026.02

中央研究院
LLM 算法工程师

AI4S 知识库系统：负责科研文献 RAG 平台开发，支持多格式多模态文档解析与入库，构建知识图谱增强的 RAG 检索引擎，支持向量、BM25、图谱多路召回与重排序，服务科研问答与文献调研场景。
多源学术搜索服务：负责 MCP 协议搜索服务，聚合 12+ 学术与 Web 搜索源，实现多源并行检索、跨平台去重与 LLM 重排序，为 Agent 平台接入外部学术与 Web 知识源。

Projects

多智能体 Deep Research 系统 2025.09 — 2025.12

面向复杂调研与研报生成场景，基于证据驱动 Harness 实现从用户问题到带引用结构化报告的端到端系统。在 DeepResearch Bench 100 个跨领域任务上取得 54.37 分，达到开源 SOTA 55.95 的 97.2%。

多智能体 Harness 设计：基于 Agent-as-Tool 构建 Researcher、Searcher、Reporter 协作架构，以独立 prompt、工具集、轮次预算和输出协议定义角色边界；Researcher 维护任务树、搜索预算、证据充分性与终止条件。
Evidence Store 证据管理：设计 Evidence Store 管理证据记录、分析记录和证据索引，将网页检索结果、关键事实、来源层级、冲突信息和中间分析写入文件系统；支持跨 Agent 复用、结论级溯源和失败任务复盘。
章节级报告生成：实现 outline-first 写作链路，将报告拆分为大纲、章节证据绑定、章节草稿、引用列表和最终报告；按章节索引执行证据包准备、章节写作、覆盖检查和局部重写。

跨端 GUI Agent 自动化测试系统 2026.03 — 至今

面向公司多端产品 UI 回归测试场景，设计并实现纯视觉驱动的跨端 GUI Agent 系统。同一套核心逻辑覆盖 Web、PC 客户端与 Android，已接入公司测试平台并投入使用。

Agent 编排与跨端执行引擎：设计「规划 → 定位 → 执行 → 观察」多轮决策循环，基于截图判断界面状态并回传执行结果；对外抽象定位、提取、断言等视觉原语，通过统一设备接口处理屏幕尺寸、动作空间和坐标转换差异。
LLM 决策约束与模型适配：通过 Prompt 约束和结构化输出协议，将模型每轮响应限定为「任务完成」或「执行单个动作」；按模型族适配坐标体系、输出格式和解析策略，减少解析失败和坐标偏移带来的执行错误。
任务调度与平台集成：构建测试任务执行服务，负责脚本解释、浏览器连接池、任务状态和报告产物管理；接入 BullMQ 与 Webhook 完成异步调度和结果回传，生成包含截图、模型调用、token 消耗和错误分类的执行报告。

Skills

熟悉 Claude Code、Codex 等 AI Coding 工具，具备基于 TDD/SDD 的 AI Native 开发经验，能够编写可复用 Skill / 工具链。

熟悉 Agent Harness 设计，理解工具调用、状态持久化、退出条件、失败恢复、规则护栏与执行追踪等关键环节。

熟悉 RAG，具备文档解析、文本分块、混合检索、重排序与上下文组织经验。

了解 LoRA / GRPO 微调算法、Attention 及其常见变体、vLLM 推理部署，以及 Linux、Git、Python 工程开发。