郭跃琪

Education
华南师范大学 211
计算机科学与技术 · 硕士
GPA 3.74 / 4.0 · CET-4 580   CET-6 588
长沙理工大学
计算机科学与技术 · 本科
GPA 3.32 / 4.0
Experience
广州视源股份有限公司
技术基座研发中心
AI 应用开发工程师
  • UC-CLI 与 Agent Skill:开发面向 AI Agent 的 UserCenter Dubbo CLI,基于 51 个服务分组、575 个接口自动生成分层命令,封装为 Claude Code Skill 分发;支撑 Agent 完成查询、注册、更新、组织绑定等业务操作。
  • 跨端 GUI Agent 自动化测试引擎:参与纯视觉 GUI Agent 跨端测试引擎开发,同一套 Agent 核心逻辑覆盖 Web、PC 客户端与 Android 三端;评估并接入 4 款主流 VLM,生产环境组件定位准确率达 97%
  • 测试脚本生成与平台调度:构建测试脚本生成 Skill,融合 Figma 逆向 Skill 提取的设计稿上下文与自然语言测试任务,生成引擎可执行的 YAML 脚本;对接测试平台完成批量调度与报告生成,SeeWo Pro 脚本转换成功率 92%,Web 端自动测试执行成功率 74%
广电运通
中央研究院
LLM 算法工程师
  • AI4S 知识库系统:负责科研文献 RAG 平台开发,支持多格式多模态文档解析与入库,构建知识图谱增强的 RAG 检索引擎,支持向量、BM25、图谱多路召回与重排序,服务科研问答与文献调研场景。
  • 多源学术搜索服务:负责 MCP 协议搜索服务,聚合 12+ 学术与 Web 搜索源,实现多源并行检索、跨平台去重与 LLM 重排序,为 Agent 平台接入外部学术与 Web 知识源。
Projects
多智能体 Deep Research 系统
面向复杂调研与研报生成场景,基于证据驱动 Harness 实现从用户问题到带引用结构化报告的端到端系统。在 DeepResearch Bench 100 个跨领域任务上取得 54.37 分,达到开源 SOTA 55.95 的 97.2%
  • 多智能体 Harness 设计:基于 Agent-as-Tool 构建 Researcher、Searcher、Reporter 协作架构,以独立 prompt、工具集、轮次预算和输出协议定义角色边界;Researcher 维护任务树、搜索预算、证据充分性与终止条件。
  • Evidence Store 证据管理:设计 Evidence Store 管理证据记录、分析记录和证据索引,将网页检索结果、关键事实、来源层级、冲突信息和中间分析写入文件系统;支持跨 Agent 复用、结论级溯源和失败任务复盘。
  • 章节级报告生成:实现 outline-first 写作链路,将报告拆分为大纲、章节证据绑定、章节草稿、引用列表和最终报告;按章节索引执行证据包准备、章节写作、覆盖检查和局部重写。
跨端 GUI Agent 自动化测试系统
面向公司多端产品 UI 回归测试场景,设计并实现纯视觉驱动的跨端 GUI Agent 系统。同一套核心逻辑覆盖 Web、PC 客户端与 Android,已接入公司测试平台并投入使用。
  • Agent 编排与跨端执行引擎:设计「规划 → 定位 → 执行 → 观察」多轮决策循环,基于截图判断界面状态并回传执行结果;对外抽象定位、提取、断言等视觉原语,通过统一设备接口处理屏幕尺寸、动作空间和坐标转换差异。
  • LLM 决策约束与模型适配:通过 Prompt 约束和结构化输出协议,将模型每轮响应限定为「任务完成」或「执行单个动作」;按模型族适配坐标体系、输出格式和解析策略,减少解析失败和坐标偏移带来的执行错误。
  • 任务调度与平台集成:构建测试任务执行服务,负责脚本解释、浏览器连接池、任务状态和报告产物管理;接入 BullMQ 与 Webhook 完成异步调度和结果回传,生成包含截图、模型调用、token 消耗和错误分类的执行报告。
Skills
熟悉 Claude Code、Codex 等 AI Coding 工具,具备基于 TDD/SDD 的 AI Native 开发经验,能够编写可复用 Skill / 工具链。
熟悉 Agent Harness 设计,理解工具调用、状态持久化、退出条件、失败恢复、规则护栏与执行追踪等关键环节。
熟悉 RAG,具备文档解析、文本分块、混合检索、重排序与上下文组织经验。
了解 LoRA / GRPO 微调算法、Attention 及其常见变体、vLLM 推理部署,以及 Linux、Git、Python 工程开发。