赵鹏阳
北京
15330050984
pengyang.zhao@foxmail.com
个人概述
清华大学电子工程系博士,研究方向为计算机视觉与生物识别;具备生成式图像复原、计算摄影、RAW
/ RGB
域画质优化与端侧算法落地经验。现任荣耀高级算法工程师,长期负责手机影像算法的预研与落地,主要方向涵盖文字场景图像复原、异构
CFA 方案通路与算法可行性验证、RAW
域联合去噪去马赛克模型量产交付,以及多机型 / Sensor HDR
成像画质优化。
教育经历
清华大学 - 博士 - 电子工程系
2017.09 - 2023.10
研究方向:计算机视觉、生物识别
吉林大学 - 学士 - 信息工程
2013.09 - 2017.06
工作经验
高级算法工程师 - 荣耀终端有限责任公司
2023.10 - 至今 (~2年零6个月)
核心项目经历
基于生成式架构的文字场景图像复原系统
项目职责:针对现实复杂退化场景下的文字图像,主导从数据闭环、复原算法研发和落地的全流程。
- 生成式复原算法研发:负责文字图像复原模型的设计、迭代与落地,主导从传统
Transformer 向 JiT + Flow Matching
生成式架构的演进,引入像素级结构约束缓解生成式模型在文字区域的笔画幻觉与结构失真问题,提升复杂退化场景下的文字可读性与结构稳定性,支撑下一代旗舰机卖点特性。
- 数据闭环与数据工程:针对高质量文字图像数据构造上,设计微调
Qwen3VL-30B-A3B-Instruct 用于文字数据打分过滤,自研基于 VLM
的自动化筛选与评价流水线,融合实采数据、渲染数据、合成数据与生成数据构建训练集,形成可持续迭代的高质量文字复原数据闭环体系。
RAW 域 Diffusion 算法预研
项目职责:参与布局下一代“端云协同”影像演进,探索多帧输入条件下的模型结构设计与条件注入策略,打破传统 ISP 在低信噪比环境下由于信息丢失导致的画质断层问题。
- 跨空间条件注入设计:针对 Flux-7B 的 Latent 空间与原始 RAW 域(Bayer
格式)的模态差异,通过添加额外数据流的方式进行信息引入,在保留大模型强纹理生成先验的同时,强制绑定
RAW 域的底层结构信息。
- Pixel 域对比实验与方案收敛:对比研究了 Latent Diffusion 与 Pixel
Diffusion 方案在图像复原中的表现,证实 Pixel Diffusion
在端到端控制上具备更高保真度,但在计算复杂度上不占优势
画质优化业务交付
项目职责:负责自研的联合去噪去马赛克算法在多款量产机型上的优化、落地及画质问题排查,保障算法稳定量产落地。
- 量产业务全流程交付:负责多款旗舰及中端机型端侧图像复原算法的全流程交付,包括数据构建、退化建模、模型训练与常见画质问题优化,推动算法稳定上线量产。
- 噪声建模与数据构建:基于 Gaussian‑Poisson 物理噪声模型对不同 Sensor
的噪声统计特性进行参数标定,构建贴近真实成像分布的 RAW
域退化数据,用于支撑 RAW
域复原模型在复杂真实退化条件下的训练与优化。
- 多 Sensor 噪声参数适配:针对不同 Sensor
噪声参数存在差异导致的模型训练时间过长的问题,通过引入 MOE
方案通过一个模型进行兼容,大幅缩短模型适配与训练周期。
专业技能
- 算法方向:计算机视觉、图像复原、生成式视觉算法、计算摄影、RAW
域画质优化、生物识别。
- AI 提效/辅助开发:在实际业务/生活中深度集成 Claude Code / Codex /
Openclaw 等 AI 工具,并能够基于相关设计思想合理设计 CLAUDE.md/AGENTS.md
与 Skills 进行项目管理与自动化效率提升;为 Openclaw 等 Multi-Agent
工具搭建技能中台避免 Agent Workspace 腐化。
- 开发技能/工具:Python, Pytorch, Diffusers, PEFT, Git, Docker
等。
- 英语能力:
通过大学英语四六级考试;具备良好的英语听说读写能力,能够快速浏览英文文献和书籍。
荣誉奖励
- 荣耀 2024 年度微光者、荣耀知识之星
- 国家奖学金、奇虎 360 奖学金、三星奖学金
- 校优秀学生干部、校优秀学生、校级国奖励学标兵
论文
发表与参与论文 7 篇,研究方向聚焦生物识别与图像复原。
- P. Zhao, S. Zhao, L. Chen, W. Yang, and Q. Liao,
"Exploiting Multi-perspective Driven Hierarchical Content-Aware Network
for Finger Vein Verification," IEEE Trans. Circuits Syst. Video
Technol., vol. 32, no. 11, pp. 7938-7950, Nov. 2022.
- P. Zhao, S. Zhao, J.-H. Xue, W. Yang, and Q. Liao,
"The Neglected Background Cues Can Facilitate Finger Vein Recognition,"
Pattern Recognit., vol. 136, Art. no. 109199, Nov. 2022.
- P. Zhao, Z. Chen, J. Feng et al., "Single-Sample
Finger Vein Recognition via Competitive and Progressive Sparse
Representation," IEEE Trans. Biometrics, Behavior, Identity
Sci., vol. 5, no. 2, pp. 209-220, Apr. 2023.
- Y. Song, P. Zhao, W. Yang, J. Zhou, and Q. Liao,
"EIFNet: An Explicit and Implicit Feature Fusion Network for Finger Vein
Verification," IEEE Trans. Circuits Syst. Video Technol., vol.
33, no. 5, pp. 2520-2532, May 2023.
- Q. Bao, R. Zhu, B. Gang, P. Zhao, W. Yang, and M.
Qing, "Distilling Resolution-robust Identity Knowledge for
Texture-Enhanced Face Hallucination," in Proc. 30th ACM Int. Conf.
Multimedia, 2022.
- S. Zhao, J. Wen, L. Fei, B. Zhang, P. Zhao, and S.
Li, "Structure Suture Learning Based Robust Multi-View Palmprint
Recognition," IEEE Trans. Neural Netw. Learn. Syst., 2022.
- S. Zhao, J. Wu, B. Zhang, L. Fei, S. Li, and P.
Zhao, "Adaptive Graph Embedded Preserving Projection Learning
for Feature Extraction and Selection," IEEE Trans. Syst., Man,
Cybern., Syst., vol. 53, no. 2, pp. 1060-1073, Feb. 2023.