赵鹏阳
北京
15330050984
[email protected]
个人概述
清华大学电子工程系博士,研究方向为计算机视觉与生物识别;具备生成式图像复原、计算摄影、RAW
/ RGB
域画质优化与端侧算法落地经验。现任荣耀高级算法工程师,长期负责手机影像算法的预研与落地,主要方向涵盖文字场景图像复原系统搭建、RAW
域 Diffusion 算法预研、异构 CFA 方案通路与算法可行性验证、RAW
域联合去噪去马赛克模型量产交付,以及多机型 / Sensor HDR
成像画质优化。
教育经历
清华大学 - 博士 - 电子工程系
2017.09 - 2023.10
研究方向:计算机视觉、生物识别
吉林大学 - 学士 - 信息工程
2013.09 - 2017.06
工作经验
高级算法工程师 - 荣耀终端有限责任公司
2023.10 - 至今 (~2年零7个月)
核心项目经历
基于生成式架构的文字场景图像复原系统
项目职责:针对现实复杂退化场景下的文字图像,主导从数据闭环、复原算法研发和落地的全流程。
- 生成式复原算法研发:负责文字图像复原模型的设计、迭代与落地,主导从传统
Transformer 向 JiT + Flow Matching
生成式架构的演进,引入像素级结构约束缓解生成式模型在文字区域的笔画幻觉与结构失真问题,提升复杂退化场景下的文字可读性与结构稳定性。新算法对比基线模型在主观盲测中胜率接近
100%;复原图像的文本识别准确率相对提升 12%,识别置信度显著提升
26%,成功支撑下一代旗舰机影像卖点特性。
- 数据闭环与数据工程:构建基于大模型驱动的自动化数据清洗与演进管线。微调
Qwen3-VL-8B-Instruct
建立硬例挖掘与价值过滤机制,对输入图像进行多维度质量量化,实现高质量文字图像的自动化高精筛选与过滤。融合实采、渲染合成与生成数据等异构源,高效构建出百万级规模的高质量文字复原训练集,形成可持续迭代的数据闭环体系。
RAW 域 Diffusion 算法预研
项目职责:参与布局下一代“端云协同”影像演进,针对 RAW 域图像传统复原模型的画质上限限制,引入生成式大模型先验,探索多帧输入条件下的模型结构设计与 RAW 域信息注入策略。
- 跨空间条件注入设计:针对 Flux-7B 的隐空间与原始 RAW 域(Bayer
格式)的模态差异,通过添加额外数据流的方式进行信息引入 RAW 域信息,结合
LoRA 微调显式约束底层结构,使输出 RGB 域下图像重建质量显著提升。
- Latent / Pixel 空间扩散方案消融与架构选型 :对比预研 Latent 与 Pixel
空间扩散两大路线,深入探究图像重建中“清晰度”与“保真度”的两者在不同技术路线上的效果差异,为模型定型与演进奠定基础。
画质优化业务交付
项目职责:负责自研的联合去噪去马赛克算法在多款量产机型上的优化、落地及画质问题排查,保障算法稳定量产落地。
- 量产业务全流程交付:负责多款旗舰及中端机型端侧图像复原算法的全流程交付,包括数据构建、退化建模、模型训练与常见画质问题优化,推动算法稳定上线量产。
- 噪声建模与数据构建:基于 Gaussian‑Poisson 物理噪声模型对不同 Sensor
的噪声统计特性进行参数标定,构建贴近真实成像分布的 RAW
域退化数据,用于支撑 RAW
域复原模型在复杂真实退化条件下的训练与优化。
- 多 Sensor 噪声参数适配:针对不同 Sensor
噪声参数存在差异导致的模型训练时间过长的问题,通过引入 MOE
方案通过一个模型进行兼容,大幅缩短模型适配与训练周期。
专业技能
- 算法方向:计算机视觉、图像复原、生成式视觉算法、计算摄影、RAW
域画质优化、生物识别。
- AI 提效/辅助开发:在实际业务/生活中深度集成 Claude Code / Codex /
Openclaw 等 AI 工具,并能够基于相关设计思想合理设计 CLAUDE.md/AGENTS.md
与 Skills 进行项目管理与自动化效率提升;为 Openclaw 等 Multi-Agent
工具搭建技能中台避免 Agent Workspace 腐化。
- 开发技能/工具:Python, Pytorch, Diffusers, PEFT, Git, Docker
等。
- 英语能力:
通过大学英语四六级考试;具备良好的英语听说读写能力,能够快速浏览英文文献和书籍。
荣誉奖励
- 荣耀 2024 年度微光者、荣耀知识之星
- 国家奖学金、奇虎 360 奖学金、三星奖学金
- 校优秀学生干部、校优秀学生、校级国奖励学标兵
论文
发表与参与论文 7 篇,研究方向聚焦生物识别与图像复原。
- P. Zhao, S. Zhao, L. Chen, W. Yang, and Q. Liao,
"Exploiting Multi-perspective Driven Hierarchical Content-Aware Network
for Finger Vein Verification," IEEE Trans. Circuits Syst. Video
Technol., vol. 32, no. 11, pp. 7938-7950, Nov. 2022.
- P. Zhao, S. Zhao, J.-H. Xue, W. Yang, and Q. Liao,
"The Neglected Background Cues Can Facilitate Finger Vein Recognition,"
Pattern Recognit., vol. 136, Art. no. 109199, Nov. 2022.
- P. Zhao, Z. Chen, J. Feng et al., "Single-Sample
Finger Vein Recognition via Competitive and Progressive Sparse
Representation," IEEE Trans. Biometrics, Behavior, Identity
Sci., vol. 5, no. 2, pp. 209-220, Apr. 2023.
- Y. Song, P. Zhao, W. Yang, J. Zhou, and Q. Liao,
"EIFNet: An Explicit and Implicit Feature Fusion Network for Finger Vein
Verification," IEEE Trans. Circuits Syst. Video Technol., vol.
33, no. 5, pp. 2520-2532, May 2023.
- Q. Bao, R. Zhu, B. Gang, P. Zhao, W. Yang, and M.
Qing, "Distilling Resolution-robust Identity Knowledge for
Texture-Enhanced Face Hallucination," in Proc. 30th ACM Int. Conf.
Multimedia, 2022.
- S. Zhao, J. Wen, L. Fei, B. Zhang, P. Zhao, and S.
Li, "Structure Suture Learning Based Robust Multi-View Palmprint
Recognition," IEEE Trans. Neural Netw. Learn. Syst., 2022.
- S. Zhao, J. Wu, B. Zhang, L. Fei, S. Li, and P.
Zhao, "Adaptive Graph Embedded Preserving Projection Learning
for Feature Extraction and Selection," IEEE Trans. Syst., Man,
Cybern., Syst., vol. 53, no. 2, pp. 1060-1073, Feb. 2023.