
职位描述
【团队定位与业务场景】
我们致力于构建面向视频场景的智能分析与理解引擎,核心业务涵盖视频结构化解析、目标行为分析与实时事件感知。你将参与核心视频分析引擎的架构设计与演进,利用计算机视觉技术处理复杂动态场景特征,支撑业务从数据到落地的全链路闭环。
【核心职责】
前沿技术落地:跟踪并复现目标检测、实例分割、多目标跟踪领域的前沿算法与工程方案,负责模型的本地部署、微调优化与推理性能调优,保障在实际场景中的稳定运行。
实时视频分析研发:构建高并发、低延迟的实时视频分析流水线,处理多源视频流数据,实现目标检测、实例分割、多目标跟踪与计数统计的端到端闭环。
工程化与迭代闭环:主导 CV 项目从数据构建、模型训练、视频推理、部署优化到 bad case 迭代的完整流程,通过持续的效果验证与问题修复,形成业务可用的稳定解决方案。
业务场景适配:深入分析视频场景中的目标行为、运动轨迹与业务规则,将业务需求抽象为模型可学习的视觉特征与约束条件,推动算法与业务的深度融合。
【任职要求】
・自驱力与探索欲:学历不限(欢迎在校生)。对计算机视觉领域有浓厚兴趣,具备持续追踪 ArXiv 前沿论文与开源社区动态的习惯。
・细分领域的实战经验:在目标检测、实例分割、多目标跟踪方向有扎实的动手开发经验,需满足以下一项或多项:
◦ 跑通并了解 YOLO、DETR、ByteTrack 等主流 CV 模型的开源代码与底层机制。
◦ 具备视频目标跟踪、计数统计或实时视频分析相关项目的完整落地经验。
◦ 熟悉并实操过 CV 模型的数据标注、训练调优、部署优化(如 TensorRT/ONNX)全流程。
・逻辑分析能力:能够清晰解构复杂视频业务场景,具备将业务逻辑抽象为视觉算法方案的能力。
・基础工程能力:熟练掌握 PyTorch 或 TensorFlow 生态,熟悉 OpenCV 等视觉工具库,能编写高效、规范的模型训练与推理代码。
【加分项】
・在 GitHub 有相关的高质量开源项目,或向主流 CV 框架贡献过代码。
・在 Kaggle、AI City Challenge 等竞赛的目标检测、视频跟踪赛道取得过优异成绩(Top 10%)。
・有独立训练并跑通特定业务场景 CV 项目的完整经验,或有大规模视频分析系统的工程化落地经验。
【我们提供】
・充足的算力资源支持,保障前

技能要求
swift
C#
C
PHP
powerbuilder

实习时间
0个月