背景
- 时间:Apr 2025 - Jun 2025
- 场景:自动驾驶视频理解与关键事件标注。
方法
- 设计聚焦驾驶关键要素的英文 Prompt,突出自车行为与跟车交互。
- 基于 VideoLLaMA2 进行微调,提升场景描述准确性。
结果
- 构建了面向自动驾驶场景的视频标注流程。
- 模型输出在行为与交互描述方面更加聚焦和稳定。
技术栈
- Python
- VideoLLaMA2
- Prompt Engineering
- Fine-tuning
反思
- 后续可引入更细粒度标签体系,覆盖更多复杂交通状态。
- 建议补充定量评测指标,便于版本间迭代对比。