盯住梅西:TensorFlow目标检测实战

开发 开发工具
本文将教你通过 TensorFlow 训练定制目标检测模型,以专门定位和识别足球巨星梅西;这一技术或许有助于催生出足球新战术,提升比赛水平。

近日,一篇题为《Following Messi with TensorFlow and Object Detection》的教程文章展示了如何通过 TensorFlow 训练定制的目标检测模型,以专门定位和识别足球巨星梅西;同时作者也希望这一技术有助于催生出足球新战术,提升赛事水平。

我们之前曾把 TensorFlow 与目标检测模型结合使用,但使用的一直是预先设定的传统数据集,比如 COCO。这次的挑战将再高一级,我会分析一个足球比赛的片段,并识别其中至少一个球员。

一提到足球,你首先想到的可能是那些天才球员,比如阿根廷人梅西。本文中,我将会:

  • 训练一个定制的目标识别模型以定位梅西
  • 选择一个真实的赛事转播视频(本文中我使用的今年 8 月 31 日世界杯预选赛南美区,乌拉圭对战阿根廷的录像),看看我们能得到什么结果。
  • 通过这项技术,我们或许可以设计新的战术,提高足球赛事的水平。

注意:我们将会结合使用 TensorFlow 与上述目标检测模型,且均具备 Apache License 2.0 许可证。

我们将从最终获取的结果开始:

比赛中的一段慢动作回放

比赛中的一段慢动作回放

如果你对此感兴趣,我建议你多花点时间一步一步学习该模型的搭建步骤。

它包含三个重要的步骤:

  1. 构建有目标可供检测的定制数据集
  2. 通过 TensorFlow 训练和评估该模型
  3. 运用该模型

步骤:

构建自定义数据集 Moment

1. 我们查看官方文档,就会发现有单独的部分介绍如何构建自定义数据集。地址:

https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/using_your_own_dataset.md

2. 我们需要想要检测的物体的图像,并且需要给它们打标签。

  • 对于这种情况,我使用的是 RectLabel 工具,对于 MacOS 是一个不错的选择。(也有其他替代工具,如 LabelImg。)
  • 然后就是***次测试,我收集来的 119 张足球比赛的图像(数量很小,但对测试来说足够了)。

我给大约 100 张梅西的图片添加了标签。

注:如要将样本投入正式的应用,这一步就需要更多图像。

3. 下一步是把照片和对应的 tag 转换成 TFFormat 文件。脚本地址:

https://github.com/nbortolotti/tensorflow-code-experiences/blob/master/custom_model_object_detection/generate_tfrecord.py。(我使用了中间步骤将 xml 注释标签转换成 csv,脚本地址:

https://github.com/nbortolotti/tensorflow-code-experiences/blob/master/custom_model_object_detection/xml_metadata_csv.py。)

4. 记住:***的环境是构建一个训练集和评估集。

训练/评估自定义模型 Moment

5. 上述文件完成后,我们就可以训练和评估模型了。

这一步我使用的是机器学习引擎,因为我没有本地基础架构可以在 1 小时内执行完整个过程。(官方说明:

https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/running_on_cloud.md)

5 个工作线程使用标准 GPU。

同样强烈推荐使用 TensorBoard 对训练和评估过程进行可视化。

记住:直接使用谷歌云存储。也就是说,所有文件必须在这种 repository 类型中,以与训练引擎完成互动。

TensorBoardML 中的 TotalLoss

TensorBoardML 中的 TotalLoss

机器学习引擎工作示例

机器学习引擎工作示例

6. 使用了 21.77 个单元,经过 1 小时 9 分钟和 2 万次迭代之后,我们得到了多个检查点和一个可用模型。

7. 我们使用***进的检查点,使用训练好的模型进行推断。(官方文档:

https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/exporting_models.md)

使用自定义模型 Moment

8. 我们将从以下选项中使用该模型:

  • 使用该模型和利用检测结果生成视频的脚本。实现示例:https://github.com/nbortolotti/tensorflow-code-experiences/blob/master/custom_model_object_detection/od_video_generator.py。
  • 实时评估视频和解码标签以计算阿根廷球星的外表的脚本。实现示例:https://github.com/nbortolotti/tensorflow-code-experiences/blob/master/custom_model_object_detection/od_video_label_detector.py
  • 注意:使用慢镜头的同样的 demo。地址:https://www.youtube.com/watch?v=ZCUJJN0q-To
  • 更多示例信息,详见:https://github.com/nbortolotti/tensorflow-code-experiences/tree/master/custom_model_object_detection

这可能只是这项有趣研究的开始……后续也许会涉及到如何改进体育战术、囊括更多运动员和验证关联。现在,我们仅仅使用传统的电视直播信息,如果我们使用更清晰或能看到球场全景的摄像头,又会发生什么呢?

所有球员的位置都可以得到计算。事实上,我们的实验证明了用机器学习识别球员非常容易,但是我们能根据球员的位置和他们擅长的技术找到更好的战术吗?

我希望你能从中获得乐趣,希望在未来,我们能够看到更多体育领域的 TensorFlow 实现。

原文:

https://becominghuman.ai/following-messi-with-tensorflow-and-object-detection-20ba6d75667

【本文是51CTO专栏机构“机器之心”的原创译文,微信公众号“机器之心( id: almosthuman2014)”】

 

戳这里,看该作者更多好文

责任编辑:赵宁宁 来源: 51CTO专栏
相关推荐

2022-12-20 07:44:09

梅西封王卡塔尔

2012-05-30 09:51:10

2022-11-23 14:10:11

黑科技智能

2018-06-08 17:23:07

华为

2019-08-01 12:47:26

目标检测计算机视觉CV

2017-10-02 16:13:47

深度学习目标检测计算机视觉

2021-10-08 09:46:42

深度学习神经网络人工智能

2019-05-23 10:02:00

AI

2022-07-25 18:06:36

AI系统

2022-08-24 09:00:00

深度可分离卷积运算模型

2020-02-28 15:33:12

代码人工智能检测

2022-10-14 16:18:40

MobileNetAndroid端模型训练

2023-12-03 08:36:33

AI模型

2017-09-20 16:25:00

深度学习视觉领域计算机

2023-12-19 16:01:40

深度学习人工智能目标检测

2017-08-17 11:30:40

阿里

2022-12-19 10:16:32

AI预测

2021-04-15 09:50:41

深度学习编程人工智能

2020-03-09 14:08:25

Python目标检测视觉识别

2023-11-08 13:05:37

AI训练
点赞
收藏

51CTO技术栈公众号