最适合初学者的18个经典开源计算机视觉项目
发布时间:2021-05-22 21:35:06 所属栏目:大数据 来源:互联网
导读:所以在这篇文章中, 我结合并创建了一个基于计算机视觉各种应用的开源计算机视觉项目列表。有很多事情要做,这是一个相当全面的清单,所以让我们深入研究! 如果你是一个完全的计算机视觉和深度学习的新手并且更想要通过视频学习, 请参考下边: 使用深度学
所以在这篇文章中, 我结合并创建了一个基于计算机视觉各种应用的开源计算机视觉项目列表。有很多事情要做,这是一个相当全面的清单,所以让我们深入研究!
如果你是一个完全的计算机视觉和深度学习的新手并且更想要通过视频学习, 请参考下边:
使用深度学习2.0 的计算机视觉
18个开源的计算机视觉项目分为下边的这些类:
图像分类
人脸识别
使用GAN的自然风格转换
场景文字检测
使用DETR的目标检测
语义分割
自动驾驶的道路交通线检测
图像标注
人类姿势估计
通过面部表情的情感识别
图像分类的开源计算机视觉项目
图像分类是计算机视觉领域的基础任务, 目标是通过给每张图片分配一个标签来区分图像。对人类来说理解区分我们看到的图像很容易。 单是对于机器来说时非常不同的。 对于机器来说区分大象和汽车都是一件繁重的任务。
下边是几个最突出的图像分类开源项目:
Cifar10
CIFAR-10是一个在训练机器学习和计算机视觉算法常用的数据集,它是机器学习最受欢迎的数据集。 包含了60000张图像, 分为10类, 每张图像的的尺寸为32x32。 类别有飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船和卡车。
ImageNet
ImageNet数据集是一个为计算机视觉研究的巨大图像数据集, 这个数据集中有多于140万张图像被手供标注, 并且这些标注说明了图像中含有那些物体。并且有多余1万张图像标注了物品的边界框。 ImageNet包含了多余20000类的物品。
作为初学者,你可以使用keras或者pytorch从头开始学习神经网络, 为了能够得到更好的效果提升学习的层次, 我建议使用迁移学习预训练模型,例如CGG-16, Resnet-50,GoogleNet等等。
![]() (编辑:常州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |