According to the project made by learning murtaza Hassan's videos every day, thank the up Master of station B: a graduate student who knows a little about everything. It is mainly used to learn opencv by myself. On my CSDN blog, I have a detailed picture and text introduction of each project. I will continue to study hard. Welcome to my CSDN blog, where I store my code and some information. CSDN link。 You can check it in my column - opencv project practice.
地址1:Opencv项目实战:01 文字检测OCR(1) 地址2:Opencv项目实战:01 文字检测OCR(2)
介绍:使用了第三方库pytesseract,以及Tesseract进行字母和数字的OCR识别,文章分为了1和2篇,第2篇相较于第1篇有所改进。个人感觉是对于文字和数字的识别方面还是有相当进步的空间。好像目前不会使用这个方面来进行OCR识别。
应用:OCR的应用非常广泛。它可以用于文件扫描软件,将纸质文档转换为可编辑的电子文本。此外,OCR还可以用于搜题软件,帮助学生快速识别和搜索问题答案。在QQ或微信等聊天软件中,文字识别可以将图片中的文字提取出来,方便快捷地转发和共享信息。此外,OCR还可以应用于自动化数据录入、身份证识别、银行卡识别等场景,极大地提高了工作效率和准确性。
介绍:通过鼠标进行点击即可进行平面的角度检测,存在人为的点击误差。
应用:通过鼠标进行角度检测具有多种应用,包括三维建模、游戏和虚拟现实以及机器人控制和自动化系统。鼠标可以用于改变物体的角度、控制视角、编辑图像,或者手动控制机器人的姿态。这种技术需要借助算法和传感器来进行姿态估计和转换,以实现特定应用领域的需求。
介绍:这里可以实现二维码和条形码的识别,扫描出来的结果可能会有数字,网址链接,英文等。除此之外,还进行了公司的员工使用工作牌扫描二维码开门的想法实现。
应用:二维码和条形码的应用广泛,如员工使用工作牌扫描二维码开门、移动支付等。这种扫描方式方便快捷,提高了门禁和支付的安全性和效率。在疫情期间更是少不了要扫场所码。
介绍:通过特征检测可将图片进行拼接,如何实现的也可以参考这里。
应用:全景图片拼接应用广泛,包括旅游、房地产、虚拟现实等领域。它将多张相邻照片合成一张全景图,提供宽广视野和沉浸式体验。在旅游中展示风景名胜,房地产展示房屋环境,VR创建虚拟场景等。手机的全景模式也采用这种方法,让用户轻松拍摄全景照片,享受更丰富的视觉体验。
介绍:gif图像中检测了水瓶(截图时间不够了),鼠标,剪刀,书,手机,牙刷,键盘,电脑等。可以检测到coco,names文件中的物品。
应用:物体检测广泛应用于多个领域。其中包括自动驾驶、视频监控、物体识别与分类、增强现实和虚拟现实、医学影像分析等。物体检测技术的应用领域在不断扩展,未来还将涵盖更多的领域和场景。
地址:Opencv项目实战:06 文档扫描仪 介绍:修正文档,可以视频检测也可以使用图片检测,实现的话,要么有VIP,兑换积分,要么就是看广告等。如果你发现扫描的文档不清晰,请修改合适的分辨率。以我个人来看,它的实用性很高。
应用:文档扫描仪可以用于扫描身份证、护照等个人身份证件。有些还具有自动文档处理功能,如自动裁剪、校正图像、去除背景噪声等。这可以提高扫描效果的质量和一致性。
介绍:高精度执行面部识别,首先简要介绍理论并学习基本实现。然后将创建一个考勤项目,该项目将使用网络摄像头检测人脸并在 Excel 表中实时记录考勤情况。
应用:人脸识别和考勤系统可以用于企业、学校等场所的考勤管理。员工或学生只需在系统中注册自己的人脸信息,然后在每天上班或上课时,系统通过摄像头检测和识别人脸,自动记录考勤时间,提高考勤的准确性和效率。考勤数据可以实时记录在Excel表或数据库中,方便后续统计和分析。
地址:Opencv项目实战:08 Yolov3更高精度的检测物体
介绍:本次物体检测,将采用新的方法,相比于上一次,它的检测效果更好,具体在下面的项目介绍当中 ,本次检测的物品有手机、牙刷、剪刀、杯子、运动球、书等。检测的这些物品是方便展示的,还可以使用水果的,大家做好后,不妨自己去试试。
应用:更高的检测精度,YOLOv3相对于前代模型,引入了更多的卷积层和更小的检测尺度,从而提高了物体检测的精度。YOLOv3在不同尺度下进行多次检测,从而能够更准确地捕捉不同大小的目标。
介绍:主要是运用了之前扫描文档的思想,以A4纸为背景,检测其中区域的物体长和宽。我的摄像头无法固定,所以是手持的,且由于我在寝室里面是真的没有找到合适的测量物体以及背景色(全是米色或原木色的)。所以效果有所欠缺,但经过ps修改的图片,检测的效果还是很不错的。
应用:在工业制造过程中,使用计算机视觉进行物体尺寸测量,可以自动进行物体尺寸测量,减少了人工操作的需求,并提高了测量的效率。相比传统的手动测量方法,计算机视觉可以在更短的时间内处理大量的数据,并实现高速、连续的测量。
介绍:采取dlib和shape_predictor_68_face_landmarks.dat文件,为图像添加蒙版,更改嘴唇的色号,如果你想修改其他的部位,它的方法是同理的,除此之外,让图片显示出脸部的68个地表.
应用:在美妆领域,可以利用计算机视觉和机器学习技术实现自动化的化妆效果。结合了图像分析、人脸识别和美妆技术,可以实时调整人脸上的妆容,不仅为用户提供了个性化的美妆体验,还可以帮助品牌和商家更好地推广和销售化妆品。
地址:Opencv项目实战:11 使用Opencv高亮显示文本检测
介绍:基于文字高亮的图片中,需要追求一种能够快速提取重点内容的方法。通过opencv的方法通过分析图片中的文字信息,并将其准确提取出来,使我们能够方便地获取关键信息并将其整理存储。为此,将文字高亮图片转换为可编辑的文本,并将提取的内容保存到一个CSV(逗号分隔值)文件中。
应用:在教育、学术、市场、法律法规以及新闻等领域,文字高亮图片的信息提取,可以帮助用户从大量的文字信息中迅速捕捉关键内容,并加速信息处理和决策过程。随着人工智能和图像识别技术的不断发展,这一方法在各个行业中的应用前景更加广阔。
介绍:平常我们在各个平台,比如某音、B站、小红薯等,有这么一群创作者——虚拟人物、带有各种背景板的创作者,前段时间还玩出了一个“我的背景板假吗?”这样的梗,那么我们今天要制作的是更改我们的背景板,将原有的去除,添加上新的背景板,并可以通过敲击键盘对背景板进行切换(本项目中,‘q’表示-1,‘w’表示+1)。
应用:在影视娱乐产业,背景替换技术,可将演员拍摄的前景图像与虚拟的背景场景进行合成,制作令人惊叹的特效,平时的工作中,线上会议中也可以替换虚拟的背景场景,可以显得更加的专业等等。
介绍:基于Mediapipe开发的简单手势识别,是后面很多有手势识别开发项目的基础。
应用:手势识别技术可以用于人机交互界面的设计,例如触摸屏、智能手机和平板电脑等设备。用户可以通过手势动作来控制和操作设备,实现更直观、自然的交互方式,提高用户体验。
介绍:本篇与上一篇有很多联系,大家可以看看这篇Opencv项目实战:13 手部追踪,我们将根据上一节的内容,进行一个拓展。本篇你可以学到如何通过手势来控制电脑的音量大小。这个就是一个主要的效果,通过大拇指与食指来控制音量,并在侧边具有一个音量条,更加美观和简洁。
应用:手势控制音量是手势识别技术在音频领域的一种应用。通过使用摄像头或其他传感器设备捕捉用户的手势动作,并将其识别为特定的音量控制命令,实现对音频设备的音量进行调节。
介绍:本篇将会以HandTrackingModule为模块,这里的模块与之前的有所不同,请按照本篇为准,前面的HandTrackingModule不足以完成本项目,本篇将会通过手势对本人的博客海报进行缩放,具体效果可以看下面的效果展示。
应用:手势缩放图片是手势识别技术在图像处理领域的一种应用。通过使用摄像头或其他传感器设备捕捉用户的手势动作,并将其识别为缩放命令,实现对图片的放大和缩小操作。
介绍:这次使用cvzone模块,制作一个虚拟拖拽系统,我们根据索引可以知道食指与中指的索引为8和12,当两指间合并时可以对虚拟方块进行拖拽,张开时解除拖拽,方块停在此处。虽然目前仍然存在一定的bug,即当两个虚拟方块重合较多时,会使其中的一个方块消失,但我们又能利用这一点可以制作计算机视觉方面的游戏,比如贪吃蛇等。
应用:虚拟拖拽系统在虚拟培训和模拟应用中发挥重要作用。例如,在医学培训中,学生可以使用虚拟拖拽系统来模拟手术操作,提高技能和手眼协调能力。在虚拟游戏和娱乐中也得到广泛应用。玩家可以使用手势或控制器来拖拽游戏中的角色、道具或物体,与虚拟环境进行互动,增加游戏的沉浸感和交互性。
介绍: 这次是一个有意思的计算机视觉游戏——贪吃蛇,我们以食指为蛇头,不断的移动我们的手指,当吃到甜甜圈的时候,蛇身增长,当食指停止或触碰蛇身时,游戏结束。点击'r'将重新开始游戏。
应用:计算机视觉游戏贪吃蛇的应用是基于虚拟现实(VR)或增强现实(AR)技术的交互式游戏体验。通过计算机视觉技术和手势识别,将玩家的手指作为贪吃蛇的控制器,创造了一种全新的游戏体验。
介绍:mediapipe中有人体姿态检测的功能,今天我们就将实现最最基础的人体姿态估计项目,它的应用还是有很多的,比如:AI锻炼检测标准、老人跌倒检测等,这些方面其实已经有了很多的参考资料了,当然在我知道的当中用yolo的倒是挺多的。那么今天我们将会通过人物跳舞的视频进行一个姿态的检测。
应用:人体姿态检测可用于虚拟现实(VR)和增强现实(AR)应用。通过识别用户的姿势和动作,可以在虚拟或增强的环境中实时渲染用户的虚拟身体,实现身临其境的交互体验,增强虚拟现实的沉浸感和真实感。
介绍:在Opencv项目实战:15 手势缩放图片中,我们搭建了HandTrackingModule模块,但在这里你还得用本节的HandTrackingModule,因为有些功能并不需要,且也是分散了一些函数的功能。在这一节中,我的想法是通过点单个食指控制move,双指合并控制click,这样就能够实现手势控制鼠标。
应用:手势控制鼠标可以提供无触摸的交互方式,减少对鼠标和键盘的依赖。用户可以使用手势来控制鼠标的移动、点击和滚动等操作,从而实现更加直观和自然的交互体验。
介绍:今天要做的是单手识别数字0到5,通过在窗口展示,实时的展示相应的图片以及文字。
应用:这种应用可以用于儿童教育和数字学习。通过展示数字图片和文字,配合单手手势识别,孩子们可以学习和记忆数字0到5,并与相应的图像和文字进行关联,提高数字认知能力和学习兴趣。
介绍:你并不需要多么了解深的机器学习算法,我的初衷是通过本项目,激发大家学习机器学习的动力。选择这种手势原因是因为只有24个字母,你的电脑足以带的动,虽然我只训练A、B、C、D等字母的手势识别,但只要掌握了方法,你可以全部弄完24个字母的手势(我觉得没这必要)。
应用:ASL是美国聋人社区的主要交流方式。手势识别技术可以将ASL手势转化为文字或语音,实现聋人与听觉人群之间的无障碍沟通。通过识别ASL手势并转化为文字或语音,聋人可以与非手语使用者进行实时对话、视频通话或传递信息。
介绍:准确的颜色框选功能,统一使用绿色边界框显示;对物体内部的颜色边缘轮廓进行识别,以白色为边缘,实现更加精细的框选;用户可以选择感兴趣的颜色进行识别,不想要的颜色将被排除;在窗口中的边框旁打印相应的颜色英文字母;对于效果不理想的情况,可通过调试Color_trackbar.py文件进行优化。
应用:在物流和仓储方面,通过物体颜色识别,可以实现对货物的自动识别和分类,提高物流和仓储的效率。例如,将不同颜色的包裹或商品按照目的地进行自动分拣和打包。
介绍:本次项目是我的软件课设,自主命题。智能计数指的是对特定物体进行计数(对于比较规整的物体效果很好,例如硬币、钥匙、方块等),表单信息指的是对图片进行计数并写入excel表格当中。从投入到应用角度来看,使用深度学习的方法是更加的准确,而使用opencv的方法有局限性,仍然有改进的空间。
应用:物体体计数能够对场景中的物体进行准确的计数,为决策和统计提供重要依据;而表单信息则能够自动化地将检测到的信息整理并存储,方便后续的分析和查询。在零售、安防、交通监控等领域发挥着重要作用。
介绍:简单的自娱自乐的计算机视觉互动游戏,石头剪刀布,使用random生成随机数,用于模拟AI窗口随机出拳,玩家窗口手势识别检测石头、剪刀、布三种手势,根据游戏规则,两方玩家进行比较,按下空格键即为游戏开始,玩家在游戏开始后,有三秒的时间思考出拳策略。计时器会显示在屏幕上。在时间结束后,玩家出拳并与AI进行比较,根据游戏规则判断胜负并累计分数。
应用:简单互动式的计算机视觉游戏。