深圳职业技术大学人工智能学院模式分析与机器智能课题组

这是深职大PAMI(Pattern Analysis and Machine Intelligence,PAMI)课题组的网站!欢迎大家关注!

深圳职业技术大学人工智能学院模式分析与机器智能课题组专注于模式分析、计算机视觉和智能人机交互领域的前沿研究,致力于推动人工智能技术在安防、智能制造、教育和医疗等实际应用中的创新发展。课题组由杨欧院长和吴庆甜博士领衔,成员包括多位在模式识别和计算机视觉领域拥有丰富经验的学术带头人及优秀的研究生和本科生。

课题组的研究方向主要涵盖以下几个方面:

1. 医学图像分割

医学图像分割是计算机视觉和医学成像领域中的一个重要任务,旨在将医学图像中的特定结构或区域从背景中提取出来。其主要目标是辅助医生在影像学诊断、手术计划和治疗效果评估等方面,提高效率和准确性。

医学图像分割

2. 人体姿态估计

人体姿态检测是计算机视觉领域中用于识别和预测图像或视频中人体关键点位置的技术,它包括2D和3D姿态估计、评估方法、DensePose以及人体参数化模型等,广泛应用于动作识别、虚拟现实、人机交互和视频监控等多个领域。

人体姿态估计

3. 扩散模型:SD

Stable Diffusion(简称SD)是一个由CompVis、Stability AI和LAION等公司研发的开源文生图模型,它以其约1B参数量、能够在普通显卡上运行推理和模型精调而广受欢迎,基于latent空间的扩散模型技术,SD能够高效地从文本描述生成图像或对现有图像进行编辑和风格转换,推动了AIGC技术的普及和发展。

扩散模型

4. talking face generation

Talking face generation是一种技术任务,它涉及给定一段音频和一张驱动人脸图片,生成一段视频中该人脸随着音频“说话”的过程,要求视频中人物的嘴唇动作、面部表情与音频保持同步,以实现音视频之间的高度一致性和逼真度。

talking face generation

5. 通用目标检测

通用目标检测是一种旨在识别和定位图像或场景中任意目标的技术,它不依赖于大规模基准数据集,而是具备强大的泛化能力,能够在开放世界中处理未知类别和新领域的数据,无需重新构建数据集或进行大规模的重新训练,同时能够识别未被引入的物体实例为“未知”,并在逐渐收到相应标签时,增量学习这些已识别的未知类别,而不会遗忘先前学习的类别。

通用目标检测

6. 工业异常检测

工业异常检测是工业自动化和质量控制中的关键环节,它通过识别和分类产品或组件中的缺陷来确保最终产品的质量满足既定标准,涉及质量控制、过程监控、预测性维护和自动化等多个方面,旨在提高生产效率,降低成本,并减少由于缺陷产品导致的潜在安全风险。

工业异常检测

7. PCB缺陷检测

研发基于改进YOLO的PCB缺陷检测系统,为工业制造提供高效的自动化检测方案。已通过专利申请并获得业内关注。

课题组不仅注重理论研究,更专注于解决实际应用中的技术挑战。多年来,团队积极参与国内外知名竞赛和合作项目,获得了多项奖项与资助,为推动人工智能技术在行业中的应用贡献了坚实力量。

缺陷检测

8. X光安检检测

X光安检检测是一种非侵入式的安全检查技术,它利用X射线穿透物品的能力来检测行李、包裹和人体内部的违禁品或危险物品,如武器、爆炸物和毒品等,广泛应用于机场、地铁站、大型活动场所等公共场所的安全检查中,以确保人员和设施的安全。

X光安检检测

9. YOLO-World开放目标检测

YOLO-World(You Only Look Once - World)是一种先进的开放目标检测技术,旨在识别和定位图像中的各种对象,即使在面对未知类别或在复杂场景中也能保持高效和准确的性能。这种技术通过单次前向传播即可实现快速检测,无需额外的区域建议或复杂的后处理步骤,使其在实时应用和大规模视觉识别任务中具有广泛的应用潜力。

人体姿态估计

10. 视觉引导的机械臂控制

视觉引导的机械臂控制是一种集成了机器视觉和机器人技术的自动化系统,它通过摄像头或视觉传感器捕捉图像信息,利用计算机视觉算法进行分析和处理,从而实现对机械臂运动的精确引导和控制,使机械臂能够自动识别目标物体的位置、姿态和特征,执行如抓取、装配、喷涂等复杂任务,广泛应用于制造业、物流、医疗等领域,以提高生产效率、灵活性和准确性。

视觉引导的机械臂控制

更多信息

我们的研究方向是开放的,持续更新中

Flag Counter