- 高洁;胡俊;庄立城;刘升;王春;
针对色盲人群中多对红、绿、蓝、黄四色区分的视觉感知障碍,而现有色盲辅助眼镜易导致非冲突颜色失真、重新着色技术引发物体颜色认知混淆等问题,提出一种基于嵌入式平台的计算机视觉辅助方法,通过HSV颜色阈值分割、形态学优化与多特征视觉符号编码技术,将颜色信息转化为形状-填充-轮廓的多维视觉特征:采用白线绘制出目标颜色的轮廓,使用不同形状的图案填充易混淆的颜色区域来帮助色盲患者区分.实验表明,在Jetson Nano嵌入式平台下,该方法实现实时处理,可为色觉障碍群体提供一种实时、准确且符合自然认知习惯的辅助解决方案.
2025年12期 v.25;No.323 1-7页 [查看摘要][在线阅读][下载 3562K] [下载次数:127 ] |[阅读次数:4 ] |[引用频次:0 ] - 吴仁愿;陈心怡;刘洋;王双丽;
针对传统医学影像分类存在的分类精度不足、局部感受野受限以及全局特征提取能力较弱等问题,提出一种结合卷积神经网络(CNN)与视觉变换器(ViT)的混合模型CNN-ViT以提高分类性能.模型的CNN层专注于提取肺部影像的局部纹理和结构特征,同时引入高效通道注意力(ECA)机制,以增强通道间关系的建模能力,从而优化特征表示;ViT模块通过多头自注意力机制捕获全局序列信息,以弥补传统CNN在全局特征提取上的不足.为了解决随着网络深度增加,计算和内存开销显著上升的问题,在深层ViT中采用ECA机制优化多头注意力,以减少参数量并提升计算效率.实验结果表明,CNN-ViT在肺纤维化、肺炎和正常肺部图像的分类任务中达96.64%的准确率,优于传统CNN和Transformer模型.
2025年12期 v.25;No.323 8-15页 [查看摘要][在线阅读][下载 1633K] [下载次数:149 ] |[阅读次数:1 ] |[引用频次:0 ] - 钟梦园;胡学友;陈锋;张家辉;
为了解决现有目标算法在复杂环境下检测精度低和漏检率高的问题,对YOLOv8算法进行改进:引入坐标注意力(CA)机制到骨干网络,通过CA同时捕获长程依赖和保留位置信息,增强对目标的特征提取;通过调整颈部网络结构增加大目标检测层,实现在同一图片中检测各种大小目标,有效检测多果实遮挡和树叶遮挡下大小不一的苹果;引入深度可分离卷积(DWConv)和C2模块,减少计算量和参数数量,提高模型的效率和速度;最后在自建数据集中进行训练,得到消融实验和对比实验的结果 .改进后的YOLOv8算法平均精度为92.8%,精确率90.1%,召回率87.5%,与常用模型(Fast R-CNN、YOLOv5s、YOLOv7-Tiny、YOLOv8n)对比,平均精度分别提高3%、4.2%、7.1%、5%,说明改进算法的检测精度更高、漏检情况更少.
2025年12期 v.25;No.323 16-22页 [查看摘要][在线阅读][下载 2873K] [下载次数:313 ] |[阅读次数:2 ] |[引用频次:0 ] - 陈波杰;曾安平;朱利红;解启娜;王新杰;付钰茜;邵利民;
针对用门控循环单元(GRU)模型进行短时强降雨预测时气象数据维度高、非线性强及极端事件稀疏性导致的模型训练不稳定、预测精度不足问题,提出一种启发式算法驱动的GRU模型优化方法(PSG-GRU),即在GRU模型基础上结合遗传算法(GA)、模拟退火算法(SAA)与Pearson相关系数.以降雨预测误差为适应度函数,通过GA全局搜索GRU关键超参数;引入SAA的概率性跳出机制,避免GA陷入局部最优,提升超参数组合鲁棒性;利用Pearson相关系数量化特征与目标降雨量的相关性,剔除冗余特征.在相同实验条件下,PSG-GRU与ConvLSTM、CNN-LSTM、Dilated CNN、STGNN进行横向对比,与GRU、GA-GRU、SAA-GRU、网格搜索优化GRU、CNN-GRU进行纵向对比.采用四川省宜宾市主城区2010—2024年地面气象观测数据作为数据集,以2010—2023年数据作为训练集,以2024年作为测试集,并用Log Loss、MAE、MSE进行模型分析. PSG-GRU与各模型对比结果表明,在Log Loss指标上平均提升19.34%,MAE指标平均提升51.87%,MSE指标平均提升76.27%,三个指标的平均提升幅度为49.16%.
2025年12期 v.25;No.323 23-30+64页 [查看摘要][在线阅读][下载 2799K] [下载次数:123 ] |[阅读次数:2 ] |[引用频次:0 ] - 王华军;童旭;
由于病理图像中目标形态多变、边界模糊以及类别不平衡,现有医学图像分割方法在复杂场景下存在精度不足和鲁棒性差等问题,因此提出一种融合多尺度特征提取与注意力机制的医学图像分割模型Med-SAMNet:在经典U-Net框架基础上,引入空洞空间金字塔池化模块(ASPP)以增强多尺度上下文信息建模能力,同时嵌入通道-空间注意力机制(CBAM),提高模型对关键结构区域的识别精度;针对类别不均衡和边界不清晰的问题,设计交叉熵与Dice联合损失函数,以提升模型在整体精度与轮廓一致性方面的表现.在公开医学图像分割数据集上开展的实验结果表明,Med-SAMNet在mIoU、Dice系数、Recall和Accuracy等指标上均优于现有主流方法 UNet、UNet_3Plus、ConvUnext、DCNet、CS2Net等,消融实验进一步证明ASPP和CBAM模块在提升分割性能中起关键作用.因此Med-SAMNet能够有效整合多尺度语义信息与显著区域特征,提升复杂医学图像中的分割精度.
2025年12期 v.25;No.323 31-38页 [查看摘要][在线阅读][下载 2007K] [下载次数:293 ] |[阅读次数:1 ] |[引用频次:0 ]