
基于视觉Transformer的马铃薯薯形与大小自动分级
[目的]解决基于人工特征设计分级方法精度低、鲁棒性差的问题。[方法]提出了一种强泛化的Transformer薯形与大小自动分级方法。基于Transformer模型构建2个PotatoViT模型,并完成马铃薯薯形分级和大小分级任务;利用迁移策略和数据增广方法训练出鲁棒性分级模型;通过测试集定量分析,验证了研究所提方法在马铃薯分级中的有效性。[结果]PotatoViT模型对薯形分级的准确率和模型F<sub>1</sub>得分分别为96.36%,94.75%,对大小分级的准确率和模型F<sub>1</sub>得分分别为89.66%,85.16%,分级精度优于VGG16、ResNet50和MobileNetV3网络模型。[结论]研究所提方法对马铃薯薯形与大小的准确、实时检测是可行的。