背景研究背景
随着人工智能和自动化技术的迅速发展,机器视觉系统已在诸如自动驾驶、智能监控和体育裁判等复杂的动态场景中得到广泛应用。在此类复杂任务中,实现高效且可靠的视觉识别,关键在于系统能否实时准确地同时感知动态运动信息和静态背景信息。因此,开发能够实现动-静态信息同步获取与协同处理的视觉感知体系,是提升机器视觉性能和适应复杂环境的关键。值得注意的是,在自然界中,生物视觉系统长期进化出卓越的协同感知能力,能够在能耗低的条件下同时完成动态运动检测与静态场景解析。这种能力源于其动态与静态信息处理通路的功能分离与相互协作,从而实现高鲁棒性的视觉感知。受此启发,构建一种能够在同一硬件体系内实现动态-静态双模视觉感知的新型光电器件,将为未来高效低功耗的人工视觉系统提供全新的技术路径。
图文解析
面对复杂环境的视觉感知需求,中国科学技术大学iGaN实验室孙海定教授团队受变色龙“动-静融合视觉”策略启发,设计并制作了一种基于InGaN纳米线/水凝胶异质结的双功能视觉传感器。这种纳米线/水凝胶界面在不同电路配置下表现出独特的电解质介导电荷积累和耗散机制,使其可通过简单切换电路连接在光突触和光探测两种工作模式之间灵活转换。进一步,引入氧化钴(CoOx)作为“人工受体”实现界面调控,显著增强了器件在两种模式下的光电性能,有效模拟了生物受体的信号放大行为。基于此,器件在光探测模式下实现了快速、清晰的静态成像,并在光突触模式下实现了图像记忆、去噪处理与动态轨迹识别。最终,构建了一个受变色龙视觉启发的双目人工视觉系统,能够同时识别运动轨迹,并在不同的运动路径下确定移动物体的绝对位置,展示了该双功能视觉器件在动-静融合感知中的可行性与应用潜力。

图1 | a) 变色龙捕食过程中视觉行为。b) 视网膜上的视觉神经细胞组成。c) 变色龙在某一时刻的静态视觉信息以及捕食过程中对猎物运动的动态视觉信息。d) 网球比赛场景示意图。e) 具有静态特征和动态特征识别能力的双功能视觉传感器结构示意图。f) 双功能视觉传感器对某一时刻移动网球的静态环境信息的识别以及对连续动态运动轨迹的识别。

图2 | a) 光刺激下闭路(左)和开路(右)电路中纳米线/电解质异质结构示意图,涉及纳米线内部和表面的电荷行为。b) 光电导模式下的能带弯曲示意图及相应的载流子行为。c) 光电导模式下,由两个连续光脉冲触发的代表性光电流响应。d) 光伏模式下的表面能带弯曲示意图及相应的载流子行为。e) 光伏模式下,由两个连续光脉冲触发的代表性突触后光电压响应。f) CoOx/InGaN结构及受体增强生物行为示意图。g) CoOx/InGaN纳米线的扫描电子显微镜图像。h) CoOx/InGaN纳米线的透射电子显微镜图像。i) CoOx/InGaN纳米线的高角度环形暗场透射电子显微镜图像。j) CoOx/InGaN纳米线的能谱元素分布图。k) CoOx/InGaN和InGaN的态密度分析。l) CoOx/InGaN的电荷密度差分布和Bader电荷分析。m) CoOx/InGaN纳米线和InGaN纳米线的瞬态光致发光衰减曲线。

图3 | 光电导模式下视觉传感器的光探测功能展示。a) 光电导模式下视觉传感器的器件示意图。b) 在450纳米光照、0 V偏置条件下,CoOx/InGaN纳米线和InGaN纳米线的I-t光响应曲线。c) CoOx/InGaN纳米线和InGaN纳米线器件的响应度和响应速度。d) 已报道电解质基光电探测器的关键光探测性能参数比较。e) CoOx/InGaN纳米线器件在450纳米光照下,不同入射光强下的光电流响应。f) 不同光强下CoOx/InGaN纳米线器件的光电流密度和响应度。g) 光电成像系统的示意图。h) 字母“N”和“U”的光学成像结果。

图4 | 光伏模式下视觉传感器的光突触功能展示。a) 光伏模式下视觉传感器的器件示意图。b) CoOx/InGaN纳米线和InGaN纳米线器件在单次光脉冲(450 纳米,0.1 mW/cm2,15 s)下的光突触响应。c) 不同光脉冲间隔时间下CoOx/InGaN纳米线和InGaN纳米线器件的PPF指数。CoOx/InGaN纳米线器件在不同d) 光强,e) 光脉冲数量下的光突触响应。f) 视觉传感器的“学习体验”行为,包括学习、遗忘和重新学习。g) 视觉传感器的图像记忆功能。h) 目标图像与背景噪声之间的对比增强,其中背景噪声包括有噪声的字母“N”和白噪声。i) 有背景噪声的未增强图像。j) 去噪预处理后的增强图像。

图5 | 受变色龙视觉启发的用于动-静态协同感知的人工视觉系统构建。a) 三种不同的运动小球轨迹示意图。虚线表示预先设定的抛物线轨迹,而彩色球体则表示沿每条轨迹选取的五个离散采样点。b-d) 器件在光突触模式下记录的光响应曲线,用于编码运动轨迹1、轨迹2和轨迹3的动态信息。e-g) 器件在光探测模式下记录的光响应分布,反应三条轨迹下的静态场景信息,包括背景与落点位置。h-j) 动态光突触信号与静态光探测信息融合后重建得到的运动小球轨迹及落地点仿真结果,展示所构建人工视觉系统的动-静态协同感知能力。
论文链接:W. Chen, D. Wang, X. Liu, et al. “Bioinspired Reconfigurable Vision Sensor Based on InGaN Semiconductor/Hydrogel Heterostructure for Dynamic-Static Fusion Perception.” Adv. Mater. (2025): e12894. https://doi.org/10.1002/adma.202512894
本文转载自【研之成理】注:文章版权归原作者所有,本文内容、图片、视频来自网络,仅供交流学习之用,如涉及版权等问题,请您告知,我们将及时处理。









