【导读】跟着人工智能技能的快速成长,视觉检测技能于医疗康健范畴的运用愈来愈广泛。传统的目力检测需要专业医护职员操作,检测效率较低,且难以实现主动化。本项目基在米尔RK3576开发板,设计并实现了一套智能目力检测体系,旨于提供一种便捷、高效的目力检测方案。RK3576是一款高机能ARM架构的开发板,搭载瑞芯微处置惩罚器,具有强盛的AI推理能力,合适运行手势辨认、图象处置惩罚等AI使命。 1、项目配景与方针 实现主动目力检测:用户经由过程简朴的手势便可完成摆布眼的目力检测 AI手势辨认:使用MediaPipe实现精准的OK手势检测,作为启动测试的交互方式 智能化流程节制:主动辨认E字标的目的、判定测试成果、主动切换测试眼别 语音交互:集针言音播报功效,提供清楚的测试指引及成果反馈 2、体系功效设计 2.1 功效架构 体系架构图申明: 架构申明: RK3576开发板: 焦点节制器,运行所有营业逻辑 视频播放模块: 利用GStreamer举行硬件解码播放指导视频 手势辨认模块: MediaPipe Hands检测OK手势作为启动旌旗灯号 间隔检测模块: 串口读取TOF传感器数据,检测用户间隔 语音播报模块: ES8388音频编解码,播报接待词及检测成果 UI显示模块: PySide6 Qt开发,HDMI输出到显示屏 数据流向: 摄像头收罗图象 → MediaPipe手势辨认 → 判定OK手势 TOF传感器检测间隔 → 串口通讯 → 判定间隔是否适合 随机天生E字标的目的 → 显示于屏幕上 用户手势 → 摄像头收罗 → 手势辨认 → 对于比判定 测试成果 → 语音播报 + 屏幕显示 2.2 焦点功效模块 2.3 测试流程 流程申明: 体系初始化 - 启动摄像头、手势辨认、间隔传感器、音频体系 播放指导视频 - 开机主动播放intro_guide.mp4先容利用要领 等候OK手势 - 视频竣事后显示提醒,用户做OK手势启动测试 右眼测试 - 随机显示E字标的目的,用户用手势回覆,3次测试后判定成果 左眼测试 - 主动切换到左手,反复右眼测试流程 显示成果 - 播报两侧目力成果,显示于屏幕上 等候从头测试 - 用户可再次做OK手势从头最先测试 3、硬件与电路申明 3.1 硬件清单 Intel RealSense D435 深度摄像头特色 本项目选用Intel RealSense D435深度摄像头作为视觉收罗装备,用在手势图象收罗。比拟平凡USB摄像头具备如下上风: 双流输出 同时撑持RGB彩色流及深度流 本项目利用RGB流(640x480)举行手势辨认 深度流可用在将来扩大(如手势支解) 高质量图象 RGB分辩率:1920x1080 @ 30fps 收罗分辩率:640x480 @ 15fps(用在手势辨认) 内置主动白均衡、主动暴光功效 合用在各类光照前提 即插即用 经由过程USB 3.0接口毗连 提供跨平台的librealsense SDK (pyrealsense2) 撑持Linux、Windows等操作体系 不变性强 工业级品质,不变性好 主动暴光及对于焦,顺应能力强 于繁杂情况下仍能正确辨认手势 易在集成 Python绑定撑持,易在开发 帧同步机制,确保数据一致性 及时性好,满意手势辨认需求 TOF激光测距模块特色 本项目选用TOF(Time of Flight)激光测距模块作为间隔检测装备,具备如下上风: 超宽测距规模 测距规模:2cm ~ 10m 笼罩从近到远的各类利用场景 高精度丈量 丈量精度:±1cm 分辩率高,可检测微小间隔变化 快速相应 相应时间: 100ms 及时检测用户间隔,合用在动态场景 抗滋扰能力强 不受光照变化影响 不受被测物体颜色及材质影响 低功耗 功耗低,发烧小 合适永劫间运行 3.2 硬件接线 RK3576开发板 │ ├── USB3.0接口 ──── Intel RealSense D435 深度摄像头 │ │ ├── 串口(UART) ───── TOF激光测距模块 │ │ ├── I2S/PCM ──────── 音频编解码 (ES8388) ── 喇叭 │ │ └── HDMI ────────── 显示器 (HDMI OUT) 3.3 体系情况 操作体系: Buildroot Linux (ARM64) Python版本: 3.10+ AI框架: MediaPipe (Google) 视觉库: Intel RealSense SDK (librealsense) GUI框架: PySide6 多媒体: GStreamer + ALSA 音频格局: WAV (44.1kHz, 16bit, stereo) 4、要害技能申明 4.1 AI手势辨认 利用Google的MediaPipe框架举行手势辨认,重要特色: 模子: MediaPipe Hands (预练习模子) 输入: RGB图象 (640x480) 输出: 21个要害点坐标、手势分类 机能: 及时推理 (30fps) 4.1.1 MediaPipe Hands 21个要害点 MediaPipe Hands 模子输出21个手部要害点,编号从0到20: 8 12 16 20 │ │ │ │ ▼ ▼ ▼ ▼ ○───────────○───────────○───────────○ ← 食指、中指、无名指、小指 │ │ │ │ 7 11 15 19 │ │ │ │ ○───────────○───────────○───────────○ │ │ │ │ 6 10 14 18 │ │ │ │ ○───────────○───────────○───────────○ │ │ │ │ 5 9 13 17 │ │ ○───────────────────────○ │ │ 4 13 │ │ ○────┴───────────────────────┴────○ │ │ 0 9 │ │ └────────────────────────────────┘ (手段) 要害点索引申明: 0: 手段 1-4: 拇指 (掌骨→近节指骨→远节指骨→指尖) 5-8: 食指 9-12: 中指 13-16: 无名指 17-20: 小指 




