Welcome-球速(体育科技有限公司)-AI落地好场景,用米尔RK3576做无人视力测试仪
2026-06-23 03:31:01||273次|新闻资讯

【导读】跟着人工智能技能的快速成长,视觉检测技能于医疗康健范畴的运用愈来愈广泛。传统的目力检测需要专业医护职员操作,检测效率较低,且难以实现主动化。本项目基在米尔RK3576开发板,设计并实现了一套智能目力检测体系,旨于提供一种便捷、高效的目力检测方案。RK3576是一款高机能ARM架构的开发板,搭载瑞芯微处置惩罚器,具有强盛的AI推理能力,合适运行手势辨认、图象处置惩罚等AI使命。

1781747183306902.png

1、项目配景与方针

实现主动目力检测:用户经由过程简朴的手势便可完成摆布眼的目力检测

AI手势辨认:使用MediaPipe实现精准的OK手势检测,作为启动测试的交互方式

智能化流程节制:主动辨认E字标的目的、判定测试成果、主动切换测试眼别

语音交互:集针言音播报功效,提供清楚的测试指引及成果反馈

2、体系功效设计

2.1 功效架构

体系架构图申明:

1781747209467762.png

架构申明:

RK3576开发板: 焦点节制器,运行所有营业逻辑

视频播放模块: 利用GStreamer举行硬件解码播放指导视频

手势辨认模块: MediaPipe Hands检测OK手势作为启动旌旗灯号

间隔检测模块: 串口读取TOF传感器数据,检测用户间隔

语音播报模块: ES8388音频编解码,播报接待词及检测成果

UI显示模块: PySide6 Qt开发,HDMI输出到显示屏

数据流向:

摄像头收罗图象 → MediaPipe手势辨认 → 判定OK手势

TOF传感器检测间隔 → 串口通讯 → 判定间隔是否适合

随机天生E字标的目的 → 显示于屏幕上

用户手势 → 摄像头收罗 → 手势辨认 → 对于比判定

测试成果 → 语音播报 + 屏幕显示

2.2 焦点功效模块

1781747239391632.png

2.3 测试流程

1781747288543342.png

流程申明:

体系初始化 - 启动摄像头、手势辨认、间隔传感器、音频体系

播放指导视频 - 开机主动播放intro_guide.mp4先容利用要领

等候OK手势 - 视频竣事后显示提醒,用户做OK手势启动测试

右眼测试 - 随机显示E字标的目的,用户用手势回覆,3次测试后判定成果

左眼测试 - 主动切换到左手,反复右眼测试流程

显示成果 - 播报两侧目力成果,显示于屏幕上

等候从头测试 - 用户可再次做OK手势从头最先测试

3、硬件与电路申明

3.1 硬件清单

1781747352726385.png

Intel RealSense D435 深度摄像头特色

本项目选用Intel RealSense D435深度摄像头作为视觉收罗装备,用在手势图象收罗。比拟平凡USB摄像头具备如下上风:

双流输出

同时撑持RGB彩色流及深度流

本项目利用RGB流(640x480)举行手势辨认

深度流可用在将来扩大(如手势支解)

高质量图象

RGB分辩率:1920x1080 @ 30fps

收罗分辩率:640x480 @ 15fps(用在手势辨认)

内置主动白均衡、主动暴光功效

合用在各类光照前提

即插即用

经由过程USB 3.0接口毗连

提供跨平台的librealsense SDK (pyrealsense2)

撑持Linux、Windows等操作体系

不变性强

工业级品质,不变性好

主动暴光及对于焦,顺应能力强

于繁杂情况下仍能正确辨认手势

易在集成

Python绑定撑持,易在开发

帧同步机制,确保数据一致性

及时性好,满意手势辨认需求

TOF激光测距模块特色

本项目选用TOF(Time of Flight)激光测距模块作为间隔检测装备,具备如下上风:

超宽测距规模

测距规模:2cm ~ 10m

笼罩从近到远的各类利用场景

高精度丈量

丈量精度:±1cm

分辩率高,可检测微小间隔变化

快速相应

相应时间: 100ms

及时检测用户间隔,合用在动态场景

抗滋扰能力强

不受光照变化影响

不受被测物体颜色及材质影响

低功耗

功耗低,发烧小

合适永劫间运行

3.2 硬件接线

RK3576开发板

├── USB3.0接口 ──── Intel RealSense D435 深度摄像头

│ │

├── 串口(UART) ───── TOF激光测距模块

│ │

├── I2S/PCM ──────── 音频编解码 (ES8388) ── 喇叭

│ │

└── HDMI ────────── 显示器 (HDMI OUT)

3.3 体系情况

操作体系: Buildroot Linux (ARM64)

Python版本: 3.10+

AI框架: MediaPipe (Google)

视觉库: Intel RealSense SDK (librealsense)

GUI框架: PySide6

多媒体: GStreamer + ALSA

音频格局: WAV (44.1kHz, 16bit, stereo)

4、要害技能申明

4.1 AI手势辨认

利用Google的MediaPipe框架举行手势辨认,重要特色:

模子: MediaPipe Hands (预练习模子)

输入: RGB图象 (640x480)

输出: 21个要害点坐标、手势分类

机能: 及时推理 (30fps)

4.1.1 MediaPipe Hands 21个要害点

MediaPipe Hands 模子输出21个手部要害点,编号从0到20:

8 12 16 20

│ │ │ │

▼ ▼ ▼ ▼

○───────────○───────────○───────────○ ← 食指、中指、无名指、小指

│ │ │ │

7 11 15 19

│ │ │ │

○───────────○───────────○───────────○

│ │ │ │

6 10 14 18

│ │ │ │

○───────────○───────────○───────────○

│ │ │ │

5 9 13 17

│ │

○───────────────────────○

│ │

4 13

│ │

○────┴───────────────────────┴────○

│ │

0 9

│ │

└────────────────────────────────┘

(手段)

要害点索引申明:

0: 手段

1-4: 拇指 (掌骨→近节指骨→远节指骨→指尖)

5-8: 食指

9-12: 中指

13-16: 无名指

17-20: 小指

gg_20260512171736_266.png

-Welcome-球速(体育科技有限公司)


相关阅读

全国服务热线
400-607-5688
公司地址
北京市昌平区回龙观高新四街 6号院1号楼5层
公司邮箱
www@qiusu.com
版权所有:球速体育科技有限公司  京ICP备18004735号-1 京公网安备 11011402010817号
400-607-5688
在线咨询
京东商城
返回顶部
电话咨询
在线咨询
返回顶部