人工智能 (AI) 应用:一个高精度ASD 诊断和照护支持系统
自闭症谱系障碍(ASD)是一种复杂的神经发育问题,在全球范围内每100名儿童中就可能影响一名患者。而在我国这一比率达到了惊人的1.8%,其中男孩患病率为2.6%,女孩则为0.9%左右。(参考文献:《中国0~6岁儿童孤独症谱系障碍筛查患病现状》) ASD的主要特征包括社交能力有限、沟通存在障碍以及 repetitive behaviors。患有 ASD 的儿童往往会对周围环境表现出过度敏感,并且由于症状表现程度差异显著而被分为多个亚型群组(可用括号补充)。随着 ASD 病发率的上升已逐渐成为一项重要的公共卫生议题,在此背景下早期识别与干预显得尤为重要。尽管在认识上已有一定进展但因个体间的巨大差异使得其整体管理仍充满挑战

ASD 的诊断与治疗工作需要依赖一个多学科团队的方法,在这个过程中包括儿科医生和其他医疗专业人士的合作至关重要
1 ASD 诊断和治疗的现状
1.1********传统 ASD 诊断方法的局限性
- 主观性: 该种传统诊断方法主要基于临床评估与行为观察的结果, 且易受评估者经验和主观判断的影响, 致使诊断结果存在不一致性。
- 缺乏客观指标: 该传统诊断手段目前尚无有效的生理指标或生物标志物作为依据, 在对自闭症谱系障碍(ASD)的早期及准确确诊方面仍显不足。
- 耗时费力: 在实际运用中, 该类传统诊断手段需耗费大量时间和精力进行多次评估与测试, 导致工作效率低下且给患者带来额外负担。
1.2********传统 ASD 治疗方法的挑战
- 未能充分考虑个体差异: 传统治疗方法通常会采用一种较为固定的方案,并未充分考虑到患者个体之间的独特需求与差异。
- 缺乏动态调整能力: 常规治疗方案往往较为单一,在面对患者病情变化时缺乏相应的动态调整机制。
- 沟通不畅现象: 医疗专业人士之间存在信息传递与协作上的不足,在实际诊疗过程中容易造成服务流程上的断层。
2 方法
2.1 数据集
本研究基于自闭症儿童与神经发育障碍类型及其姿态运动特征的三维(3D)数据集合进行探索性分析。该数据集合由Kinect v2摄像头获取,并整合了关节定位信息、骨骼运动视频序列、关节轨迹记录以及三星Note9后置摄像头捕捉的颜色图像序列。其中一部分是关于身体关节的位置坐标数据;另一部分则包含了骨骼形态变化的动态影像资料以及颜色图像序列。这些文件夹共计700份样本资料,在自闭症儿童与神经发育障碍类型中各占一半。每个类别下共有350份详细的数据样本记录。特别增加了9份重度自闭症患者的深度颜色影像资料作为补充研究材料。

2.2 面部和身体表情提取
本研究采用了迁移学习方法,并通过多组预训练的卷积神经网络(CNN)模型来进行面部和身体表情的提取。主要涉及的技术包括:
- VGG19
- Xception
- ResNet50V2
- MobileNetV2
- EfficientNetB0
这些模型被选择是因为它们在图像分类任务中表现出色。
2.3 数据预处理
- 图像尺寸调整: 调整图像尺寸至与所选用CNN模型预期输入尺寸一致。
- 图像归一化: 对像素值实施标准化处理至0-1区间范围。
- 数据增强: 通过旋转变换、镜像翻转以及缩放操作提升数据多样性并扩大数据量。
2.4 迁移学习
- 模型初始化: 基于 ImageNet 数据集预训练的模型权重进行 CNN 模型参数初始化。
- 模型修改: 对CNN架构进行优化设计,在其后端几层增加新的分类层,并明确区分自闭症儿童与精神分裂类型儿童。
2.5 模型训练
- 数据划分: 将数据按类型划分为训练数据、验证数据和测试数据。
- 超参数调节: 利用消融实验对学习率、批量大小以及训练周期等关键超参数进行优化调整。
- 最佳优化器选择: 在处理稀疏数据方面表现出色的Adagrad优化器是最佳选择。
- 损失评估度量: 使用二元交叉熵损失函数量化预测结果与真实结果之间的差距程度。
- 参数更新方法: 基于反向传播算法更新模型权重参数。
- 防范过拟策略: 采用早停策略以防止模型出现过拟合现象。
2.6 伦理考虑和偏差缓解
本研究采取了以下措施来确保 AI 模型的伦理性和公平性:
- 数据去标识化: 对患者的全部数据实施去标识化处理以确保隐私保护。
- 数据安全: 将敏感信息存储于安全且加密的数据库中限定仅授权人员访问敏感数据库。
- 模型可解释性: 发布详尽的技术文档并采用可解释的人工智能(XAI)方法来阐述决策机制。
- 偏差调优: 通过构建包含多维度特征的数据集引入系统性的偏差检测与调优机制以降低模型偏差风险。
3 评估及结论
3.1 评估指标
- 准确率 (Accuracy): 准确率衡量模型预测结果的总准确性程度, 其计算公式为: 准确率 = (真阳性 + 真阴性) / 总样本数量
- 精确率 (Precision): 精确率衡量模型正确识别自闭症患者的比例, 其计算公式为: 精确率 = 真阳性 / (真阳性 + 假阳性)
- 召回率 (Recall): 召回率衡量模型检测出所有自闭症患者的效率, 计算公式为: 召回率 = 真阳性 / (真阳性 + 假阴性)
- AUC (Area Under the Curve): AUC 衡量模型区分自闭症患者与正常人群的能力, 其取值范围介于 0 到 1 之间, AUC 值越大表示模型的区分能力越强。
3.2 评估过程
- 数据按比例分类为三组:训练数据、验证数据与测试数据。各组分别用于不同阶段的任务:作为AI建模的基础材料;参与参数优化的过程;作为最终性能检验的标准。
- 采用算法选择与参数设置策略构建AI系统,并通过逐步优化实现性能提升。
- 采用交叉验证方法结合独立测试对AI系统进行全面评价,并根据结果计算出关键指标如准确率、精确率、召回率以及AUC值等。
3.3 评估结论

- 模型性能:** _**_Xception、ResNet50V2 和 MobileNetV2 等模型在识别自闭症儿童的表情时展现出卓越的能力,并获得了显著的诊断准确率;其中 ResNet50V2 在这一领域表现尤为突出;MobileNetV2 模型则展现了良好的通用性;然而其精确度与召回率略逊于其他两种模型;相比之下 VGG19 和 EfficientNetB0 则存在一定程度的过拟合现象 需要进一步优化以提升其性能。
- 数据连续性: 本研究突出了持续采集与分析自闭症儿童面部及全身表情数据的必要性;以便全面理解 ASD 的行为特征及其诊断与治疗方法的有效途径。
4 扩展了解 ASD诊断软件Cognoa********Canvas Dx(已获FDA授权)
Canvas Dx是首个获得FDA批准的专业自闭症筛查软件。该系统专为18至5岁儿童设计,在早期识别自闭症谱系障碍方面具有显著优势。尽管它不具备独立诊断功能,但可作为辅助工具协助专业人员做出准确判断和制定治疗计划。
