Elsevier


情感障碍杂志


第 369 卷,2025 年 1 月 15 日,第 643-652 页
Journal of Affective Disorders

 研究论文

日本环境与儿童研究中预测慢性产后抑郁症的决策树学习

医学TOPSCI升级版 医学2区SCI基础版 医学2区IF 4.9SWJTU A
https://doi.org/10.1016/j.jad.2024.10.034  获取权利和内容

根据知识共享许可
 开放获取

 亮点


  • 开发了慢性产后抑郁症的预测模型。

  • 使用机器学习技术(决策树)来创建模型。

  • 怀孕期间测量的变量用于分支条件。

  • 决策树非常简单,可以使用笔和纸来实现。

  • 事实证明,决策树是相对强大的。

 抽象的

 背景


许多研究已经使用机器学习技术来构建产后抑郁症的预测模型,但很少有这样的模型足够简单,可以用笔和纸在社区孕产妇保健环境中使用。在这里,我们使用决策树构建慢性产后抑郁症的预测模型。

 方法


参与者为 84,091 名母亲。产后 1 个月和 6 个月爱丁堡产后抑郁量表评分≥9 被确定为慢性产后抑郁。训练数据集包括怀孕期间测量的 84 个不同变量,包括健康状况和生物标志物。在学习中,分支深度限制为 3,每个分支的分支数为 4,分支中的最小 n 数为 100。训练数据与验证数据的比率设置为 7:3。

 结果


创建了具有 35 个分支、接收器操作特性下的面积为 0.84 的决策树。提取了 84 个变量中的 10 个,分类最有效的是“感觉毫无价值”。在训练时 ( n = 58,635),最常见和最不常见的分支分别为 73.2% 和 0.84%(平均值 = 6.29%);在验证时 ( n = 25,456),它们分别为 60.4% 和 0.72%(平均值 = 6.52%)。

 局限性


使用自填问卷来识别慢性产后抑郁症。

 结论


这项研究创建了一个简单且性能相对较高的预测模型。由于该模型无需机器学习专业知识即可轻松理解和使用,因此预计将在孕产妇保健环境中发挥作用,包括基层社区卫生。

 缩写


联合电子计算机系统
日本环境与儿童研究
EPDS
爱丁堡产后抑郁量表
体重指数
体重指数
埃西
ENRICHD 社会支持调查表
K6
凯斯勒心理困扰量表
AQ-J-10
自闭症谱商
SF-8
简式 8
标清
标准差
RR
风险率
奥罗克
接收器工作特性下的面积

 关键词


流行病学
纵向研究
产后抑郁症
机器学习
决策树

 一、简介


产后抑郁症是一种常见的精神疾病,患病率为 10%–15% ( Gavin et al., 2005 ; Howard et al., 2014 ; O'Hara and McCabe, 2013 ; Woody et al., 2017 ),并且大多数的患者在 3-6 个月内自然恢复,高峰期约为产后 1 个月( Takehara 等,2018Tokumitsu 等,2020 )。然而,一些患者可能具有慢性特征,这种慢性产后抑郁不仅更有可能持续超过产后 6 个月( Goodman,2004Musliner 等,2016Wajid 等,2020 ),而且有更大的可能性。对儿童完整发育产生负面影响( Matijasevich 等,2015Oh 等,2020Stein 等,2014van der Waerden 等,2015 )。与许多其他精神疾病不同,产后抑郁症是高度可预测的,因此慢性产后抑郁症的早期筛查是一个重要的公共卫生问题。

尽管产后抑郁症存在多种风险和保护因素( Beck,2001Norhayati 等,2015Robertson 等,2004 ),但在许多领域积极使用的机器学习最近已被引入用于早期预测产后抑郁症。在最近的综述论文( Cellini et al., 2022Zhong et al., 2022 )中,选取了 2009 年至 2022 年期间超过 10 篇有质量保证的机器学习论文,据报道,可以通过以下方法做出相对准确的预测:利用支持向量、随机森林等方法,灵活整合各种风险和保护因素。最近的一篇论文( Liu et al., 2024 )也报道了在美国电子健康记录中实施逻辑回归模型来预测产后抑郁症。然而,除了少数例外,这些先前的研究往往侧重于开发能够通过使用所谓的黑盒算法组合许多变量来实现高预测性能的模型( Zhong et al., 2022 )。 然而,在电子健康记录尚未到位,或者当地助产士、公共卫生护士、临床心理学家、政府官员和其他不一定是信息科学和技术人员的情况下,以这种方式开发的模型可能很难实施专家们通过纸笔面对面互动提供妇幼保健服务,不仅在中低收入国家如此,在发达国家日本也是如此。因此,需要一种可以在没有计算机的情况下实施的预测方法,并且足够简单、直观且易于理解,以便非机器学习专家的医疗保健提供者可以向孕妇解释事情也不是机器学习专家,但仍保持适当的准确性水平。

在这项研究中,我们使用大型队列研究的数据,基于一种相对简单且高度可解决的方法,构建了一个产后抑郁症的预测模型,该模型能够显示慢性抑郁症的特征,使用怀孕期间测量的变量。用于数据挖掘,即决策树。这里的目标不是提高预测性能,而是构建一个非常简单的表格,可以在现场用笔和纸轻松使用,同时保持适当的预测精度水平。

 2. 方法


2.1.研究设计和人群


参与者是参加日本环境与儿童研究 (JECS) 的母亲,这是一项由政府资助的正在进行的全国性出生队列研究,旨在研究各种环境因素对儿童健康和发展的影响。 JECS 的设计和基线特征已在其他地方详细报道( Kawamoto 等人,2014 年Michikawa 等人,2018 年)。简而言之,2011 年 1 月至 2014 年 3 月期间,孕妇通过面对面招募的方式在日本 15 个区域中心(农村和城市地区)的合作医疗保健提供者处登记。随访发生在怀孕中/晚期、分娩时以及产后 1 个月和 6 个月。数据由医生、助产士/护士和/或研究协调员从病历转录中收集,通过怀孕期间抽血获得的血样,并通过主要手工分发给参与者的自我报告调查问卷,直到产后 1 个月,主要是产后6个月通过邮寄。

本研究分析了 2021 年 4 月发布的 jecs-qa-20210401 数据集。该数据集包含 103,057 次怀孕的数据。在本研究中,5647例怀孕因多次登记(同一母亲的第二次或第三次登记)而被排除,3562例因流产或死产而被排除。在剩下的 93,848 名独特母亲中,另有 9757 名母亲因数据缺失或对产后抑郁症没有反应而被排除在外。这留下了 84,091 名母亲进行最终分析(补充图 1)。

有助于这项工作的所有程序均符合相关国家和机构人体实验委员会的道德标准以及 1975 年赫尔辛基宣言(2008 年修订)。JECS 协议由环境部机构审查委员会审查和批准流行病学研究(100910001)和所有参与机构的伦理委员会。所有参与者都获得了书面知情同意书。这项具体研究还得到了富山大学伦理委员会的批准(R2019035)。

 2.2.措施

 2.2.1.结果


慢性产后抑郁症是根据产后1个月和6个月实施的爱丁堡产后抑郁量表(EPDS: Cox等,1987 )的结果来确定的。 EPDS是著名的10项自我报告问卷,用于筛查产后抑郁症,总分范围为0到30。日文版EPDS由Okano等人开发。 (1996) ,并被证明具有良好的内部可靠性(Cronbach's alpha = 0.78)和重测可靠性( r = 0.92),最佳抑郁症筛查分数为 8/9(75% 敏感性和 93% 特异性)。因为这个 8/9 分界点是由Yamashita 等人确认的。 (2000) (82%的敏感性和95%的特异性),我们采用产后两个时间点的总分≥9作为慢性产后抑郁症病例定义的标准( Kasamatsu等,2019 )。

 2.2.2.接触


产后抑郁症的风险取决于多种因素( Beck,2001Norhayati 等,2015Robertson 等,2004 )。在怀孕期间,我们测量了 84 个与产后抑郁症相关或至少潜在相关的变量,并将它们用作训练变量。变量如下:
  • -

    人体测量、社会经济和人口因素(15 项)
  • -

    医生诊断的精神和发育障碍史(7 项)

    • 医生诊断的抑郁症、焦虑症、自主神经功能障碍、精神分裂症、注意力缺陷和多动障碍、学习障碍、自闭症、阿斯伯格综合症或广泛性发育障碍的病史。
  • -

    生活方式和饮食(6项)
  • -
     睡眠状态(5项)

    • 过去一个月的睡眠深度、过去一个月醒来时的总体感觉、过去一个月入睡困难、过去一个月睡得很香直到早上、过去一个月尽管睡眠时间充足但仍感觉睡眠不足。
  • -

    社会支持与信任(9项)

    • 有关情感社会支持的项目源自 ENRICHD 社会支持量表(ESSI: Mitchell 等人,2003 )并进行了一些修改(例如是否有人表现出爱和情感,是否有人为您提供情感支持)( Matsumura 等人) al.,2022c ),有关邻里信任的项目源自芝加哥邻里人类发展项目( Sampson 等人,1997 )并进行了一些修改(例如邻居相互信任,邻里是安全的)( Morozumi 等人, 2020 ),有关广义信任的项目源自人们信任量表( Yamagishi,1986 )并进行了一些修改(例如大多数人可以信任,大多数时候人们试图提供帮助,或者他们大多只是在寻找帮助)他们自己)( Matsumura 等人,2023b )。
  • -

    自闭症特征(10项)

    • 自闭症谱系商数(AQ-J-10: Kurita et al., 2005 )中的项目包括偏好独处、偏好收集有关事物类别的信息以及难以弄清楚人们的意图。
  • -

    心理困扰(6项)

    • 凯斯勒心理困扰量表(K6: Furukawa et al., 2008 ; Kessler et al., 2002 ; Sakurai et al., 2011 )中的项目如下: 在过去 30 天中,您多久感到…… 1. 紧张? 2.绝望? 3.烦躁? 4. 情绪低落,没有什么能让你高兴起来? 5.一切都是努力? 6.一文不值?
  • -

    生活质量(8项)
  • -

    伴侣(丈夫)相关因素(4项)

    • 丈夫的教育程度、吸烟状况、亲密伴侣暴力(即实施身体暴力或情感虐待)( Matsumura 等人,2022a )。
  • -

    怀孕相关因素(6项)

    • 服用口服避孕药史、本次怀孕前不孕症治疗情况、服用叶酸补充剂的频率、怀孕时的感受、孕吐、妊娠并发症(如高血压、糖尿病、精神疾病、甲状腺疾病、自身免疫性疾病、肾脏疾病、心脏病、癫痫)。
  • -
     生物标志物 (6 项)

    • 收缩压和舒张压、血液总胆固醇和血液甘油三酯( Mutsuda et al., 2022 )、血清胰岛素样生长因子-1浓度( Adachi et al., 2021 )和8-羟基-2'-脱氧鸟苷浓度为氧化应激的标志。
  • -
     使用的药物(2项)

    • 精神药物(例如抗抑郁药、抗焦虑药和抗精神病药)和抗菌药物。

详细项目和答复类别列于附表1。


2.3.统计分析


我们对训练数据集进行决策树学习,然后使用验证数据集检查创建的决策树的性能。对于决策树学习,我们将分支深度限制为 3(即,预测基于最多回答 3 个问题),将单分支数量限制为 4,目的是使其易于在现场使用。生长树的标准是信息增益(熵减少),并且设置变量以便它们在每个分支仅分裂一次(即,如果它们属于不同分支,则变量可以多次使用)。分支中 n 的最小数量设置为 100 以防止过度拟合。减少误差剪枝方法用于分支剪枝( Quinlan,1986 )。缺失值被分配给最相似的节点。训练数据与验证数据的比例设置为 7:3。

根据最高和最低患病率分支相对于平均患病率的风险比 (RR)、受试者工作特征曲线下面积 (AUROC)、最佳截止值、灵敏度来评估所得决策树的性能(真阳性/(真阳性+假阴性))、特异性(真阴性/(真阴性+假阳性))、阳性预测值(真阳性/(真阳性+假阳性))、阴性预测值(真阴性/ (真阴性 + 假阴性))和准确性((真阳性 + 真阴性)/(真阳性 + 真阴性 + 真阳性 + 假阴性))。

在验证过程中,使用通过训练创建的决策树对参与者进行分类,被分类到预测慢性产后抑郁症分支(即训练期间患病率超过截止值的分支)的参与者被认为患有慢性产后抑郁症抑郁症,并评估预测性能。

使用 SAS ver. 分析数据。 9.4(SAS Institute Inc.,卡里,北卡罗来纳州)与 HPSPLIT 程序。


2.3.1.敏感性分析


为了评估当前决策树学习的稳定性,我们创建了 100 个具有不同伪随机序列种子的决策树,用于提取训练数据集,并评估提取的变量和 AUROC 的频率和重要性。

此外,为了进一步检查生成的决策树是否存在过度拟合和泛化问题,我们对具有不同背景特征的 15 个区域中心的n = 500 进行了分层和重新采样,并测试了它们的预测性能。

此外,为了追求模型在训练过程中的表面性能,我们将分支深度增加到10,每个分支的分支数量增加到5,并将一个分支的最小n数减少到50。然后,我们在设置无需分支修剪,同时授予在同一分支内重用同一变量的权限。

 3. 结果


总共分析了 84,091 名母亲;平均年龄±标准差(SD)为31.1±4.98岁,平均孕前BMI±SD为21.2±3.25,平均胎次±SD为0.81±0.88。其中,5424 人(6.45%)患有慢性产后抑郁症。与纳入分析的母亲 ( n = 84,091) 相比,被排除在外的母亲 ( n = 9757) 往往更年轻、胎次更高、吸烟者、未婚、亲密伴侣的受害者暴力、家庭收入较低以及有精神疾病史。有效缓解率约为89.6%(=84,091/93,848)。

图 1显示了在训练数据集上学习的决策树结果 ( n = 58,635)。灰色填充的分支被认为会导致慢性产后抑郁症。分支数量为 35 个,在 84 个候选变量中,提取的 10 个是 K6 的项目 6(无价值)、4(抑郁)、3(不安或烦躁)和 1(紧张)( Furukawa 等人, 2008凯斯勒等人,2002樱井等人,2011 );感觉睡眠不足;两个情感社会支持项目(存在一个可以向您表达爱意和感情的人,存在一个您可以信赖为您提供情感支持的人),两个一般信任项目(相信大多数时候人们会努力做到这一点)有帮助、相信大多数人是可以信任的)以及医生诊断的抑郁症病史。表 1总结了这些变量对于预测的相对重要性。各分支慢性产后抑郁症的患病率最高为 73.2%,最低为 0.84%,训练数据集中平均患病率为 6.52% 的相应风险比 (RR) 分别为 11.23 和 0.13。受试者工作特征下面积(AUROC)为0.84(图2 ),最佳截断值、敏感性、特异性、阳性预测值、阴性预测值和准确度分别为7.00%、76.0%、76.8%,分别为 18.6%、97.9% 和 76.8%。
Fig. 1

  1. 下载:下载高分辨率图像 (1MB)

  2. 下载:下载全尺寸图像


图1 .从训练数据集导出的决策树 ( n = 58,635)。


灰色填充的分支被认为会导致慢性产后抑郁症。

K6、凯斯勒心理困扰量表; M,缺失值。

所有分支条件均由怀孕期间测量的变量组成。有关 K6 和睡眠的项目询问过去 30 天的情况。


表 1 .训练数据集中 10 个变量的相对重要性 (n = 58,635)。

 种类 变量 重要性
 心理困扰
在过去 30 天里,您有多少次感到自己一无是处? (K6第6项)
1.000
 心理困扰
在过去 30 天内,您有多少次感到焦躁不安或坐立不安? (K6第3项)
0.357
 心理困扰
在过去的 30 天里,您有多少次感到非常沮丧,没有任何事情可以让您高兴起来? (K6 第 4 项)
0.290
 情感社会支持
您是否可以信赖有人为您提供情感支持(讨论问题或帮助您做出艰难的决定)? (ESSI 第 5 项)
0.157
 抑郁症史
您有医生诊断为抑郁症的病史吗?
0.146
 睡觉
在过去的一个月里,您是否感觉无论睡多久都睡不够?
0.117
 广义信任
你会说人们大多数时候都试图提供帮助,还是大多只是照顾自己?
0.104
 情感社会支持
有没有人可以向你表达爱意和感情? (ESSI 第 3 项)
0.098
 心理困扰
在过去 30 天内,您有多少次感到紧张? (K6第1项)
0.068
 广义信任
你说大多数人都可以信任吗?
0.059

K6、凯斯勒心理困扰量表; ESSI、ENRICHD 社会支持调查表。
Fig. 2

  1. 下载:下载高分辨率图像 (106KB)

  2. 下载:下载全尺寸图像


图2 .在训练数据集上学习的决策树的接收者操作特征曲线 (n = 58,635)。


图 3显示了将获得的决策树拟合到验证数据集的结果( n = 25,456)。表 2总结了这些变量对于预测的相对重要性。结果与训练结果相似,没有明显差异。最高患病率为 60.4%,最低为 0.72%,根据训练数据集中的平均患病率 6.52% 计算,相应的 RR 分别为 9.27 和 0.11。 AUROC为0.84(图4 ),敏感性、特异性、阳性预测值、阴性预测值和准确度分别为76.3%、77.2%、18.4%、98.0%和77.2%。
Fig. 3

  1. 下载:下载高分辨率图像 (1MB)

  2. 下载:下载全尺寸图像


图3 .适合验证数据集的决策树 ( n = 25,456)。


灰色填充的分支被认为会导致慢性产后抑郁症。

K6、凯斯勒心理困扰量表; M,缺失值。

所有分支条件均由怀孕期间测量的变量组成。有关 K6 和睡眠的项目询问过去 30 天的情况。


表 2 .验证数据集中 10 个变量的相对重要性 (n = 25,456)。

 种类 变量 重要性
 心理困扰
在过去 30 天里,您有多少次感到自己一无是处? (K6第6项)
1.000
 心理困扰
在过去的 30 天里,您有多少次感到非常沮丧,没有任何事情可以让您高兴起来? (K6 第 4 项)
0.285
 心理困扰
在过去 30 天内,您有多少次感到焦躁不安或坐立不安? (K6第3项)
0.273
 睡觉
在过去的一个月里,您是否感觉无论睡多久都睡不够?
0.139
 情感社会支持
有没有人可以向你表达爱意和感情? (ESSI 第 3 项)
0.115
 情感社会支持
是否有人可以为您提供情感支持(讨论问题或帮助您做出艰难的决定)(ESSI 第 5 项)
0.097
 广义信任
你会说人们大多数时候都试图提供帮助,还是大多只是照顾自己?
0.088
 心理困扰
在过去 30 天内,您有多少次感到紧张? (K6第1项)
0.078
 广义信任
你说大多数人都可以信任吗?
0.061
 抑郁症史
您有医生诊断为抑郁症的病史吗?
0.000

K6、凯斯勒心理困扰量表; ESSI、ENRICHD 社会支持调查表。
Fig. 4

  1. 下载:下载高分辨率图像 (106KB)

  2. 下载:下载全尺寸图像


图4 .决策树的接收者操作特征曲线适合验证数据集 (n = 25,456)。


补充表 2 总结了敏感性分析中从总共 100 个不同决策树中提取的前 20 个变量。其中,排名第1至第9和第13的10个变量对应于主分析中提取的10个变量。这 100 个决策树的平均 (SD) AUROC 训练时为 0.84 (0.002),验证时为 0.84 (0.004)。

将获得的决策树拟合到按 15 个区域分层的每个n = 500 数据集进行进一步的敏感性分析,得出 AUROC 的平均值 (SD)、敏感性和特异性分别为 0.84 (0.04)、74.0 % (8.7 %) 和 77.9 %( 3.2%),分别(补充表3)。

放松约束学习的最终敏感性分析产生了一个有 648 个分支的决策树,使用了训练数据集中 84 个变量中的 64 个,得出 AUROC 为 0.91,敏感性为 88.8%,特异性为 75.5%,而获得的值验证数据集的概率分别为 0.80、72.6% 和 74.7%。

 4. 讨论


本研究的目的是创建一个模型,使用高度可读的机器学习方法(即决策树)来预测慢性形式的产后抑郁症。为此,对参与 JECS 的 84,000 名母亲测量了 84 个与产后抑郁症相关的变量。数据是在怀孕期间通过问卷调查、医疗/临床记录转录和血液分析获得的。决策树的分支深度被限制为最多 3 个和最多 4 个分支,目的是使其在现场使用简单,这与之前研究中报告的典型决策树(例如, Zhang 等人,2017)形成鲜明对比。 ,2021 ),这太复杂了,无法写在纸上。训练使用 84 个候选变量中的 10 个,生成具有 35 个分支和 AUROC 为 0.84 的决策树。 AUROC 在训练和验证之间几乎保持不变,考虑到它与敏感性分析的结果相反,表明没有发生过度拟合。最能预测分类的变量是怀孕期间 K6 的第 6 项(感觉毫无价值)。在学习和验证中,分支中最高(最低)风险的患病率均高于 60%(低于 0.9%),基于简单患病率的 RR 高于 9.0(低于 0.13)。总体而言,可以得出结论,本研究尝试生成简单且相对高性能的决策树是成功的。使用此决策树时,可以按照图 1所示的顺序提出问题,以确定是否应将某人分类在灰色填充分支下,该分支被认为可以预测慢性产后抑郁症。

在为本研究创建决策树时,从各种变量中提取了 10 个变量。这10个变量包括K6中的4个项目( Furukawa等,2008Kessler等,2002Sakurai等,2011 ),1个来自睡眠剥夺的项目,2个来自ESSI的项目,2个来自一般人信任的项目,以及医生诊断的抑郁症病史。最有效的预测因子是 K6 第 6 项,即无价值,这与最近的研究一致,即发现无价值是抑郁症的最重要原因( Ebrahimi 等,2021Skjerdingstad 等,2021 )。从另一个角度来看,这也与荟萃分析研究相一致,该研究表明自尊是产后抑郁症最强的保护因素之一( Beck,2001 ),而低自尊是抑郁和焦虑的强烈预期风险,并且反之亦然( Sowislo 和 Orth,2013 )。因此,在这项研究中,无价值感是抑郁症最有效的预测因素也就不足为奇了。

接下来的两个预测项目是 K6 第 3 项(焦虑)和第 4 项(抑郁),这并不奇怪,因为已知怀孕期间的抑郁和焦虑是产后抑郁的非常强的危险因素( Beck,2001Gaillard 等人) ., 2014 ; Plant et al., 2017 ; Robertson et al., 2004 ),并且两者通常是共病的 ( Brown et al., 2001 ; Wiethoff et al., 2010 ),围产期抑郁症也是如此 ( Falah) -Hassani 等人,2017 )。在有效预测结果的其他项目中,医生诊断的抑郁症病史和社会支持(ESSI 第 3 项和第 5 项)也令人信服,因为它们已被表明是产后抑郁症的危险因素( Matsumura 等人, 2022c罗伯逊等人,2004 )。睡眠在荟萃分析中并未得到太多关注,但考虑到它与抑郁症状相关,这一点也是合理的。最后,由于普遍信任也与产后心理健康相关( Matsumura et al., 2023b ),因此将其提取为预测因素也就不足为奇了。 本研究并未提取其他已知的风险或促进因素,例如婚姻状况、社会经济状况、意外怀孕和抗抑郁药物的使用,但其中许多变量并不独立于提取的 10 个变量。因此,这些变量很可能以聚合或围绕(或独立于)提取的变量的方式相关,但仅仅因为它们的预测性较差而未被提取。

尽管本研究中获得的决策树最多只需要回答三个问题,但其预测性能与之前的机器学习研究中的预测准确性相当。事实上,根据( Zhong et al., 2022 ),支持向量达到 AUROC >0.80 的研究为十分之 3,随机森林为 8 中,逻辑回归为 8 中 1,逻辑回归为 4 中 2。决策树,因此本研究中 0.84 的 AUROC 被认为反映了相对较好的性能。此外,过去的一些研究要求模型构建中包含>100个特征( Hochman et al., 2021Wang et al., 2019 ),其中大多数>20个( Zhong et al., 2022 );考虑到这一点,我们研究中提取的变量数量 10 个就相当简单了。请注意,一些结果表明,即使仅使用 5-10 个变量,AUROC 也不会下降( Andersson et al., 2021 ),但如前所述,我们的模型只需要每个孕妇最多 3 个问题。而且,模型中的10个问题孕妇自己也可以轻松回答。尽管人们已经注意到,临床和生物学因素的结合对于通过机器学习预测产后抑郁症很重要( Cellini et al., 2022 ),但考虑到孕产妇健康环境中通常需要的简单性,如果它能够预测产后抑郁症,那么这将是一个更有用的工具。仅由孕妇自己可以轻松回答的项目构成。 总的来说,鉴于这样一个简单的模型可以很好地预测抑郁症,也许未来机器学习对产后抑郁症预测的研究目标将是要么提高许多变量的预测性能(迄今为止的主要目标),要么提高轻松度正如本研究中那样,同时保持适当的(尽管不是最高的)准确性水平,并且对于孕妇本身和医疗保健提供者来说足够简单、直观和易于理解,他们都不是机器方面的专家学习。因此,我们需要认真讨论如何充分利用这些工具,有效分配有限的医疗资源,并将其与有效的护理计划联系起来。

还应注意两点。首先,当使用获得的决策树时,预测慢性产后抑郁症的分支是那些 K6 第 6 项的答案不是“从来没有”的分支。因此,如果用户不关心风险程度,则可以判断风险较高,然后终止该过程。然而,预计后续计划将根据估计风险是 70% 还是 9% 而有很大差异,因此最好全面实施该计划,以确定某人应该被分类到哪个分支,如果可能的。

其次,关于决策树的稳定性,众所周知,根据数据的性质和用于创建树的参数,决策树学习可能会陷入过度拟合。然而,敏感性分析的结果表明,图1中的决策树的泛化性相当高。部分原因是,即使创建了 100 个类似的决策树,也提取了明显的变量趋势,并且创建的决策树仅由这些顶级变量组成,并且学习和预测之间的预测性能没有显着差异。确认。部分原因是,即使该模型应用于不同背景的区域,也可以做出与训练期间具有相同准确度的预测。这主要是因为所包含的变量对于预测有用并且用于训练的数据集很大,而且还因为,正如引言中提到的,我们创建了一个简单的树,它优先考虑现场实施的适用性而不是数值分类性能。事实上,在最终的敏感性分析中,我们创建了一个复杂的树,它通过放宽一些限制来优先提高预测性能。然而,尽管训练期间的性能有所提高,但该树最终的通用性不太理想,并且容易过度拟合。

这项研究有几个优点。首先,样本被认为具有相对代表性,因为它包括了来自日本各地的母亲。其次,尽管对孕妇从怀孕初期到产后六个月进行了跟踪,但仍然保持了较高的有效反应率(约89.6%)。这表明选择偏差较低。第三,样本量大,超过84000名母亲。这使得研究能够在不过度拟合的情况下进行。第四,研究中总共使用了84个与产后抑郁症相关的变量。这些不仅包括问卷答复,还包括医疗数据和仍然很少使用的血液分析结果( Cellini 等人,2022 )。最后,本研究中作为最终预测模型构建的决策树以可以用笔和纸实现的形式进行了演示。

这项研究也有一些局限性。首先,通过自填问卷而不是临床诊断来评估产后抑郁症。因此,与使用临床诊断标准获得的病例相比,病例可能被高估了( Bennett et al., 2004 )。其次,慢性产后抑郁症的定义是基于产后六个月的数据,与跟踪患者出生后数年的研究相比,这可能略有高估。第三,所有项目均选自自填式问卷。虽然这使得它们很容易收集,但这也意味着回答可能存在个体差异,并且可能存在受访者没有如实回答的情况。第四,虽然回复率较高,但心理或身体健康状况不佳的参与者可能无法返还问卷。因此,我们不能排除由于退出或无答复而导致选择偏差的可能性,这是大多数队列所固有的。最后,由于该研究是在日本进行的,因此不能保证普遍性。在其他国家,特别是产后抑郁症发病率较高的低收入和中等收入国家,需要进一步验证这一工具,因为这些国家可以有效地使用该工具。

总之,本研究基于妊娠期间测量的变量作为分支条件,使用决策树构建了一个简单且相对高性能的慢性产后抑郁症预测模型。因为预测是如何做出的很容易,即使对于不是机器学习专家的孕妇和医疗保健提供者来说,这种方法也可以用笔和纸轻松实现。由于本研究创建的模型与现有的风险因素文献高度一致,因此预计它将在社区孕产妇保健环境中有用,特别是在面对面的互动中。


CRediT 作者贡献声明


Kenta Matsumura:写作——原稿、可视化、方法论、形式分析、概念化。 Kei Hamazaki:写作——评论和编辑。 Haruka Kasamatsu:写作 – 评论和编辑。 Akiko Tsuchida:写作——评论和编辑。 Hidekuni Inadera:写作 – 审阅和编辑、验证、项目管理。


撰写过程中对生成式人工智能和人工智能辅助技术的声明


在准备这项工作的过程中,作者使用 DeepL 和 Curie 来提高语言和可读性。使用此工具/服务后,论文经过作者审阅并经过专业编辑(ThinkSCIENCE,日本东京)。作者对本出版物的内容承担全部责任。

 资金


JECS 由日本环境省资助。资金来源在研究设计中没有发挥任何作用;数据的收集、分析或解释;在撰写报告时;或决定提交本文发表。本文的调查结果和结论仅由作者负责,并不代表上述政府机构的官方观点。


竞争利益声明

 没有任何。

 致谢


我们感谢 JECS 的参与者以及参与数据收集过程的所有个人。

 附录 A。


截至 2023 年,JECS 小组成员:Michihiro Kamijima(日本名古屋市立大学首席研究员)、Shin Yamazaki(日本筑波国家环境研究所)、Yukihiro Ohya(东京国家儿童健康与发展中心) ,日本)、Reiko Kishi(北海道大学,日本札幌)、Nobuo Yaegashi(东北大学,仙台,日本)、Koichi Hashimoto(福岛医科大学,福岛,日本)、Chisato Mori(千叶大学,日本千叶)、Shuichi Ito(横滨市立大学,日本横滨)、Zentaro Yamagata(山梨大学,日本中央)、Hidekuni Inadera(富山大学,日本富山)、Takeo Nakayama(京都大学,日本京都)、Tomotaka Sobue(大阪)日本吹田大学)、Masayuki Shima(兵库医科大学,日本西宫)、Seiji Kageyama(鸟取大学,米子,日本)、Narufumi Suganuma(高知大学,南国,日本)、Shoichi Ohga(九州大学,福冈,日本) )和 Takahiko Katoh(熊本大学,日本熊本)。


附录 B. 补充数据

 数据可用性


由于日本的道德限制和法律框架,数据不适合公开发表。 《个人信息保护法》(2003年5月30日第57号法,2015年9月9日修订)禁止公开保存包含个人信息的数据。日本文部科学省和厚生劳动省实施的涉及人类受试者的医疗和健康研究伦理准则也限制流行病学数据的公开共享。有关数据访问的所有询问均应发送至jecs-en@nies.go.jp 。负责处理发送至此电子邮件地址的询问的人员是国家环境研究所 JECS 项目办公室的 Shoji F. Nakayama 博士。

References

 被引用 (0)

1

JECS 小组成员列于附录中。