开启左侧

人工智能可以为抗击新冠肺炎做些什么?

[复制链接]
人工智能 发表于 2020-2-3 17:18:47 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
如果说流行病学中较为严谨的科学研究,比如疫苗制造,药物研发,那么机器学习暂时不能代替主流方法。
主要是因为目前主流的机器学习手段可解释性不强,而流行病学等生物和医药学科需要发现数据的内在联系 ( e.g. 因果 or 相关:某些特性或者某些现象是疾病流行的诱因 or 存在相关性 ),并通过这些联系指导线下实践。


可惜的是目前以NN,boosting为主的主流算法暂时无法满足这些要求。  根据目前的新闻来看,机器学习等数据和计算科学在这次疫情中扮演的主要是辅助角色,其中对控制疫情最帮助的应该是 接触者追踪(contract tracing) 、数据预测和新的流行病学传播模型[possible]。   


接触者追踪

众所周知,与流行传染病患者密切接触的人,自身被感染的风险更高,并且有可能进一步传染他人。
因此,追踪并观察这些密切接触者有助于这些高危人群第一时间得到护理和治疗,并防止病毒进一步扩展,这也是流行病控制的关键。  
整个过程称为contact tracing,大概可以分为接触者识别(1)、建立接触者列表(2)和接触者随访(3)三步。  
上一次大规模爆发的疫情是非洲的埃博拉病毒(2013-2015左右),但是在埃博拉病毒爆发期间,非洲整体信息系统普遍落后,当时无法通过技术手段加速追踪过程。虽然也曾有学者在Google,爱立信和三星捐赠的支持下在几内亚开展实验[1]


但是这种依靠捐赠分发手机的小型实验只能小幅度提高接触者随访的效率,当时的主流追踪手段依然是感染者自身回忆,主要的追踪流程依然采用纸质手段,以计算机数据手段为辅:   不过在这次的疫情中,我们应该会有机会通过近些年的高度信息化工具来改变加速整个接触者追踪的速度和效率,从而控制疫情传播。     自然而然,衍生出了两个问题。  
问题1:如何识别接触者?  
从计算机的角度看,接触者识别(1) 本质上是寻找和感染者时间、空间上有重叠的人群。人所走过必有痕迹,尤其是在信息社会,虽然数据上的痕迹不能完全等同于线下接触,但是依然能够给接触者寻找带来很多便利。  如果我们考虑到已经存在的各种数据源,其中可用、而且会非常有效的数据痕迹包括:基站数据(运营商)、支付数据(银联&第三方支付机构)、出行数据(铁路&飞机&住宿)、城市摄像头&户口等行政数据(公安)等。当然如何高效组织和搜索这些数据还涉及个人隐私、以及谁有权限调用等重要问题,我们抛开这些问题不谈,先说说能怎么做、以及做到什么程度。  基站数据:呼叫详细记录(Call Detail Record,CDR):狭义上的CDR是指手机通话或者发送短信时的基本信息记录,消息发送者身份(Points of origin),目的地的身份 (Endpoints),通话持续时间,总使用时间计费等等,但是这只适用于2G/3G。4G以后,CDR通常指任何手机与基站交互后,被记录的数据,这里的数据可能包含用户位置估计(源自于基站定位)。换句话说,只要已知基站分布位置,任何人携带手机后的粗略运动轨迹,都可以通过CDR分析获得[2]。  CDR数据样例(现在很可能不是这样了),来源ITU 虽然目前基站覆盖范围通常在1K-3K米左右,并不能很精确的确定感染源和接触人群是否存在物理接触,但是对于感染源长期驻留的某些区域,可以考虑对该区域用户进行系统标记,如果某标记用户存在继续暴露的可能,可以视情况而定提示风险或进行医学观察。   CDR数据用户轨迹复原 其实现在CDR分析已经很成熟了,完全可以用在接触者追踪中。在国际电信联盟(ITU)给出的CDR使用案例中,曾经给出了埃博拉时期的一份案例[3]。  在一个小镇上出现了一例埃博拉病毒,电信部门通过CDR分析追踪该小镇居民(可能为高危接触者)在48小时内的扩散情况(3小时间隔):  第一个12小时,   第二个12小时,   第三个12小时,   第四个12小时,   这个案例可以扩展一下,如果当时反应迅速,相关数据机构可以考虑定位武汉华南海鲜市场的常驻人群,并追踪这些高危人群后续的行为轨迹,这样可以精准联系到其密切接触的具体人员,完成接触者识别(1)。
此外,CDR数据通常会在运营商留存很久,因此对于已感染人员的行为轨迹可以准确还原,并建立GEO数据库做相关分析比对,多个感染源在短时间内驻留或者通过的区域可以划分为高危区域、做重点观察。   其实现在对CDR数据的利用已经有了一些成功案例:在2010年1月海地地震以及2010年10月霍乱爆发之后,瑞典卡罗林斯卡研究所的研究人员分析了两百万部手机的每日运动数据,并能够确定霍乱暴发的关键区域,量化受灾难影响的人口及其在接下来的时期内的流动,对当时政府决策提供了巨大价值[4][5]。  相关机器学习和统计学习方法有机会在CDR分析中得到应用,比如可能的各种预测流动性和区域发病率等问题,这个问题其实很像目前用在CDR分析中的移动数据吞吐量预测[6]:   个人线下交互数据:视频监控、交易数据和出行数据。关于这些数据是否可用于接触者识别,出于个人隐私和社会敏感程度考虑,目前相关研究比较少。视频、个人线下支付交易和出行数据是最直接的接触者暴露证据,但是目前面临的问题是数据孤岛现象严重,数据分散且无法收集,数据的相关性因此无法分析建立。 目前已经曝出多个列车和航班上存在确诊的感染人员,需要紧急扩散寻找同程人员的示例,这就反映出了铁路部门和公安部门的信息系统并没有一个非常高效、自动化的交流渠道和平台,很可能目前依然只是靠系统初步筛选、人工再筛选和联系的阶段。  所以,建立政府部门和各企业间、政府各部门间的数据协同和共享平台对疫情来说是很有必要的,但是短期内怕是无法完成,关键问题是个人隐私和公共卫生安全事件之间的权衡,谁来建立这个数据平台,以及什么情况下才能使用这个数据平台。  不过目前确实是一个开始建立相应平台的时机,将会非常有利于接触者识别和个人卫生风险提示。   


问题2:识别接触者之后,如何建立接触者列表和接触者随访?  
相信自从微信和手机普及以后,简单的添加接触者、对接触者的医学观察可以通过社交软件高效完成,不必像埃博拉病毒期间需要各家各户访问、社区监控[1]。  但是考虑到目前本地医务人员和志愿者不足,可以考虑通过构建APP建立本地接触者与外地富余医疗人员之间的观察联系,类似远程随访机制或线上专项医生,这样可以分担部分疫区医疗压力,同时可以引入心理志愿者,为相关接触者分担心理压力。如果存在一个统一的线上随访平台,同时完成医疗资源分配和数据录入,会提高很多工作者的工作效率,也有利于自闭在家的医学观察用户或者普通用户获得专业的医学建议,尽量不去医院,避免交叉感染。。     数据预测和新的流行病学传播模型[possible] 更进一步,从科研角度讲,上述提到的CDR等数据可以建立实时的人口流动和疫情传播模型,目前大部分对于疫情的数据分析往往基于传统的流行病学方法,求解微分或者动力学模型,辅以社会经济或者人口统计学特征,求解足够置信的预测数据,比如R0数据或者对潜在感染人数预测。 这些模型虽然在指导公共卫生政策方面很成功,但是往往无法精确体现复杂的人类行为、移动轨迹、真实接触程度。  比如,采取严格的人口管制和卫生措施的城市,其新增潜在传染病例数目往往无法通过传统动力学模型衡量,而鉴于目前武汉地区医疗资源问题,每日新增病例可能只是因为试剂盒受限,无法精确衡量真实疫情变化趋势,这些可以通过基于上述提到的数据分析完成。  基于真实行为数据的流行病学传播模型是真实可行的,而且也存在一部分研究成果,但是依然严重不足,也没有足够的实验经验[7]。我想可能是因为这些数据过于敏感,无法通过正常途径获得。   
一种可能的基于CDR数据的感染区域建模和潜在感染数目预测,来自[7] 看到新闻,一些科技公司也参与了人口迁徙「大数据」预测,但是看到的结果往往只是单纯的数据可视化结果,对于科学研究和行政指令来说,每天湖北有多少人口流动只是一个象征性的、表面化的数据和图表。说白了,是人口数据的统计可视化,这依然是传统的流行病动力学模型,这种工作并不solid。  如果如文献[7]一样更深一步利用收集到的数据订制流行病动力学模型(如果能拿到相应数据),相信能获得更加令人振奋的结论。这种结论也会更有指导意义,某些人工智能算法也可以因此得到施展拳脚。  当然这一点也不简单,至少比画个图要学的难多了(:




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册 微信登录 手机动态码快速登录

x
人工智障网是有关于人工智能最新资讯的平台,是人工智能行业专业的新闻发布信息的地方,专注于人工智能,AI,物联网,5G,未来城市,大数据以及人工智能学习的各类人工智能学习知识教程和学习资料,专注人工智能AI相 ...
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

发布主题
阅读排行更多+
最智能的人工智能网!
QQ:162057003
周一至周五 9:00-18:00
意见反馈:162057003@qq.com

扫一扫关注我们

Powered by Discuz! X3.4   © 2020 ( 鲁ICP备18055727号 )  |  |网站地图