今日讯！大数据疫情峰值预测靠谱吗

来源: 发布时间:2022-12-21 09:01:04

“互联网+医疗”大数据可以为防疫提供参考吗？近日，随着疫情防控措施持续优化，关于各地疫情峰值的大V模型、小程序预测等也引发了网友的讨论。如在微信小程序中，可查看各大城市疫情高峰时间进度条，直接具体到高峰期的开始和结束日。

专家分析认为这种从统计学角度做流行病的预测和观察所得出的宏观趋势，有一定的参考价值，但精准到某天开始、某天结束的数据准确性有待商榷且价值不大。同时，这两种模型都将百度这一搜索引擎的搜索数据用作数据源，存在一定缺陷。

(相关资料图)

预测精准到“天数”

北京商报记者检索发现，互联网上的疫情峰值预测来源主要有2个：其一是一位大V建模，其二是微信小程序数据团+。

大V建模方面，经济学家、某平台百万粉丝大V陈沁用公开的百度指数和一套成熟的数学模型做了疫情峰值预测。他预测北京本轮疫情感染已经到达峰值，一直到1月上旬，会不断趋好。

公开资料显示，陈沁毕业于复旦大学经济系，曾任教于复旦大学经济学院，现任BBD Index首席经济学家。曾在China Economic Review、《经济研究》《经济学季刊》《金融研究》等权威期刊发表过诸多论文。

微信小程序数据团+，则由一家致力于大数据和人工智能领域的科技公司——上海脉策数据科技有限公司提供技术支持，在小程序上选择想要查询的城市，便可以显示所预测的该城市“疫达峰”可视化进度图表，如小程序显示北京第一波高峰到达日为12月16日，第一波高峰结束日为1月13日。

这两种疫情峰值测算都有其背后的原理。

根据陈沁公开的信息，他是借鉴了已经比较成熟的数学模型，用百度指数去测算疫情情况，“总体来说就是看超额搜索指数的覆盖面积，当覆盖面积达到一定阈值后就代表人口感染达到一定阈值，感染自然达峰、结束”。

微信小程序数据团+的原理类似，使用的是百度搜索指数和巨量算数数据进行计算。

北京商报记者注意到，这两种预测模式都将百度搜索指数纳入了数据源之中，但这种依赖搜索引擎数据的模型科学吗？

数据源存问题

北京商报记者将各地官方已经公布的疫情高峰预估时间和微信小程序预测的时间进行了对比。

如江西省政府新闻办在12月15日召开的江西省新冠肺炎疫情防控工作新闻发布会指出，据专家分析研判，江西省下一波疫情高峰将在今年12月底、明年1月初到来，2023年春节前后达到峰值。仅可选择城市的小程序中查询的结果则显示，南昌市第一波高峰峰值在12月21日，在2023年1月8日结束高峰期。

对此，一位统计学领域的专业人士周鸿(化名)向北京商报记者分析表示，一方面，从统计学角度做流行病的预测和观察，所得出的宏观趋势有一定的参考价值，但精准到某天开始、某天结束的数据准确性有待商榷且价值不大；另一方面，这两种模型都将百度这一搜索引擎的搜索数据用作数据源，在数据源上便存在一定问题。

“百度引擎的搜索频次总体上有一定价值，但跟实际结合后可能存在一些差异。”周鸿解释道，首先在移动互联网时代，大众的搜索渠道众多，百度搜索只是其中之一，甚至还有很大数量的人群并不会使用智能手机进行检索；其次，公共卫生事件所受到的影响因素非常多，比如某个地区突然出台了防疫相关的政策变动，会导致短期内该地区对相关话题的搜索量大幅上升。综合来看，将百度引擎作为数据源之一，并不能完全反映现实情况。

如何才能使模型更科学？周鸿建议，将国家卫健委公布的每日阳性人数和进行一定规模问卷调查得出的感染情况作为数据源之一，反而更能准确地反映出某个城市疫情发展趋势的变化。

回归到本次模型预测的价值本身，北京社科院研究员、中国人民大学智能社会治理研究中心研究员王鹏认为，就模型所测的月份上的峰值，在宏观角度上可以为线下防疫提供参考。“一方面各地通过感染情况，提前做好医疗资源、物资储备、人员调度等，也为市民日常生活防护进行一定的提醒；另一方面，这种模型对全国各地‘疫情峰值’进度都有一定预测，为全国一盘棋、疫情发展阶段不同的地区合作调配资源等提供了参考。”

“医疗大数据”尚有局限性

事实上，运用统计学的专业知识进行大数据分析、预测的案例并不少见。国家统计局每个月发布的宏观经济数据如全国CPI(居民消费价格指数)和PPI(工业生产者出厂价格指数)等，便是在对相关主体进行抽样调查的基础上进行的。另外，相关机构通过对人口基数和增速进行统计后，对人口规模的预测也属于统计学的应用。

而此次“疫达峰”所属的医疗卫生领域，则是统计学大数据适用的一个相对特殊的领域。

周鸿介绍了国外“医疗大数据”的一个典型案例——谷歌流感趋势(GFT)。谷歌公司发现，每年大约有9000万美国居民使用互联网来查询与自身相关的疾病、药物或者医院信息，而关于流行性感冒的搜索量可以及时地反映当时流感的现状；因此，他们使用互联网搜索记录来即时预测美国疾控中心延迟发布的疑似流感病例占比。该研究利用2003-2007年这五年的流感数据做模型，其推论在2008年的测试数据中得到很好验证，之后很长一段时间的流感预测结果也与实际情况非常一致。

但四年以后，《自然杂志消息》报道，在最近的一次流行感冒爆发中谷歌利用大数据流感趋势预测失效了，这一次谷歌的大数据预测模型显示流感爆发非常严重，然而疾控中心在慢慢汇总各地统计的流感数据以后，发现谷歌的预测结果远远超过了实际情况。

对于这种统计学大数据在医疗领域的适用性，中南大学硕士研究生刘琛发表在《临床医学研究与实践》期刊上的《从谷歌流感趋势(GFT)案例分析“医疗大数据”的局限性》一文中得出结论指出，医学本质是一门经验科学，大数据是人类迈向数据时代的工具，大数据分析为许多医学难题的解决提供了新途径，改变了一些疾病诊断方式，另一方面也为科研教学提供了有力的数据支撑。

“但就现状而言，大部分大数据分析技术(如nosql)还难以在医疗领域被重用，只有通过大数据方面的技术研究，不断地改进大数据在临床医学应用中的缺陷，才能更好、更准确地为患者服务。”刘琛说。

标签：

今日讯！大数据疫情峰值预测靠谱吗

乌鲁木齐中心城区可以放鞭炮吗

世界快看：银川市将于1月14日举办冬季农业嘉年华

广深铁路（601333）1月10日主力资金净买入474.40万元

报道：Windows7已落幕 但硬件市场准备好了吗

悦康药业：注射用羟基红花黄色素A治疗急性缺血性脑卒中有效性与安全性Ⅲ期临床试验已揭盲|天天观热点

法国2022年12月CPI同比上涨5.9%_每日看点

来钱花（马上金融）借款逾期9个月延迟还款会上征信系统吗

环球短讯！粤开策略：关注中药细分板块投资机会

eSIM板块1月9日跌0.47%，广和通领跌，主力资金净流出2.14亿元

今日报丨吉星高照贷款逾期3个月还不起征信有什么影响

必创集团董事长朱成荣聘江西省“五型”政府建设监督员

嗨袋贷款逾期一个月会上征信吗？

全球今亮点！顺丰押下四个亿，春节放手一搏

快看：新春走基层｜北京大兴国际机场郑鹏：日行3万步 用心守护每一扇安全门

观热点：猫的单词怎么写 猫的英语怎么读

人民币对美元重返6.8，升值空间还有多大？_全球资讯

天天实时：英国经济处于“结构性空洞”

全球今日报丨阳光玫瑰会越放越甜吗?

刘强东所怒斥的，真的是PPT吗？

[快讯]华培动力:华培动力：高级管理人员集中竞价减持股份结果|讯息

音飞储存（603066）1月6日主力资金净卖出448.62万元

【环球报资讯】*ST天马：公司参与投资的嘉兴翎贲宸桠股权投资合伙企业（有限合伙）目前持有麒麟软件股权

四川大学第二幼儿园教职工招聘（编外）

高分之作《穿书后我靠便利店带太子逃荒》必读章节让你入坑不后悔！

全球快讯:女明星就是女明星，小时候就比素人有星范儿，你能认出是谁吗

果链龙头大跌，机构资金“打架”，公司最新回应来了 播报

浦东力推揭榜挂帅平台，用市场化专业化机制，让科创需求和技术供给“双向奔赴”

热门：22农发10(增9)中标利率为3.0030%

禾元生物递表科创板，拟募资35.02亿元，尚未实现盈利

麻风病菌暗藏肝脏再生密码

持续发展壮大市场主体 扶持个体工商户健康发展

近日，记者从衡水市人民政府新闻办公室召开的《衡水市市场监督管理...

河北省交通项目建设劳动竞赛暨拉练考评范围发布

日前，省交通运输厅、省总工会、省财政厅联合印发《2022年全省交通...

河北现有灌木林地2100多万亩 占全省林地面积的18.5%

日前，省林草局印发《关于科学开展灌木林地造林绿化的指导意见》提...

河北：力争2022年底前新增分布式光伏装机250万千瓦以上

近日，河北省整县(市、区)推进屋顶分布式光伏开发试点建设推进会议...

河北省全面开展防汛风险隐患排查整治 消除安全度汛隐患

日前，省防汛抗旱指挥部办公室印发《关于开展防汛风险隐患排查整治...

报道：Windows7已落幕但硬件市场准备好了吗

快看：新春走基层｜北京大兴国际机场郑鹏：日行3万步用心守护每一扇安全门

观热点：猫的单词怎么写猫的英语怎么读

果链龙头大跌，机构资金“打架”，公司最新回应来了播报

持续发展壮大市场主体扶持个体工商户健康发展

河北现有灌木林地2100多万亩占全省林地面积的18.5%

河北省全面开展防汛风险隐患排查整治消除安全度汛隐患