feedback

意见

反馈

back-to-up

回到

顶部

糖尿病数据的可视化分析 | DT×NYCDSA

NYCDSA

John Yap   07-20

最近,国产电影《我不是药神》正在上映,这部根据真实性故事改编的电影,通过对病人群体的描写,引发了社会对于医疗问题的大讨论。作为一位长期关注临床健康问题的统计学家,数据侠 John Yap 希望用数据可视化的方式,帮助人们更好地认识疾病。这次,他把目光聚焦在了糖尿病问题上。

疾病是人类生活的一部分。我们的历史上一直不断和疾病抗争:从公元前430年在雅典爆发的天花到最近几年肆虐美洲大陆的寨卡病毒。幸运的是,科技发展给现代医学带来的治疗方法的变革,已经帮助人们取得了抗争疾病的更高效的方法。而临床试验就是这些科学方法的核心。

临床医学对糖尿病的治疗带来很大帮助。我制作了这个R Shiny app原型(你还可以登录我的 Github页面查看源代码,自己做一些更多的探索),它的目标是对美国的糖尿病临床研究信息,这些信息可以用在以下情况:

  • 糖尿病患者对参与新药物、新治疗方法的临床试验感兴趣,或者想在未来第一时间知道临床研究的新消息;
  • 你对药物学感兴趣,并且想了解更多有关现实中的临床试验的知识;
  • 你是医疗工作者,想要了解临床实验的赞助商们,以及可能影响到你所在机构的临床试验的最新进展;
  • 你对投资药物研究感兴趣,想要了解赞助数据、产品生产数据等;

这个项目的灵感来自 Xiao Jia 之前的一个项目。数据集来自 ClinicalTrials.gov,一个存储美国和世界各国临床试验数据的网站,资源来自美国国家医学图书馆。

为了创建一个App,我的研究仅仅局限在一种特定的疾病(糖尿病),赞助商只包含美国本土的机构,而且以两个主要的研究类型(临床试验和观察性研究)为主。简单来说,临床试验通常是在一种药物或治疗方式推向公众之前,小范围进行的测试。而观察性研究则是在药物已经上市后,进行的安全性评估。

App主页面上有五类信息:简介,研究信息,年度数据,赞助数据以及地图。简介是以视频形式呈现。研究信息会展示比如赞助类型、糖尿病种类、治疗模式、研究进展等特定信息,以柱状图呈现。基于这个功能我得出一些发现:

  • 糖尿病的临床试验数量多于观察性研究的数量;
  • 研究通常来自医药公司等行业内公司以及其他机构(一些学术或非盈利组织赞助);
  • 最常见的干预类型包括药物干预,行为干预以及器械干预。

年度数据的功能展示了每年开始或完成的研究数。如果我们看一看不同年份开始的研究数据,会发现:

  • 大多数研究是由行业或者其他(研究机构、非营利组织)机构来资助的
  • 2000年到2010年间,由行业或其他机构资助的临床试验陡增。一个可能的原因是糖尿病在这几年成为一个严重的公共安全隐患,引发更多的研究。
  • 2010年之后,由行业资助的研究数下降,由其他机构资助的保持不变。这可能意味着行业内不再认为研究糖尿病的治疗能够带来商业回报?这个现象值得深入研究。
 

赞助数据以表格形式展示,对不同赞助商的数据进行收集整理。表格包括每个赞助商资助的研究数,以及参与者(参与总数、平均值、最小及最大值)和时长(平均值、近几年的最小和最大值)的概况。从中你会发现:

  • 资助项目最多的10个赞助商中,7个来自行业内
  • AstraZeneca资助了最多的研究(168项)
  • 国家糖尿病、消化系统及肾脏系统疾病协会排名前三

在地图的功能上,我们展示了赞助商在全国的分布情况。你可以选择查看不同的研究类型并放大地图查看。最初的地点标示以块状展示,当你放大后会分散开,显示更具体的信息。这可以让你看到自己所在区域是否有相应的临床试验。

 

这个app仅仅用了两周左右时间完成。如果有更多时间和精力,它可以在以下方面得到提升:

  • 将其他疾病也纳入其中
  • 将美国以外的赞助商也纳入其中
  • 将更多研究类型,比如注册研究等纳入其中

另外还可以加入更多的功能,比如显示疾病发生所在地信息、受资助的临床试验的进展阶段。这些额外的功能能够帮助想要长期投资药物领域的投资者更好地选择赞助商。这会提高App的商业价值。

(本文编译自技术博客 Visualizing Diabetes Clinical Studies Data 仅代表作者观点。)

数据侠门派

John Yap是一名在临床试验以及观察性研究方面有多年工作经验的统计学家。他参加了NYCDSA的课程来提高自己的数据科学能力。他希望用自己的能力来帮助人类提高生活质量。

关于DT×NYCDSA

DT财经与纽约数据科学学院是战略合作伙伴。DT×NYCDSA 系合作开设的系列专栏。

加入数据侠

数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing004并备注“数据社群”,合作请联系datahero@dtcj.com。

分享这篇文章到