用户名*
邮箱*
密码*
确认密码*
验证码* 点击图片更换验证码
找回密码
忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。
天地化育万物, 内心涌现泉源
Clementine中药物治疗案例分析
一、研究问题:
通过数据分析发现以往处方适用的规律,给不同临床特征病人更适合服用哪种药物的建议,为未来医生填写处方提供参考。此案例将采用决策树的方法,找出哪种药物适用于哪一种类型的病人。
二、过程:
本案例的数据是Clementine软件自带的一份关于药物研究的数据DRUGIN,一共有200条数据,该资料包含的字段如下图:
1.读取数据到Clementine中。
2.浏览数据内容。在“输出”选项卡中选择“表”节点加到数据流中,执行该节点,所生成的数据表名将列在流管理窗口的输出选项卡中。如图:
3.观察各个变量的数据分布特征。在“输出”选项卡中选择“数据审核”节点加到数据流中,执行该节点,所生成的数据表名列在流管理窗口的输出选项卡中,如图3-1;创建分布图,汇总分析数据类型,找出每种药物对症患者的比例如图3-2。
图3-1:
图3-2:
可以看到,该数据有200个样本,对Age、Na、K这三个数值型变量,计算且输出最小值、最大值、均值、标准差、偏态系数等基本描述统计量。数据显示,病人的年龄差距比较大。
同时,输出了各个变量的直方图或柱状图。图形表明,病人中的Age、BP、Cholesterol水平的分布都比较均匀,差异不大,但服用药物DrugY的病人数明显高于服用其他药物的人数。
4.观察服用不同药物的病人唾液中钠钾的含量情况。这里,通过散点图反映。在“图形”卡中选择“散点图”节点加到数据流中,设置节点参数,指定Na为X轴,K为Y轴,服用不同Drug的病人数据采用不同颜色的点,执行该节点,所生成的图形文件名列在流管理窗口的输出选项卡中,如图:
图形显示,服用DrugY的病人,其唾液中的钾含量明显低于其他类病人,但钠含量有的较低有的较高。单纯的钾含量较低的病人选用DrugY应该比较理想。
5.观察服用不同药物病人唾液中的钠钾的浓度比例情况。为更准确地评价药物状况,单纯观察钾含量是不全面的,应观测钠与钾的浓度比值指标,它能够更准确反映病人肾上腺皮质的功能状态。该指标是原始数据中没有的,应首先计算生成,然后观察其分布特征。在“字段选项”选择卡中选择“导出”节点加到数据流中,设置节点参数指定生成的新变量名为Na_to_K,计算公式为Na/K。在“图形”选项卡中选择“直方图”节点,设置节点参数指定绘制Na_to_K的直方图,且服用不同药物的病人数据采用不同的颜色。执行“直方图”节点,所生成的图形文件名列在流管理窗口的“输出”选项卡中,如图:
图形显示,针对Na_to_K值处在高水平(大于或等于15)的病人,DrugY应该是理想的选择。
6.不同血压特征病人的药物选择,在“图形”选项卡中选择“网络”节点加到数据流中,设置节点参数指定绘制关于Drug与BP的网状网络图,执行“网络”节点,所生成的图形文件名列在流管理窗口的“输出”选项卡中,如图:
此网状图通过线条粗细反映病人BP与Drug的取值情况。可以看到,无论血压状况如何,都可以服用DrugY,其三条线的粗细程度差别不大。因此,DrugY对病人的血压没有特殊限定,更具有普遍服用性。在不考虑选择DrugY时,血压高的病人可服用DrugA或DrugB,血压低的病人则应该在DrugX和DrugC中选择。
7.全面分析决定药物选择的其他影响因素。通过前面的分析,似乎对选择DrugY的依据有了一定的结论,但没有考虑Age、Sex、和Cholesterol等方面,分析仍是不全面的。同时,应怎样选择其他药物,也没有给出明确且全面的标准。这里,希望进一步利用数据,通过建立模型,从Age、Sex、BP、Cholesterol、Na/K的综合角度分析选择不同药物的依据。
首先,在建模中不再直接采用K和Na变量,而是采用Na/K,因此先将变量K和Na筛掉。在“字段”选项卡中选择“过滤”节点加到数据流中,设置参数在K和Na变量上打叉筛掉,然后,指定建立模型过程中各个变量的作用,这里Age、Sex、BP、Cholesterol、Na/K为解释变量,称为模型的输入变量,Drug为被解释变量,称为模型的输出变量。在“字段”选项卡中选择“类型”节点加到数据流中,设置参数指定不同变量的作用角色。最后,在“建模”选项卡中选择“C5.0”节点加到数据流中。选择C5.0模型,执行C5.0节点,生成的模型名列在流管理窗口的模型选项卡中。选择流管理窗口中的模型选项卡,右击鼠标,选择弹出菜单中的“浏览”选项,浏览模型结果,如图:
采用决策树图表形式分析,可以更轻松地查看各个血压类别的观测值数量以及各个观测值的百分比。如图:
可以看出,当病人的Na_to_K值高于14.64时,应选择DrugY,无需考虑其他因素。当病人的Na_to_K值≤14.64时,对于高血压病人,年龄是主要的判断依据,年龄≤50岁的,更适合DrugA,高于50的则应选择DrugB;对于低血压病人,则应依据其胆固醇指标选择,胆固醇正常的选择drugX,胆固醇高的选择drugC。对于血压正常的病人可选择DrugX。性别对选择药物没有影响。
8.模型的预测精度评价。首先,选择流管理窗口中的“模型”选项卡,右击鼠标,选择弹出菜单中的“添加到流”选项,将模型计算结果加到数据流中;然后,在“输出”选项卡中选择“分析”节点并与模型结果节点相连,执行“分析”节点,所生成的结果列在流管理窗口的输出选项卡中,如图:
可以看到,所建模型的正确预测精度达到了99.5%,模型较为理想。
9.本次实验最终所建立的数据流如图:
三、结论:
1.当病人的Na_to_K值高于14.64时,应选择DrugY,无需考虑其他因素。
2.当病人的Na_to_K值≤14.64时:对于高血压病人,年龄是主要的判断依据,年龄≤50岁的,更适合DrugA,高于50的则应选择DrugB;对于低血压病人,则应依据其胆固醇指标选择,胆固醇正常的选择drugX,胆固醇高的选择drugC;对于血压正常的病人可选择DrugX。
3.性别对选择药物没有影响。
小组成员:田金千201310811127,张荷梅201310811128,吴双201310811129,熊凯利201310811124,杨超201310811117
药物案例分析
1。通过数据挖掘找出适合治疗此疾病的不同患者的药物。找出这几种药物中(A.B.C.X.Y)哪个是最佳药品创建汇总试图找出每种药物的对应患者的比例。
2.建立散点图,我们可以看出Y药物对K,NA的影响较大。
3,创建网络图,通过对网络图的分析我们可以看出,药品Y与三种级别的血压都相关。通过对药品Y线段的隐藏,我们可以看出只有药品A.B与高血压相关,只有药品C和X与低血压有关。只有药品X与正常血压有关。
4.K和NA的比例可以用来预测什么时候用药品Y,我们为每条记录导出一个包含此比例值得字段,然后利用这些字段来构建模型预测何时使用哪一种药品。
5,插入一个字段Na to k,输入公式Na/k,构建直方图,通过直方图我们可以看出,当Na to k 字段值的值大于或等于15时,选择药品Y。
6,通过使用规则构建模型来拟合数据,用来证明血液中K和Na 的比例及血压似乎都会影响药品的选择。
7、在类型上将新品字段Na-to-k的方向设置为输出,表明我们要预测的是新字段,其他字段设置为输入。表明这些变量是将用作预测变量。
8、创建C5.0模型,通过形成的决策树我们可以看出K,Na比例小于14.642的高血压患者,年龄将决定如何选择药品,对于低血压患者,胆固醇含量似乎是最有力的预测变量。
9、将C5.0模型添加到流,然后添加分析节点,通过输出显示,我们可以看出此模型已正确预测该数据集中大部分记录的药品选择。
10、结论:K.Na比例大于等于14.642时使用Y药品,钾钠比例小于14.642且年龄小于等于50.5的高血压患者使用A药品。钾钠比例小于14.642且年龄大于50.5的高血压患者使用B药品。钾钠比例小于14.642且低血压胆固醇高的患者使用C药品,钾钠比例小于14,642且低血压胆固醇正常的患者使用X药品,钾钠比例小于14.642且血压正常的患者使用Y物品。
小组成员:胡桂英、李亚梅、邓月敏、陈兰药物治疗案例分析
问题: 通过数据挖掘找出适合治疗此疾病的药物
结论:在五种药物测试中一共有200个样本中:
Na_to_K的比例>14.642的人只选择药品Y,
Na_to_K的比例<=14.642的人中,血压偏高的人且年龄<=50的选择药物A,年龄〉50的人选择药物B;
血压低的且胆固醇正常的人选择药物X,胆固醇高的人选择药物C;
血压正常的人选择药物X。
解决方法:
1.提出假设 (血液中钠与钾的比例以及血压会影响药品的选择)
2.构建数据分析模型
在五种药物测试中一共有200个样本中:
1.Na_to_K的比例>14.642共91人(占45.5%)只选择药品Y,
2.Na_to_K的比例<=14.642共109人(占54.5%),其中血压偏高的人共39人(占19.5%),其中年龄<=50的人中有23人选择药物A(占11.5%),年龄〉50的人中有16人选择药物B(占8%);
3.血压低的人共34人(占17%)且胆固醇正常的有18人选择药物X,胆固醇高的有16人选择药物C;
4.血压正常的有36人选择药物X。
综上所述:假设正确
组员:叶燕飞;李永菊;洪露平;欧小芳
一、要解决的问题
用过收集到的一组患有同一疾病的患者的数据,了解到他们在治疗过程中,每位患者均对五种药物中的一种有明显反应。因此我们要解决的问题就是通过对这些药物的数据分析找出适合治疗此疾病的药物。
二、分析解决过程
1、首先随机调查了200名患者的个人数据,集成表格,进行分析,分析内容如下
2、通过对患者使用药物的分析,得知使用药品Y的患者最多,而药品B和C的患者最少
3、通过比较Na和K的比率散点图,得知只有药物Y是对症药品
4、通过不同血压和药品之间的关系,而我们已经知道药品Y是最佳药品,忽略药品Y对血压的影响,得知药品 A 和 B 与高血压有关,药品 C 和 X 与低血压有关,只有药品 X 与正常血压有关。
小组成员:杨晨博201310811130
郭鑫 201310811115
胡浩 201310811112
雷佳鑫201310811113
1.药物治疗案例中:已拥有的原始数据(包括了五种药物,Drug A、B、C、X、Y;血压;胆固醇;唾液中Na和K的含量;病人的年龄和性别。接下来通过整理分析这些数据发现以往处方适用的规律,给不同临床特征病人更适合服用哪种药物的建议;
2.通过软件我们制定出了整个分析过程的流程模式:
接下来通过数据分析得到以下数据分布类型:
散店图:
上图可得出唾液中K含量低的患者,大多服用了drug Y;
直方图
可得 Na_to_K值处在高水平的病人,最好使用drug Y;
绘制网状图:
得出在高血压的情况下使用药品A和B,在低血压的情况下使用药品C 和X,正常血压情况下,使用药品X。
3.通过以上数据得出以下结论:
1、钾钠比小于等于14.642
50岁以上的高血压患者选用B
50岁以下的高血压患者选用A
胆固醇正常的低血压患者选用X
胆固醇高的低血压患者选用C
正常血压的患者选用X
2.钾钠比大于14.642的患者选用药物Y
并通过cs5.0得出决策树
4.0最后对分析数据进行分析可得:
药物治疗分析
邓小龙 201310811119
赵梦楠 201310811101
蒲虹燕 201310811104
何正阳 120106130440
药物分析解决的什么问题?
通过数据挖掘找到治疗疾病的最优药品;
分析选择药物的因素:血压、胆固醇和钾钠浓度比;
解决步骤:
读取文本数据-添加表-创建分布图-创建散点图-创建网络图-导出新字段-构建模型-浏览模型-使用分析节点。
1.创建流
2.运用分布图可得出drugY所占比例最大,drugB,drugC最小。
3.创建散点图,分析钾钠浓度对选择药品的影响。
4.绘制网络图,分析血压与药品间的关系
5.导出新字段-当Na_to_K字段的值大于或等于15时,应选择药品Y.
6.构建并浏览模型,对于钾钠比例小于14.642的高血压患者,年龄将决定如何选择药品,而对于低血压患者,胆固醇是预测变量。
7.使用节点分析,分析正确性
结论
由决策树可得
1.钾钠比小于等于14.642
正常血压患者选用X
目的:用已收集了一组患有同一疾病的患者的数据。在治疗过程中,每位患者均对五种药物中的一种有明显反应。我们可以通过数据挖掘找出适合治疗此疾病的药物。
Ò1.先加载一个原始数据节点于可变文件,再通过数据挖掘分析,可以在这里添加表,分布图,字段图,散点图,网络图来分析了解数据分布情况。
2.
可以找出每种药物的对症患者的比例,结果表明,药品 Y 的对症患者最多,而药品 B 和药品 C 的对症患者最少。。
3.
钠与钾的比例似乎可以用来预测何时可以使用药品 Y,可以为每条记录导出一个包含此比例值的字段。该字段稍后可用于构建模型以预测何时可使用五种药品中的每一种药品。
这样,我们可以通过执行各个节点浏览了解数据关系。
4.通过建立模型分析可以得出以下浏览模型,然后打开。
Ò对于钠钾比例小于 14.642 的高血压患者,年龄将决定如何选择药品。对于低血压患者,胆固醇含量似乎是最有力的预测变量。
5.
Ò使用分析节点,可以点评估模型的精确度。
小组成员:张华艳
兰亚丽
范云月
廖羽
解决问题:通过数据分析,找出更适合治疗不同疾病患者的药物。
解决步骤:读取文本数据-添加表-创建分布图-创建散点图-创建网络图-导出新字段-构建模型-浏览模型-使用分析节点。
1.运用分布图了可得到drugY所占比例最大,其次是drugX。
2.创建散点图,看出钠和钾对不同药品所产生的影响。
3.导出新字段,得出当比例大于等于15时,应该选择drugY。
4.构建浏览模型
5.分析节点
结论: 1)当Na-to-K小于等于14.642,
年龄大于50岁适合使用drugB
年龄小于等于50岁适合使用drugA
2)低血压患者
胆固醇正常适合使用drugX
胆固醇高适合使用drugC
正常血压的患者选用drugX
3)当Na-to-K大于14.624
患者适合使用drugY
工商13-3 324朱玲 326罗婷 327王露蓉 332德间木初
A.药物治疗解决什么问题?
找出适合患者的最优药品,哪些元素会影响对药品的选择。
B.解决问题的过程
1.读取文本数据,了解数据类型
2.添加表,对信息进行分类统计
3.创建分布图,汇总分析数据类型,找出每种药物对症患者的比例。
结果表明,药品 Y 的对症患者最多,而药品 B 和药品 C 的对症患者最少。
4.创建散点图,分析哪些因素会对药品产生影响,以纳和钾为例,显示为纳和钾的比率。
5.创建网络图-药品 Y 与三种级别的血压均相关,只有药品 A 和 B 与高血压有关。只有药品 C 和 X 与低血压有关。只有药品 X 与正常血压有关。
6.导出新字段-当 Na_to_K 字段的值大于或等于 15 时,应选择药品 Y
7.构建并浏览模型,对于钠钾比例小于 14.642 的高血压患者,年龄将决定如何选择药品。对于低血压患者,胆固醇含量似乎是最有力的预测变量。
8.使用分析节点,分析正确性。
C.结论—分析出各类患者最适用的药物
NA/K<=14.642,
高血压患者年龄小于等于50岁,选择药品A
大于50岁,选择药品B
低血压患者胆固醇正常选择药品X,胆固醇高选择药品C
正常血压患者选择药品X
NA/K>14.642,
选择药品Y
药物治疗适用性分析
成员:李佳桧 顾祖芬 王玉珠 蔺静 罗健 陈玉敏 彭湘媛
一:解决问题
通过数据挖掘找出适合治疗相关疾病的药物
对选择药物的影响因素:血压 胆固醇 钾钠浓度比
二:解决步骤
1.添加原始数据,了解原始数据情况
2.添加数据表,了解各个不同患者的年龄、血压情况、对药物的适应性等信息
3.创建分布图,可以读取到不同药物所占比例,药物Y的对症患者最多,B、C的对症患者最少
4、创建散点图,分析钾和钠在血液中的浓度对选择药品的影响。5、绘制网络图,分析血压和药品之间的关系。得出:在高血压的情况下使用药品A和B,在低血压的情况下使用药品C 和X,正常血压情况下,使用药品X
5、绘制网络图,分析血压和药品之间的关系。
6、运用直方图,根据钠钾比例找出适合的药品。得出:当比例>=15时应该选择药品Y
7、创建模型,得出所有因素对使用药物的联系
三、结论
昵称*
E-Mail*
回复内容*
回复 ( 10 )
Clementine中药物治疗案例分析
一、研究问题:
通过数据分析发现以往处方适用的规律,给不同临床特征病人更适合服用哪种药物的建议,为未来医生填写处方提供参考。此案例将采用决策树的方法,找出哪种药物适用于哪一种类型的病人。
二、过程:
本案例的数据是Clementine软件自带的一份关于药物研究的数据DRUGIN,一共有200条数据,该资料包含的字段如下图:
1.读取数据到Clementine中。
2.浏览数据内容。在“输出”选项卡中选择“表”节点加到数据流中,执行该节点,所生成的数据表名将列在流管理窗口的输出选项卡中。如图:
3.观察各个变量的数据分布特征。在“输出”选项卡中选择“数据审核”节点加到数据流中,执行该节点,所生成的数据表名列在流管理窗口的输出选项卡中,如图3-1;创建分布图,汇总分析数据类型,找出每种药物对症患者的比例如图3-2。
图3-1:
可以看到,该数据有200个样本,对Age、Na、K这三个数值型变量,计算且输出最小值、最大值、均值、标准差、偏态系数等基本描述统计量。数据显示,病人的年龄差距比较大。
同时,输出了各个变量的直方图或柱状图。图形表明,病人中的Age、BP、Cholesterol水平的分布都比较均匀,差异不大,但服用药物DrugY的病人数明显高于服用其他药物的人数。
4.观察服用不同药物的病人唾液中钠钾的含量情况。这里,通过散点图反映。在“图形”卡中选择“散点图”节点加到数据流中,设置节点参数,指定Na为X轴,K为Y轴,服用不同Drug的病人数据采用不同颜色的点,执行该节点,所生成的图形文件名列在流管理窗口的输出选项卡中,如图:
图形显示,服用DrugY的病人,其唾液中的钾含量明显低于其他类病人,但钠含量有的较低有的较高。单纯的钾含量较低的病人选用DrugY应该比较理想。
5.观察服用不同药物病人唾液中的钠钾的浓度比例情况。为更准确地评价药物状况,单纯观察钾含量是不全面的,应观测钠与钾的浓度比值指标,它能够更准确反映病人肾上腺皮质的功能状态。该指标是原始数据中没有的,应首先计算生成,然后观察其分布特征。在“字段选项”选择卡中选择“导出”节点加到数据流中,设置节点参数指定生成的新变量名为Na_to_K,计算公式为Na/K。在“图形”选项卡中选择“直方图”节点,设置节点参数指定绘制Na_to_K的直方图,且服用不同药物的病人数据采用不同的颜色。执行“直方图”节点,所生成的图形文件名列在流管理窗口的“输出”选项卡中,如图:
图形显示,针对Na_to_K值处在高水平(大于或等于15)的病人,DrugY应该是理想的选择。
6.不同血压特征病人的药物选择,在“图形”选项卡中选择“网络”节点加到数据流中,设置节点参数指定绘制关于Drug与BP的网状网络图,执行“网络”节点,所生成的图形文件名列在流管理窗口的“输出”选项卡中,如图:
7.全面分析决定药物选择的其他影响因素。通过前面的分析,似乎对选择DrugY的依据有了一定的结论,但没有考虑Age、Sex、和Cholesterol等方面,分析仍是不全面的。同时,应怎样选择其他药物,也没有给出明确且全面的标准。这里,希望进一步利用数据,通过建立模型,从Age、Sex、BP、Cholesterol、Na/K的综合角度分析选择不同药物的依据。
首先,在建模中不再直接采用K和Na变量,而是采用Na/K,因此先将变量K和Na筛掉。在“字段”选项卡中选择“过滤”节点加到数据流中,设置参数在K和Na变量上打叉筛掉,然后,指定建立模型过程中各个变量的作用,这里Age、Sex、BP、Cholesterol、Na/K为解释变量,称为模型的输入变量,Drug为被解释变量,称为模型的输出变量。在“字段”选项卡中选择“类型”节点加到数据流中,设置参数指定不同变量的作用角色。最后,在“建模”选项卡中选择“C5.0”节点加到数据流中。选择C5.0模型,执行C5.0节点,生成的模型名列在流管理窗口的模型选项卡中。选择流管理窗口中的模型选项卡,右击鼠标,选择弹出菜单中的“浏览”选项,浏览模型结果,如图:
可以看出,当病人的Na_to_K值高于14.64时,应选择DrugY,无需考虑其他因素。当病人的Na_to_K值≤14.64时,对于高血压病人,年龄是主要的判断依据,年龄≤50岁的,更适合DrugA,高于50的则应选择DrugB;对于低血压病人,则应依据其胆固醇指标选择,胆固醇正常的选择drugX,胆固醇高的选择drugC。对于血压正常的病人可选择DrugX。性别对选择药物没有影响。
8.模型的预测精度评价。首先,选择流管理窗口中的“模型”选项卡,右击鼠标,选择弹出菜单中的“添加到流”选项,将模型计算结果加到数据流中;然后,在“输出”选项卡中选择“分析”节点并与模型结果节点相连,执行“分析”节点,所生成的结果列在流管理窗口的输出选项卡中,如图:
可以看到,所建模型的正确预测精度达到了99.5%,模型较为理想。
9.本次实验最终所建立的数据流如图:
三、结论:
1.当病人的Na_to_K值高于14.64时,应选择DrugY,无需考虑其他因素。
2.当病人的Na_to_K值≤14.64时:对于高血压病人,年龄是主要的判断依据,年龄≤50岁的,更适合DrugA,高于50的则应选择DrugB;对于低血压病人,则应依据其胆固醇指标选择,胆固醇正常的选择drugX,胆固醇高的选择drugC;对于血压正常的病人可选择DrugX。
3.性别对选择药物没有影响。
小组成员:田金千201310811127,张荷梅201310811128,吴双201310811129,熊凯利201310811124,杨超201310811117
药物案例分析
1。通过数据挖掘找出适合治疗此疾病的不同患者的药物。找出这几种药物中(A.B.C.X.Y)哪个是最佳药品创建汇总试图找出每种药物的对应患者的比例。
2.建立散点图,我们可以看出Y药物对K,NA的影响较大。
3,创建网络图,通过对网络图的分析我们可以看出,药品Y与三种级别的血压都相关。通过对药品Y线段的隐藏,我们可以看出只有药品A.B与高血压相关,只有药品C和X与低血压有关。只有药品X与正常血压有关。
4.K和NA的比例可以用来预测什么时候用药品Y,我们为每条记录导出一个包含此比例值得字段,然后利用这些字段来构建模型预测何时使用哪一种药品。
5,插入一个字段Na to k,输入公式Na/k,构建直方图,通过直方图我们可以看出,当Na to k 字段值的值大于或等于15时,选择药品Y。
6,通过使用规则构建模型来拟合数据,用来证明血液中K和Na 的比例及血压似乎都会影响药品的选择。
7、在类型上将新品字段Na-to-k的方向设置为输出,表明我们要预测的是新字段,其他字段设置为输入。表明这些变量是将用作预测变量。
8、创建C5.0模型,通过形成的决策树我们可以看出K,Na比例小于14.642的高血压患者,年龄将决定如何选择药品,对于低血压患者,胆固醇含量似乎是最有力的预测变量。
9、将C5.0模型添加到流,然后添加分析节点,通过输出显示,我们可以看出此模型已正确预测该数据集中大部分记录的药品选择。
10、结论:K.Na比例大于等于14.642时使用Y药品,钾钠比例小于14.642且年龄小于等于50.5的高血压患者使用A药品。钾钠比例小于14.642且年龄大于50.5的高血压患者使用B药品。钾钠比例小于14.642且低血压胆固醇高的患者使用C药品,钾钠比例小于14,642且低血压胆固醇正常的患者使用X药品,钾钠比例小于14.642且血压正常的患者使用Y物品。
小组成员:胡桂英、李亚梅、邓月敏、陈兰药物治疗案例分析
问题: 通过数据挖掘找出适合治疗此疾病的药物
结论:在五种药物测试中一共有200个样本中:
Na_to_K的比例>14.642的人只选择药品Y,
Na_to_K的比例<=14.642的人中,血压偏高的人且年龄<=50的选择药物A,年龄〉50的人选择药物B;
血压低的且胆固醇正常的人选择药物X,胆固醇高的人选择药物C;
血压正常的人选择药物X。
解决方法:
1.提出假设 (血液中钠与钾的比例以及血压会影响药品的选择)
2.构建数据分析模型

在五种药物测试中一共有200个样本中:
1.Na_to_K的比例>14.642共91人(占45.5%)只选择药品Y,
2.Na_to_K的比例<=14.642共109人(占54.5%),其中血压偏高的人共39人(占19.5%),其中年龄<=50的人中有23人选择药物A(占11.5%),年龄〉50的人中有16人选择药物B(占8%);
3.血压低的人共34人(占17%)且胆固醇正常的有18人选择药物X,胆固醇高的有16人选择药物C;
4.血压正常的有36人选择药物X。
组员:叶燕飞;李永菊;洪露平;欧小芳
一、要解决的问题
用过收集到的一组患有同一疾病的患者的数据,了解到他们在治疗过程中,每位患者均对五种药物中的一种有明显反应。因此我们要解决的问题就是通过对这些药物的数据分析找出适合治疗此疾病的药物。
二、分析解决过程
1、首先随机调查了200名患者的个人数据,集成表格,进行分析,分析内容如下
小组成员:杨晨博201310811130
郭鑫 201310811115
胡浩 201310811112
雷佳鑫201310811113
1.药物治疗案例中:已拥有的原始数据(包括了五种药物,Drug A、B、C、X、Y;血压;胆固醇;唾液中Na和K的含量;病人的年龄和性别。接下来通过整理分析这些数据发现以往处方适用的规律,给不同临床特征病人更适合服用哪种药物的建议;
2.通过软件我们制定出了整个分析过程的流程模式:
散店图:
直方图
可得 Na_to_K值处在高水平的病人,最好使用drug Y;
绘制网状图:
3.通过以上数据得出以下结论:
1、钾钠比小于等于14.642
50岁以上的高血压患者选用B
50岁以下的高血压患者选用A
胆固醇正常的低血压患者选用X
胆固醇高的低血压患者选用C
正常血压的患者选用X
2.钾钠比大于14.642的患者选用药物Y
并通过cs5.0得出决策树
4.0最后对分析数据进行分析可得:
药物治疗分析
邓小龙 201310811119
赵梦楠 201310811101
蒲虹燕 201310811104
何正阳 120106130440
药物分析解决的什么问题?
通过数据挖掘找到治疗疾病的最优药品;
分析选择药物的因素:血压、胆固醇和钾钠浓度比;
解决步骤:
读取文本数据-添加表-创建分布图-创建散点图-创建网络图-导出新字段-构建模型-浏览模型-使用分析节点。
1.创建流
3.创建散点图,分析钾钠浓度对选择药品的影响。
4.绘制网络图,分析血压与药品间的关系
1.钾钠比小于等于14.642
50岁以上的高血压患者选用B
50岁以下的高血压患者选用A
胆固醇正常的低血压患者选用X
胆固醇高的低血压患者选用C
正常血压患者选用X
2.钾钠比大于14.642的患者选用药物Y
目的:用已收集了一组患有同一疾病的患者的数据。在治疗过程中,每位患者均对五种药物中的一种有明显反应。我们可以通过数据挖掘找出适合治疗此疾病的药物。
Ò1.先加载一个原始数据节点于可变文件,再通过数据挖掘分析,可以在这里添加表,分布图,字段图,散点图,网络图来分析了解数据分布情况。
可以找出每种药物的对症患者的比例,结果表明,药品 Y 的对症患者最多,而药品
B 和药品 C 的对症患者最少。。
3.
钠与钾的比例似乎可以用来预测何时可以使用药品 Y,可以为每条记录导出一个包含此比例值的字段。该字段稍后可用于构建模型以预测何时可使用五种药品中的每一种药品。
这样,我们可以通过执行各个节点浏览了解数据关系。
4.通过建立模型分析可以得出以下浏览模型,然后打开。
Ò对于钠钾比例小于
14.642 的高血压患者,年龄将决定如何选择药品。对于低血压患者,胆固醇含量似乎是最有力的预测变量。
5.![]()
Ò使用分析节点,可以点评估模型的精确度。
小组成员:张华艳
兰亚丽
范云月
廖羽
解决问题:通过数据分析,找出更适合治疗不同疾病患者的药物。
解决步骤:读取文本数据-添加表-创建分布图-创建散点图-创建网络图-导出新字段-构建模型-浏览模型-使用分析节点。
1.运用分布图了可得到drugY所占比例最大,其次是drugX。
年龄大于50岁适合使用drugB
年龄小于等于50岁适合使用drugA
2)低血压患者
胆固醇正常适合使用drugX
胆固醇高适合使用drugC
正常血压的患者选用drugX
3)当Na-to-K大于14.624
患者适合使用drugY
药物治疗分析
工商13-3 324朱玲 326罗婷 327王露蓉 332德间木初
A.药物治疗解决什么问题?
找出适合患者的最优药品,哪些元素会影响对药品的选择。
B.解决问题的过程
1.读取文本数据,了解数据类型
2.添加表,对信息进行分类统计
3.创建分布图,汇总分析数据类型,找出每种药物对症患者的比例。
结果表明,药品 Y 的对症患者最多,而药品 B 和药品 C 的对症患者最少。
4.创建散点图,分析哪些因素会对药品产生影响,以纳和钾为例,显示为纳和钾的比率。
5.创建网络图-药品 Y 与三种级别的血压均相关,只有药品 A 和 B 与高血压有关。只有药品 C 和 X 与低血压有关。只有药品 X 与正常血压有关。
6.导出新字段-当 Na_to_K 字段的值大于或等于 15 时,应选择药品 Y
7.构建并浏览模型,对于钠钾比例小于 14.642 的高血压患者,年龄将决定如何选择药品。对于低血压患者,胆固醇含量似乎是最有力的预测变量。![]()
8.使用分析节点,分析正确性。
C.结论—分析出各类患者最适用的药物
NA/K<=14.642,
高血压患者年龄小于等于50岁,选择药品A
大于50岁,选择药品B
低血压患者胆固醇正常选择药品X,胆固醇高选择药品C
正常血压患者选择药品X
NA/K>14.642,
选择药品Y
药物治疗适用性分析
成员:李佳桧 顾祖芬 王玉珠 蔺静 罗健 陈玉敏 彭湘媛
一:解决问题
通过数据挖掘找出适合治疗相关疾病的药物
对选择药物的影响因素:血压 胆固醇 钾钠浓度比
二:解决步骤
1.添加原始数据,了解原始数据情况
2.添加数据表,了解各个不同患者的年龄、血压情况、对药物的适应性等信息
3.创建分布图,可以读取到不同药物所占比例,药物Y的对症患者最多,B、C的对症患者最少
4、创建散点图,分析钾和钠在血液中的浓度对选择药品的影响。5、绘制网络图,分析血压和药品之间的关系。得出:在高血压的情况下使用药品A和B,在低血压的情况下使用药品C 和X,正常血压情况下,使用药品X
5、绘制网络图,分析血压和药品之间的关系。
6、运用直方图,根据钠钾比例找出适合的药品。得出:当比例>=15时应该选择药品Y
7、创建模型,得出所有因素对使用药物的联系
三、结论
1、钾钠比小于等于14.642
50岁以上的高血压患者选用B
50岁以下的高血压患者选用A
胆固醇正常的低血压患者选用X
胆固醇高的低血压患者选用C
正常血压的患者选用X
2.钾钠比大于14.642的患者选用药物Y