帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

关于C4.5连续属性信息增益修正问题?

在C4.5中,对连续属性的处理如下: 1. 对特征的取值进行升序排序 2. 两个特征取值之间的中点作为可能的分裂点,将数据集分成两部分,计算每个可能的分裂点的信息增益(InforGain)。优化算法就是只计算分类属性发生改变的那些特征取值。 3. 选择修正后信息增益(InforGain)最大的分裂点作为该特征的最佳分裂点 4. 计算最佳分裂点的信息增益率(Gain Ratio)作为特征的Gain Ratio。注意,此处需对最佳分裂点的信息增益进行修正:减去log2(N-1)/|D|(N是连续特征的可能的分裂点个数,D是训练数据数目,此修正的原因在于:当离散属性和连续属性并存时,C4.5算法倾向于选择连续特征做最佳树分裂点) 我想问的 […]

查看全文

上学是荒废了学业,现在后悔莫急,浪子回头真的能成功嘛?

偶然间看到了一篇文章,一位老师写给卖鱿鱼的大二女生的那篇,我确实感到了一股不一样的力量突然支撑起了自己,我作为一个普通的专科生,学习真的很差今年7月份毕业了。刚刚步入社会的我感到迷茫和不知所措,因为我不知道现在自己该做什么,应该去做什么,没有一个理想和目标。只是在一家小公司做些简单的工作,也许接下来我会听从家里的安排回到家乡结婚生子。因为一直以来自己在学校非常敷衍贪玩没有真正的认真学习过,现在真正懂得学习的重要性了也是有些晚了,真的很后悔自己竟然虚度光阴二十载。那篇文章我反反复复看了很多遍,觉得自己不能再这样过下去了,决定选择继续深造,第一步目标想要专升本。可是因为学业荒废太久对自己也没有信心,不知该从何学起。也不知究竟是错是对,希 […]

查看全文

spark和deeplearning的关系,想做大数据处理分析,是该专注于学spark还是深度学习呢?

我刚读研一,自己对大数据的处理分析比较感兴趣,导师让我看深度学习方面的论文和deeplearning4j方面的算法源代码,但是自己不知道如何把spark和深度学习结合起来,以后还是想出来工作的不做研究,我该怎么做呢,对了,学习spark需要hadoop基础,我现在没有这方面基础,只有java基础。

查看全文

小波聚类 wavecluster算法的细节问题,请问具体是怎么实现的?

最近论文需要用到wavecluster,但是在网上找了资料,基本都是下面的这些,基本上看不太懂,求大神指教一下,如果能有具体的代码或者伪代码就最好啦,谢谢大神 步骤1) 对特征空间进行量化,把每个维度分成m段,这样,整个空间分成单元,然后把对象分机到相应的单元; 步骤2) 对量化后的特征空间进行离散小波变换; 步骤3) 在变化后的特征空间的子波段中找出相连的部分,就是簇; 步骤4) 为每个簇所包含的单元分配相应的标签; 步骤5) 建立查找表,用于把变换后特征空间中的单元映射到原特征空间中的单元; 步骤6) 把每个单元的标签分配给该单元内的所有对象。

查看全文