各位看官大家好,小弟机器学习入门,有一些疑惑:1. 机器学习说白了是求一个函数f=h(x),这个函数可能是多元多次的,然后给定一组x,求y。这样理解正确吗?2. 如果特征值是字符串,比如用户id是guid,那么字符串怎么带入方程h(x)呢? 是不是和模型有关,如果是决策树,特征值可以是字符串,如果是线性模型的话,特征值只能是数值型3. 如果某一列特征值是数值型,那么数值的不同会反应他们的倍数关系吗,比如下面年龄数值,第二个用户的年龄是第一个用户的2倍,会影响最后的h(x)吗: userid, age, count 1 , 1 , 1 2 , 2 , 3 3 , 4 , 94. 现在拿到一个数据,提不出来特征,有没有介绍提取特征的书籍 […]
查看全文在中国是否有可能建立起美国那样的个人信用体系?目前国内征信行业是什么样的发展状况?难点有哪些?
之前和fico中国合作项目。这评分模型其实就是个逻辑回归。中国现在在大数据分析方面有那么多有实力的企业,还有那么多人才。建立起美国那样的评分体系还有哪些障碍?现在搞征信的企业我只知道阿里和平安,具体国内征信行业现在发现到什么阶段了,和美国差距还有多大?
查看全文为什么无线网IPHONE进入APP STOR进不去,只能用数据流量进去之后再转换到无线网下载?
不光是我的手机,同事的iphone也是,用WIFI进APP STOR 特别慢或者根本进不去,只能用数据流量进去之后再转换到WIFI之后再下载,想问下各位知友,这个是小概率事件还是普遍的情况?而且换到其他的WIFI还是有同样的情况
查看全文HBase中rowkey设计有哪些注意点?分别针对这举出一个实例给予说明。
HBase中rowkey设计有哪些注意点,分别针对这举出一个实例给予说明。
查看全文