用户名*
邮箱*
密码*
确认密码*
验证码* 点击图片更换验证码
找回密码
忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。
想吃唐僧肉的,想吃唐僧豆腐的
聚类是一个比较困难的问题,原因之一就在于这个问题本身并不是well-defined的。由于聚类本质上是一个unsupervised learning问题(这里先不讨论semi-supervised clustering),所以其输入通常只有需要被聚的数据本身,而没有任何其他的指导信息。这往往会导致多个同样合理但迥然不同的聚类结果。以西游记中的妖怪为例:
* 如果按变人之后的性别作为标准,那很明显蝎子精,白骨精等女妖和黄风怪,黑熊怪等男妖需要分别聚在不同的类;
* 但如果按孙悟空打得过还是打不过(需要求助)作为标准,那么蝎子精,黄风怪等战斗力爆表的妖怪应该就和黑熊怪之流被划分在不同的类中。
* 如果按是山大王还是小喽啰作为标准,那么金角大王,银角大王和巴山虎,伶俐虫等自然会分属不同类;
* 但如果按所属国界作为标准,此时金角大王,银角大王和手下的巴山虎,伶俐虫就需要被聚为同一类了,因为他们都来自平顶山莲花洞。
* 如果按想不想吃唐僧肉作为标准,那么玉兔精,六耳猕猴就应该属于少量对唐僧肉不感兴趣的妖怪;
* 但如果按最后的下场死没死作为标准,那么被一棒打死的六耳猕猴肯定就会和被收走的玉兔精分属不同的类别。
以上列举的只是少量的例子,应该还会有许多其他的聚类标准。举这些例子是为了说明,其实并没有哪个指标一定会比其他指标更好更合理,很多时候用哪个标准往往是由具体的任务所决定的。为了消除或减弱聚类结果的不确定性,在机器学习中往往会使用以下一些方法:
1. 引入少量pairwise constraints或者labels去指导聚类,这就是semi-supervised clustering问题。比方说当我们被明确告知琵琶精和玉兔精需要被归为一类,琵琶精和金角大王不能被归为一类时,我们就知道很可能需要把性别作为聚类标准。
2. 在设计feature时,人为控制不同attribute的权重。比方说如果我在feature中加大了地域相关指标的权重,那最后的聚类结果很可能会以妖怪所在的地点作为标准。
3. 不改变feature本身,却改变计算点间距离的函数。比方说用一些非单位矩阵的distance metric去取代传统的欧氏距离。这本质上和2是类似的方法,都是用改变点间距离来影响聚类结果。
4. 人为介入。用不同算法或者同一算法的不同参数或初始值生成多个不同的聚类结果,再人为介入选择符合任务设定的结果。
5. 使用ensemble clustering把多个不同聚类结果整合成一个更好(或者更被广泛接受)的聚类结果。
法力指数(与变化数成正比);
武力指数(与同孙悟空对打回合数成正比);
政治属性(与后台有关);
生物属性(按照界门纲目科属种来给分);
法宝加成;
个体户、民营、合资、外资、国企
属性:
0.称号 (分类型:ex”红孩儿“)
1.性别 (分类型:”male”,”female”,”changeable“)
2.出身 (分类型:“仙界”,“人间土生土长”)
3.修为 (数值型:以年份来计[纯人类的修为为0])
4.法宝威力
5.势力 (顺序分类型:”小“,”中“,”大“)
6.出场集数
7.结局 (分类型:”dead”,”alive”)
选取其中的几个属性做聚类分析,估计会发现结局跟出身的相关性是最大的,然后就分成了两类,233333
PS:好像挺多聚类算法都是基于连续型数值的,最近多了解了下,感觉自己还是too young了……
人:本体是人,如:强盗,女儿国国王
魔:造型不限,本体没有固定,靠修炼获得强大的能力。如:铁扇公主,红孩儿,六耳猕猴,九灵元圣。
仙:在天届或者佛届有自身的地位,但是在西游路上起到阻碍或者贪图唐僧肉的,如:大鹏金翅,镇远大仙。
预警!!
Kaiser已关注此问题。
泻药
《如何用互联思维为十八大精神插上翅膀在中国特色的网络大环境下分析猴子的N种形态》
猴子的第一种形态–猴崽子
生性狂野,好以真性情自居,茹毛饮血,拎个猴屁股逮谁跟谁来。生得含糊,活得鲁莽,却也有份天真的情怀。不料一日被酆都大帝艹翻在地,血肉横飞,本想反抗,奈何阎王手握一本猴崽黑历史,跪之。猴崽自此发愤图强,武练棍法,文习忽悠,如此循环… …
猴子的第二种形态–毛猴
猴崽子上访菩提炮祖学技巧,下询胡同大仙儿学理论,周六学撕逼,周日读心理。一日忽觉全身经脉发胀双手颤抖不止,猴儿知道这是内力被压抑不得释放的表现,乘着这股王霸之气直奔酆都复仇。天道酬勤,猴崽子没白瞎了自己下的功夫,此去酆都一战成名。此战之后猴崽子便跃升为地界大V,是春风得意好不威风。那张稚嫩的猴脸不复存在,过度分泌的荷尔蒙使那双猴眼瞅谁都冒凶光,桀骜不驯、不可一世,此乃毛猴儿。
猴子的第三种形态–妖猴
(作为一只米猴,我要去关注小米的发布会了,有人看再写。)
AD AP 还有肉
1 以下凡前的主人分类
佛家 道家 无主
佛家 观音宠物鲤鱼,文殊宠物狮子,如来门前蝎子老鼠
道家 老君宠物青牛,寿星宠物白鹿
无主 白骨精,蜘蛛精
1.5按照下场分类 有的妖怪没有主人也有领导回收 比如蜘蛛精
2 动物原形分类(推荐!)
动物类(兔狮牛羊虎鹿熊蜘蛛蜈蚣蝎子龙大鹏孔雀鼠鲤鱼蛇龟)
动物大类下面再按照门纲目细分子类
神兽类 ,爬行类,虫类,鸟类
人类(金角)
其他类(白骨精这种尸魔)
3按照修炼成妖的方式(积累法力)分类 偷吃类,听课修炼类,神兽逃跑类
4按性别分 男妖怪要吃 女妖怪劫色
5以前世因果分类
情缘 黄风怪和百花羞
仇缘 狮子和乌鸡国国王
6以法力等级排序
昵称*
E-Mail*
回复内容*
回复 ( 10 )
想吃唐僧肉的,想吃唐僧豆腐的
聚类是一个比较困难的问题,原因之一就在于这个问题本身并不是well-defined的。由于聚类本质上是一个unsupervised learning问题(这里先不讨论semi-supervised clustering),所以其输入通常只有需要被聚的数据本身,而没有任何其他的指导信息。这往往会导致多个同样合理但迥然不同的聚类结果。以西游记中的妖怪为例:
* 如果按变人之后的性别作为标准,那很明显蝎子精,白骨精等女妖和黄风怪,黑熊怪等男妖需要分别聚在不同的类;
* 但如果按孙悟空打得过还是打不过(需要求助)作为标准,那么蝎子精,黄风怪等战斗力爆表的妖怪应该就和黑熊怪之流被划分在不同的类中。
* 如果按是山大王还是小喽啰作为标准,那么金角大王,银角大王和巴山虎,伶俐虫等自然会分属不同类;
* 但如果按所属国界作为标准,此时金角大王,银角大王和手下的巴山虎,伶俐虫就需要被聚为同一类了,因为他们都来自平顶山莲花洞。
* 如果按想不想吃唐僧肉作为标准,那么玉兔精,六耳猕猴就应该属于少量对唐僧肉不感兴趣的妖怪;
* 但如果按最后的下场死没死作为标准,那么被一棒打死的六耳猕猴肯定就会和被收走的玉兔精分属不同的类别。
以上列举的只是少量的例子,应该还会有许多其他的聚类标准。举这些例子是为了说明,其实并没有哪个指标一定会比其他指标更好更合理,很多时候用哪个标准往往是由具体的任务所决定的。为了消除或减弱聚类结果的不确定性,在机器学习中往往会使用以下一些方法:
1. 引入少量pairwise constraints或者labels去指导聚类,这就是semi-supervised clustering问题。比方说当我们被明确告知琵琶精和玉兔精需要被归为一类,琵琶精和金角大王不能被归为一类时,我们就知道很可能需要把性别作为聚类标准。
2. 在设计feature时,人为控制不同attribute的权重。比方说如果我在feature中加大了地域相关指标的权重,那最后的聚类结果很可能会以妖怪所在的地点作为标准。
3. 不改变feature本身,却改变计算点间距离的函数。比方说用一些非单位矩阵的distance metric去取代传统的欧氏距离。这本质上和2是类似的方法,都是用改变点间距离来影响聚类结果。
4. 人为介入。用不同算法或者同一算法的不同参数或初始值生成多个不同的聚类结果,再人为介入选择符合任务设定的结果。
5. 使用ensemble clustering把多个不同聚类结果整合成一个更好(或者更被广泛接受)的聚类结果。
法力指数(与变化数成正比);
武力指数(与同孙悟空对打回合数成正比);
政治属性(与后台有关);
生物属性(按照界门纲目科属种来给分);
法宝加成;
个体户、民营、合资、外资、国企
属性:
0.称号 (分类型:ex”红孩儿“)
1.性别 (分类型:”male”,”female”,”changeable“)
2.出身 (分类型:“仙界”,“人间土生土长”)
3.修为 (数值型:以年份来计[纯人类的修为为0])
4.法宝威力
5.势力 (顺序分类型:”小“,”中“,”大“)
6.出场集数
7.结局 (分类型:”dead”,”alive”)
选取其中的几个属性做聚类分析,估计会发现结局跟出身的相关性是最大的,然后就分成了两类,233333
PS:好像挺多聚类算法都是基于连续型数值的,最近多了解了下,感觉自己还是too young了……
人:本体是人,如:强盗,女儿国国王
魔:造型不限,本体没有固定,靠修炼获得强大的能力。如:铁扇公主,红孩儿,六耳猕猴,九灵元圣。
仙:在天届或者佛届有自身的地位,但是在西游路上起到阻碍或者贪图唐僧肉的,如:大鹏金翅,镇远大仙。
预警!!
Kaiser已关注此问题。
泻药
《如何用互联思维为十八大精神插上翅膀在中国特色的网络大环境下分析猴子的N种形态》
猴子的第一种形态–猴崽子
生性狂野,好以真性情自居,茹毛饮血,拎个猴屁股逮谁跟谁来。生得含糊,活得鲁莽,却也有份天真的情怀。不料一日被酆都大帝艹翻在地,血肉横飞,本想反抗,奈何阎王手握一本猴崽黑历史,跪之。猴崽自此发愤图强,武练棍法,文习忽悠,如此循环… …
猴子的第二种形态–毛猴
猴崽子上访菩提炮祖学技巧,下询胡同大仙儿学理论,周六学撕逼,周日读心理。一日忽觉全身经脉发胀双手颤抖不止,猴儿知道这是内力被压抑不得释放的表现,乘着这股王霸之气直奔酆都复仇。天道酬勤,猴崽子没白瞎了自己下的功夫,此去酆都一战成名。此战之后猴崽子便跃升为地界大V,是春风得意好不威风。那张稚嫩的猴脸不复存在,过度分泌的荷尔蒙使那双猴眼瞅谁都冒凶光,桀骜不驯、不可一世,此乃毛猴儿。
猴子的第三种形态–妖猴
(作为一只米猴,我要去关注小米的发布会了,有人看再写。)
AD AP 还有肉
1 以下凡前的主人分类
佛家 道家 无主
佛家 观音宠物鲤鱼,文殊宠物狮子,如来门前蝎子老鼠
道家 老君宠物青牛,寿星宠物白鹿
无主 白骨精,蜘蛛精
1.5按照下场分类 有的妖怪没有主人也有领导回收 比如蜘蛛精
2 动物原形分类(推荐!)
动物类(兔狮牛羊虎鹿熊蜘蛛蜈蚣蝎子龙大鹏孔雀鼠鲤鱼蛇龟)
动物大类下面再按照门纲目细分子类
神兽类 ,爬行类,虫类,鸟类
人类(金角)
其他类(白骨精这种尸魔)
3按照修炼成妖的方式(积累法力)分类 偷吃类,听课修炼类,神兽逃跑类
4按性别分 男妖怪要吃 女妖怪劫色
5以前世因果分类
情缘 黄风怪和百花羞
仇缘 狮子和乌鸡国国王
6以法力等级排序