帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

Distance based outlier detection in large dataset?

如题。 问题是有一个存在硬盘上的数据库,数据库大小约是内存的20倍,其中恰好有一个 outlier, 怎么用furthest nearest neighbor的方法(每个点都有许多neighbors, 把离某点O最近的neighbor与O的距离记作r_O, 这里要求的是找出使r_O最大的O。)找出这个outlier? 要求是数据库的scan次数不超过三次。 (从数据库读入的次数不超过三次, 但是从数据库读入内存后对数据的的读取次数并没有限制)我查了不少文献,也查到了不超过3次scan找出outlier的方法,但是这些方法都需要给定 参数,比方说给定(r,k) (表示某个点O 周围r半径内的object不超过k个则这个点判断 为out […]

查看全文

百度大数据部机器学习

我参加了今年的校招,拿到了百度的大数据部机器学习-数据挖掘工程师offer和腾讯的SNG事业群数字音乐部PC客户端开发offer。个人现在倾向于百度 这个offer,但是对百度这个部门是否算是其核心部门以及这个部门的这个职位是否还不错不够了解,我也查过相关的资料,但是没找到满意的,希望了解的给点建议,谢谢~还有,腾讯的这个职位大家如果觉得发展还不错的话也可以提供一些信息,谢谢

查看全文