Distance based outlier detection in large dataset?

举报
如题。 问题是有一个存在硬盘上的数据库,数据库大小约是内存的20倍,其中恰好有一个 outlier, 怎么用furthest nearest neighbor的方法(每个点都有许多neighbors, 把离某点O最近的neighbor与O的距离记作r_O, 这里要求的是找出使r_O最大的O。)找出这个outlier? 要求是数据库的scan次数不超过三次。 (从数据库读入的次数不超过三次, 但是从数据库读入内存后对数据的的读取次数并没有限制)我查了不少文献,也查到了不超过3次scan找出outlier的方法,但是这些方法都需要给定 参数,比方说给定(r,k) (表示某个点O 周围r半径内的object不超过k个则这个点判断 为out […]
理由
举报 取消
1 条回复 700 次浏览 学习,数据,数据挖掘,机器

可支配资金在60万,如何实现5年内翻番??

举报
如题,本人目前可支配资金在50-60万元?有无可能在五年内翻番??备注如下:本人自由职业,由于家中两孩子,现在家带孩子+工作,赚的钱只够日常开销。所以靠工作带来的资金积累可以无视。会点外汇交易,但是不灵通,暂无法实现盈利。a股市场玩过,亏了。
理由
举报 取消
8 条回复 1020 次浏览 外汇,投资,股票

百度大数据部机器学习

举报
我参加了今年的校招,拿到了百度的大数据部机器学习-数据挖掘工程师offer和腾讯的SNG事业群数字音乐部PC客户端开发offer。个人现在倾向于百度 这个offer,但是对百度这个部门是否算是其核心部门以及这个部门的这个职位是否还不错不够了解,我也查过相关的资料,但是没找到满意的,希望了解的给点建议,谢谢~还有,腾讯的这个职位大家如果觉得发展还不错的话也可以提供一些信息,谢谢
理由
举报 取消
6 条回复 1589 次浏览 学习,数据,数据挖掘,机器,腾讯

苹果内部最近是不是在搞什么大动作?

举报
最近发现苹果似乎在犯一些不应该犯的错,下面3点仅仅是我自己观察到的,不能说明什么,但所谓管中窥豹可见一斑,有时候往往能从一些细微处看出大问题来,所以才想求证一下。1.最新的OS X EI Capitan版本中国区差评明显多过好评,这种情况在以前似乎没看到过,以往都是好评如潮。2.Xcode不到一个月的时间里连续发布两个版本更新,这种情况也是第一次遇到。3.我们自己的应用最近一个版本的评论全部被删,我们没有做过任何违法App Store政策的事情,比如刷榜刷量等。
理由
举报 取消
1 条回复 1177 次浏览 App,Apple,macOS,Store,Xcode,苹果公司