怎么从信息中获得新闻以及信息价值的量化评级? 举报 理由 举报 取消 专业机构怎么从大量信息中提取有用信息作为新闻,以及给这些信息价值分类评级,有哪些量化方法? 2018年1月23日 2 条回复 1340 次浏览 价值,信息,大数,据分析,数据,新闻
回复 ( 2 )
信息可以分为两种,硬信息和软信息,或者叫结构化信息和非结构化信息
比如股价涨跌多少,GDP涨了多少,一次空难死了多少人,这些都是最方便量化的
我主要聊聊非结构化信息
在大数据概念之前,量化投资研究者一般使用NLP引擎来处理资讯。
什么是NLP引擎?
他的思维核心是情绪,他建立了一个字典,字典里有固定的范式,对于新闻和信息中的词语进行情绪的评分,比如:
开启无疑是一个正面词,迁移是一个中性偏正面词,压缩是一个中性词,这样一来,这条新闻标题就成为一个中性偏正面词
当然,NLP有很多误判的时候,不过从大概率角度来说,随着字典的越来越优化,以及上下文语义环境的优化,NLP的判断肯定是越来越准的。
大概能回答你的问题了,下面我展开一点,说说NLP在投资领域的应用。
比如我的股票池里有APPLE INC. 那么我会在处理后的信息池里提取有APPLE、IPHONE、MAC或者TimCook的新闻。
最后用得分乘以权重,就可以得到当前情绪的分
权重怎么得出呢?也用字典就行了,比如苹果这个新闻只是关于充电器的,那么权重就低,如果是苹果收购了什么公司,或者销量方面的报道,那么权重就会很高。
然后我们可以设定一个阀值,比如高于多少就买入,低于多少就卖出,就可以了。
NLP只是个简单的模型,因为他只有情绪这一个变量,后来也有很多人基于NLP开发了其他模型,但是万变不离其宗,主要核心仍然是情绪指数。
如果我们加入更多变量,以及更多维度和参考标签,系统将越来越完善。
另外,随着数据建设越来越完备,可读的数据越来越多,新网量化这块可以越来越准。
做nlp呀