发起人:Liam 初入职场

当“反政治正确”成为了政治正确

回复 ( 2 )

  1. JohnK无相法师
    理由
    举报 取消

    信息可以分为两种,硬信息和软信息,或者叫结构化信息和非结构化信息

    比如股价涨跌多少,GDP涨了多少,一次空难死了多少人,这些都是最方便量化的

    我主要聊聊非结构化信息

    在大数据概念之前,量化投资研究者一般使用NLP引擎来处理资讯。

    什么是NLP引擎?

    他的思维核心是情绪,他建立了一个字典,字典里有固定的范式,对于新闻和信息中的词语进行情绪的评分,比如:

    媒体称钢铁业将开启50万人大迁移 压缩1.5亿吨产能

    开启无疑是一个正面词,迁移是一个中性偏正面词,压缩是一个中性词,这样一来,这条新闻标题就成为一个中性偏正面词

    当然,NLP有很多误判的时候,不过从大概率角度来说,随着字典的越来越优化,以及上下文语义环境的优化,NLP的判断肯定是越来越准的。

    大概能回答你的问题了,下面我展开一点,说说NLP在投资领域的应用。

    比如我的股票池里有APPLE INC. 那么我会在处理后的信息池里提取有APPLE、IPHONE、MAC或者TimCook的新闻。

    最后用得分乘以权重,就可以得到当前情绪的分

    权重怎么得出呢?也用字典就行了,比如苹果这个新闻只是关于充电器的,那么权重就低,如果是苹果收购了什么公司,或者销量方面的报道,那么权重就会很高。

    然后我们可以设定一个阀值,比如高于多少就买入,低于多少就卖出,就可以了。

    NLP只是个简单的模型,因为他只有情绪这一个变量,后来也有很多人基于NLP开发了其他模型,但是万变不离其宗,主要核心仍然是情绪指数

    如果我们加入更多变量,以及更多维度和参考标签,系统将越来越完善。

    另外,随着数据建设越来越完备,可读的数据越来越多,新网量化这块可以越来越准。

我来回答

Captcha 点击图片更换验证码