社交媒体与股市的关系

社交媒体我们日常都在用,股市我们也总要看一眼。它们之间的关系,可比想象中要密切得多。最典型的例子莫过于2021年1月Reddit上散户对GameStop的逼空,使股价在短期内急剧升高,充分显示了社交媒体对股市的影响。

如今,社交媒体已经从最初的聊天工具变成了传播消息的重要渠道,像X、Reddit等平台都有专门给投资者交流的地方。人们可以在上面分享经验、转发消息、发表看法、宣泄情绪,其速度和规模早已超过传统媒体。

投资者的信息来源也在向社交平台转移。比如,美国投资者使用社交媒体获取投资信息的调查结果显示,在2024年,有30% 的投资者使用YouTube,而使用Reddit、脸书、领英、Instagram、X的也都超过10%。

此外,SEC在2013年正式允许企业通过社交媒体发布重大信息,因而来越来越多的企业也将X、脸书等平台当作重要的沟通渠道。例如,Marshall等三位学者发现,有超过70% 的S&P 1500企业在2020年拥有X账户且持续使用这个平台。

对我们普通投资者来说,理解社交媒体与股市的关系,不是为了赶时髦,更是为了了解当今股价形成的内在机制。

对于“社交媒体与股市”的研究,近些年发展得相当快。它有行为金融学为主要支撑,若干理论作基础,大量实证成果为依据,逐步形成了一个相对完整的体系。

行为金融学认为,投资者并不完全理性,认知能力也有限,投资决策会受到诸如情绪、热点关注、他人看法等因素的影响,从而在股市中表现出情绪化、过度反应、从众、偏见等非理性行为。

社交媒体正是影响这些因素的重要渠道。行为金融学中的理论,包括噪声交易者、情绪驱动、有限注意力和意见分歧理论,为分析它与股市的关系提供了理论基础。

噪声交易者理论 (noise trader)认为,市场上既存在理性的投资者,也存在非理性的“噪声交易者”。所谓“噪声交易者”,指的是那些依据噪声(无价值的信息)进行交易的投资者,因为他们错误地认为那是有价值的信息。

当市场上存在噪声交易者时,他们的交易行为会导致价格偏离内在基本价值,并加剧价格波动。

你会不会因为网上的一个谣言就下单?

情绪驱动理论 (sentiment driven)指的是投资者 (如噪声交易者)会被情绪影响而改变投资决策,从而影响股票价格。

Baker & Wurgler(2006)把“情绪”定义为愿不愿意冒险投机,这种情绪会影响投资者挑选哪些股票,进而影响价格使其偏离基本价值。作者进一步指出,情绪对不同类型股票的影响并不相同:对那些难以定价的股票(例如新的、小的、增长快的、尚未盈利、没有分红的企业),作用尤其大。

你有过专挑这样的股票来投机的经验吗?

有限注意力理论 (limited attention)指出,一般投资者,如散户的注意力是有限的,无法关注股市上所有股票,来逐一判断是不是要买入。他们只能考虑那些吸引他们目光,引起他们关注的股票。因此,这个理论预测,那些引人注目的“热门股票”会引发大量的购买需求,从而推高价格。

看看你的资产中有没有那些耀眼的明星股票?

意见分歧 (divergence of opinion)认为,未来的不确定性和风险本身就会使人们产生不同的看法。比如,对股票未来回报的判断,投资者之间往往会有明显分歧。

意见分歧催生买卖交易,并能使某些股票的价格被抬得过高,以至于未来价格出现回落。

说完理论,再来看实证研究。

在 2000 年之前,人们普遍认为网上的投资讨论价值不大,可以忽略。然而,一些学者研究发现,尽管网络讨论嘈杂,却对股市有显著的预测能力,包括预测股价(或股票收益,即股价的变化)、成交量、以及股价波动。

Antweiler & Frank(2004)是这方面的经典研究之一。作者收集了雅虎财经(Yahoo! Finance)和Raging Bull两个股票讨论区中在2000年全年发布的帖子(messages),并对道琼斯工业平均指数和互联网商务指数中的45家企业进行分析。

对于这两个讨论区的帖子,他们着眼于三个方面。第一是讨论数量(帖子的多少)。因为热点股票往往会吸引投资者,也会掺杂许多噪声交易者的帖子。

第二是帖子中的观点(看涨、看跌),因为人们在做投资决策时往往会受到他人看法的影响。

第三是帖子中的意见分歧(有看涨的,也有看跌的)。根据意见分歧理论,分歧越大,成交量越高。

作者的发现,讨论数量与股票收益(负相关)、成交量(正相关)、波动(正相关)都有关联;帖子对某一股票总体看涨,则其股票收益增加;意见分歧加大,则成交量增多。

不过,这些关联都是短期的。长期看,股票收益、成交量、股价波动会回落。

讨论“情绪与股市”离不开Tetlock (2007)。作者考察《华尔街日报》中一个与股市有关的专栏:“Abreast of the Market”,分析专栏中呈现的 “悲观语气” (pessimism) 是否可以预测道琼斯工业平均指数的表现。研究的时间跨度从1984年到1999年。

作者发现,《华尔街日报》上的消极、悲观语气对股票价格产生向下压力,但这个影响只是暂时的,随后股价又会逆转。他还发现,过度的悲观语气会使成交量大增。

如何衡量投资者对某只股票的关注程度(注意力)呢?不同于Antweiler & Frank(2004)用“发帖数量”来表示,Da 等三位学者(2011)提出使用 “Google 搜索量”这个指标,这一做法后来被广泛沿用。

三位学者考察2004年至2008年间Google 搜索量与Russell 3000企业的股票收益。结果显示,注意力的上升会伴随着未来两周的股价上涨。而且这种现象在散户多,分析师覆盖少的小企业股票上表现得尤为明显。

我用一张图来概括平台与股市的实证研究:平台用户/投资者的关注度(注意力)、情绪、不同观点是否能预测股价(或股票收益)、成交量和股价波动等股市变量。

看到这里,有人会问:如何从平台、新闻媒体的发帖与讨论中提取情绪和其他内容,即如何对它们进行量化呢?

我们可以采用文本分析(textual analysis)的方法,也就是用AI算法去“阅读”文字,从中找出所需要的内容,将其转化成指标,并作为变量放入模型当中。

举个例子,要研究发帖人的情绪是乐观还是悲观。首先制作一个词典,里面有两类词汇:表示乐观的与表示悲观的。然后让算法去阅读文字,找出反映乐观的词和反映悲观的词各有多少,据此做成指标。最简单的做法是:如果发帖人用的乐观词多于悲观词,那他就是乐观的,反之亦然。

随着社交媒体的兴起,学者们将目光移向这些平台上的消息,情绪与股价之间的关联。与传统媒体相比,社交平台可以随时地、直接地互动,而且平台上的信息不仅传播广,而且异常迅速,也使得媒体与股市的关系可以更加深入、细致。

Bollen等三位学者(2011)在收集大量 Twitter 信息(两百七十万用户的一千万条tweets)的基础上,把平台上的情绪细分为六种,包括平静、惊慌、笃定、快乐等。

他们发现,当情绪仅分为高低两种时,情绪与道琼斯工业平均指数没有关联;而当情绪被细分为六种后,其中的“平静”具有显著作用:当天的“平静”情绪可以预测未来几天的指数表现(上涨),然而一周后影响消失,价格回落。

这篇论文的贡献在于把社交媒体的情绪细化。虽然研究方法仍显初步,比如平台上的情绪用的是总体情绪,市场分析针对的是股指,但它标志着社交媒体情绪研究的真正开始。

2014年,Sprenger 与另外两名学者搜集了Twitter上直接与公司股票有关的近25万条tweets,并针对个股进行分析。他们的研究结果与之前讨论的大体一致。

与此同时,为解释研究结果,作者进一步考察平台的传播机制,发现如果某一用户的预测较准确,他的发帖往往会受到重视,被反复提及、被追随,从而具有更大的号召力。这些与我们直觉相符的现象被作者用大量数据加以统计验证。

文章还发现,相较于社交媒体影响股市,其实股市对社交媒体的影响更大。例如,前一天股价下跌,会引发次日平台情绪低落。所以媒体与股市的关系不是单向的,而是相互影响的。

上述考察的媒体与股市之间的关联是以天为单位,并没有涉及一天之内的这种关联。Renault (2017) 的分析填补了这个空白。

作者使用专注金融市场的StockTwits 平台数据,对5年间发布的近6千万条消息进行分析,结果表明,开盘后最初半小时的情绪可以预测收盘前最后半小时的S&P 500 指数表现,即平台总体正面(负面)情绪与较高(较低)的指数收益显著相关。然而,次日指数会出现逆转。

他指出,这个短暂的指数收益变动是由情绪驱动的噪声交易引发的,而且这种情绪驱动主要来自投资新人的交易行为。

社交媒体与股市的研究大多考察的是美国股市。然而,不同国家的资本市场结构并不一样。例如,与美国相比,在中国个人/散户投资占比高,并且他们更愿意投资个股而不是指数。那么,在那种背景下,社交媒体与股市的关系是否会有所不同?

Li & Ahn(2024)分析了2020年新浪微博上关于COVID讨论所呈现的情绪与沪深300指数的关系。作者采用机器学习与深度学习的文本分析方法,从微博帖子中提取情绪内容,量化成指标。他们发现,平台上的低落情绪对指数价格有显著的负面影响,从而佐证了社交媒体情绪与中国股市的关联。但这种影响会因行业不同而有所差异。

看到这里,你不妨停下来问问自己,社交媒体影响我的投资决策吗?我有没有过因为一条帖子而改变交易的时候?

最后,与上述文章考察单一社交平台不同,Cookson 等学者在2024年将研究扩展到Twitter、StockTwits、Seeking Alpha 等多平台环境。他们注意到,不同平台的属性存在差异,比如用户构成不一样(专业、散户、新人),平台设计有差异(发帖字数限制、话题是否受限),覆盖的企业类型也不相同。

在研究中,他们发现,不同平台上的关注度非常相似,例如某一天,各个平台会讨论同一批企业。但是不同平台上的情绪却不大相似,不大会彼此传染。

他们进一步将情绪和关注度分为三个平台“共有部分”与“平台特有部分”。结果显示,平台特有的情绪和关注度与股市之间的关系会因平台不同而呈现差异。他们据此提出,社交媒体与股市的关系具有平台差异性。

到此,这个话题的论述主要基于行为金融学理论及相关实证发现。但这并不意味着传统金融理论有效市场假说(EMH)在这一领域不成立。

“有效市场”基于传统金融学的假设:投资人的决策是理性的,会根据自己掌握的相关信息来做决定,而不受其他因素影响。因此,股票价格反映的是所有可获得的信息,一旦有新的信息出现,价格会迅速作出调整。

事实上,早期的一些研究,如 Tumarkin & Whitelaw(2001),考察Raging Bull讨论区留言板上的消息,没有发现这些留言具有预测股市走向的能力,因为它们没有提供新的信息。这个结果更接近EMH的观点。

可以说,行为金融学与有效市场假说从两个不同角度帮助我们更好地理解社交媒体与资本市场的关系。

文章到了这里,已接近结尾。你也许会问,既然社交媒体的情绪、关注点、分歧等因素与股市有关,如果将这些因素纳入交易模型,据此交易,会不会盈利呢?

Tetlock(2007)曾做过实验,他把情绪作为参数放入交易模型来进行交易,发现确实可以获得额外收益。不过他也承认,在计算收益时并没有考虑交易成本和税收。因此,对散户来说是不是可行,还不好下结论。

那么,如果是大机构呢,如果在AI算法普及之后呢?就留待读者去思考吧。

(更多细节与参考文献,请见博客系列原文)

请您先登陆,再发跟帖!