封面文章

文本中隐含的跨境资金流动信息 ——基于文本大数据分析构建跨境资金流出压力指数

来源: 《中国外汇》2022年第3期 作者:孙希昀 侯骏 王淼 杨磊

【内容摘要】:防范短期跨境资本流动风险是金融外汇管理部门的一项重要工作,对短期跨境资本流动进行有效管理的前提是对未来跨境资金流动的方向和强度进行有效测度。本文通过收集和清洗大量财经类文本数据来构建经济金融中文语料库,在此基础上使用词法分析和机器学习相结合的混合方法对文本进行语义分析,完成文本正负情感倾向标注,进而构建跨境资金流出压力指数。实证研究发现,通过该文本分析方法所构建的跨境资金流出压力指数对未来跨境资金流出规模的变动具有一定预测能力,并且频率为周的高频跨境资金流出压力指数预测能力更强。

【关键词】:文本挖掘 语义分析 跨境资金流出压力指数

一、引言

测度跨境资金流动压力的传统方法主要依赖于经济增长率等宏观经济指标以及购售汇数据等微观主体行为指标,此类数据在更新频率、获得时效等方面存在一定局限。近年来,随着微博、微信等新媒体的兴起,信息传播的速度越来越快,各类专家、学者通过自媒体平台发表其对经济形势、金融市场、国际关系的观点,其中隐含的情绪往往对市场主体的跨境资金摆布行为产生潜在影响。在此背景下,借助机器学习对自媒体上的大数据文本进行分析,为衡量跨境资金流出压力打开了一扇新窗口。通过对网络上海量非结构化文本数据进行文本分析,构建高频跨境资金流出压力指数,有助于刻画市场主体摆布跨境资金的特征,在一定程度上反映市场预期、情绪变化对跨境资金流动的影响,与传统的跨境资金流出压力测度方法形成相互补充。

本文是付费内容,请先 登录数字阅读账户订阅数字杂志
数字杂志阅读
您尚未登陆
登陆 注册
本期