科技性抑郁?
2024年10月,谷歌DeepMind计算机研究员Felix Hill结束了自己年轻的生命,他曾经发布过关于AI压力的博文,呼吁大家关注AI研究者的心理健康,他这样写道:“从某一时刻开始,私人聚会中我身边围着一群人,他们得知我是谷歌AI研究员,都迫切的想找我了解最新发展,但是,没有人找我聊音乐,没有人找我聊足球。”,“即使我已经为了减少焦虑完全不看新闻,但是看足球比赛过程中,广告里也全是AI。。”
2018年,我第一次接触到人工智能这个词,对于这个能自动从数据中寻找规律的思想感到新奇。此前我接受的科学训练大多为如何观察实验,提出对于规律的猜想,再通过数据去检验规律的有效性。这个过程需要直觉,经验,以及有时出现的运气。而利用AI来拟合,只要数据够多,噪声够少,在定义清楚目标任务后,可以有机会自动计算出这个规律。即使这个计算出的规律难以直接被我们的大脑理解,但能够省掉大把掉头发的劳累,而且在应用场景中的效果足够好,何乐而不为呢?带着好奇与兴奋,我开始转向了人工智能的研究。
不知道从什么时候开始,我好像感受到了某种东西,讨论AI相关话题时会越来越烦躁。新闻里,主持人介绍着人工智能前景无限,路边广告牌上写着AI是新世界的钥匙,各种各样媒体都在报导各式各样的最新进展与突破。但是在AI这个当下炙手可热领域里进行科研,我却是越来越焦躁不安,像是不小心扑到岸边的鱼,挣扎着一下一下张大嘴,却还是慢慢窒息。后来,情况越演越烈,我变得害怕网络,无法使用手机,甚至无法使用电脑。
我是怎么了?还可以清晰记得第一次了解矩阵空间的畅快感;第一次搭建起神经网络,看到loss函数在迭代中下降时的兴奋感。那时候,我会花大量的时间去琢磨某个参数对模型效果的影响,去思考针对特定任务优化方式的构造逻辑。但好像从某一个时刻开始,我变得越来越急躁,关注点也发生了偏移。新的论文,新的研究方向出现的速度越来越快。浏览器上的标签页是越开越多,链接一个接一个的跳转。我急着吸收新的知识,新的想法,害怕遗漏了任何一个可能有价值的内容。
网络世界带来的焦虑让我有这样的体验:早上起来,发现某公众号推送了一篇最新的文章,“刚刚,某研究所联合某大学发布了新的模型,效果远超SOTA(state-of-the-art,前沿研究)。”,打开文章一看,确实是发表在了顶级刊物上。快速浏览了一下主要内容,了解在做的应用方向。看了一下主要图表,网络结构看起来很大一块;占满一整页的表里对比了最新的好多个模型,最后那一行的加粗数字代表着该模型的效果超过了其他的。再看实验细节,用了8张A100做训练。被该研究组实验设备的豪气惊的深吸一口气。接着点开作者主页,又为作者的论文数量和在大公司实习的几段经历咂舌,默默添加该主页到收藏夹,希望之后再回来拜读他的整个研究。
有一天我突然发现,收藏夹内容越来越多,而做最初做研究的畅快感越来越少。我好像在不断的往前奔跑,但我不知道自己这么急着到底要去哪里。
2022年,ChatGPT进入了公众视野,一下子,人工智能这个词几乎家喻户晓。人们说,“新的技术革命已经到来,通用大模型的出现就像曾经电气的出现,新的产能世界即将到来!”巨量的资金涌入芯片行业,不仅是与大模型技术相关的AI初创公司,即使只涉及到一点AI的公司也跟着一个个冒出头来。机器人公司用AI做感知和控制,物流公司用AI优化路径,金融公司用AI推荐产品,连美容产品都说自己用AI调整了成分。已经存在的公司也赶紧更新了自己的主页,想法设法加上一个AI模块增加竞争力。全世界好像都欢腾起来了,所有人的目光都聚焦这“新世界”。
人们似乎对于有AI的美好世界深信不疑,满心想着怎么制造出更强的模型,不惜投入大量的资源。一个项目投入了却没做出来,没关系,赶紧开始下一个,好像按下了加速键,节奏变得越来越快。
我脑子里有一个意象:自己是一棵根扎得不够深的树,在这个环境得到的养分只能让我的冠越变得越大,根系却无法变长,变深。无论是我这个新手还是Felix这样研究语言模型的老手,我们都切身感受到了巨大的压力。我想要探明这种焦虑和恐惧。我们所体会到的到底是什么?在21世纪之初,在这样快节奏的世界里,诞生的会不会是一种“科技性抑郁”?