关于「中文已死」这个结论

我大概写了有十年博客,基本上也算是见证了这十年里屏蔽手段和敏感词的变化。十年前那会儿也是有敏感词库,不过基本上会限定在一些特定的历史事件和领导人名称上,以及出现一些群体性事件后会短暂屏蔽一些人名和地名。这样的敏感词库你很容易找到,你也很容易学会,只要稍加自我审查,你大抵是能在写作时避开这些内容的。比较好笑是有一次我写「汪洋大海」,结果半天发不出去,后来才知道,原来是汪洋的名字不能发。

这个词库一直在更新,其涵盖的层面也一直在被扩展,首先是越来越多的名词不能再讲了,尤其是和政治,社会制度,秩序,国家运行有关的词语,再后来就是很多指代性的词也不能再讲了,然后你就得开始考虑如何能够讲出来,你就开始使用许多奇怪的分隔符,同音字,试图骗过机器。但是后来会发现机器学习也在学习,它逐渐开始理解了你那些同音字和分隔符。最好是写英文,但是英文的那些词逐渐也会被屏蔽,用德语可以解决这个问题。但不管是哪门外语,这就意味着你写出来的东西默认别人懂这门语言,这肯定不对。

在这个过程中,你的所有精力都用来在考虑,我如何审查我自己,才能让这篇东西被更多人读到。你的自我审查会越来越严重,而且这还只是对抗机器这个环节,更不要提你还要继续想,你如何才能骗过随时都在巡逻的审查员,来让你的这篇内容不被删除,你写太明白,它看了会直接删除,你写不明白,那没人能够读懂。你要让它看不明白你在讲什么,同时又…

--

--

随机游走森林

做做数据,读读小说,偶尔走走,偶尔写写。