平城区金贸国际中心的写字楼里,上海润迅云中声谷大数据智慧服务基地占据了整整几层楼。数千名戴着耳机的年轻人,被框在格子间里,重复着点击、拖拽、框选的动作,他们的指尖划过屏幕,也划过自己被算法定义的人生。截至2025年11月,大同已投运服务器74.5万台,引进69家呼叫标注数据企业,带动3万多人就近就业,而这些从业者中,94%都是本地户籍——他们是煤炭时代的遗民,也是AI时代最底层的“挖煤工”。
大同不是个例。国家数据局首批确定的数据标注基地中,山西永和、贵州毕节、云南蒙自等中西部县城赫然在列。永和的数据标注基地里,80%的员工是女性,她们多是农村宝妈、返乡青年,在实体经济的缝隙里找不到立足之地,最终被吸入这片赛博流水线。
这一幕,像极了一百年前的曼彻斯特。当年,失去土地的农民被赶进纺织厂,在机器的轰鸣中出卖劳动力;如今,在实体经济中被边缘化的年轻人,被赶到电脑屏幕前,为北京、深圳乃至硅谷的AI巨头,生产大模型必需的“食粮”。他们从事着最具未来感的行业,干的却是最原始的计件工作,而更诡异的是,没人觉得这有什么问题。

一、流水线的异化:从“高薪体面”到“指尖炼狱”
数据标注的本质,是教机器认识世界。自动驾驶需要分清红绿灯与行人,大模型需要辨别猫与狗,而这一切的前提,是人类先在图片上画框标注,告诉机器“这是什么”。这份工作无需高学历,只需耐心和一根能不停点击的食指,曾是县城里令人羡慕的“白领工作”。2017年是标注行业的黄金时代,一个简单的2D框就能卖到一毛多,甚至有公司开出5毛的高价。手速快的标注员,一天干十几个小时,能赚五六百块,在人均工资不高的县城,这无疑是高薪。但大模型的飞速进化,很快撕碎了这份“体面”,将这条赛博流水线拖入残酷的内卷。
到2023年,简单图像标注的单价暴跌至3到4分钱,跌幅超90%。即便是难度更高的3D点云图——那些由密集点位构成、需放大数倍才能看清边缘的图像,标注员要在三维空间中拉出精准的立体框,严丝合缝包裹住车辆或行人,这样一个复杂的标注,也仅能拿到5分钱。
单价暴跌的背后,是劳动强度的暴增。为了守住每个月两三千块的底薪,标注员必须不断提升手速,每天重复上千次、上万次相同的动作。这从来不是轻松的白领工作:上班时手机必须锁进储物柜,不允许接打电话,系统会精准记录鼠标轨迹和停留时间,只要停顿超过三分钟,后台的警告就会如期而至,像鞭子一样抽打在每一个疲惫的人身上。
更令人崩溃的是近乎苛刻的容错率。行业及格线普遍在95%以上,部分公司甚至要求98%-99%——拉100个框,只要错2个,整张图就会被打回返修。动态图里,变道的车辆被遮挡,标注员要靠联想逐一识别;3D点云图中,超过10个点的物体必须画框,一根线画长、一个细节漏标,都会被质检挑出毛病。一张图返修四五次是常态,有时忙一个小时,到手只有几毛钱。湖南一位标注员晒出的结算单显示,一天拉700多个框,最终收入仅30.2元。
这是一幅极致割裂的图景:一边是科技发布会上,大佬们畅谈AGI将解放人类;另一边是黄土高原、西南大山的县城里,年轻人每天死盯屏幕八到十个小时,机械拉框,夜里做梦,指尖都在半空中画着车道线。有人说,人工智能的外表是呼啸而过的豪车,打开车门才发现,里面有一百个人骑着自行车,拼尽全力踩踏——没人觉得这有什么问题。
二、情感的量化:被算法抽空的“AI导师”
当图像识别的瓶颈被突破,大模型开始向更深层进化:它需要学会思考、对话,甚至拥有“同理心”。这就催生了大模型训练中最核心、也最昂贵的环节——RLHF(基于人类反馈的强化学习),简单来说,就是让真人给AI的回答打分,告诉它哪个更符合人类的价值观和情感偏好。ChatGPT之所以“像人”,背后是无数RLHF标注员的默默付出。在众包平台上,这类标注任务明码标价,单件3到7元,标注员需要对AI的回答进行主观情感打分,评判其是否“温暖”、是否“有同理心”、是否“照顾用户情绪”。
荒诞的是,承担这份“情感导师”工作的,大多是月薪两三千、在现实泥淖中疲于奔命的底层打工人——他们连自己的情绪都无暇顾及,却要为AI制定情感与价值观的标准。他们必须把温暖、同理心这些复杂幽微的人类情感,揉碎、量化成1到5的冰冷分数,一旦打分与系统“标准答案”不符,就会被判定为正确率不达标,扣减本就微薄的计件工资。
这是一种残酷的认知抽空。人类的情感、道德与悲悯,被强行拖入算法的漏斗,在量化与标准化的刻度里,被榨干最后一点温热。当我们惊叹于AI能写诗谱曲、嘘寒问暖,披上多愁善感的皮囊时,那些屏幕前的标注员,却在日复一日的机械判断中,退化成了没有情绪的打分机器。
这是AI产业链最隐秘的角落,从不现身于融资新闻和技术白皮书,却支撑着整个行业的光鲜。没人觉得这有什么问题。
三、阶层的折叠:985硕士与小镇青年的殊途同归
底层的拉框工作正在被AI碾压,而这条赛博流水线,正向上蔓延,吞噬着更高阶的脑力劳动。大模型的胃口越来越大,不再满足于简单常识,开始疯狂吞噬人类的专业知识与高阶逻辑。各大招聘平台上,“大模型逻辑推理标注”“AI人文训练师”等兼职频繁出现,门槛极高——多要求985/211硕士及以上学历,涵盖法律、医学、哲学、文学等专业领域。许多名校研究生被吸引,涌入大厂外包群,却很快发现,这不是脑力体操,而是一场精神折磨。
正式接单前,他们要阅读几十页的打分标准,经过两到三轮试标;正式标注时,若正确率低于平均水平,就会被直接踢出群聊,失去接单资格。更令人窒息的是,这些标准并非固定不变——面对相似的问题和回答,用相同的逻辑打分,结果可能截然相反。这就像做一份永远没有标准答案的试卷,无法通过努力提升正确率,只能在原地消耗脑力与体力。
这就是大模型时代的新型剥削——阶层折叠。曾经,知识是打破阶层壁垒、向上攀爬的黄金阶梯;如今,知识沦为了供奉给算法的、更复杂的数字草料。在算法与系统的绝对权力面前,象牙塔里的985硕士,与黄土高原上的小镇青年,迎来了最诡异的殊途同归。
他们一同坠入深不见底的赛博矿坑,被剥夺光环、抹平差异,统统变成了履带上廉价且可随时替换的齿轮。国外亦是如此:2024年,苹果砍掉圣地亚哥一个121人的AI语音标注团队,这些负责改善Siri多语言处理能力的员工,曾以为自己站在大厂核心业务边缘,却在一瞬间坠入失业深渊。
在科技巨头眼中,无论是县城里的拉框大妈,还是名校毕业的逻辑训练师,本质上都是可随时替换的“耗材”。没人觉得这有什么问题。
四、财富的虹吸:万亿巴别塔下的血汗博弈
中国信通院的数据显示,2023年中国数据标注市场规模达60.8亿元,2025年预计突破200亿元,到2030年,全球市场销售额将飙升至1171亿元。这些惊人的数字背后,是OpenAI、微软、字节跳动等科技巨头动辄数千亿、上万亿美元的估值狂欢。但泼天的财富,从未流向那些真正“喂养”AI的人。中国数据标注行业,呈现出典型的倒金字塔外包结构:最顶层是手握核心算法的科技巨头,第二层是大型数据服务供应商,第三层是遍布各地的标注基地与中小型外包公司,最底层,才是拿计件工资的标注员。
每一层外包,都要刮走一层油水。当大厂给出的单价是5毛钱时,经过层层盘剥,落到县城标注员手里的,可能连5分钱都不到。希腊前财政部长雅尼斯·瓦鲁法基斯在《技术封建主义》中提出一个尖锐观点:今天的科技巨头,已不是传统资本家,而是“云领主”——他们拥有的算法、平台、算力,就是赛博时代的数字领土。
在这个新的封建体系里,用户是免费上供数据的数字佃农,我们的每一次点赞、评论、浏览,都是在为云领主积累财富;而那些分布在下沉市场的数据标注员,是最底层的数字农奴——他们不仅要生产数据,还要清洗、分类、打分,将原始数据转化为大模型能消化的高质量饲料。
这是一场隐秘的认知圈地运动。就像19世纪英国圈地运动把农民赶进纺织厂,今天的AI浪潮,把实体经济中无立足之地的青年,赶到了屏幕前。AI没有抹平阶层鸿沟,反而搭建了一条从中西部县城,直通北上广深科技巨头的“数据与血汗输送带”。技术革命的叙事宏大华丽,底色却永远是廉价劳动力的规模化消耗。
没人觉得这有什么问题。
五、终局的残酷:亲手喂大的巨兽,终将砸掉饭碗
最残酷的结局,正在加速到来。随着大模型能力的跃升,那些曾经需要人类日夜劳作的标注任务,正在被AI自己接管。2023年4月,理想汽车创始人李想透露,过去一年,理想需完成1000万帧自动驾驶图像人工标定,外包成本近一亿元;而使用大模型自动标注后,过去一年的工作量,仅需3个小时就能完成——效率是人类的1000倍。这还只是2023年的水平。2026年3月,理想发布新一代MindVLA-o1自动标注引擎,效率再一次迭代升级。行业里那句自嘲,正在变成冰冷的现实:“有多少智能,就有多少人工”,但如今,大厂在数据标注外包上的投入,已出现40%-50%的断崖式下降。
那些在电脑前枯坐无数日夜、熬红双眼的小镇青年,亲手喂大了一只巨兽,而现在,这只巨兽正转过头,缓缓砸掉他们的饭碗。
夜幕降临,大同平城区的写字楼依旧惨白如昼。交接班的年轻人在电梯间里沉默相对,交换着疲惫的躯壳。在这个被无数多边形框禁锢的折叠空间里,没人关心大洋彼岸的Transformer架构又有了怎样的突破,没人听得懂千亿参数背后的算力轰鸣。
他们的视线,只焊死在后台那根代表“及格线”的红绿进度条上,算计着几分、几毛的计件收入,能不能在月底拼凑起一点体面的生活。一边是纳斯达克的敲钟声与科技媒体的溢美之词,巨头们为AGI的降临举杯相庆;另一边,这些以血肉之躯喂大AI的数字农奴,只能在酸痛的睡梦中,战战兢兢地等待着——那只自己亲手饲养的巨兽,会在某个寻常清晨,漫不经心地一脚踢飞他们的饭碗。
没人觉得这有什么问题。
本文来自微信公众号: 动察Beating ,作者:Sleepy.md
