
手机的收集,专挑细处断!
眼看着要迟到了,你从地铁里挤出来冲锋,过闸机的时候却生死刷不出来二维码;
盯着倒计时抢人人号,点进去就转圈,等页面终于加载好,号早就没了;
看演唱会想攥紧时间发个热乎一又友圈,最终比及散场才发送出去。

图丨giphy
好音问是,不是你的手机老了坏了。
坏音问是,你正站在一个被几百东谈主同期挤爆的无线小区里。
“无线小区”,你可以把它遐想成酒店里诀别的不临幸间,每个房间由基站负责接待。平日没啥问题,几百号东谈主涌进吞并个房间,那谁齐别想顺畅上网。

无线小区的约略透露图,中心为基站。昭着“蜂窝收集”这个说法何如来的了吧?丨作家供图
说回发轫那些握狂须臾——闸机刷不开,人人号抢不到,一又友圈发不出去,这些能忍。但淌若碰到突发大事件呢?收集还能我方抢救一下吗?
要想网不卡,先多修基站
最平直的想路:多建基站,把东谈主群分散到更多无线小区里。
基站越多,容量越大、掩盖越广——酒店房间多了,每个房间分到的来宾就少了。
何况电磁波天生会衰减,离天线越远信号越弱,再碰上墙壁树木,衰减更快。想让更多边缘有信号,只可靠铺更多基站来补。
我国已建成数百万个4G 和5G 基站。可基站铺满了,新忙活也来了。

航拍的5G基站丨图虫创意
基站越多,忙活也越多
电磁波空间是分享的。你的手机、邻居的手机、路边汽车里的开荒,可能挤在吞并派频率上。基站之间也不异——数目一多,相互干涉就成了绕不开的问题。
为了让千千万万台开荒不撞车,收集得在频率和时间上量入为主,就像十字街头的车流——分谈行驶、分时放行。从业者给每个小区分拨编号,匡助手机分清信号来路,挑信号最佳的接入。
不外,手机不知谈哪个无线小区最佳——信号最强的无线小区,可能还是被各式结尾挤爆了,接进去就卡。

使东谈主梦回拨号上网丨giphy
那基站能不行主动迷惑?能!
我们可以通过东谈主工操作、或依照历史记载、或依照事先设定,让基站给赋闲小区“加分”。加分不是真把信号调强了——即使辐射功率不变,被加分的小区在手机眼里“看起来”信号更好,手机等结尾就会被和善地迷惑到赋闲小区。

基站:这位用户内部请~丨图虫创意
问题处分了吗?莫得啊!
让收集我方学会变贤达
更根底的问题是,收集建好后,用户的骨子踱步时常跟缱绻预期差很远。
比如好意思食广场的基站平日很闲,每到饭点就被挤爆。靠东谈主工操作、事先设定、历史记载,齐很难实时把用户从拥堵的好意思食广场基站挪到掌握赋闲的泊车场基站。
何如处分这个问题呢?从业者盯上了“强化学习”。
强化学习靠“试错”和“奖励”学会作念事,无谓东谈主写法令。我们成长里也有它的影子:上课寝息→磨练不足格→决定崇敬听讲→拿到好收货。
东谈主无再少年,AI 有一万次试错的契机,来望望AI在无线收集里怎样强化学习。
AI先是不雅察每个小区的负载率、用户数目、信号质地(状况);
然后调理天线功率、朝向和条约参数迷惑结尾(看成);
目标是让最挤的小区尽量闲下来,负载率越低、它得到的奖励越高(奖励)。
AI在仿真环境里无间试错,不雅察奖励涨跌以更新战略。千千万万轮后,它摸索出了辅导:本小区负载超80%且近邻低于60%?把东谈主移动昔时!两个小区齐忙?按兵不动!

面容学家斯金纳透露用近似的活动教练过老鼠取食丨miepvonsydow.wordpress.com
这个活动在实验中获取了可以的用户体验。
慕尼黑工业大学的盘考团队用强化学习给用户分拨小区:4个小区、15名用户不停出动的仿真中,传统战略让一个小区平均接入超11东谈主,强化学习压在6东谈主以内[1]——你从和10个东谈主抢网速形成最多5个,体验翻倍。
甚而在节能省电上也施展优秀。
无线小区太闲的时候可以暂时关停。定时关停(比如到了夜里12点关停部分无线小区)可以省俭7.91%的能耗,基于固定值关停(比如负载低于某个值关停部分无线小区)可以省俭13.48%的能耗。使用强化学习的活动决定是否关停,省俭能耗则达到了15.26%[2]!
值得一提的是,收受这种活动,还能保证在97.40%的时段内,有95%以上的用户能用到不低于5Mbps的下载速度,比定时关停和基于固定值关停齐要高——省得更多,瑕玷更小。
当前强化学习握住基站还齐在仿真环境中进行,到了复杂的信得过宇宙会不会掉链子,还说不好。
比如这套系统学会了随着仿真数据走,去合适夙夜岑岭地铁上的使用需求,成果到了周末或者节沐日民众齐窝在家里,还随着老规矩管事的系统就可能让用户上网卡顿。
更万般的仿真数据能堵辗转,也期待它在实验中无间学习完善,给我们更丝滑的体验。
不仅仅无线收集的故事
除了握住基站,强化学习这东西还忽闪嘛?
其实你可能还是用过了。ChatGPT 和 DeepSeek 的教练用到 的RLHF(“从东谈主类反映中强化学习”),旨趣亦然不异的:AI 给出回应(看成),东谈主或 AI 打分(奖励),AI 凭证分数调理。教练聊天 AI 和教练管基站的 AI,底层齐是“试错→打分→杰出”。
让系统变贤达,也不啻强化学习这一种活动。
第一类,强化学习。技巧是靠近无间变化的环境,我方摸出最优战略。收集负载平衡天生即是这种问题——用户一会儿涌这儿、一会儿涌那边,莫得固定例律。
第二类,传统机器学习。你给我历史数据,我从中找章程。比如拿几万东谈主身高体重和体检成果,学会“什么范围的东谈主巧合率偏胖”。但收集数据片霎万变,光靠历史不够。
第三类,法令系统。把人人辅导写成“淌若……就……”塞进度序,比如“小区 A 负载超80%,把10%用户挪到小区 B”。优点是可靠、无谓教练,瑕玷是法令没写到的场景就握瞎。

图丨giphy
三种活动各有惬意区。收集负载正好落在强化学习最擅长的那块土地——动态、莫得固定谜底。以前运维靠工程师写死法令,当今收集我方试、我方学、我方调。
改日,法令系统管旧例场景,传统机器学习从历史数据找章程,强化学习叮嘱“法令写不到、章程找不到”的动态变化,三者勾搭。我们也期待更强横的 AI 加入进来。
参考文件
[1] A. Prado, F. Stöckeler, F. Mehmeti, P. Krämer and W. Kellerer, "Enabling Proportionally-Fair Mobility Management With Reinforcement Learning in 5G Networks," in IEEE Journal on Selected Areas in Communications, vol. 41, no. 6, pp. 1845-1858, June 2023, doi : 10.1109/JSAC.2023.3273705
[2] A.-K. Dang体育游戏app平台, H. Khalifé, M. Sintorn, S. Rovedakis and S. Secci, "Data-driven Energy Optimization in Mobile Networks with User Experience Guarantees," IEEE INFOCOM 2025 - IEEE Conference on Computer Communications, 2025, doi : 10.1109/INFOCOM55648.2025.11044545