GFW遇到了效率瓶颈?
Key
FuckBinxing
1楼 大 中 小 发表于 2010-6-2 21:27 只看该作者
GFW遇到了效率瓶颈?
最近无聊翻了翻CNCERT/CC的通告,发现下面这个东西。
http://www.cert.org.cn/articles/ … 2010051324982.shtml
这个竞赛的意思就是GFW说:我出钱,你来给我提高GFW运转效率!干得好,以后这种活还找你。
思路:多正则表达式匹配-深度包检测-功夫网。
Terminusbot 整理,讨论请前往 2049bbs.xyz
id已被绿坝屏蔽
闃呭悗鍗崇剼
2楼 大 中 小 发表于 2010-6-2 21:41 只看该作者
我靠,正则都用上了,不会吧,莫非以后电话号码里包含 6 和 4 的都发不出去。。。。
id已被绿坝屏蔽
闃呭悗鍗崇剼
3楼 大 中 小 发表于 2010-6-2 22:09 只看该作者
北邮学生2006年的时候做的垃圾测试数据。我勒个艹。
DaemonEye
不河蟹的围观团团员
4楼 大 中 小 发表于 2010-6-2 23:54 只看该作者
肯定要用上正则 甚至LALR语义分析一类的玩意
效率问题无解 如果说gfw增长是几何级别 互联网的数据增长就是平方级别的 追不上
翱翔sky
资深群众
5楼 大 中 小 发表于 2010-6-3 11:47 只看该作者
引用:
原帖由 DaemonEye 于 2010-6-2 23:54 发表
肯定要用上正则 甚至LALR语义分析一类的玩意
效率问题无解 如果说gfw增长是几何级别 互联网的数据增长就是平方级别的 追不上
我就奇怪了,几何级别的增长和平方级别的增长不是一回事吗?还是我弄错了?
DaemonEye
不河蟹的围观团团员
6楼 大 中 小 发表于 2010-6-3 11:52 只看该作者
引用:
原帖由 翱翔sky 于 2010-6-3 11:47 发表
我就奇怪了,几何级别的增长和平方级别的增长不是一回事吗?还是我弄错了?
说错了 gfw是代数增长…
george
思想罪在逃犯 大洋之声轮值DJ
7楼 大 中 小 发表于 2010-6-3 12:11 只看该作者
算法早就被研究透了,效率还是要靠大规模并行计算解决。个人觉得数据包过滤这种事情正适合并行处理,也就是说只要花钱上硬件,应该没什么不好解决的。
萧易寒
8楼 大 中 小 发表于 2010-6-3 13:57 只看该作者
正则解析相对来说应该很慢吧。。。
Joystyle
9楼 大 中 小 发表于 2010-6-3 20:06 只看该作者
TG不缺钱,堆设备呗~
542027128
受人鼓动的一小撮不明真相的群众之一
10楼 大 中 小 发表于 2010-6-3 20:45 只看该作者
引用:
原帖由 george 于 2010-6-3 12:11 发表
算法早就被研究透了,效率还是要靠大规模并行计算解决。个人觉得数据包过滤这种事情正适合并行处理,也就是说只要花钱上硬件,应该没什么不好解决的。
并行处理耗得硬件资源更多,只是被分担了而已,草TM的GFW,浪费老子们的税钱
cireb
11楼 大 中 小 发表于 2010-6-3 21:11 只看该作者
这种比赛也有,牛B~想想有谁去参加?搞无间道不错,嘿嘿~
s7lx
12楼 大 中 小 发表于 2010-6-6 23:36 只看该作者
其实正则表达式加速还是很有可能的。就是用不同的杂凑算法去匹配特征,这样无关的数据就可以快速通关,直到N层杂凑都能符合的时候,再去完整的正则表达,这时候如果还能匹配再reset…
方滨兴这老贼不上1984bbs吧。。。希望他没有看到