GFW遇到了效率瓶颈?

Key

FuckBinxing

1楼 大 中 小 发表于 2010-6-2 21:27 只看该作者

GFW遇到了效率瓶颈?

最近无聊翻了翻CNCERT/CC的通告,发现下面这个东西。

http://www.cert.org.cn/articles/ … 2010051324982.shtml

这个竞赛的意思就是GFW说:我出钱,你来给我提高GFW运转效率!干得好,以后这种活还找你。

思路:多正则表达式匹配-深度包检测-功夫网。


Terminusbot 整理,讨论请前往 2049bbs.xyz


id已被绿坝屏蔽

闃呭悗鍗崇剼

2楼 大 中 小 发表于 2010-6-2 21:41 只看该作者

我靠,正则都用上了,不会吧,莫非以后电话号码里包含 6 和 4 的都发不出去。。。。

id已被绿坝屏蔽

闃呭悗鍗崇剼

3楼 大 中 小 发表于 2010-6-2 22:09 只看该作者

北邮学生2006年的时候做的垃圾测试数据。我勒个艹。

DaemonEye

不河蟹的围观团团员

4楼 大 中 小 发表于 2010-6-2 23:54 只看该作者

肯定要用上正则 甚至LALR语义分析一类的玩意

效率问题无解 如果说gfw增长是几何级别 互联网的数据增长就是平方级别的 追不上

翱翔sky

资深群众

5楼 大 中 小 发表于 2010-6-3 11:47 只看该作者

引用:

原帖由 DaemonEye 于 2010-6-2 23:54 发表

肯定要用上正则 甚至LALR语义分析一类的玩意

效率问题无解 如果说gfw增长是几何级别 互联网的数据增长就是平方级别的 追不上

我就奇怪了,几何级别的增长和平方级别的增长不是一回事吗?还是我弄错了?

DaemonEye

不河蟹的围观团团员

6楼 大 中 小 发表于 2010-6-3 11:52 只看该作者

引用:

原帖由 翱翔sky 于 2010-6-3 11:47 发表

我就奇怪了,几何级别的增长和平方级别的增长不是一回事吗?还是我弄错了?

说错了 gfw是代数增长…

george

思想罪在逃犯 大洋之声轮值DJ

7楼 大 中 小 发表于 2010-6-3 12:11 只看该作者

算法早就被研究透了,效率还是要靠大规模并行计算解决。个人觉得数据包过滤这种事情正适合并行处理,也就是说只要花钱上硬件,应该没什么不好解决的。

萧易寒

8楼 大 中 小 发表于 2010-6-3 13:57 只看该作者

正则解析相对来说应该很慢吧。。。

Joystyle

9楼 大 中 小 发表于 2010-6-3 20:06 只看该作者

TG不缺钱,堆设备呗~

542027128

受人鼓动的一小撮不明真相的群众之一

10楼 大 中 小 发表于 2010-6-3 20:45 只看该作者

引用:

原帖由 george 于 2010-6-3 12:11 发表

算法早就被研究透了,效率还是要靠大规模并行计算解决。个人觉得数据包过滤这种事情正适合并行处理,也就是说只要花钱上硬件,应该没什么不好解决的。

并行处理耗得硬件资源更多,只是被分担了而已,草TM的GFW,浪费老子们的税钱

cireb

11楼 大 中 小 发表于 2010-6-3 21:11 只看该作者

这种比赛也有,牛B~想想有谁去参加?搞无间道不错,嘿嘿~

s7lx

12楼 大 中 小 发表于 2010-6-6 23:36 只看该作者

其实正则表达式加速还是很有可能的。就是用不同的杂凑算法去匹配特征,这样无关的数据就可以快速通关,直到N层杂凑都能符合的时候,再去完整的正则表达,这时候如果还能匹配再reset…

方滨兴这老贼不上1984bbs吧。。。希望他没有看到