第一百四十二章更多问题(1/3)

赛博英雄传作者：吾道长不孤仙侠阅读记录

    向山大概听明白了。

    或者说，唯一让向山懵逼了一瞬间的，也就是英格丽德举出的那个例子。

    他没想到会在这种场合听到这种……奇怪的例子。

    但是，除此之外，好像并没有什么更有价值的东西。

    只能说，任何专业人士，在超出自己专业领域之后，就不比一般人更加智慧吧。

    虽然在英格丽德眼中，这些外星人的书写方式有趣极了，但归根结底，这就是一种压缩算法。

    而这无法解释向山现在在琢磨的问题。

    “所有外星机械的设计图纸、装配工艺、材料制造的参数，再加上它们自身运行的ai，加在一块，是如何压缩到两三百mb这个水平的”。

    外星人使用了两种压缩算法。

    一种大致可以称作“字典算法”，即“将高频出现的排列组合用，做成对应字典，然后用字典内编号代码来替代该组合”。这种手段人类也在使用。当然，如果“字典”做得很大，那么数据本体就可以压缩得很小。但有些时候，又会形成“字典比数据本体还要大”的情况。

    外星人大概是选择了一个恰好的数值，保证“本体+字典”的大小最小。

    另外就是英格丽德所说的这种二维的符号矩阵。

    但不管怎么样，信息的无损压缩一定是有极限的。

    而这种二维矩阵的算法，不管外星人将读取规则设计得怎样花里胡哨，它都存在一个“上限”的。

    就如英嘉所说，如果多增加一个“下一个终止/方向符号无效”的符号，固然可以增加读取路线的数量，但是却会导致符号之中混入大量除了表示“下一个终止/方向符号无效”之外没有其他任何意义的符号，“字典”的集合之中也要增加项目。

    “读取路线”的增加，会导致“掺杂过多只与读取规则有关的符号”以及“字典”的膨胀。

    同字典算法一样，到最后，同样也会出现“读取规则”大小大于数据本体大小的问题。

    这里面同样存在一个平衡点。

    按照向山估计，关于读取规则的符号可能也就那么几个，不会太多。

    而二维的符号矩阵也存在另一个问题。就好像“填字游戏”一样，一个空间坐标上的符号，要受到来自四个方向内容的制约。这反而使得信息的表达不像一维的文字那样自由。

第一百四十二章 更多问题(1/3)

第一百四十二章更多问题(1/3)