什么是数字的基石？使得千年来数学家们前赴后继地痴迷对它研究( 二 ) _小知识

每次以 1000 为一组，分别计数这一范围内素数的个数。先计数 1000 以内素数的个数，接着是 1000 到 2000 之间，然后是 2000 到 3000 之间，以此类推，高斯开始对素数表的探索。
高斯发现，随着数值增大，素数出现的频率会逐渐降低，遵循“反对数”定律。虽然高斯的素数分布定理并没有算出素数数目的精确值，但他给出了一个非常好的近似值。例如，根据素数定理预测在 1000000 到 1001000 之间存在 72 个素数，而正确结果是 75，误差在 4% 左右。这令他提出一个猜想：，其中为不大于 x 的素数个数。也就说当 x 趋近无限时，有下式成立：

文章插图

而在这个猜想提出一个世纪之后，这个称之为素数定理(prime number theorem)才得到了证明。

文章插图

▲ π(x), x/lnx 和 π(x)/(x/lnx) 的比较
随着素数计数范围越来越大，估计值与真实值的相对误差将趋近于 0 。悬赏百万奖金，位列当今数学界七大难题之一的黎曼猜想(Riemann hypothesis)，也描述了高斯定理估算的精确程度。
素数定理和黎曼猜想已经得到了人们的广泛关注，但它们在早期，都是从枯燥的素数表数据分析开始的。现在，我们获取数据的方式都来自于计算机程序的运算，不再需要手算筛选，但数学家们仍在寻找素数研究的新模式。除了 2 和 5 之外，所有素数都以 1，3，7 或 9 结尾。19 世纪，人们发现这几个末位数字在素数中存在相同的出现频率。换句话说，如果你计数到 100 万，25%的素数末位为 1，25% 末位为 3，25% 末位为 7，25% 末位为 9 。
对素数末位数字的分析除了 2 和 5 之外，所有素数都以 1，3，7 或 9 结尾。19 世纪，人们发现这几个末位数字在素数中存在相同的出现频率。

文章插图

▲ ?图表来自：The Conversation, CC-BY-ND，作者Martin Weissman
几年前，斯坦福大学的数论学家莱姆克·奥利弗(Lemke Oliver) 和坎南·桑德拉贾恩(Kannan Soundararajan)在实验中观察素数及其下一个相邻素数的末位数字规律，意外发现了一个问题。例如，23 之后的素数是 29，它们的末位数字是前 3 后 9 。那么，相邻两个素数的末位数字，是前 3 后 9 常见，还是前 3 后 7 常见呢?

文章插图

▲ 100 万以内的连续素数末位数字对儿出现的频率。相同颜色代表末位数字对儿具有相同的间距值。(M.H. Weissman, CC BY)
数论学家们预计会存在一些差异，但实验结果远超预期。将相邻素数末位数字对儿按照间距不同进行分组，譬如，23 与 29 间距为 6 。结果发现，像 23 和 29 这样前 3 后 9 的素数对儿的占比，超过先 7 后 3 的素数对儿占比，尽管两种情况中相邻素数对儿的间距都为 6 。虽然数学家们很快给出了一种较为可信的解释。但是，当涉及到连续素数的研究时，数学家们大部分还局限在分析数据进而寻找合理解释的阶段，距离揭示真相的唯一标准——数学上证明，似乎还需要很长一段路要走。