1 前言

    如前面所说,每一门语言都有其优势和劣势。 我们认为,数据科学无疑是 Julia 的优势。 同时,我们三个都使用 Julia 作为日常的数据科学工具。 另外,你可能使用 Julia 研究数据科学! 这就是为什么这本书聚焦在数据科学上。

    目前来看,数据很丰富,在不久的未来还将产生更多的数据。 一份 2012 年底的报告总结说,从 2005 年到 2020 年,数字化存储的数据量将增长 300 倍,从 130 EB增加到 40000 EB(Gantz & Reinsel, 2012)。 这个数字相当于 40 万亿 GB,更确切地说,这相当于地球上的每个人创建了 5.2 TB 的数据! 目前,在 2020 年,每人平均 每秒创建 1.7 MB 的数据 ()。 一份最近的报告指出大约 在2022年,三分之二(65%)的国家其 GDP 正在实现数字化 (Fitzgerald et al., 2020)。