大数据文摘出品

编译:CoolBoy

今天,文摘菌要给大家介绍一个数据工程(注:非数据分析)资源超级大列表,你想找的全部在这儿~(Github链接见文末)

这个资料集是由区块链公司POA Network的技术负责人Igor Barinov所制作的。资源本身并没有代码之类的内容,而是为大家总结了数据工程上必要工具的链接,包含了从数据库到并行处理,再到数据集等一系列内容。每一项分类下都有清楚的链接和简介。

这个资源集的目录如下:

着实是很全面的一个列表,从事数据工程的同学应该很熟悉。

这个列表的内容有多详细呢?我们可以看一下关系数据库(relational database)的例子来窥斑见豹:

可以看到,仅仅是关系数据库这一项,作者就总结出了一份很齐全的工具列表,包括了MySQL、PostgreSQL等大家熟悉的工具,也有其它稍微陌生一点的名字。而MySQL下面也附着了基于MySQL协议的相关工具。

在整个数据库(Databases)的大板块下,其他的数据库模型(Key-Value、Column、Document、Graph、Distributed、Timeseries、Others)也被如此详细地总结出来。其他的大板块亦是如此。

此外,列表的最后还有一个社区的板块,包含了论坛、会议和Podcast的链接:

有没有厉害的同学要给这个列表进行补充呢?

Github链接:

【今日机器学习概念】