在路上
2022-01-19
徐老师好,当数据遇上AI,需要从源头来规范日志格式,用一种语言处理整个流程,这一切都是为了提升数据科学家的工作效率。这说明数据的价值来自于分析,以及所得出的结论。在阅读《Streaming System》时我以为流式处理是大数据未来的方向,但是我最近在读《数学之美》和《智能时代》,发现大数据的价值在于服务于AI,而AI的重点不在于实时性,而在于海量、完备性和相关性。实时处理是当今的热点,不过比起追逐潮流,更重要的是理解数据,才构建高效的大数据环境,让数据发挥价值。
2
Geek_88604f
2022-05-15
看来大数据需要和数据仓库建模理论结合
piboye
2022-01-20
clickhouse 这些sql 系统的 udf 可以用python 来实现机器学习吗?
那时刻
2022-01-19
良好管理的元数据,会大大提升数据科学家们的工作团队效率。这个深有体会,我们之前数据字典不规范,导致部门之间的信息不均衡,后来通过统一数据字典以及可视化的方式,来统一信息的一致性