• 在路上
    2022-01-19
    徐老师好,当数据遇上AI,需要从源头来规范日志格式,用一种语言处理整个流程,这一切都是为了提升数据科学家的工作效率。这说明数据的价值来自于分析,以及所得出的结论。在阅读《Streaming System》时我以为流式处理是大数据未来的方向,但是我最近在读《数学之美》和《智能时代》,发现大数据的价值在于服务于AI,而AI的重点不在于实时性,而在于海量、完备性和相关性。实时处理是当今的热点,不过比起追逐潮流,更重要的是理解数据,才构建高效的大数据环境,让数据发挥价值。
    
    2
  • Geek_88604f
    2022-05-15
    看来大数据需要和数据仓库建模理论结合
    
    
  • piboye
    2022-01-20
    clickhouse 这些sql 系统的 udf 可以用python 来实现机器学习吗?
    
    
  • 那时刻
    2022-01-19
    良好管理的元数据,会大大提升数据科学家们的工作团队效率。这个深有体会,我们之前数据字典不规范,导致部门之间的信息不均衡,后来通过统一数据字典以及可视化的方式,来统一信息的一致性
    
    